Learning Representations and Generative Models for 3D Point Clouds

三维几何数据为研究表示学习和生成建模提供了一个很好的领域。在本文中,我们研究用点云表示的几何数据。介绍了一种具有最先进的重构质量和泛化能力的deep AutoEncoder (AE) 网络。学习表示在三维识别任务上优于现有方法,通过简单的代数操作实现了形状编辑,如语义部分编辑、形状类比和形状插值以及形状补全。我们对不同的生成模型进行了深入的研究,包括在原始点云上运行的GANs、在我们AEs的固定潜空间中训练的具有显著提升的GANs以及高斯混合模型(GMMs)。为了定量地评估生成模型,我们引入了基于点云组间匹配的样本保真度和多样性度量。有趣的是,我们对泛化、保真度和多样性的评估表明,在我们的AEs的潜在空间中训练过的GMMs总体效果最好。
论文链接:https://arxiv.org/abs/1707.02392
代码链接:https://github.com/optas/latent_3d_points

真实物体的三维表示是视觉、机器人、医学、增强现实和虚拟现实应用的核心工具。最近对用于深度学习的3D几何编码的尝试包括基于视图的投影,体积网格和图形。在这项工作中,我们集中关注三维点云的表示。在本文中,我们探索了深层架构在学习表示中的应用,并介绍了点云的第一个深层生成模型。在文献中,只有少数针对三维点云量身定制的深层架构存在,它们的关注点在别处:Pointnet以分类和分割为目标,或者只使用点云作为媒介或输出表示。
本文的主要贡献是:
1)一种新的点云的AE架构:灵感来自于Pointnet。Pointnet架构可以通过(i)对不可见样本进行高质量重建;(ii)通过简单分类方法(SVM)得到好的分类质量;(iii)对有意义语义的操作、插值和形状补全的能力,学习到紧凑的表达。
2)第一套点云深度生成模型:该模型能够合成点云,具有(i)可测量的高保真度,(ii)训练和待用数据的良好覆盖率。工作流程为首先训练一个AE来学习潜在的表示,然后在这个固定的潜在空间中训练一个生成模型。在潜在空间中训练的GANs,在这里称为l-GANs,比原始GANs更易于训练,并且实现了更好的重构效果和数据分布的覆盖。在潜在空间中进行训练时,多类GANs的表现几乎与特定于某类的GANs相当。
3)一项关于新旧点云 metrics 的研究:关于之指标在用于学习良好表示的重构目标与评估生成样本方面的适用性。还发现Chamfer distance,无法确定某些病态的情况。
4)生成模型的保真度和覆盖率:基于两个不同的点云集合之间的最佳匹配。提出的覆盖率可以识别生成模型完全忽略的部分数据分布,这是基于基数的多样性度量可能无法捕获的。

算法框架:

一、 点云的表示模型
AE网络的输入是一个2048点(2048×3矩阵)的点云,表示一个三维形状。编码器架构遵循pointnet的设计原则:内核大小为1且特征不断增加的一维卷积层;这种方法独立地编码每个点。在卷积之后放置一个“对称”的置换不变函数(例如max pool),以产生联合表示。用5个一维卷积层,每个后面跟着一个ReLU层和一个BN层。最后一个卷积层的输出逐特征最大化,生成一个k维向量,这是潜在空间的基础。解码器使用3个全连接层对潜在向量进行转换,前两个有ReLU层,产生2048×3维的输出。为了保持置换不变,使用了两种结构损失:EMD近似和CD,因此产生了两个不同的AE模型,称为AE-EMD和AE-CD。为了规范AEs,我们考虑了各种bottleneck尺寸,通过随机旋转点云来使用drop-out和on-the-fly augmentations(动态扩增)。本文使用的是具有128维bottleneck层的AE。
二、 点云的生成模型
2.1 Raw point cloud GAN (r-GAN)
首先尝试在将原始2048×3点集输入r-GAN。判别器的结构与AE相同,且没有用BN结构,激活函数为leaky ReLUs。最后一个全连接层的输出被送入一个sigmoid神经元。生成器将高斯噪声矢量作为输入,并通过5个全连接-激活层将其映射为2048×3的输出。
2.2 Latent-space GAN (l-GAN)
l-GAN不在原始点云输入上操作,而是将数据输入预训练的AE,该AE用具有EMD(或CD)损失函数的每个类别对象进行单独训练。然后,l-GAN的生成器和判别器都对AE的 bottleneck变量进行操作。训练结束后使用AE的解码器将生成器学习的编码转换为点云。l-GAN的结构明显比r-GAN的结构简单。具体而言,单个隐藏层的MLP生成器与两个隐藏层的MLP判别器耦合,足以产生可测量性良好和真实的结果。
2.3 Gaussian mixture model
还可以在AEs学得的潜在空间上建立了一系列高斯混合模型(GMMs)。首先对配置的分布进行采样,然后使用AE的解码器,GMM可以变成点云生成器,类似于l-GANs。

主要结果:

本项工作在P2提出两项指标:EMD与CD。以及三种生成模型的评估指标,包括:JSD、Coverage与MMD,详见论文。本文通过试验确定了提出的评估指标的有效性。实验数据基于ShapeNet,按照85%-5%-10%的比例划分的训练/验证/测试集。
一、AE的表示能力
首先,用MMD-CD和MMD-EMD度量来报告其泛化能。AE能够重建不可见的形状,其质量几乎与用于训练的形状一样好。如表1,比较重建点云和真实值之间的MMD-CD和MMD-EMD,在该指标下的繁华差距很小。
在这里插入图片描述
利用AE还可以在潜在编码可以进行语义上有意义的操作以及完成形状补全问题。具体而言,AE网络不仅可以重建相同的点云,也可以输出预期形状,详见附录D。
使用潜在表示来训练SVM分类器,并得到分类分数。见表2,ModelNet10和ModelNet40数据集上都有较高的分数。
在这里插入图片描述
二、 评估生成模型
训练了五个带有椅子类别点云的生成器。首先建立两个分别用CD或EMD损失训练的AE,分别称为AE-CD和AE-EMD,并在每个潜在空间训练l-GAN,使用Goodfellow等人的非饱和损失。在AE-EMD学习的空间中,我们训练了另外两个模型:一个相同的(架构方面的)l-GAN,利用具有梯度惩罚的Wasserstein目标和一个GMM族,具有不同数量的方法和协方差结构。 我们还直接在点云数据上训练r-GAN。表3,验证了基于潜在方法和使用AE-EMD与AE-CD的效果。此外,证明了简单的GMM可以获得与潜在WGAN质量相当的结果。
在这里插入图片描述

Abstract

Three-dimensional geometric data offer an excellent domain for studying representation learning and generative modeling. In this paper, we look at geometric data represented as point clouds. We introduce a deep AutoEncoder (AE) network with state-of-the-art reconstruction quality and generalization ability. The learned representations outperform existing methods on 3D recognition tasks and enable shape editing via simple algebraic manipulations, such as semantic part editing, shape analogies and shape interpolation, as well as shape completion. We perform a thorough study of different generative models including GANs operating on the raw point clouds, significantly improved GANs trained in the fixed latent space of our AEs, and Gaussian Mixture Models (GMMs). To quantitatively evaluate generative models we introduce measures of sample fidelity and diversity based on matchings between sets of point clouds. Interestingly, our evaluation of generalization, fidelity and diversity reveals that GMMs trained in the latent space of our AEs yield the best results overall.

我们现在已经有了单目相机采集到的原始图像,对应的深度图,以及对应的相机位姿(以往博客有提及),接下来我们就可以用这些数据进行拼接点云 生成 三维稠密点云地图了。 首先还是先看例程,基于SLAM14讲5.4的源码:本机环境Eigen3,pcl1.7 opencv3.3.1 源码提供了5张彩色图和深度图以及对应的相机位姿(平移向量xyz旋转四元数qxqyqzqw), 例程效果如下: 我们可以根... 在了解点云数据如何快速 生成 三维 模型 前,我们先来了解什么是点云数据,点云数据是怎么 生成 的。点云数据是指在一个三维坐标系统中的一组向量的集合,每一个点都包含有三维坐标,有些可能含有颜色信息或反射强度信息。颜色信息通常是通过相机获取彩色影像,然后将对应位置的像素的颜色信息赋予点云中对应的点。强度信息的获取是激光扫描仪接收装置采集到的回波强度,此强度信息与目标的表面材质、粗糙度、入射角方向,以及仪器的发射能量,激光波长有关。点云数据一般由3D扫描设备产生,例如三维激光扫描仪、扫描全站仪、激光雷达,立体摄像头,越渡时 在本文,提出了一个新的架构 InterFaceGAN,通过解释由GAN学到的隐语义(latent semantics),进行语义的面部编辑。在该框架中,我们详细地研究隐空间中的不同语义是如何被编码的。我们发现,在线性变形(linear transformations)之后,训练良好的 生成 模型 的 latent code 学习到了一个分离的(disentangled) 表示 (representation)。我们研究分离各种语义,并设法将一些纠缠的语义与子空间投影分离,从而更精确地控制面部属性。 最近碰到三维 模型 处理问题,我需要使用三维 模型 的点云,但是手头只有三维 模型 的solidworks文件,需要把solidworks文件转成点云。 有一种方法是使用meshlab处理。在sw里把文件另存为stl格式,然后在meshlab中打开,然后细分 模型 ,最后另存为xyz格式。但这种方法有一个很大的缺点,就是点云很不均匀,在平面区域点非常少,所以这个方法gg。 知乎上有人给了一个方法link,用pcl... 注:本文是在学习了高翔博士的相关博客(http://www.cnblogs.com/gaoxiang12/p/4652478.html)后写成的,纯粹作为一个学习笔记1.在上一节即http://blog.csdn.net/zhuquan945/article/details/52788278中讲到的 代码根目录/src/ 文件夹中,即在/slam/src中新建一个名字为generatePointC... 三维几何数据为研究 表示 学习和 生成 建模提供了一个很好的领域。在本文中,我们研究用点云 表示 的几何数据。介绍了一种具有最先进的重构质量和泛化能力的deep AutoEncoder (AE) 网络。学习 表示 在三维识别任务上优于现有方法,通过简单的代数操作实现了形状编辑,如语义部分编辑、形状类比、形状插值以及形状补全。我们对不同的 生成 模型 进行了深入的研究,包括在原始点云上运行的GANs、在我们AEs的固定潜空间中训练的具有显著提升的GANs以及高斯混合 模型 (GMMs)。为了定量地评估 生成 模型 ,我们引入了基于 点云 生成 :Diffusion Probabilistic Models for 3D Point Cloud Generation简介 论文 abstractinstructionRelated works 2021 CVPR abstract   我们提出了一个用于点云 生成 的概率 模型 ,它是各种三维视觉任务的基础,如点云形状补全、上采样、合成和数据增强。受非平衡热力学中扩散过程的启发,我们将点云中的点视为热力学系统中与热浴接触的粒子,它们从原始分布扩散到噪声分布。因此,点云的 生成 相当于学习反向扩散 Abstract 与在规则密集网格中 表示 的图像不同, 三维点云 是不规则和无序的,因此对其应用卷积可能很困难。在本文中,我们将动态滤波器扩展到一种新的卷积运算,名为PointConv。PointConv可以应用于点云,以构建深度卷积网络。我们将卷积核视为由权重函数和密度函数组成的三维点的局部坐标的非线性函数。对于给定的点,通过多层感知器网络和核密度估计的密度函数学习权函数。这项工作最重要的贡献是提出了一种新的用于有效计算权重函数的重新公式,它使我们能够极大地扩展网络并显著提高其性能。学习的卷积核可用于计算三维空 三维几何数据为研究 表示 学习和 生成 建模提供了一个很好的领域。在本文中,我们研究用点云 表示 的几何数据。介绍了一种具有最先进的重构质量和泛化能力的deep AutoEncoder (AE) 网络。学习 表示 在三维识别任务上优于现有方法,通过简单的代数操作实现了形状编辑,如语义部分编辑、形状类比和形状插值以及形状补全。我们对不同的 生成 模型 进行了深入的研究,包括在原始点云上运行的GANs、在我们AEs... PointRCNN: 点云的3D目标 生成 与检测 PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud 论文 地址:https://arxiv.org/abs/1812.04244 代码地址:https://github.com/sshaoshuai/PointRCNN 本文提出了一种基于点云的三维目标检测方法。整个框架由两个阶段组成:第一阶段用于自下而上的3D方案 生成 ,第二阶段用于在标准坐标系中细化方案以获得最终的 要制作 三维点云 深度学习 模型 ,您可以遵循以下步骤: 数据准备:收集和准备 三维点云 数据集。您可以使用各种传感器(例如激光雷达、结构光)来获取 三维点云 数据,然后对其进行预处理,例如去噪、点云配准等。 特征提取:选择合适的特征提取方法来从点云数据中提取特征。例如,您可以使用voxel-based方法将点云数据转换为体素网格,并使用卷积神经网络(CNN)对其进行处理。 模型 构建:基于您选择的特征提取方...