三维点云技术的迅速发展在现实世界应用中发挥了至关重要的作用,如机器人技术、自动驾驶、增强现实和虚拟现实等多个领域。简单来说,三维点云是一种通过捕捉和处理物体表面的无数个点,生成物体或场景的三维模型。当前,三维点云技术的主要任务包括物体分类、分割和检测,这些任务的主要挑战在于如何处理点云数据的无序结构以及标注大规模点云数据集。点云数据的无序结构意味着点的顺序没有固定的模式,这与传统的图像数据不同。此外,由于点云数据通常包含数百万个点,手动标注这些数据非常耗时且昂贵。

为了解决这些问题,研究人员正在探索无监督领域自适应(UDA)的方法,旨在无需人工标注大规模点云数据的情况下,实现有效分类和分割。近年来的研究表明,在目标领域的训练过程中加入自监督学习的方法,通过让模型自己生成标注并进行训练,可以显著提升UDA点云任务的性能。然而,大多数现有的方法仅关注几何变形,即点云的形状变化,而忽略了语义信息,这导致了不同领域之间的差距难以弥合。通过结合几何和语义信息,未来的研究和实践有望进一步提升三维点云技术的应用效果。

彭小江和李青提出了一种新的解决方案——图注意力双重集成学习(GRADE)框架。这一方法通过在源数据上进行初步训练,在目标数据上建立两个协作训练分支(教师-学生模型),每个分支构建一个时间平均教师模型,并将其生成的伪标签传递给另一个分支。这种合作不仅捕捉高级语义信息,还提高了网络的一致性泛化能力和准确重建能力。为了使教师模型生成更可靠的标签,该方法改进了现有的DGCNN架构,加入了动态图注意力模块,从而更好地挖掘局部邻域点之间的关系。

实验结果显示,GRADE方法在多个无监督领域自适应基准上的分类和分割任务表现显著优于当前最先进的方法。这一成果不仅在几何重建方面表现出色,还注重可靠的高级语义信息的获取,推动了三维点云技术在各种应用中的进步。

稿件来源:大数据与互联网学院