深度学习在点云识别中的应用
主讲人一:刘永成,中科院自动化所在读博士,研究兴趣为3D点云处理、图像分割、多标签图像分类等。https://yochengliu.github.io/
主讲人二:李瑞辉,香港中文大学计算机系在读博士,研究兴趣为三维点云处理、三维重建等。https://liuruihui.github.io/
Part 1:深度学习在点云识别中的应用 –刘永成
本次分享主要以思想和方法性内容为主,不涉及具体实现细节。
本次分享的内容框架,Brief review主要是介绍到2019年8月份的该领域进展。
3D表示有多视角+2D CNN(存在自遮挡和多图消耗资源的不足)、体素化表格(受制于划分精度)+3D CNN、mesh(有点和边)+DL(GNN)、图像深度(2.5维)+CNN和纯点云+DL(GNN&CNN)。基于纯点云数据是目前比较open的问题
点云的优势
基于纯点云数据的任务类型
点云的数据集介绍。其中PartNet对未来机器人领域的推动性会比较大
场景类型的点云数据集:
对于纯点云数据来说存在的一些挑战:Irregular(unordered)、robustness to geometric transformation、robustness to corruption, outlier,noise, partial data and large-scal data
接下来综述一下最近的工作
首先致敬PointNet
PointNet++改进PointNet无法提取局部领域信息的不足
后续很多工作都是在PointNet和PointNet++基础上做的。
之前的方法都多用到了手动处理(Voxel或投射)和超参设置的过程,接下来介绍用自动学习的方法去思考
还有一些其他思路的方法
有些研究者开始考虑用图卷积方法去思考这个问题
空域图卷积
谱域图卷积
既然2D图像有直接适用于图像结构的卷积方法,那么能不能直接设计出一种合理的适用于3D点云的卷积方法呢?
对于点云挑战,还有一个是鲁棒性问题
对于旋转不变性,有一些工作:
讲者在github上总结了点云深度学习领域工作的分类
讲者的工作: RS-CNN
他的研究motivation
方法的主要思想
几何不变性的实验
工作二:DensePoint
文章的motivation
考虑的思路:
实验效果结果,DensePoint对噪声点的鲁棒性有较好的效果。
讲者的展望:
Part2:PointAugment: an Auto-Augmentation Framework for Point Cloud Classification –李瑞辉
分享内容的框架
目前普遍使用的Data Augment(DA)方式
简单的数据增强方法的介绍
google在2019年CVPR出了该领域第一个paper做数据增强方法的分类和从数据自动判断增强方式
上述方法存在的主要问题:
基于对抗方式的自动数据增强
讲者的工作在于对点云数据做自动数据增强
motivation
传统的DA方式:Rotation, Scaling, Translation, jittering,这种处理方式是和training分开的。
讲者工作的主要流程思想,joint optimization可以动态调整augmentation sample的困难度。
上述的feature extraction是可以用现有任何方法去替换的,加下来基于PointNet给个简单例子
构建网络部分对于augment来说不是重点,关键在于如何训练,分类网络会告诉增强网络这个增强样本好还是不好,那么怎么定义好与不好?对于augmentor来说,没有GT,所以它更像一种自监督学习,这里给出两个requirement
讲者提出的solution,这是一种简单的版本,没有考虑到requirement(2)
接下来引入了一个动态调整的边界参数$\rho$,去调整增强样本的复杂度,刚开始的时候比较低,随着$\rho$增大,增强样本的复杂度增加。
实验验证设计的loss有效性,橘色的线是用pointnet++做的baseline
接下来是分类器的loss介绍,目的是为了让生成器和原始点云的Feature尽量接近
实验用到的数据集和实验效果,能够看到它在imbalance的数据集上提升更大。
鲁棒性的验证
自动数据增强的工作是从谷歌的19年文章出来后才慢慢引起注意