深度学习在点云识别中的应用

深度学习在点云识别中的应用

主讲人一：刘永成，中科院自动化所在读博士，研究兴趣为3D点云处理、图像分割、多标签图像分类等。https://yochengliu.github.io/

主讲人二：李瑞辉，香港中文大学计算机系在读博士，研究兴趣为三维点云处理、三维重建等。https://liuruihui.github.io/

Part 1：深度学习在点云识别中的应用 –刘永成

本次分享主要以思想和方法性内容为主，不涉及具体实现细节。

本次分享的内容框架，Brief review主要是介绍到2019年8月份的该领域进展。

3D表示有多视角+2D CNN(存在自遮挡和多图消耗资源的不足)、体素化表格(受制于划分精度)+3D CNN、mesh（有点和边）+DL(GNN)、图像深度(2.5维)+CNN和纯点云+DL(GNN&CNN)。基于纯点云数据是目前比较open的问题

点云的优势

基于纯点云数据的任务类型

点云的数据集介绍。其中PartNet对未来机器人领域的推动性会比较大

场景类型的点云数据集：

对于纯点云数据来说存在的一些挑战：Irregular(unordered)、robustness to geometric transformation、robustness to corruption, outlier,noise, partial data and large-scal data

接下来综述一下最近的工作

首先致敬PointNet

PointNet++改进PointNet无法提取局部领域信息的不足

后续很多工作都是在PointNet和PointNet++基础上做的。

之前的方法都多用到了手动处理(Voxel或投射)和超参设置的过程，接下来介绍用自动学习的方法去思考

还有一些其他思路的方法

有些研究者开始考虑用图卷积方法去思考这个问题

空域图卷积

谱域图卷积

既然2D图像有直接适用于图像结构的卷积方法，那么能不能直接设计出一种合理的适用于3D点云的卷积方法呢？

对于点云挑战，还有一个是鲁棒性问题

对于旋转不变性，有一些工作：

讲者在github上总结了点云深度学习领域工作的分类

讲者的工作： RS-CNN

他的研究motivation

方法的主要思想

几何不变性的实验

工作二：DensePoint

文章的motivation

考虑的思路：

实验效果结果，DensePoint对噪声点的鲁棒性有较好的效果。

讲者的展望：

Part2：PointAugment: an Auto-Augmentation Framework for Point Cloud Classification –李瑞辉

分享内容的框架

目前普遍使用的Data Augment(DA)方式

简单的数据增强方法的介绍

google在2019年CVPR出了该领域第一个paper做数据增强方法的分类和从数据自动判断增强方式

上述方法存在的主要问题：

基于对抗方式的自动数据增强

讲者的工作在于对点云数据做自动数据增强

motivation

传统的DA方式：Rotation, Scaling, Translation, jittering，这种处理方式是和training分开的。

讲者工作的主要流程思想，joint optimization可以动态调整augmentation sample的困难度。

上述的feature extraction是可以用现有任何方法去替换的，加下来基于PointNet给个简单例子

构建网络部分对于augment来说不是重点，关键在于如何训练，分类网络会告诉增强网络这个增强样本好还是不好，那么怎么定义好与不好？对于augmentor来说，没有GT，所以它更像一种自监督学习，这里给出两个requirement

讲者提出的solution，这是一种简单的版本，没有考虑到requirement(2)

接下来引入了一个动态调整的边界参数$\rho$，去调整增强样本的复杂度，刚开始的时候比较低，随着$\rho$增大，增强样本的复杂度增加。

实验验证设计的loss有效性，橘色的线是用pointnet++做的baseline

接下来是分类器的loss介绍，目的是为了让生成器和原始点云的Feature尽量接近

实验用到的数据集和实验效果，能够看到它在imbalance的数据集上提升更大。

鲁棒性的验证

自动数据增强的工作是从谷歌的19年文章出来后才慢慢引起注意