Relation-Shape CNN：以几何关系卷积推理点云3D形状

PandaJiong

2019-04-29

3D点云中相邻点的空间几何关系能够有区分性地表达其所隐含的3D形状。基于该先验，来自中科院自动化所模式识别国家重点实验室的研究者提出了Relation-Shape CNN，将经典的2D CNN拓展至3D点云领域进行几何关系学习，该方法在三个主流的点云分析任务上均实现了优秀的性能。此外，该方法不仅可以从点云中学习3D形状，还能从点云的2D投影空间中推理3D形状。

一、背景

近年来，3D 点云分析在自动驾驶和机器人等领域有着诸多的应用，因此得到了各界广泛的关注。主流的点云分析任务都需要对点云的 3D 形状进行高级别的理解，比如点云识别。但从不规则分布的 3D 点中很难推理学习其隐含的 3D 形状。随着以卷积神经网络（CNN）为代表的深度学习方法的兴起，大量的研究工作致力于将 CNN 在图像分析上的巨大成功复制到点云处理领域。然而由于点云数据的不规则性，经典的图像网格卷积难以适用。

一般来说，在点云上进行卷积学习主要面临三大挑战：

点云由无序的点集构成，因此卷积需要对点的输入顺序具有置换不变性。
点云分布于 3D 几何空间，因此卷积应当对点云的刚体变换具有鲁棒性，比如平移、旋转等。
点云形成一个隐含的形状，因此卷积得到的表征应当具备有区分力的「形状意识」。

本文提出 Relation-Shape CNN（RS-CNN）来缓解上述挑战。RS-CNN 的核心是从几何关系中推理学习 3D 形状，因为在本文看来，3D 点之间的几何关系能够有表现力的编码其隐含的形状信息。所提出的 RS-CNN 在点云分类、部件分割和法向估计三个任务上均达到了最佳水平。并且得益于对几何关系的建模，RS-CNN 能够自然地实现置换不变性以及刚体变换鲁棒性。为了验证 RS-CNN 的几何形状推理能力，本文还在 3D 点云的 2D 投影空间中做了测试，实验表明，RS-CNN 依然具备优秀的形状识别性能。

二、Relation-Shape CNN（RS-CNN）

Relation-Shape CNN：以几何关系卷积推理点云3D形状

RS-CNN 的基本卷积算子如图 2 所示。为了实现局部卷积归纳学习，我们将局部点云子集

Relation-Shape CNN：以几何关系卷积推理点云3D形状

建模为一个球形邻域，该邻域的中心点为采样点 xi，其余点作为 xi 的邻居点

Relation-Shape CNN：以几何关系卷积推理点云3D形状

。在该邻域上，我们构建了一个一般性的卷积操作方法：

Relation-Shape CNN：以几何关系卷积推理点云3D形状

其中 x 是三维点，f 是特征向量，dij 是点 xi 和 xj 的 3D 欧式距离，r 是球半径。卷积结果 f Psub 通过首先使用函数 τ 对邻域中每一个点进行特征变换，然后使用函数 A 聚集变换后的特征，最后经过非线性 σ 激活后获得。注意到仅当 A 是对称函数，并且函数 τ 对邻域中每一个点均共享参数时，f Psub 对输入点的顺序具有置换不变性。

在经典网格卷积中，特征变换函数实现为

Relation-Shape CNN：以几何关系卷积推理点云3D形状

其中 wj 为可学习的卷积权重，•表示按元素相乘。该卷积方法在点云数据上操作时会有两个缺陷：1）由于 wj 不共享参数，因此该卷积对输入点集不具备置换排列不变性。2）在反向传播中 wj 的梯度仅与孤立点 xj 相关，因此该卷积难以捕捉到点间关系。

为了克服上述问题，我们将卷积转换为从几何关系中学习。在方法上，我们将 wj 替换为 wij，并让 wij 从几何关系向量 hij 中学习一个高维的映射函数 M。hij 是预先定义的点 xi 和 xj 之间的几何先验。该过程可以描述为：

Relation-Shape CNN：以几何关系卷积推理点云3D形状

其中映射函数 M 的目标是从几何先验中学习一个高维的、有表现力的关系表达，以编码 3D 点集的空间布局，这里我们使用共享的多层感知器（MLP）实现映射函数 M。以这种方式，wj 巧妙地转换为 wij，它的梯度由预定义的几何先验 hij 决定，且与点 xi 和 xj 均几何相关。于是，公式（1）中的 f Psub 变为：

Relation-Shape CNN：以几何关系卷积推理点云3D形状

该卷积方法聚集了点 xi 和所有邻居点

Relation-Shape CNN：以几何关系卷积推理点云3D形状

之间的几何关系表达，因此可以对 3D 点的空间分布进行显式的推理，进而有区分力的反映其隐含的 3D 形状。其中几何先验 hij 可以灵活设置，因为映射函数 M 能将 hij 映射为高维的关系向量，以实现与特征 fxj 进行通道对齐。在经典图像 CNN 中，随着图像分辨率的降低，特征通道数会逐渐增加以提升表达能力。基于此，我们在 f Psub 上增加共享的 MLP 以实现通道提升映射。

Relation-Shape CNN：以几何关系卷积推理点云3D形状

图 3 为经典 2D 网格卷积的示意图。注意到 wj 总是隐含着 xi 和 xj 的一个固定位置关系，也就是说，wj 在学习过程中受到了限制，实际上编码了一种规则的网格关系。因此，我们所提出的关系卷积方法具有通用性，它也能够建模经典的 2D 栅格卷积。

Relation-Shape CNN：以几何关系卷积推理点云3D形状

图 4 展示了 RS-CNN 应用于点云分类和点云分割的网络框架。将所提出的几何关系卷积方法搭配均匀的点云下采样算法，可以很容易实现类似图像 CNN 的多层神经网络，相关操作简单高效。

三、实验

为了验证 RS-CNN 的有效性，我们在主流的点云分析任务上进行了测试，包括点云分类、部件分割和法向预测。ModelNet40 上的分类结果如表 1 所示，在仅使用 3D 坐标 xyz 和 1k 个稀疏点作为输入的情况下，RS-CNN 仍然实现了最佳分类效果。

Relation-Shape CNN：以几何关系卷积推理点云3D形状

ShapeNet part 上的分割效果如图 6 所示。尽管点云所形成的形状多种多样，并且很容易产生混淆，RS-CNN 依然可以准确地将部件分割出来。

Relation-Shape CNN：以几何关系卷积推理点云3D形状

ModelNet40 上的法向预测结果如图 7 所示。与 PointNet 以及 PointNet++相比，RS-CNN 可以取得更加准确的法向预测结果。尽管如此，RS-CNN 仍然难以有效推理棘手的形状，比如旋转楼梯以及错综复杂的植物。

Relation-Shape CNN：以几何关系卷积推理点云3D形状

公式（3）中的几何先验可以进行灵活地定义，我们在 ModelNet40 上测试了五个比较直观的例子，结果如表 6 所示。可以看到，仅仅使用 3D 欧式距离作为低维几何关系（model A），RS-CNN 依然能够取得 92.5% 的精度，这很让人印象深刻。此外，为了测试 RS-CNN 的几何形状推理能力，我们强制置零某一维的坐标值，即将 3D 点云投影到 2D 空间（model E，图 9），得到的分类精度均接近 92.2。这证明了 RS-CNN 不仅可以从 3D 点云中学习 3D 形状，还能从 2D 投影空间中推理 3D 形状。

Relation-Shape CNN：以几何关系卷积推理点云3D形状

Relation-Shape CNN：以几何关系卷积推理点云3D形状

为了验证所提出的几何关系卷积的鲁棒性，我们设置几何先验 hij 为 3D 欧式距离，然后在 ModelNet40 上进行鲁棒性测试，结果如表 7 所示。虽然几何关系 hij 能够做到旋转不变，但网络初始输入的特征 xyz 仍然会受到旋转的影响。针对这一问题，我们引入法向将每一个局部点集旋转到以法向和采样点确定的局部坐标系中，实现了旋转不变。但该旋转会给形状识别带来困难，因此分类精度会有所下降。

Relation-Shape CNN：以几何关系卷积推理点云3D形状

Relation-Shape CNN：以几何关系卷积推理点云3D形状

论文：Relation-Shape Convolutional Neural Network for Point Cloud Analysis

论文地址：https://arxiv.org/abs/1904.07601
项目主页：https://yochengliu.github.io/Relation-Shape-CNN/

摘要：点云分析非常具有挑战性，因为从一系列不规则点中很难捕捉其隐含的形状。在本文中，我们提出了 RS-CNN，即 Relation-ShapeConvolutionalNeuralNetwork，它致力于拓展经典的规则网格 CNN 至不规则的配置以进行点云分析。RS-CNN 的核心是从关系中学习，也就是学习 3D 点间的几何拓扑约束。具体来说，局部点集的卷积权重被转换为从几何先验中学习一个高维的关系表达，该几何先验由点集中的一个采样点和剩余点预先定义而来。这样，归纳后的局部卷积表示可以对 3D 点的空间布局进行显式的推理，进而获得有区分力的形状意识和良好的鲁棒性。使用该卷积可以搭建一个分层的架构 RS-CNN，以实现具有上下文形状意识的学习方法来进行点云分析。在具有挑战性的基准数据上，横跨三个任务的大量实验研究表明，RS-CNN 达到了当前最佳水平。

注：作者正在维护一个「点云处理最新论文集」项目，感兴趣的读者可查看以下链接：https://github.com/Yochengliu/awesome-point-cloud-analysis

卷积 cnn深度学习卷积神经网络

PandaJiong

0 关注 0 粉丝 0 动态

相关推荐

浅谈CNN和RNN

在上一篇文稿中主要对深度学习的基础做了一个阐述，对于其中的神经网络和BP算法进行额外的延伸与拓展。但作为日前最为火热的人工智能技术，掌握这些内容远远还不够。因为深度学习面临的实际问题往往不是线性可分的问题，有时甚至超出了分类的问题，这就必须对深度学习模型加

Site 2020-08-20

记初次调试CNN做文本向量表示

卷积操作在图像处理的领域应用广泛，图像做卷积处理有一个天然的好处，即：每个像素点的位置与相邻位置相对固定，也就是说，除了边缘，每一个节点都有相同数量的相邻节点。所以卷积操作相对容易。但是，随着文本表示的发展，用向量来表示文本的思想应用的越来越广泛深入。to

啸林 2020-07-04

9大主题卷积神经网络（CNN）的PyTorch实现

大家还记得这张图吗？深度系统介绍了 52 个目标检测模型，纵观 2013 年到 2020 年，从最早的 R-CNN、OverFeat 到后来的 SSD、YOLO v3 再到去年的 M2Det，新模型层出不穷，性能也越来越好！上文聚焦于源码和论文，对于各种卷

demm 2020-09-18

理解卷积神经网络中的自注意力机制

计算机视觉中的编解码结构的局限性以及提升方法。卷积神经网络广泛应用于深度学习和计算机视觉算法中。虽然很多基于CNN的算法符合行业标准，可以嵌入到商业产品中，但是标准的CNN算法仍然有局限性，在很多方面还可以改进。由于其简单和准确，该体系结构被广泛使用。顾名

sunxinyu 2020-09-17

Pytorch_第十篇_卷积神经网络（CNN）概述

卷积神经网络，简称CNN。卷积神经网络相比于人工神经网络而言更适合于图像识别、语音识别等任务。本文主要涉及卷积神经网络的概念介绍，首先介绍卷积神经网络相比于人工神经网络的优势，其次介绍卷积神经网络的基本结构，最后我们分别介绍神经网络的各个部件从而完整的了解

walegahaha 2020-08-15

第四周：卷积神经网络 part3

S. K. Roy, G. Krishna, S. R. Dubey, B. B. Chaudhuri HybridSN: Exploring 3-D–2-D CNN Feature Hierarchy for Hyperspectral Image Cl

cherry0 2020-08-15

一文了解卷积神经网络基础，建议收藏

今天给大家讲一下卷积神经网络，主要包括四个部分：卷积神经网络的历史、全连接层、卷积层和池化层。CNN的英文全称是Convolutional Neural Network，雏形是LeCun在1998年发明的LeNet网络结构。那么到底什么是神经网络呢？198

georgesale 2020-08-14

卷积神经网络中的参数共享/权重复制

参数共享或权重复制是深度学习中经常被忽略的领域。但是了解这个简单的概念有助于更广泛地理解卷积神经网络的内部。卷积神经网络能够使那些通过网络馈送的图像在进行仿射变换时具有不变性。这个特点提供了识别偏移图案、识别倾斜或轻微扭曲的图像的能力。仿射不变性的这些特征

fengzhimohan 2020-07-23

经典网络之NIN(Network in Network)

本篇博文主要讲解2014年ICLR的一篇非常牛逼的paper：《Network In Network》，过去一年已经有了好几百的引用量，这篇paper改进了传统的CNN网络，采用了少量的参数就松松击败了Alexnet网络，Alexnet网络参数大小是230

wenxuegeng 2020-06-14

【理论】适用于手机端目标检测的卷积神经网络方案

　　本文作者在工作中需要实现一种适用于手机端目标检测任务的神经网络，因此撰写这篇综述性报告，详细梳理目前手机端目标检测领域的神经网络应用现状。　　1959年，Hubel和Wiesel发现人类视觉系统中的可视皮层是采用分层机制处理信息的。受此启发，人们提出了

wenxuegeng 2020-06-08

14 深度学习-卷积

人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括语音识别、图像识别、机器人、自然语言处理、智能搜索和专家系统等。卷积神经网络也是通过一层一层的节点组织起来的。而对于卷积神经网络

cherry0 2020-06-06

基于深度卷积神经网络的图像风格迁移与神经涂鸦系统的设计与实现

本文中设计并实现了一款基于卷积神经网络的图像风格迁移系统，可以通过神经表示来分离和重组任意图像的内容与风格，为艺术图像的创建提供了新的算法与算法框架；本文中还实现了神经涂鸦系统作为风格迁移功能的补充，神经涂鸦系统通过使用语义注释及手动创建像素标签的方法提高

hnyzyty 2020-06-05

14深度学习-卷积

机器学习：一种实现人工智能的方法；机器学习都可以被精准地定义为：1、任务2、训练过程3、模型表现。　　全连接神经网络与卷积神经网络都是通过一层一层的节点组织起来的，和全连接神经网络一样，卷积神经网络中的每一个节点就是一个神经元；

hnyzyty 2020-06-03

机器学习12卷积神经网络

而对于卷积神经网络，相邻两层之间只有部分节点相连，为了展示每一层神经元的维度，一般会将每一层卷积层的节点组织成一个三维矩阵。因此，全连接神经网络和卷积神经网络的唯一区别就是神经网络相邻两层的连接方式。以digit0为例，进行手工演算。

wenxuegeng 2020-06-03

14 深度学习-卷积

人工智能是最早出现的，也是最大、最外侧的同心圆；其次是机器学习，稍晚一点；最内侧，是深度学习，当今人工智能大爆炸的核心驱动。而对于卷积神经网络，相邻两层之间只有部分节点相连，为了展示每一层神经元的维度，一般会将每一层卷积层的节点组织成一个三维矩阵。

walegahaha 2020-06-03

13.深度学习-卷积

它使得机器学习实现众多应用，拓展了人工智能的领域范畴，给人工智能能以璀璨未来。而对于卷积神经网络，相邻两层之间只有部分节点相连，为了展示每一层神经元的维度，一般会将每一层卷积层的节点组织成一个三维矩阵。类似的，全连接神经网络的损失函数以及参数的优化过

cherry0 2020-06-03

14深度学习-卷积

以digit0为例，进行手工演算。

georgesale 2020-06-02

14 深度学习-卷积

机器学习，一种实现人工智能的方法；机器学习都可以被精准地定义为：1、任务T；2、训练过程E；3、模型表现P；深度学习则是一种实现机器学习的技术；深度学习使得机器学习能够实现众多应用，并拓展了人工智能的领域范畴。以digit0为例，进行手工演算。

zhaorui0 2020-06-01

13.深度学习-卷积

机器学习，一种实现人工智能的方法；机器学习都可以精准地被定义为：1任务T；2.训练过程E;3.模型表现P。深度学习则是一种实现机器学习的技术；它适合处理大数据。而对于卷积神经网络，相邻两层之间只有部分节点相连，为了展示每一层神经元的维度，一般会将每一层卷积

kuankeTech 2020-06-01

手把手使用numpy搭建卷积神经网络

本文使用numpy实现卷积层和池化层，包括前向传播和反向传播过程。在具体描述之前，先对使用符号做定义。\表示第4层神经网络的激活值；\和\表示神经网络第5层的参数；\表示神经网络第l层的激活向量的第i个元素。\表示当前层神经网络的高度、宽度和通道数。填充情

hnyzyty 2020-05-12

第五讲卷积神经网络 - Resnet--cifar10

# residual_path为True时，对输入进行下采样，即用1x1的卷积核做卷积操作，保证x能和F维度相同，顺利相加。out = self.a2 # 最后输出的是两部分的和，即F+x或F+Wx,再过激活函数。def __init__: # block

georgesale 2020-05-10

第五讲卷积神经网络 --baseline

self.c1 = Conv2D(filters=6, kernel_size=(5, 5), padding=‘same‘) #卷积层。self.p1 = MaxPool2D(pool_size=(2, 2), strides=2, padding=‘s

hnyzyty 2020-05-08

使用Python+TensorFlow2构建基于卷积神经网络（CNN）的ECG心电信号识别分类（二）

目前，国际上公认的标准数据库包含四个，分别为美国麻省理工学院提供的MIT-BIH数据库、美国心脏学会提供的AHA数据库、欧共体CSE数据库、欧洲ST-T数据库。当前使用最广泛且被学术界普遍认可的据库为MIT-BIH心律失常数据库。MT-BIH心律失常数据库

hnyzyty 2020-05-05

使用Python+TensorFlow2构建基于卷积神经网络（CNN）的ECG心电信号识别分类（一）

本篇博客以及之后的一个系列，我将记录下我是如何从一个没学过信号处理，不懂什么是深度学习，没接触过心电信号的小白，一步步做出基于CNN的心电信号识别分类的过程。网络上关于ECG方面的相关博客内容不多，可以直接运行的相关代码也寥寥无几，这给初学者造成了很大的困

walegahaha 2020-05-05

卷积神经网络模型可解释性

缺乏可解释性仍然是在许多应用中采用深层模型的一个关键障碍。在这项工作中，明确地调整了深层模型，这样人类用户可以在很短的时间内完成他们预测背后的过程。具体地说，训练了深度时间序列模型，使得类概率预测具有较高的精度，同时被节点较少的决策树紧密地建模。使用直观的

wenxuegeng 2020-05-04

一位中国博士把整个CNN都给可视化了，每次卷积池化都清清楚楚

美国有线电视新闻网吗？每一个对AI抱有憧憬的小白，在开始的时候都会遇到CNN这个词。但每次，当小白们想了解CNN到底是怎么回事，为什么就能聪明的识别人脸、听辨声音的时候，就懵了，只好理解为玄学：。这个名叫CNN解释器在线交互可视化工具，把CNN拆开了揉碎了

玉来愈宏的随笔 2020-05-02

CNN卷积神经网络基础理论知识

说到卷积，就不得不提互相关\。卷积实质就是一种互相关运算，只不过要在进行互相关运算前，要把\上下左右进行翻转。即\的计算顺序是从左到右，从上到下，而\的顺序是从右到左，从下到上。卷积在数字图像处理中最重要的作用是进行特征提取。卷积神经网络是一类包含卷积计算

liqing 2020-04-19

【python实现卷积神经网络】全连接层实现

The expected input shape of the layer. For dense layers a single digit specifying. the number of features of the input. Must be

vs00ASPNET 2020-04-17

PandaJiong

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号