自动优化架构，这个算法能帮工程师设计神经网络

天岚量产机

2019-12-11

近日，NeurIPS 2019 近日在加拿大温哥华召开。腾讯 AI Lab 共 14 篇论文入选，位居国内企业前列。这也是腾讯 AI Lab 第四次参加 NeurIPS，会议期间，我们选取了一篇来自腾讯 AI Lab 的优秀论文进行解读。

在这篇由腾讯 AI Lab 主导，和华南理工大学合作完成的论文中，作者利用强化学习的方法学习了一种神经网络结构转换器。它能对任意的神经网络结构进行优化，将其转换为更紧凑、识别精度更高的结构。以下为论文的详细解读。

NAT: Neural Architecture Transformer for Accurate and Compact Architectures

论文链接：https://papers.nips.cc/paper/8362-nat-neural-architecture-transformer-for-accurate-and-compact-architectures.pdf

现有的深度神经网络结构要么是人工设计的，要么是通过神经网络结构搜索 (NAS) 方法自动搜索得到的。然而，这些网络结构可能包含许多冗余的计算操作，存在可优化的空间。为了实现网络结构的优化，作者提出了一个神经网络结构转换器（Neural Architecture Transformer，简称为 NAT）的方法。该方法可以用计算复杂度更低的计算操作代替网络结构中冗余的操作，从而实现性能提高的同时，保证不会引入额外的参数和计算量。

神经网络中的计算操作可以分为三类，即 S, N, O。其中，S 表示跳跃连接，N 表示为空连接（即两个节点之间没有连接），O 表示除了跳跃连接和空连接之外的其它操作（如：卷积、池化操作等）。显然，这三者计算量的大小顺序为：O>S>N。为了降低网络结构的计算复杂度，我们希望所学到的 NAT 用计算量更少的操作来代替原网络结构中的冗余操作。因此，NAT 遵循以下的转换规则：OàS, OàN, SàN。由于跳跃连接往往有助于提升模型的性能而且其引入的计算量非常少，因此 NAT 也允许 NàS。总之，NAT 的转换方案如下图所示。

自动优化架构，这个算法能帮工程师设计神经网络

具体来讲，对于任意一个服从分布p(·)的网络结构β，NAT 的目标为寻求找到，仅仅通过上述所允许的操作变化得到的，最优的结构α。这个优化问题可以写成：

自动优化架构，这个算法能帮工程师设计神经网络

其中：

R(α│β)=R(α,w_α )-R(β,w_β )，R(α,w_α ) 表示最优参数为 w_α的网络结构α在验证集合上的性能；
c(α)≤κ 是所得到的模型的计算开销的一个约束。

然而，直接获得最优的结构α是很困难的。因此，NAT 首先学习一个策略，然后从学到的策略中采样α，即α服从。为了学习策略π，我们解决以下优化问题：

自动优化架构，这个算法能帮工程师设计神经网络

为了解决该优化问题，作者采用了强化学习方法中的策略梯度方法。为此，需要构造一个合适的策略函数。由于网络结构β可以用 (X,A) 表示（其中 A 为邻接矩阵，X 为节点特征），来表示，作者在这里的策略π(α|β,θ) 采用了两层的图卷积神经网络（GCN），即：

自动优化架构，这个算法能帮工程师设计神经网络

其中，

自动优化架构，这个算法能帮工程师设计神经网络

此外文章采用了参数共享的方法来避免从头训练每个结构的参数。总体看来，优化思路就是对下面两步进行迭代优化：

1、更新神经网络参数 w，（利用了参数共享的思想）:

自动优化架构，这个算法能帮工程师设计神经网络

2、更新θ，（利用最大熵鼓励探索）:

自动优化架构，这个算法能帮工程师设计神经网络

其中第 2 步的流程示意图如下所示：

自动优化架构，这个算法能帮工程师设计神经网络

为了验证 NAT 的有效性，作者将 NAT 应用于人工设计的结构（如：VGG、ResNet、MobileNet）和 NAS 得到的结构（如：ENAS、DARTS、NAONet）。结果分别见表 1 和表 2 所示。

自动优化架构，这个算法能帮工程师设计神经网络

表 1. NAT 在人工设计的网络结构上的优化结果。

自动优化架构，这个算法能帮工程师设计神经网络

表 2. NAT 在 NAS 方法所得的网络结构上的优化结果。

从表 1 和表 2，可以观察到，在 ImageNet 数据集上，经过 NAT 优化后的模型都比原来的基准模型，在计算复杂度相近甚至更低的情况下，获得了更高的识别精度。

下面，对 NAT 优化后的模型结构进行可视化。图 1 和图 2 分别给出了 NAT 在人工和 NAS 所设计的网络结构上的优化结果。

自动优化架构，这个算法能帮工程师设计神经网络

图 1. NAT 在人工设计的网络结构上的优化结果。

如图 1 所示，对于人工设计的网络结构，NAT 引入额外的跳跃连接来提高识别精度。

自动优化架构，这个算法能帮工程师设计神经网络

图 2. NAT 在 NAS 设计的网络结构上的优化结果。

神经网络算法架构算法

天岚量产机

0 关注 0 粉丝 0 动态

相关推荐

74KB图片也高清，谷歌用神经网络打造图像压缩新算法

还在为图像加载犯愁吗？最新的好消息是，谷歌团队采用了一种GANs与基于神经网络的压缩算法相结合的图像压缩方式HiFiC，在码率高度压缩的情况下，仍能对图像高保真还原。而在与原图进行对比时，HiFiC所展现出来的还原效果仍然非常优秀。目前处于特殊时期，大量国

justaipanda 2020-09-07

神经网络内部长啥样？

神经网络就像“炼丹炉”一样，投喂大量数据，或许能获得神奇的效果。然而，这种情况下，神经网络其实成了“黑匣子”——具有一定的功能，但看不见是怎么起作用的。如果只做简单的图像分类，其实还好；但如果用在医学方向，对疾病进行预测，那么神经网络下的“判断”就不可轻信

雜貨鋪 2020-10-30

详解深度学习感知机原理

我们之前的机器学习专题已经结束了，我们把机器学习领域当中常用的算法、模型以及它们的原理以及实现都过了一遍。虽然还有一些技术，比如马尔科夫、隐马尔科夫、条件随机场等等没有涉及到。但是这些内容相比来说要弱一些，使用频率并不是非常高，我们就不一一叙述了，感兴趣的

深度学习大讲堂 2020-10-14

神经网络与人类思维间的深层关系

人工智能席卷了世界，所谓的“机器学习算法”已经渗透到现代技术各个可能的层面，它已成为义务而不是创新。有些人可能会争论，我们今天使用的机器学习算法是否足够自主到可以称为真正的AI，这个争论过于宽泛，并不是本文的重点。在这篇文章中，我试图探索神经网络与人类思维

walegahaha 2020-10-06

GraphSAGE图神经网络算法详解

GraphSAGE 是 17 年的文章了，但是一直在工业界受到重视，最主要的就是它论文名字中的两个关键词：inductive 和 large graph。今天我们就梳理一下这篇文章的核心思路，和一些容易被忽视的细节。最核心的就是利用图的结构信息，为每个 n

fengzhimohan 2020-09-09

用Python实现多层感知器神经网络

除非你能学习到一些东西，否则不要重复造轮子。我将介绍在Python中创建多层感知器神经网络的基本知识。感知器是神经网络的基本组成部分。感知器的输入函数是权重，偏差和输入数据的线性组合。激活函数是一种确保感知器“发射”或仅在达到一定输入水平后才激活的数学方法

zyhzyh 2020-09-08

令人着迷的无梯度神经网络优化方法

梯度下降是机器学习中最重要的思想之一：给定一些代价函数以使其最小化，该算法迭代地采取最大下降斜率的步骤，理论上在经过足够的迭代次数后才达到最小值。柯西于1847年首次发现，在1944年针对非线性优化问题在Haskell Curry上得到扩展，梯度下降已用

wenxuegeng 2020-08-03

神经网络之父Hinton再审视34年前的奠基性成果，欲在大脑中搜寻AI方法的“存在”

直到现在，几乎你听说过的每一个关于人工智能的进步，仍基于 30 年前的一篇阐述多层神经网络训练方法的论文演变而来。那就是 Geoffrey Hinton 在 1986 年写下的《Learning representations by back-propag

sunxinyu 2020-05-02

神经网络(三)：前馈神经网络(FNN)

2.非线性问题的三种解决方法：

cherry0 2020-05-01

反向传播神经网络（BP）

由题意输入变量取值范围为e={-2,-1,0,1,2}和ec={-2,-1,0,1,2}，则输入矢量有25种情况，分别如下所示：。选取较好的BP神经网络参数，包括隐含层节点个数、学习速率等。网络采用一个隐含层，假设其神经元节点个数为S1，则网络结构可写为2

walegahaha 2020-02-15

人工智能之卷积神经网络(CNN)

人工智能之机器学习主要有三大类:1)分类;2)回归;3)聚类。今天我们重点探讨一下卷积神经网络算法。随后，更多的科研工作者对该网络进行了改进。现在，CNN已经成为众多科学领域的研究热点之一，特别是在模式分类领域，由于该网络避免了对图像的复杂前期预处理，可以

wenxuegeng 2020-02-11

神经网络-前向算法

直观来看一波, 神经网络是咋样的.我们首先好奇的就是, 输入 --> 到输出是如何计算的, 看一波最简单的网络3层结构.Softmat: f -> [0.5, 0.3, 0.2] 将一个向量, "归一化" 的感觉。如何计算隐

wenxuegeng 2020-01-13

如何理解深度学习中的dropout正则化技术解决过拟合问题？

正文为了解决神经网络的过拟合问题，我们需要使用L2正则化，除了L2正则化解决过拟合的问题，还可以使用另外一个正则化方法——Dropout，我们下面详细介绍一个这个正则化的原理。这个神经网络存在着过拟合的问题，我们要使用dropout来解决这个过拟合问题，d

无风而起 2019-12-24

图神经网络的ImageNet？斯坦福开源百万量级OGB基准测试数据集

在满是「MNIST」这样的小数据里，图神经网络也需要「ImageNet」这样的大基准？近日，斯坦福大学的 Jure Leskovec 教授在 NeurlPS 2019 大会演讲中宣布开源 Open Graph Benchmark，这是迈向图神经网络建模统一

xxzz 2019-12-23

NeurIPS 2019 |自动优化架构，这个算法能帮工程师设计神经网络

近日，NeurIPS 2019 近日在加拿大温哥华召开。腾讯 AI Lab 共 14 篇论文入选，位居国内企业前列。这也是腾讯 AI Lab 第四次参加 NeurIPS，会议期间，我们选取了一篇来自腾讯 AI Lab 的优秀论文进行解读。在这篇由腾讯 AI

denwill 2019-12-11

可视化卷积神经网络的基础知识

它的灵感来自于诺贝尔奖得主Hubel和Wiesel在1962年出版的《Receptive fields, binocular interaction and functional architecture in the cat’s visual corte

panrenlong 2019-12-08

[ch04-03] 用神经网络解决线性回归问题

点击star加星不要吝啬，星越多笔者越努力。我们是首次尝试建立神经网络，先用一个最简单的单层单点神经元，如图4-4所示。下面，我们用这个最简单的线性回归的例子，来说明神经网络中最重要的反向传播和梯度下降的概念、过程以及代码实现。严格来说输入层在神经网络中并

georgesale 2019-12-06

再人工智能领域如何快速搭建一个运行良好的神经网络算法模型？

首先我们先初始一个神经网络模型，然后我们通过训练集误差来确定我们算法是否处于高偏差问题，如果确实处于高偏差的问题，那么我们此时要做的就是选择一个新的神经网络，比如更多的隐藏层或者隐藏单元的网络，或许你能找到一个更合适解决此问题的新的网络架构，要想找到一个新

天行九歌 2019-12-04

RNN循环神经网络学习——概述

　　循环神经网络的主要用途是处理和预测序列数据。循环神经网络最初就是为了刻画一个序列当前的输出与之前信息的关系。也就是说，循环神经网络的隐藏层之间的节点是有连接的，隐藏层的输入不仅包含输入层的输出，还包括上一时刻隐藏层的输出。RNN当前的状态是由上一时刻的

cherry0 2019-12-01

一文搞懂神经网络

人工智能是这几年非常火的技术，上至九十九下至刚会走都对人工智能或多或少的了解。这篇文章没有数学公式、没有代码，旨在帮助读者快速掌握神经网络的核心知识。delta 是一种监督规则，每当向神经网络发送一种学习模式时都会调用它，这种情况被称为循环。感知器感知器

雜貨鋪 2019-11-19

天岚量产机

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号