神经网络内部长啥样？

雜貨鋪

2020-10-30

神经网络就像“炼丹炉”一样，投喂大量数据，或许能获得神奇的效果。

“炼丹”成功后，神经网络也能对没见过的数据进行预测了~

然而，这种情况下，神经网络其实成了“黑匣子”——具有一定的功能，但看不见是怎么起作用的。

如果只做简单的图像分类，其实还好；但如果用在医学方向，对疾病进行预测，那么神经网络下的“判断”就不可轻信。

如果能了解它是怎么工作的，就更好了。

出于这种考虑，来自牛津大学的博士生Oana-Maria Camburu撰写了毕业论文《解释神经网络（Explaining Deep Neural Networks）》。

在这篇论文中，她将这些“黑匣子”一个个打开，对神经网络原理进行了详细的解释。

为什么要打开神经网络“黑匣子”？

事实上，神经网络之所以起作用，最直观的原因就是，它由大量非线性函数组成。

神经网络内部长啥样？

这些非线性函数，使得网络可以学习原始数据中各种抽象级特征。

然而，也正是因为神经网络中的这些非线性函数，使得人类往往难以理解，它们是如何起作用的。

这就导致神经网络在疾病预测、信用额度、刑法等方向上“不太受欢迎”。

医生和法律相关的研究者往往更乐意采用可解释模型，例如线性回归、决策树，因为神经网络在疾病预测中的确出过问题：

人们利用神经网络预测肺炎患者的病情发展，其中一项患者特征为是否有哮喘病史。

神经网络内部长啥样？

神经网络经过训练后预测，有哮喘病史的患者死于肺炎的可能性较低。

但其实结果恰好相反，哮喘本身会给肺炎带来雪上加霜的效果。

之所以数据表明哮喘患者较少死于肺炎，往往是因为哮喘能被及早发现，所以患者得肺炎后能被及早治疗。

如果这种神经网络被应用于实践中，将会带来非常危险的结果。

此外，即使是神经网络，也会对男女性别产生刻板印象、产生种族偏见。

神经网络内部长啥样？

例如，调查表明，有些语料库和模型，在预测再犯时，会更“偏爱”男性。

除了错误的预测和种族、性别歧视以外，神经网络还很脆弱。

无论是对图像进行小改动欺骗分类算法、还是用语音识别瞒过NLP模型，神经网络被“爆雷”的情况也不少。

为了让神经网络应用于更多的方向，也为了让我们更好地学习它的原理，作者从两个方向对神经网络进行了解释。

2 种方法解释神经网络

“事后再解释”

第一种方法，称之为基于特征的解释方法，又叫“事后再解释”——因为这种方法，是在神经网络训练好后，才对其输入特征进行解释的。

这种方法针对文本的词（token）、或是针对图像的超像素（super pixels），进行“事后”解释。

神经网络内部长啥样？

目前这种方法应用较为普遍，不容易出现解释偏见，但需要验证解释方法的真实性。

这里的根本原理，是研究外部解释方法给出的解释、与模型本身生成的自然语言解释之间，是否存在相关性，而相关性具体又是什么。

在论文中，作者引入了一种新的验证方法，来判断解释方法的真实性。

让神经网络自己解释

那么，如果能让神经网络一边训练、一边“解释自己”呢？

这是论文提到的第二种方法，即在模型中植入一个生成预测解释的模块，对预测的结果进行解释。

神经网络内部长啥样？

至于神经网络对自己的解释是否正确，还需要人为进行判断。

在这里面，作者同样引入了一种判断方法，对模型自己生成的解释进行判断，从而得出神经网络解释的结果。

神经网络算法 text-align

雜貨鋪

0 关注 0 粉丝 0 动态

相关推荐

详解深度学习感知机原理

我们之前的机器学习专题已经结束了，我们把机器学习领域当中常用的算法、模型以及它们的原理以及实现都过了一遍。虽然还有一些技术，比如马尔科夫、隐马尔科夫、条件随机场等等没有涉及到。但是这些内容相比来说要弱一些，使用频率并不是非常高，我们就不一一叙述了，感兴趣的

深度学习大讲堂 2020-10-14

神经网络与人类思维间的深层关系

人工智能席卷了世界，所谓的“机器学习算法”已经渗透到现代技术各个可能的层面，它已成为义务而不是创新。有些人可能会争论，我们今天使用的机器学习算法是否足够自主到可以称为真正的AI，这个争论过于宽泛，并不是本文的重点。在这篇文章中，我试图探索神经网络与人类思维

walegahaha 11评论 2020-10-06

GraphSAGE图神经网络算法详解

GraphSAGE 是 17 年的文章了，但是一直在工业界受到重视，最主要的就是它论文名字中的两个关键词：inductive 和 large graph。今天我们就梳理一下这篇文章的核心思路，和一些容易被忽视的细节。最核心的就是利用图的结构信息，为每个 n

fengzhimohan 2020-09-09

用Python实现多层感知器神经网络

除非你能学习到一些东西，否则不要重复造轮子。我将介绍在Python中创建多层感知器神经网络的基本知识。感知器是神经网络的基本组成部分。感知器的输入函数是权重，偏差和输入数据的线性组合。激活函数是一种确保感知器“发射”或仅在达到一定输入水平后才激活的数学方法

zyhzyh 2020-09-08

74KB图片也高清，谷歌用神经网络打造图像压缩新算法

还在为图像加载犯愁吗？最新的好消息是，谷歌团队采用了一种GANs与基于神经网络的压缩算法相结合的图像压缩方式HiFiC，在码率高度压缩的情况下，仍能对图像高保真还原。而在与原图进行对比时，HiFiC所展现出来的还原效果仍然非常优秀。目前处于特殊时期，大量国

justaipanda 2020-09-07

令人着迷的无梯度神经网络优化方法

梯度下降是机器学习中最重要的思想之一：给定一些代价函数以使其最小化，该算法迭代地采取最大下降斜率的步骤，理论上在经过足够的迭代次数后才达到最小值。柯西于1847年首次发现，在1944年针对非线性优化问题在Haskell Curry上得到扩展，梯度下降已用

wenxuegeng 2020-08-03

神经网络之父Hinton再审视34年前的奠基性成果，欲在大脑中搜寻AI方法的“存在”

直到现在，几乎你听说过的每一个关于人工智能的进步，仍基于 30 年前的一篇阐述多层神经网络训练方法的论文演变而来。那就是 Geoffrey Hinton 在 1986 年写下的《Learning representations by back-propag

sunxinyu 2020-05-02

神经网络(三)：前馈神经网络(FNN)

2.非线性问题的三种解决方法：

cherry0 2020-05-01

反向传播神经网络（BP）

由题意输入变量取值范围为e={-2,-1,0,1,2}和ec={-2,-1,0,1,2}，则输入矢量有25种情况，分别如下所示：。选取较好的BP神经网络参数，包括隐含层节点个数、学习速率等。网络采用一个隐含层，假设其神经元节点个数为S1，则网络结构可写为2

walegahaha 2020-02-15

人工智能之卷积神经网络(CNN)

人工智能之机器学习主要有三大类:1)分类;2)回归;3)聚类。今天我们重点探讨一下卷积神经网络算法。随后，更多的科研工作者对该网络进行了改进。现在，CNN已经成为众多科学领域的研究热点之一，特别是在模式分类领域，由于该网络避免了对图像的复杂前期预处理，可以

wenxuegeng 2020-02-11

神经网络-前向算法

直观来看一波, 神经网络是咋样的.我们首先好奇的就是, 输入 --> 到输出是如何计算的, 看一波最简单的网络3层结构.Softmat: f -> [0.5, 0.3, 0.2] 将一个向量, "归一化" 的感觉。如何计算隐

wenxuegeng 2020-01-13

如何理解深度学习中的dropout正则化技术解决过拟合问题？

正文为了解决神经网络的过拟合问题，我们需要使用L2正则化，除了L2正则化解决过拟合的问题，还可以使用另外一个正则化方法——Dropout，我们下面详细介绍一个这个正则化的原理。这个神经网络存在着过拟合的问题，我们要使用dropout来解决这个过拟合问题，d

无风而起 2019-12-24

图神经网络的ImageNet？斯坦福开源百万量级OGB基准测试数据集

在满是「MNIST」这样的小数据里，图神经网络也需要「ImageNet」这样的大基准？近日，斯坦福大学的 Jure Leskovec 教授在 NeurlPS 2019 大会演讲中宣布开源 Open Graph Benchmark，这是迈向图神经网络建模统一

xxzz 2019-12-23

NeurIPS 2019 |自动优化架构，这个算法能帮工程师设计神经网络

近日，NeurIPS 2019 近日在加拿大温哥华召开。腾讯 AI Lab 共 14 篇论文入选，位居国内企业前列。这也是腾讯 AI Lab 第四次参加 NeurIPS，会议期间，我们选取了一篇来自腾讯 AI Lab 的优秀论文进行解读。在这篇由腾讯 AI

denwill 2019-12-11

自动优化架构，这个算法能帮工程师设计神经网络

近日，NeurIPS 2019 近日在加拿大温哥华召开。腾讯 AI Lab 共 14 篇论文入选，位居国内企业前列。这也是腾讯 AI Lab 第四次参加 NeurIPS，会议期间，我们选取了一篇来自腾讯 AI Lab 的优秀论文进行解读。在这篇由腾讯 AI

天岚量产机 2019-12-11

可视化卷积神经网络的基础知识

它的灵感来自于诺贝尔奖得主Hubel和Wiesel在1962年出版的《Receptive fields, binocular interaction and functional architecture in the cat’s visual corte

panrenlong 2019-12-08

[ch04-03] 用神经网络解决线性回归问题

点击star加星不要吝啬，星越多笔者越努力。我们是首次尝试建立神经网络，先用一个最简单的单层单点神经元，如图4-4所示。下面，我们用这个最简单的线性回归的例子，来说明神经网络中最重要的反向传播和梯度下降的概念、过程以及代码实现。严格来说输入层在神经网络中并

georgesale 2019-12-06

再人工智能领域如何快速搭建一个运行良好的神经网络算法模型？

首先我们先初始一个神经网络模型，然后我们通过训练集误差来确定我们算法是否处于高偏差问题，如果确实处于高偏差的问题，那么我们此时要做的就是选择一个新的神经网络，比如更多的隐藏层或者隐藏单元的网络，或许你能找到一个更合适解决此问题的新的网络架构，要想找到一个新

天行九歌 2019-12-04

RNN循环神经网络学习——概述

　　循环神经网络的主要用途是处理和预测序列数据。循环神经网络最初就是为了刻画一个序列当前的输出与之前信息的关系。也就是说，循环神经网络的隐藏层之间的节点是有连接的，隐藏层的输入不仅包含输入层的输出，还包括上一时刻隐藏层的输出。RNN当前的状态是由上一时刻的

cherry0 2019-12-01

一文搞懂神经网络

人工智能是这几年非常火的技术，上至九十九下至刚会走都对人工智能或多或少的了解。这篇文章没有数学公式、没有代码，旨在帮助读者快速掌握神经网络的核心知识。delta 是一种监督规则，每当向神经网络发送一种学习模式时都会调用它，这种情况被称为循环。感知器感知器

雜貨鋪 2019-11-19

雜貨鋪

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号