神经网络的激活函数为什么要使用非线性函数？

aaJamesJones

2019-11-04

神经网络的激活函数为什么要使用非线性函数？

有人说这曾经是一道面试题！
我没说过这句话，但是感觉挺有道理 --- 鲁迅

▍什么是激活函数

在神经元中，输入的inputs通过加权求和，然后被作用了一个函数，这个函数就是激活函数 Activation Function。激活函数在神经网络中的位置如图所示：
神经网络的激活函数为什么要使用非线性函数？

▍为什么要用非线性函数

要解释这个问题，可以反过来思考一下，为什么激活函数不能使用线性函数。
如果使用线性函数，每一层输出都是上层输入的线性函数，无论神经网络有多少层，输出都是输入的线性组合。加深神经网络的层数就没有什么意义了。线性函数的问题在于不管加深层数到多少，总是存在与之等效的「无隐藏层」的神经网络。为了稍微直观的理解这一点，考虑下面一个简单的例子。

存在一个线性函数f(x)=kx(k≠0)作为激活函数，将y=f(f(f(x)))对应三层的神经网络。很明显可以想到同样的处理可以由y=ax(a=k^3)，一个没有隐藏层的神经网络来表示。该例子仅仅是一个近似，实际中的神经网络的运算要比这个例子复杂很多，但不影响结论的成立。也就是说，使用线性激活函数时，无法发挥多层网络带来的优势。

相反如果使用非线性函数，激活函数给神经元引入了非线性因素，使得神经网络可以任意逼近任何非线性函数，这样神经网络就可以应用到众多的非线性模型中。

以上！

神经网络的激活函数为什么要使用非线性函数？

神经网络模型非线性

aaJamesJones

0 关注 0 粉丝 0 动态

相关推荐

机器学习的未来就在这里：高斯过程和神经网络是等价的

高斯进程已经存在了一段时间，但它只是在过去5-10年，有一个大的复苏，其兴趣。部分原因是求解的计算复杂：由于他们的模型需要矩阵反转，复杂性是 O，很难更快地获得。高斯过程最酷的特征之一是它们非常非常相似的神经网络。中央极限定理可以统一明显复杂的现象，在这

lemonade 12评论 2020-11-10

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 14评论 2020-11-02

【干货】图神经网络的十大学习资源分享

本文转自雷锋网，如需转载请至雷锋网官网申请授权。图神经网络是深度学习的一个相对较新的领域，从最近开始越来越流行。Twitter、Google或Facebook等大公司都会开始对于GNN投入研究，事实证明了GNN优于其他使用图数据的机器学习模型。由于此领域的

walegahaha 2020-10-20

神经网络：高深莫测又妙趣横生的完整历史！

在翻阅各种资料之后，我对神经网络的历史深深入迷了。这是个非常有趣的研究主题，我从中获得了不少快乐。自上个世纪以来，神经网络和人工智能一直是热门话题。在流行文化电影中，人工智能机器人风靡全球，吸引着大量猎奇之士。神经网络的灵感来源于生物神经元是一种受编程范式

WFRainn 2020-10-19

建神经网络模型，哪种优化算法更好？35000次测试告诉你

想要优化自己的神经网络，却不知道哪种优化器更适合自己？又或者，想知道深度学习中梯度下降的算法到底都有哪些？现在，最全面的优化算法分析来了。它整理了自1964年以来，几乎所有的优化方法，将它们进行了分类。此外，它还给出了几种基准测试方法，并用它分析了1344

WhiteHacker 2020-10-14

图神经网络快速爆发，最新进展都在这里了

近年来，图神经网络发展迅速，最近的会议上发表了大量相关的研究论文。本文作者正在整理一个GNN的简短介绍和最新研究报告的摘要。希望这对任何准备进入该领域或试图赶上最新技术进展的人有所帮助。在典型的GNN中，消息传递是由边在相邻节点之间上执行的。在任何神经层，

雜貨鋪 2020-10-13

神经网络“炼丹炉”内部构造长啥样？牛津大学博士小姐姐论文解读

神经网络就像“炼丹炉”一样，投喂大量数据，或许能获得神奇的效果。然而，这种情况下，神经网络其实成了“黑匣子”——具有一定的功能，但看不见是怎么起作用的。如果只做简单的图像分类，其实还好；但如果用在医学方向，对疾病进行预测，那么神经网络下的“判断”就不可轻信

zyhzyh 2评论 2020-10-09

2019年Philip S. Yu团队的图神经网络综述

使用graph来表示对象之间的复杂关系和依赖关系，然而graph数据的复杂已有的机器学习算法很难处理，所以使用深度学习方法来处理。此外还讨论图神经网络跨各种领域的应用、总结开源代码、数据集和图神经网络评价指标。最后给出可能的研究方向。然而graph与图像不

cherry0 2020-09-23

9大主题卷积神经网络（CNN）的PyTorch实现

大家还记得这张图吗？深度系统介绍了 52 个目标检测模型，纵观 2013 年到 2020 年，从最早的 R-CNN、OverFeat 到后来的 SSD、YOLO v3 再到去年的 M2Det，新模型层出不穷，性能也越来越好！上文聚焦于源码和论文，对于各种卷

demm 2020-09-18

什么时候以及为什么基于树的模型可以超过神经网络模型？

基于树的模型和神经网络其实并没有太多的不同。神经网络通常被认为是机器学习的圣杯，无所不知，解决一切问题，主要是因为它们很复杂。虽然它们看起来如此不同，但它们只是一枚硬币的两面。任何Kaggler都知道XGBoost是到目前为止最受欢迎的最佳竞赛提交选择。决

zhaoyin 2020-09-16

当支持向量机遇上神经网络：SVM、GAN距离之间的关系

SVM 是机器学习领域的经典算法之一。给定一组训练实例，每个训练实例被标记为属于两个类别中的一个或另一个，SVM 训练算法创建一个将新的实例分配给两个类别之一的模型，使其成为非概率二元线性分类器。SVM 模型将实例表示为空间中的点，这样映射就使得单独类别的

绝望的乐园 2020-09-02

浅谈CNN和RNN

在上一篇文稿中主要对深度学习的基础做了一个阐述，对于其中的神经网络和BP算法进行额外的延伸与拓展。但作为日前最为火热的人工智能技术，掌握这些内容远远还不够。因为深度学习面临的实际问题往往不是线性可分的问题，有时甚至超出了分类的问题，这就必须对深度学习模型加

Site 2020-08-20

图神经网络的究竟有多强大？道翰天琼认知智能机器人平台API接口大脑为您揭秘。

图神经网络的究竟有多强大？道翰天琼认知智能机器人平台API接口大脑为您揭秘。认知智能CI机器人是杭州道翰天琼智能科技有限公司旗下产品。具有突破性，创新性，领航性。认知智能机器人技术体系更加先进，更加智能，是新一代智能，认知智能领域世界范围内唯一的认知智能机

CristianoJason 2020-08-19

谷歌用算力爆了一篇论文，解答有关无限宽度网络的一切

无限宽度神经网络是近来一个重要的研究课题，但要通过实证实验来探索它们的性质，必需大规模的计算能力才行。近日，谷歌大脑公布的一篇论文介绍了他们在有限和无限神经网络方面的系统性探索成果。该研究通过大规模对比实验得到了 12 条重要的实验结论并在此过程中找到了一

cetrolchen 2020-08-18

Pytorch_第十篇_卷积神经网络（CNN）概述

卷积神经网络，简称CNN。卷积神经网络相比于人工神经网络而言更适合于图像识别、语音识别等任务。本文主要涉及卷积神经网络的概念介绍，首先介绍卷积神经网络相比于人工神经网络的优势，其次介绍卷积神经网络的基本结构，最后我们分别介绍神经网络的各个部件从而完整的了解

walegahaha 2020-08-15

一文了解卷积神经网络基础，建议收藏

今天给大家讲一下卷积神经网络，主要包括四个部分：卷积神经网络的历史、全连接层、卷积层和池化层。CNN的英文全称是Convolutional Neural Network，雏形是LeCun在1998年发明的LeNet网络结构。那么到底什么是神经网络呢？198

georgesale 2020-08-14

用神经网络给照片补光，谷歌这项研究却实现了「鬼片」效果

打光是图像处理过程中的重要步骤，打光的好坏可能会影响整体效果的展示。打光方法也各有不同，MIT、谷歌等的一项新研究另辟蹊径，通过神经光传输方法进行图像的二次打光和视图合成，实现了相当不错的效果。图像合成早已不是新鲜话题，但是「打光」可是所有照片的难题。对于

XiaotingCheng 2020-08-13

图神经网络越深，表现就一定越好吗？

数十层甚至数百层神经网络的应用，是深度学习的重要标志之一。但现实情况却远非如此：比如今年被视作机器学习领域最火热的研究方向之一——图神经网络，大多数都只运用了寥寥几层网络。众所周知，深度图神经网络的训练过程非常艰难。近日来，人们致力于解决图神经网络中的深度

码猿同学 2020-08-07

73岁Hinton老爷子构思下一代神经网络：属于无监督对比学习

在近期举行的第 43 届国际信息检索年会上，Geoffrey Hinton 做了主题为《The Next Generation of Neural Networks》的报告。Geoffrey Hinton 是谷歌副总裁、工程研究员，也是 Vector

白飞飞Alan 2020-07-29

人工智能迁移学习如何工作在AI模型和培训过程起到那些作用

如今，人工智能程序可以识别照片和视频中的面部和物体，实时转录音频，提前数年通过X射线扫描检测癌症，并在某些最复杂的游戏中与人类竞争。幸运的是，转移学习是一种使用从一种训练有素的AI模型获得的知识到另一种知识的学科，可以帮助解决这些问题。例如，基本模型可能无

AI启蒙研究院 2020-07-23

aaJamesJones

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号