为什么神经网络如此强大？

fengzhimohan

2020-05-29

为什么神经网络如此强大？

普适逼近定理

众所周知，神经网络非常强大，可以将其用于几乎任何统计学习问题，而且效果很好。但是您是否考虑过为什么会这样? 为什么在大多数情况下此方法比许多其他算法更强大?

与机器学习一样，这有一个精确的数学原因。简而言之，神经网络模型描述的功能集非常大。但是描述一组功能意味着什么? 一组功能如何大? 这些概念乍一看似乎很难理解，但是可以正确定义它们，从而阐明为什么某些算法比其他算法更好的原因。

机器学习作为函数逼近

让我们以一个抽象的观点来阐述什么是机器学习问题。假设我们有数据集

为什么神经网络如此强大？

其中x⁽ᵏ⁾是数据点，y是与数据点相关的观测值。观测值y⁽ᵏ⁾可以是实数，甚至可以是概率分布(在分类的情况下)。任务只是找到一个函数f(x)，对于该函数f(x⁽ᵏ⁾)近似为y⁽ᵏ⁾。

为此，我们预先修复了参数化的功能系列，然后选择最适合的参数配置。例如，线性回归使用函数族

为什么神经网络如此强大？

作为参数的函数族，以a和b为参数。

如果我们假设有一个真实的基础函数g(x)描述了x⁽ᵏ⁾和y⁽ᵏ⁾之间的关系，则该问题可以表述为函数逼近问题。这将我们带入了美丽的近似理论技术领域。

近似理论入门

可能您一生中多次遇到指数函数。它的定义是

为什么神经网络如此强大？

其中e是著名的欧拉数。这是一个超越函数，基本上意味着您无法通过有限的多次加法和乘法来计算其值。但是，当您将其放入计算器时，您仍然会获得价值。该值仅是一个近似值，尽管对于我们的目的通常是足够的。实际上，我们有

为什么神经网络如此强大？

这是一个多项式，因此可以显式计算其值。 n越大，近似值越接近真实值。

逼近理论的中心问题是为这些问题提供数学框架。如果您有任何函数g(x)以及从计算方面更易于处理的函数族，那么您的目标就是找到一个与g足够接近的"简单"函数。本质上，近似理论搜索三个核心问题的答案。

什么是"足够接近"?
我可以(或应该)使用哪个函数系列来近似?
从给定的近似函数族中，哪一个确切的函数最适合?

别担心这些听起来是否有点抽象，因为接下来我们将研究神经网络的特殊情况。

神经网络作为函数逼近器

因此，让我们重申这个问题。我们有一个函数g(x)，它描述数据和观测值之间的关系。这不是确切已知的，仅对于某些值

为什么神经网络如此强大？

其中g(x⁽ᵏ⁾)=y⁽ᵏ⁾。我们的工作是找到一个f(x)

从数据中概括知识
并且在计算上可行。

如果我们假设所有数据点都在子集X中，则

为什么神经网络如此强大？

持有，我们想要一个数量最高准则的函数

为什么神经网络如此强大？

尽可能小。您可以通过绘制这些函数，为图形包围的区域着色并计算沿y轴的最大扩展区域来想象这个数量。

为什么神经网络如此强大？

即使我们不能评估g(x)的任意值，我们也应该始终在更广泛的意义上接近它，而不是要求f(x)仅适合已知数据点xₖ。

因此，给出了问题。问题是，我们应该使用哪一组函数进行近似?

具有单个隐藏层的神经网络

从数学上讲，具有单个隐藏层的神经网络定义为

为什么神经网络如此强大？

其中φ是非线性函数(称为激活函数)，例如S型函数

为什么神经网络如此强大？

和

为什么神经网络如此强大？

值x对应于数据，而wᵢ，bᵢ和vᵢ是参数。是功能家族

为什么神经网络如此强大？

足以近似任何合理的功能? 答案是肯定的!

普适逼近定理

为什么神经网络如此强大？

> The universal approximation theorem in its full glory :) Source: Cybenko, G. (1989) "Approximations by superpositions of sigmoidal functions", Mathematics of Control, Signals, and Systems, 2(4), 303–314.

1989年的一个著名结果被称为通用逼近定理，该结论指出，只要激活函数像S形函数且被逼近的函数是连续的，具有单个隐藏层的神经网络就可以根据需要精确地对其进行逼近。 (或使用机器学习术语进行学习。)

如果确切的定理似乎很困难，请不要担心，我将详细解释整个过程。 (实际上，我故意跳过了稠密之类的概念，以使说明更清晰，尽管不够精确。)

步骤1。假设要学习的函数是g(x)，它是连续的。让我们固定一个小的ε并在函数周围绘制一个ε宽的条纹。 ε越小，结果越好。

为什么神经网络如此强大？

第二步。 (最困难的部分。)找到表格的功能

为什么神经网络如此强大？

完全在条纹内该定理保证了这样的F(x)的存在，因此这个函数族被称为通用逼近器。这是神经网络的真棒，赋予它们真正的力量。

为什么神经网络如此强大？

但是，有几个警告。例如，该定理没有说出N，也就是隐藏层中神经元的数量。对于较小的ε，它可能非常大，从计算角度来看这是不利的。我们希望尽快计算预测，而计算100亿项之和绝对不好玩。

第二个问题是，即使该定理保证了一个良好的逼近函数的存在，也没有告诉我们如何找到它。尽管这可能令人惊讶，但这在数学中是非常典型的。我们有非常强大的工具来推断某些对象的存在，而又不能显式构造它们。 (有一所称为建构主义的数学学校，它拒绝纯粹的存在性证明，例如通用逼近定理的原始证明。但是，这个问题根深蒂固。如果不接受非构造性证明，我们甚至无法谈论无限集上的函数。)

但是，最大的问题是，在实践中，我们永远不会完全了解底层功能，而只会知道所观察到的内容：

为什么神经网络如此强大？

有无数种可能的配置可以很好地适合我们的数据。它们中的大多数可怕地概括为新数据。您肯定知道这种现象：这是可怕的过度拟合。

拥有权利的同时也被赋予了重大的责任

所以，这是东西。如果您有N个观测值，则可以找到一个非常适合您的观测值的N-1阶多项式。这没什么大不了的，您甚至可以使用Lagrange插值明确地写下该多项式。但是，它不会推广到任何新数据，实际上会很糟糕。下图展示了当我们尝试将大多项式拟合到一个小的数据集时会发生什么。

为什么神经网络如此强大？

神经网络也有同样的现象。这是一个巨大的问题，而通用逼近定理给我们关于如何克服这一问题的绝对零提示。

通常，功能族的表现力越高，就越容易过度拟合。拥有权利的同时也被赋予了重大的责任。这称为偏差方差折衷。对于神经网络，从权重的L1正则化到下降层，有很多方法可以缓解这种情况。但是，由于神经网络具有如此高的表现力，因此这个问题始终在后台隐约可见，需要不断关注。

超越万能逼近定理

机器学习神经网络模型

fengzhimohan

0 关注 0 粉丝 0 动态

相关推荐

机器学习的未来就在这里：高斯过程和神经网络是等价的

高斯进程已经存在了一段时间，但它只是在过去5-10年，有一个大的复苏，其兴趣。部分原因是求解的计算复杂：由于他们的模型需要矩阵反转，复杂性是 O，很难更快地获得。高斯过程最酷的特征之一是它们非常非常相似的神经网络。中央极限定理可以统一明显复杂的现象，在这

lemonade 2020-11-10

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 2020-11-02

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 2020-11-19

机器学习新风暴：如何用ML模型预测房价？

从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过去的数据预测未来的数据。机器学习大致分为两大类：监督学习和无监督学习。对此可以使

81510295 2020-11-17

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 2020-11-17

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 2020-11-16

LinkedIn开源Dagli，发布Java机器学习函数库

近年来，越来越多的优秀的机器学习工具不断涌现，如 TensorFlow、 PyTorch、 Caffee 和 CNTK、用于大规模数据的 Spark 和 Kubeflow，以及用于各种通用模型的 scikit-learn、 ML.NET 和最近的 Trip

lgblove 2020-11-16

关于机器学习算法的16个技巧

您可能听说过瑞士军刀。如果没有，请看下面的图片。它包含许多刀片和工具。每个人都专门从事一项特定的任务。在某些情况下，不同的刀片可以完成相同的任务，但性能不同。我将机器学习算法视为瑞士军刀。性能可能会根据任务和数据的特征而变化。例如，对数损失是与所有分类算法

Pokemogo 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 2020-11-16

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 2020-11-13

需要知识的后深度学习时代，如何高效自动构建知识图谱

前沿的知识图谱自动构建技术有哪些？这篇文章将逐一解答这些问题。二者展示的信息量是差不多的，但右边这种看起来更加直观。而且，随着文本篇幅的增长，这种优势会体现得更加明显。其中，图的节点代表现实世界中存在的“实体”，图的边则代表实体之间的“关系”。基于知识图谱

lizhengjava 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 2020-11-13

24个提高知识和技能极限的机器学习项目

数据科学项目为你提供了一种有前途的方式来启动你在该领域的职业。你不仅可以通过应用它来学习数据科学，还可以在自己的简历上展示一些项目！这是大多数人挣扎和错过的地方。另外，我们确保所有数据集都是开放的并且可以自由访问。它由中型和大型数据集组成，需要一些认真的模

EchoYY 2020-11-12

IT自动化和人工智能将在2021年走向何方？

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

CSDN人工智能头条 2020-11-11

无监督机器学习的重要指南

人们如今正处在数字化转型时代，只有一个不变的因素——进化。而组织采用的高科技解决方案正在引入数字化转型。因此，毫不奇怪的是，技术进步已完全取代了平凡的业务。因此，人们需要了解无监督机器学习在各行业中的广泛应用。如果用户标记了可以作为示例的训练数据，人们将其

mogigo00 2020-11-11

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

在数据领域，很多人都在说机器学习，但是只有很少的人能说清楚怎么回事。网上关于机器学习的文章，大多都是充斥各种定理的厚重学术三部曲，或是关于人工智能、数据科学魔法以及未来工作的天花乱坠的故事。尽管数据分析实际工作中用到机器学习的机会真的不多，但我觉得它仍是数

jaybeat 2020-11-10

理解AI：为什么要在人工智能系统中寻求可解释性呢？

本文转载自公众号“读芯术”。或许这是你第一次听到人工智能前面加“可解释的”这个形容词，但其实它的涵义你一定能理解。可解释的人工智能是指构建AI应用程序的技术和方法，人们借此以理解它们做出特定决策的原因。换句话说，如果我们可以从AI系统获得有关其内部逻辑的解

白飞飞Alan 2020-11-11

Python 用5行代码学机器学习—线性回归

我准备使用scikit-learn给大家介绍一些模型的基础知识，今天就来讲讲线性回归模型。开始之前，你要确保Python和pip已经成功安装在电脑上噢，如果没有，请访问这篇文章：超详细Python安装指南进行安装。如果你用Python的目的是数据分析，

机器学习之家 2020-11-10

fengzhimohan

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号