深度神经网络 DNN

georgesale

2020-06-09

深度神经网络（Deep Neural Networks，以下简称DNN）是深度学习的基础，而要理解DNN，首先我们要理解DNN模型，下面我们就对DNN的模型与前向传播算法做一个总结。

https://zhuanlan.zhihu.com/p/29815081

??

1 从感知机到神经网络

??

感知机的模型，它是一个有若干输入和一个输出的模型，如下图:

深度神经网络 DNN

输出和输入之间学习到一个线性关系，得到中间输出结果：

深度神经网络 DNN

接着是一个神经元激活函数：

深度神经网络 DNN

从而得到想要的结果1或者-1.

??

这个模型只能用于二元分类，且无法学习比较复杂的非线性模型，因此在工业界无法使用。而神经网络则在感知机的模型上做了扩展，总结下主要有三点：

??

（1）加入了隐藏层，隐藏层可以有多层，增强模型的表达能力，如下图实例，当然增加了这么多隐藏层模型的复杂度也增加了好多。

深度神经网络 DNN

??

（2）输出层的神经元也可以不止一个输出（输出层有多个神经元），可以有多个输出，这样模型可以灵活的应用于分类回归，以及其他的机器学习领域比如降维和聚类等。多个神经元输出的输出层对应的一个实例如下图，输出层现在有4个神经元了。

深度神经网络 DNN

??

深度神经网络 DNN

深度神经网络 DNN

还有后来出现的tanh, softmax,和ReLU等。通过使用不同的激活函数，神经网络的表达能力进一步增强。

??

??

??

2 DNN的基本结构

??

神经网络是基于感知机的扩展，而DNN可以理解为有很多隐藏层的神经网络。多层神经网络和深度神经网络DNN其实也是指的一个东西，DNN有时也叫做多层感知机（Multi-Layer perceptron,MLP）。

??

从DNN按不同层的位置划分，DNN内部的神经网络层可以分为三类，输入层，隐藏层和输出层,如下图示例，一般来说第一层是输入层，最后一层是输出层，而中间的层数都是隐藏层。

深度神经网络 DNN

层与层之间是全连接的，也就是说，第i层的任意一个神经元一定与第i+1层的任意一个神经元相连。虽然DNN看起来很复杂，但是从小的局部模型来说，还是和感知机一样，即一个线性关系：

深度神经网络 DNN

深度神经网络 DNN

??

深度神经网络 DNN

??

深度神经网络 DNN

深度神经网络 DNN

??

深度神经网络 DNN

深度神经网络 DNN

??

??

??

3 DNN前向传播算法数学原理

??

深度神经网络 DNN

深度神经网络 DNN

??

深度神经网络 DNN

??

深度神经网络 DNN

??

所谓的DNN前向传播算法就是利用若干个权重系数矩阵W,偏倚向量b来和输入值向量x进行一系列线性运算和激活运算，从输入层开始，一层层的向后计算，一直到运算到输出层，得到输出结果为值。

??

深度神经网络 DNN

??

深度神经网络 DNN

深度神经网络 DNN

??

??

??

5 DNN的反向传播算法

??

5.1要解决的问题：

深度神经网络 DNN

??

深度神经网络 DNN

??

可以用一个合适的损失函数来度量训练样本的输出损失，接着对这个损失函数进行优化求最小化的极值，对应的一系列线性系数矩阵W,偏置向量b即为我们的最终结果。在DNN中，损失函数优化极值求解的过程最常见的一般是通过梯度下降法来一步步迭代完成的，也可以是其他的迭代方法比如牛顿法与拟牛顿法。

??

5.2反向传播算法的基本思路：

在进行DNN反向传播算法前，我们需要选择一个损失函数，来度量训练样本计算出的输出和真实的训练样本输出之间的损失。

??

DNN可选择的损失函数有不少，为了专注算法，这里使用最常见的均方差来度量损失。即对于每个样本，我们期望最小化下式：

深度神经网络 DNN

??

深度神经网络 DNN

深度神经网络 DNN

深度神经网络 DNN

对于输出层的参数，损失函数变为：

深度神经网络 DNN

求解W,b的梯度：

深度神经网络 DNN

??

深度神经网络 DNN

??

深度神经网络 DNN

??

5.3DNN反向传播算法过程：

由于梯度下降法有批量（Batch），小批量(mini-Batch)，随机三个变种，为了简化描述，这里我们以最基本的批量梯度下降法为例来描述反向传播算法。实际上在业界使用最多的是mini-Batch的梯度下降法。区别仅仅在于迭代时训练样本的选择。

??

深度神经网络 DNN

??

深度神经网络 DNN

深度神经网络 DNN

??

??

6 均方差损失函数+Sigmoid激活函数的问题

??

在讲反向传播算法时，我们用均方差损失函数和Sigmoid激活函数做了实例，首先我们就来看看均方差+Sigmoid的组合有什么问题。

??

首先我们回顾下Sigmoid激活函数的表达式为：

深度神经网络 DNN

??

7 交叉熵损失函数+Sigmoid激活函数改进DNN算法收敛速度

??

??

??

??

??

??

dnn 深度神经网络

georgesale

0 关注 0 粉丝 0 动态

相关推荐

使用NetworkX模块绘制深度神经网络（DNN）结构图

本文将展示如何利用Python中的NetworkX模块来绘制深度神经网络结构图。在文章Keras入门（一）搭建深度神经网络解决多分类问题中，我们创建的DNN结构图如下：。该DNN模型由输入层、隐藏层、输出层和softmax函数组成，每一层的神经元个数分别为

sjzhahalala 2019-06-28

Keras入门（一）搭建深度神经网络（DNN）解决多分类问题

Keras介绍Keras是一个开源的高层神经网络API，由纯Python编写而成，其后端可以基于Tensorflow、Theano、MXNet以及CNTK。Keras 为支持快速实验而生，能够把你的idea迅速转换为结果。Keras适用的Python版本是

kinghighbury 2019-06-28

DotNetNuke 5 C#版本解读之--架构介绍

整体上DNN5和其它比较大的企业级应用系统一样分为web服务器和数据库服务器。Web服务器包括表现层，商业逻辑层和数据访问层，而数据库服务器主要是数据层。表现层主要包含如下几个部分：webforms:整个DNN主要的就是哪个default.aspx页面来展

有瑕疵的老兵 2012-07-06

UIUC推出最新DNN/FPGA协同设计方案，助力物联网终端设备AI应用

UIUC、IBM 和 Inspirit IoT, Inc的研究人员提出 DNN 和 FPGA 加速器的协同设计方案，通过首创的「Auto-DNN」网络搜索引擎 +「Auto-HLS」加速器生成技术，自动生成适用于终端设备的 DNN 模型及 FPGA 加速器

zhuhong 2019-05-28

微软资深研究员详解基于交错组卷积的高效DNN｜公开课笔记

卷积神经网络在近几年获得了跨越式的发展，虽然它们在诸如图像识别任务上的效果越来越好，但是随之而来的则是模型复杂度的不断提升。越来越深、越来越复杂的卷积神经网络需要大量存储与计算资源，因此设计高效的卷积神经网络是非常重要和基础的问题，而消除卷积的冗余性是该问

FromZerotoHero 2018-07-11

微软资深研究员详解基于交错组卷积的高效DNN

卷积神经网络在近几年获得了跨越式的发展，虽然它们在诸如图像识别任务上的效果越来越好，但是随之而来的则是模型复杂度的不断提升。越来越深、越来越复杂的卷积神经网络需要大量存储与计算资源，因此设计高效的卷积神经网络是非常重要和基础的问题，而消除卷积的冗余性是该问

yuyin 2018-07-11

周志华最新论文：首个基于决策树集成的自动编码器，表现优于DNN

今年 2 月，南京大学的周志华教授和他的学生 Ji Feng 提出了一种不同于深度神经网络的 Deep Forest 模型——gcForest，这是一种决策树集成的方法，较之深度神经网络有很强的竞争力。深度神经网络需要花大力气调参，相比之下 gcFores

沦落天堂 2017-09-27

腾讯AI Lab参与：基于弹性网络正则化的深度神经网络对抗样本攻击

腾讯 AI Lab 在 2018 年 AAAI 中入选论文 11 篇，其中一篇与 IBM Research、The Cooper Union 和加州大学戴维斯分校合作的论文入选口头报告。这篇论文提出一种基于弹性网络正则化的攻击算法，该算法将对抗样本攻击

lwnylslwnyls 2018-01-30

EDEN：结合进化算法与DNN自动搜索神经网络架构与超参数

在该论文中，研究者提出了一种进化深度网络，即一种神经进化算法。该算法结合了遗传算法和深度神经网络，并可用于探索神经网络架构的搜索空间、与之相关联的超参数和训练迭代所采用的 epoch 数量。机器之心简要介绍了该论文。通过使用 EDEN，研究者认为我们可以解

VincentLee 2017-09-28

最全的DNN概述论文：详解前馈、卷积和循环神经网络技术

本论文技术性地介绍了三种最常见的神经网络：前馈神经网络、卷积神经网络和循环神经网络。且该文详细介绍了每一种网络的基本构建块，其包括了基本架构、传播方式、连接方式、激活函数、反向传播的应用和各种优化算法的原理。本文不仅介绍了这三种神经网络的基本原理与概念，同

fengzhimohan 2017-09-07

10大任务超越BERT，微软提出多任务深度神经网络MT-DNN

新智元将于3月27日在北京泰富酒店举办“2019新智元AI技术峰会——智能云芯世界”，聚焦智能云和AI芯片发展，重塑未来AI世界格局。同时，新智元将现场权威发布若干AI白皮书，聚焦产业链的创新活跃，助力中国在世界级的AI竞争中实现超越。MT-DNN结合了B

zhousenbiao 2019-03-22

浏览器最快的DNN执行框架WebDNN：从基本特性到性能测评

WebDNN 是网页浏览器中最快的 DNN 执行框架，而本文首先简单介绍了 WebDNN 特征与其框架结构，即表明了为什么 WebDNN 能为端用户提供高效的 DNN 应用。而后文章将给出 WebDNN 与 Keras.js 的详细对比，并在最后一部分介绍

hyv 2017-06-05

神经网络：从基本概念到新的可能性

生物学中的神经网络是互相交换信息的相互连接的神经元。这个想法现在已经适用于机器学习的世界，并被称为人工神经网络。深度学习是一个经常出现的词，是指几层连续放置的人工神经网络。DNN 在很多人工智能任务之中表现出了当前最佳的准确度，但同时也存在着计算复杂度高的

hexianhao 2017-04-19

论文详解：有关DNN那点儿事

麻省理工学院MIC旨在对整个社区进行进行关于机器学习的教育，使得大家能够更快的进入机器学习这个领域。深度神经网络在越来越广泛的工业应用中提供无与伦比的精度和性能，例如图像识别、自然语言处理和其他复杂问题，如自动驾驶车辆的控制。尽管与旧机器学习算法相比有了巨

Pokemogo 2018-07-20

「深度森林第三弹」周志华等提出梯度提升决策树再胜DNN

今天，ArXiv上公布了深度森林系列最新的第三弹——可做表示学习的多层GBDT，冯霁、俞扬和周志华提出了一种新颖的具有显式表示学习能力的多层GBDT森林，它可以与目标传播的变体进行共同训练，这种方法在很多神经网络不适合的应用领域中具有巨大的潜力。还记得周志

freefly 2018-06-04

OpenCv-C++-深度神经网络（DNN）模块-使用FCN模型实现图像分割

中文名称是“全卷积网络”，它将传统CNN中的全连接层转化成一个个的卷积层。在传统的CNN结构中，前5层是卷积层，第6层和第7层分别是一个长度为4096的一维向量，第8层是长度为1000的一维向量，分别对应1000个类别的概率。cout <&a

hhhhhjkk 2019-02-22

超过70个DNN卷积算法的模板库

在机器学习中，卷积神经网络是一种深度前馈人工神经网络，已成功地应用于图像识别。卷积神经网络是解决各种重要神经网络的机器算法之一。今天介绍的triNNity是在一个地方收集尽可能多的DNN卷积算法，并提供干净、简单和高性能的实现，它也是DNN卷积算法设计的试

pengkingli 2017-11-23

自学习芯片、实时3D表情捕捉渲染，百倍DNN模型无损压缩

英特尔中国研究院媒体开放日，英特尔中国研究院院长宋继强率领团队，共同分享了英特尔中国研究院的整体定位、研究方向和创新机制，以及英特尔在人工智能、机器人等领域的最新研究成果。在人工智能的大背景下，这几年，说起芯片霸主英特尔，似乎总有一股时过境迁的味道。明年就

songfeidream 2017-12-01

Hinton实验室探访：Capsule后最新研究，软决策树更好理解DNN分类

《纽约时报》今日发文，记者走访Hinton在多伦多的实验室，为我们带来Hinton新作“Capsule Network”的更多信息。同时，新智元注意到Hinton和Capsule Network作者之一的Nicholas Frosst最近新发表了论文，使用

gscienty 2017-11-29

使用TensorFlow实现DNN

使用高级API实现多层神经网络这里我们使用tensorflow.contrib包，这是一个高度封装的包，里面包含了许多类似seq2seq、keras一些实用的方法。y = tf.placeholder#注意数据类型上面使用占位符的方法来声明模型的输入X和y

ukakasu 2017-12-18

georgesale

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号