深度｜生成对抗网络（GAN）是如何运行的

wangjunyi

2017-02-13

关注关注

参与：朱朝阳、微胖

作者：Chanchana Sornsoontorn

GAN暨生成对抗网络（Generative Adversarial Networks）是由两个彼此竞争的深度神经网络——生成器和判别器组成的。

生成器和辨别器的目标是生成与训练集中一些数据点非常相似的数据点。

GAN是一个非常强有力的想法。甚至 Yann LeCun 都称赞道这是近20年最酷的想法。他希望是自己发现了 GAN 而不是Ian Goodfellow。

目前，人们利用GAN可以完成不同种类的生成任务，它能够生成现实中的图片，三维模型，视频和其他更有价值的成果。

GAN的生成样例

深度｜生成对抗网络（GAN）是如何运行的

生成类似于MNIST数据库的手写数字图片——甚至连人类都无法区别生成的图片和真实图片

深度｜生成对抗网络（GAN）是如何运行的

使用StackGAN基于文字描述生成图片

深度｜生成对抗网络（GAN）是如何运行的

使用 DCGAN （深度卷积对抗生成网络）生成人脸

深度｜生成对抗网络（GAN）是如何运行的

使用DCGAN生成动漫人物

视频1：https://www.youtube.com/watch?v=Pt1W_v-yQhw

利用一张静止的图像预测下一帧图像

视频2：https://www.youtube.com/watch?v=mfx7uAkUtCI

生成三维模型

除了生成实物外，你还能基于抽象的想法做算术运算，比如摘掉人脸上的眼镜！

深度｜生成对抗网络（GAN）是如何运行的

面部的数学运算： DGGAN-code

那么添插图片会怎样呢？

给定两张图片，它能生成从一张图片转化成另一张图片这个过程的所有图片。

深度｜生成对抗网络（GAN）是如何运行的

还有许多你能

让人印象非常深刻，不是吗？

GAN背后的理念

举个例子吧，假设我们想让GAN生成类似于训练集（如 CelebA 数据库）中的人脸图片

我们生成器的架构可能会像下面这样：

深度｜生成对抗网络（GAN）是如何运行的

对于一个DGGAN生成器而言 ,输入是一个随机法向量并通过反卷积栈输出图像。

辨别器

深度｜生成对抗网络（GAN）是如何运行的

辨别器的输入是一张图片，通过卷积栈后输出这幅图是否为真的概率。

我们的整个GAN架构将会是这样的：

深度｜生成对抗网络（GAN）是如何运行的

“生成器努力生成让辨别器认为是真的假图片。然后当一张图片输入时，辨别器会尽最大的努力试着辨别真的图片和生成的图片”

生成器和辨别器会共同进步直到辨别器无法辨别真实的和生成的图片。到了那时，生成式对抗网络只能以0.5的概率猜一下哪张是真实的哪张是生成的，因为生成器生成的人脸图片太真实了。

官方GAN论文：

生成模型可以被看作是一队伪造者，试图伪造货币，不被人发觉，然而辨别模型可被视作一队警察，努力监察假的货币。游戏当中的竞争使得这两队不断的改善方法，直到无法从真实的物品中辨别出伪造的。

在理想最优状态，生成器将知道如何生成真实的人脸图片，辨别器也会知道人脸的组成部分。

最优生成器

直观来说，之前在生成器中展示的代码向量将会代表抽象的东西。例如，如果代码向量有100维度，可能会由一维自动代表了“面部年龄”或“性别”。

为什么生成器会学习到这种表示呢？因为知道了人们的年龄和性别会帮助你画出更适合他们的人脸图片。

最优辨别器

给定一张图片，辨别器必须找到正确区分真实和生成的人脸的部分。

直观上说，当辨别器中的一些隐藏神经元看到比如眼睛，嘴巴，头发等物体时，他们就会被激活。这些特征对之后的其他任务比如分类是很有用的。

如何训练

我们共同训练生成器和辨别器，让他们变得强壮，通过反复训练防止其中一个网络比另一个网络强大太多。

为什么轮回训练网络使双方共同变强而不是单独训练让他们的性能更强大？

如果其中一个网络太强大，另外一个会因能力太差而导致两个网络性能都弱化。一个网络不知道自己在跟低级的网络竞争而导致其认为自己很高级。自作聪明的网络就会对低级的网络过拟合。

训练辨别器

给它一张训练集中的图片和一张生成器生成的图片，如果得到的是生成图片辨别器应该输出0，如果是真实的图片应该输出1。

从技术性的角度：交叉熵的损失可以由最优控制器弥补，小菜一碟！

生成器

生成器必须努力让辨别器在得到它生成的图片后输出1。

现在，这有一个有趣的部分。

假设生成器生成了一张图片，辨别器认为这张图片有0.4的概率是真实图片。生成器如何调整它生成的图片来增加这个概率，比如说增加到0.41？

答案就是：

为训练生成器，辨别器不得不告诉生成器如何调整从而使它生成的图片变得更加真实。

生成器必须向辨别器寻求建议！

直观来说，辨别器告诉生成器每个像素应调整多少来使整幅图像更真实一点点。

技术上来说，通过反向传播辨别器输出的梯度来调整生成图片。以这种方式训练生成器，你将会得到与图片形状一样的梯度向量。

如果你把这些梯度加到生成的图片上，在辨别器看来，图片就会变得更真实一点。

但是我们不仅仅把梯度加到图片上。

相反，我们进一步反向传播这些图片梯度成为组成生成器的权重，这样一来，生成器就学习到如何生成这幅新图片。

我重复一遍，为生成好的图片，你必须向老师展示你的工作，得到反馈！

如果辨别器不帮助生成器的话，那就太残酷了，因为生成器实际做的工作比辨别器更艰难，它生成图片！

这就是生成器如何被训练的。

结论

两个网络并不是一直都在斗争，它们不得不协同合作以达到共同的目标。在整个训练过程中，辨别器不得不教导生成器如何在生成的数据上微做调整。同时它也一直都在学习如何做一个更好的老师。

它们共同变强，在理想状态下，会达到一种平衡。

gan

wangjunyi

0 关注 0 粉丝 0 动态

关注关注

这个模型脑补能力比GAN更强，ETH超分辨率模型SRFlow

近日，来自苏黎世联邦理工学院计算机视觉实验室的研究者提出了一种超分辨率模型 SRFlow。该模型具备比 GAN 更强的脑补能力，能够根据低分辨率输入学习输出的条件分布。该论文已被 ECCV 2020 收录。超分辨率是一个不适定问题，它允许对给定的低分辨率图

Iamthedoctor 2020-09-08

当支持向量机遇上神经网络：SVM、GAN距离之间的关系

SVM 是机器学习领域的经典算法之一。给定一组训练实例，每个训练实例被标记为属于两个类别中的一个或另一个，SVM 训练算法创建一个将新的实例分配给两个类别之一的模型，使其成为非概率二元线性分类器。SVM 模型将实例表示为空间中的点，这样映射就使得单独类别的

绝望的乐园 2020-09-02

宅男大叔自学AI打造大师级水准，火爆推特

最近，一位日本宅男大叔佐藤做了一个AI生成肖像画的网站AI Gahaku，10天内用户访问量从0暴增到100万，引爆推特。简单易操作，上传一张人脸照片，就能生成一张大师级肖像画。而比技术更神奇的是佐藤自己，因为他是自学AI做出来的，不得不佩服的宅男创造力。

绝望的乐园 2020-08-18

联想口红电源mini45W对比GaN氮化镓65W外观哪个好?

thinkplus口红电源，相信大家应该不会感到陌生。在去年11月初，口红电源首发，至今将近一年，一经推出，便赢得了广泛好评，而小米65W氮化镓充电器具有小巧、高效、发热低等特点，并且支持小米10Pro超级快充，这两个哪个好呢，感兴趣的朋友不要错过了。至于

CSDNyun 2020-07-21

CNN、RNN、GAN都是什么？终于有人讲明白了

全连接、密集和线性网络是最基本但功能强大的架构。这是机器学习的直接扩展，将神经网络与单个隐藏层结合使用。全连接层充当所有架构的最后一部分，用于获得使用下方深度网络所得分数的概率分布。编码器和解码器可能是深度学习另一个最基本的架构之一。一个句子将被编码为中间

zhangsh00 2020-07-23

AAE对抗自编码器/GAN与VAE的区别

不幸的是，变分自动编码器通常会在先验分布的空间中留下一些区域，这些区域不会映射到数据中的实际样本。对抗性自动编码器旨在通过鼓励编码器的输出完全填充先验分布的空间来改善此情况，从而使解码器能够从先验采样的任何数据点生成逼真的样本。

zhangsh00 2020-06-16

course | 李宏毅lecture1-GAN基础知识

注意，这时候鉴别器部分是固定住的，虽说损失函数是接在鉴别器网络之后的，鉴别器有梯度反传，但梯度反传不对鉴别器的参数进行更新。因为它要输出可能它自己也没有看过的，也就是创造。机器得有大局观，图片中的各个构件之间是怎么组合的，传统的structured lea

Beryl 2020-05-31

轻松构建 PyTorch 生成对抗网络(GAN)

展现在您眼前的这幅图像中的人物并非自真实存在，其实她是由一个机器学习模型创造出来的虚拟人物。图片取自维基百科的 GAN 条目，画面细节丰富、色彩逼真，让人印象深刻。生成对抗网络是一种生成式机器学习模型，它被广泛应用于广告、游戏、娱乐、媒体、制药等行业，可

sayhaha 2020-05-28

生成对抗网络--Generative Adversarial Networks (GAN)

警察判断是否是假钞,如果认为是假钞,说明假钞与真钞存在区别。制造假钞的人按照警察给出的反馈改进假钞制造工艺。训练GAN的基本步骤:. 输入:长度为100的向量。如果对您有帮助，就打赏一下吧O(∩_∩)O

zhangsh00 2020-05-26

520快手送“男朋友”GAN生成对抗网络助力单身狗“顺利脱单”

“官宣官宣了，我男朋友帅吧”。昨天是520网络情人节，数万人在快手官宣脱单，这是怎么做到的？原来是快手上线了一款视频特效，让单身的小伙伴们瞬间甜蜜分身，“顺利脱单”。这是快手为用户准备的一系列520特效中的一款，受到用户欢迎。快手上线的520一系列魔表中还

Ephemeroptera 2020-05-21

Gan(一) - 一份来自香港理工大学的Gans综述

标题：Generative Adversarial Networks : Challenges, Solutions, and Future Directions

Ephemeroptera 2020-05-15

GAN Compression - 1 - 论文学习

GAN Compression: Efficient Architectures for Interactive Conditional GANs. 在不损失图像质量的前提下，我们将CycleGAN的计算量减少了20×以上，GauGAN的计算量减少了9×，

架构技术交流 2020-04-23

单张图像就可以训练GAN！Adobe改良图像生成方法 | 已开源

数据集太小了，无法训练GAN？试试从单个图像入手吧。去年谷歌就提出了SinGAN，是第一个拿GAN在单幅自然图像学习的非条件生成模型。而最近，来自Adobe和汉堡大学的研究人员，对这个方法做了改进，探讨了几种让GAN在单幅图像提高训练和生成能力的机制。研究

xmdxcsj 2020-03-30

一个模型击溃12种AI造假，各种GAN与Deepfake都阵亡，已开源

AI造出的假图片恐怕很难再骗过AI了。连英伟达本月刚上线的StyleGAN2也被攻破了。最新研究发现，只要用让AI学会鉴别某一只GAN生成的假图片，它就掌握了鉴别各种假图的能力。只要做好适当的预处理和后处理，以及适当的数据扩增，便可以鉴定图片是真是假，不论

朝花amp夕拾 2020-03-09

paper | Generative Adversarial Network-Based Intra Prediction for Video Coding

提出一种新的帧内预测方法，使用GAN来消除空间冗余。基于GAN的方法的方法使用更多的信息来产生更灵活的预测模式。帧内预测被建模为一个去瑕疵过程，使用GAN来充满重建帧中丢失的部分。GAN模型被加入到编码器和解码器中，与传统的预测模型进行率失真比较。HM、V

绝望的乐园 2020-02-15

GAN的数学原理

判别器D中D是一个函数，用来衡量PG和Pdata之间的差距，可用来取代极大似然估计。

算法与数学之美 2020-01-12

GAN的资料

GANs是一种以半监督方式训练分类器的方法，可以参考我们的NIPS paper和相应代码。GANs不需要蒙特卡洛估计来训练网络，人们经常抱怨GANs训练不稳定，很难训练，但是他们比训练依赖于蒙特卡洛估计和对数配分函数的玻尔兹曼机简单多了。GANs起码在Im

zhangsh00 2020-01-03

搜索速度快9倍！Uber创建新的GAN网络，可媲美当前最好架构

生成对抗网络可以分为两部分，创建样本的生成器和区分生成样本和真实样本的判别器。它的用途很多，其中之一就是生成合成数据。Uber的研究人员最近在题为“通过学习加快神经结构的搜索速度”的论文中利用这一点提出了一种特殊的GAN——生成式教学网络。论文指出，与仅使

liongxiong 2019-12-31

Detecting GAN-generated Imagery using Color Cues

生成器的对通道的内部表示类似于彩色RGB三通道像素合成的方式，但是所使用的权重与摄像机的类似光谱灵敏度完全不相同。工作重点主要放在GAN之间的共同特征和生成器靠后的几层，因为到达最后几层的线索不太可能被后续的连续的处理改变。

Ephemeroptera 2019-12-09

使用生成对抗网络（GAN）生成手写字

这就如同一个造假团伙一样，A负责生产，B负责就鉴定，刚开始的时候，两个人都是菜鸟，A随便画了一幅画拿给B看，B说你这不行，然后A再改进，当然需要改进的不止A，随着A的改进，B也得不断提升，B需要发现更细微的差异，直至他们觉得已经没什么差异了，他们便决定停止

zhangsh00 2019-12-08

安科网

深度｜生成对抗网络（GAN）是如何运行的

wangjunyi

GAN的生成样例

生成三维模型

GAN背后的理念

如何训练

结论

wangjunyi

相关推荐

这个模型脑补能力比GAN更强，ETH超分辨率模型SRFlow

当支持向量机遇上神经网络：SVM、GAN距离之间的关系

宅男大叔自学AI打造大师级水准，火爆推特

联想口红电源mini45W对比GaN氮化镓65W外观哪个好?

CNN、RNN、GAN都是什么？终于有人讲明白了

AAE对抗自编码器/GAN与VAE的区别

course | 李宏毅lecture1-GAN基础知识

轻松构建 PyTorch 生成对抗网络(GAN)

生成对抗网络--Generative Adversarial Networks (GAN)

520快手送“男朋友”GAN生成对抗网络助力单身狗“顺利脱单”

Gan(一) - 一份来自香港理工大学的Gans综述

GAN Compression - 1 - 论文学习

单张图像就可以训练GAN！Adobe改良图像生成方法 | 已开源

一个模型击溃12种AI造假，各种GAN与Deepfake都阵亡，已开源

paper | Generative Adversarial Network-Based Intra Prediction for Video Coding

GAN的数学原理

GAN的资料

搜索速度快9倍！Uber创建新的GAN网络，可媲美当前最好架构

Detecting GAN-generated Imagery using Color Cues

使用生成对抗网络（GAN）生成手写字

wangjunyi