为什么说GAN很快就要替代现有摄影技术了？

wanfuchun

2019-03-12

为什么说GAN很快就要替代现有摄影技术了？

【新智元导读】自GAN诞生以来，在计算机视觉领域中表现可谓是惊艳连连：文本-图像转换、域迁移、图像修复/拓展、人脸合成甚至是细微表情的改变，无所不能。本文对此进行了盘点，并且作者表示：GAN很快就可能替代现有的摄影技术了！

AI生成的图像可能会取代现有的摄影技术。

许多人当听到“人工智能”、“机器学习”或者“bot”的时候，首先浮现在脑海当中的应当是科幻片中经常出现、未来感十足的既会走路又会说话的机器人。

为什么说GAN很快就要替代现有摄影技术了？

但事实并非如此！人工智能已经“潜伏”在我们身边很多年了。现在就有可能在你的智能手机里(Siri/谷歌语音助手)、汽车GPS系统里。

然而，在过去几年中，没有哪个域比计算机视觉更受其影响。

随着科技的发展，具有超高分辨率视觉吸引力的图像变得越来越普遍。人们不再需要学习如何使用Photoshop和CorelDRAW等工具来增强和修改图像，因为AI可以在这些方面产生最佳效果的图像。然而，最新提出的想法实际上是综合使用AI来生成图像。

以往我们所看到的所有图像，其生成过程肯定都或多或少有“人”的参与。但是试想一下，一个计算机程序可以从零开始绘制你想要它绘制的任何内容，在不久的将来，你只需要给它一些指令，例如“我想要一张站在埃菲尔铁塔旁边的照片”，然后图像就生成了(当然，你的输入要准确)！

为什么说GAN很快就要替代现有摄影技术了？

生成对抗网络(GAN)

“在机器学习过去的10年里，GAN是最有趣的一个想法。”

——Yann LeCun

生成这种合成图像的基础就是生成对抗网络(GAN)。

自从Ian Goodfellow和他的同事在2014年发现并推出他们的研究论文以来，GAN一直是深度学习中最迷人且被最广泛使用的技术之一。这项技术无穷无尽的应用，也就是所谓对抗性训练的核心，不仅包括计算机视觉，还包括数据分析、机器人技术和预测模型。

那么，GAN有什么了不起的呢？

生成性对抗网络属于一组生成模型。这意味着他们的工作是在完全自动化的过程中创建或“生成”新数据的。

为什么说GAN很快就要替代现有摄影技术了？

lan Goodfellow论文中生成的图像。

地址：https://arxiv.org/abs/1406.2661

顾名思义，GAN实际上由两个相互竞争的独立神经网络组成（以对抗的方式）。其中一个神经网络称为生成器，从随机噪声中生成新的数据实例；另一个神经网络称为鉴别器，它会对这些实例进行真实性评估。换言之，鉴别器决定它检查的每个数据实例是否属于实际的训练数据集。

一个简单的例子

假设你的任务就是高仿一幅著名画作。但不幸的是，你并不知道这位艺术家是谁，也没有见过他的画作。但你的任务就是高仿它，并作为原作之一在拍卖会上展出。

你只有一些颜料和画布。但是拍卖商不希望随意出售作品，所以他们雇了一名侦探来对画作辨别真伪。侦探手中有这幅名作的真迹，所以若是你随意拿出一个作品，侦探立刻就能知道你的画作是赝品(甚至完全不同)。

为什么说GAN很快就要替代现有摄影技术了？

当侦探拒绝了一次之后，你会再去创作一个作品。但是通过这次经验，你会通过侦探得到一些提示(这些提示有关真迹画作应该是什么样子)。

当你再次尝试的时候，画作会比第一次好一些。此时，侦探还是不相信这是真迹，于是你在又得到一些提示的情况下，再次尝试，以此类推。直到你画了1000次，侦探拿着你的高仿作品，已然不知道哪幅画是真迹了。

GAN的工作流程是什么？

将上述的思维过程应用于神经网络组合，GAN的训练过程包括以下步骤：

为什么说GAN很快就要替代现有摄影技术了？

GAN的基本框架。

地址：https://medium.freecodecamp.org/an-intuitive-introduction-to-generative-adversarial-networks-gans-7a2264a81394

最开始，发生器接收一些随机噪声并将其传递给鉴别器；
因为鉴别器已经访问了真实图像的数据集，所以它将这些真实数据集与从生成器接收到的图像进行比较，并评估其真实性；
由于初始图像只是随机噪声，它将被评估为“假”；
生成器通过不断改变参数，开始生成更好的图像；
随着训练的进行，生成假图像的生成器和检测它们的鉴别器会变得越发的智能；
最后，生成器设法创建一个与真实图像数据集中的图像难以区分的图像。此时，鉴别器便无法分辨给定的图像是真还是假；
此时，训练结束，生成的图像就是我们想要的最终结果。

为什么说GAN很快就要替代现有摄影技术了？

我们自己的GAN生成汽车标志图像的过程。

优点和缺点

与其它技术一样，GAN也有自身的优缺点。

下面是GAN的一些潜在优势：

为什么说GAN很快就要替代现有摄影技术了？

GAN并不总是需要带标签的样本来训练；
它们更容易训练依赖于蒙特卡罗(Monte Carlo)近似的对数分割函数梯度的生成模型。由于蒙特卡罗方法在高维空间中不能很好地工作，这样的生成模型不能很好地执行像使用ImageNet进行训练的现实任务。
他们没有引入任何确定性偏差。像变分自动编码器这样的某些生成方法会引入确定性偏差，因为它们优化了对数似然的下界，而不是似然本身。

同样，GAN也有它的缺点：

GAN特别难训练。这些网络试图优化的函数是一个本质上没有封闭形式的损失函数。因此，优化这一损失函数是非常困难的，需要在网络结构和训练协议方面进行大量的反复试验；
(特别是)对于图像生成，没有适当的措施来评估准确性。由于合成图像可以通过计算机本身来实现，因此实际结果是一个非常主观的主题，并且取决于人类观察者。相反，我们有起始分数和Frechet初始距离等功能来衡量他们的表现。

GAN的应用

最有趣的部分来了！

我们可以用GAN做的所有惊人的东西。在它所有潜在用途中，GAN已经在计算机视觉领域中实现了大量应用。

文本-图像转换

这个概念有许多实验的方法，例如TAC-GAN(文本条件辅助分类器生成对抗网络)。

为什么说GAN很快就要替代现有摄影技术了？

左：TAC-GAN的结构示意图。右：将一行文本输入网络所产生的结果。

域迁移(Domain Transfer)

GAN在风格转换等概念中很受欢迎。：

它包括使用称为CGAN（条件生成对抗网络）的特殊类型的GAN进行图像到图像的转换。

绘画和概念设计从未如此简单。

然而，虽然GAN可以从它的草图中完成像钱包这样简单的绘图，但绘制更复杂的东西，如完美的人脸，目前还不是GAN的强项。

为什么说GAN很快就要替代现有摄影技术了？

CGAN pix2pix的实验结果

Image Inpaintinng(图像修复)/Image Outpainting(图像拓展)

生成网络的两个非常激动人心的应用是：图像修复(Inpainting)和图像拓展(Outpainting)。

第一种包括在图像中填充或噪声，这可以看作是图像的修复。例如，给定一个残缺的图像，GAN能够以“passable”的方式对其进行纠正它。

另一方面，图像拓展涉及到使用网络自身的学习来想象一个图像在当前边界之外可能会是什么样子。

为什么说GAN很快就要替代现有摄影技术了？

左：图像修复结果；右：图像拓展结果。

人脸合成

由于生成网络的存在，使得人脸合成成为了可能，这涉及到从不同角度生成单个人脸图像。

这就是为什么面部识别不需要数百个人脸样本，只需要用一个样本就能识别出来的原因。

不仅如此，生成“人造人脸”也变得可能。 NVIDIA最近使用他们的GAN 2.0在Celeba Hq数据集上生成了高清分辨率的人造人脸，这是高分辨率合成图像生成的第一个例子。

为什么说GAN很快就要替代现有摄影技术了？

用Progressive GAN生成想象中的名人面孔。

GANimation

GAN使得诸如改变面部运动这样的事情也成为可能。GANimation是一项使用PyTorch的研究成果，它将自己定义为“从一张图像中提取具有解剖学意义的面部动画”。

为什么说GAN很快就要替代现有摄影技术了？

GANimation官方实现。

地址：https://www.albertpumarola.com/research/GANimation/index.html

绘画-照片转换

利用GAN使图像变得更逼真的另一个例子是简单地将绘画变成照片。

这是使用称为CycleGAN的特殊类型的GAN完成的，它使用两个发生器和两个鉴别器。

我们把一个发生器称为G，它把图像从X域转换成Y域。另一个生成器称为F，它将图像从Y转换为X。每个生成器都有一个对应的鉴别器，该鉴别器试图将其合成的图像与真实图像区分开来。

为什么说GAN很快就要替代现有摄影技术了？

CycleGAN的结果。

地址：https://github.com/junyanz/CycleGAN

GAN是一把双刃剑

机器学习和GAN肯定会在不久的将来对成像和摄影产生巨大影响。

目前，该技术能够从文本输入生成简单图像。然而，在可预见的未来，它不仅能够创建高分辨率的精确图像，还能够创建完整的视频。

想象一下，只需要简单地将脚本输入到GAN中，便可以生成一部电影。不仅如此，每个人都可以使用简单的交互式应用程序来创建自己的电影（甚至可以自己主演！）。

当然，技术是一把双刃剑。

若是这么好的技术被坏人利用，后果是不堪设想的。完美的假图像还需要一种方法来识别和检测它们，我们需要对这类图像的产生进行管制。

目前，GAN已经被用于制作虚假视频或“Deepfakes”，这些视频正以消极的方式被使用着，例如生成名人假的不良视频或让人们在不知情的情况下“被发表言论”。

音频、视频合成技术使用不良手段造成传播后的结果将是非常可怕的。

原文链接：

https://medium.com/sfu-big-data/ai-the-future-of-photography-c7c80baf993b

【2019新智元 AI 技术峰会倒计时16天】

2019年的3月27日，新智元再汇AI之力，在北京泰富酒店举办AI开年盛典——2019新智元AI技术峰会。峰会以“智能云•芯世界“为主题，聚焦智能云和AI芯片的发展，重塑未来AI世界格局。

同时，新智元将在峰会现场权威发布若干AI白皮书，聚焦产业链的创新活跃，评述华人AI学者的影响力，助力中国在世界级的AI竞争中实现超越。

购票

活动行购票链接：2019新智元AI技术峰会--智能云•芯世界_精彩城市生活，尽在活动行！！

gan 人工智能计算机视觉

wanfuchun

0 关注 0 粉丝 0 动态

相关推荐

这个模型脑补能力比GAN更强，ETH超分辨率模型SRFlow

近日，来自苏黎世联邦理工学院计算机视觉实验室的研究者提出了一种超分辨率模型 SRFlow。该模型具备比 GAN 更强的脑补能力，能够根据低分辨率输入学习输出的条件分布。该论文已被 ECCV 2020 收录。超分辨率是一个不适定问题，它允许对给定的低分辨率图

Iamthedoctor 2020-09-08

当支持向量机遇上神经网络：SVM、GAN距离之间的关系

SVM 是机器学习领域的经典算法之一。给定一组训练实例，每个训练实例被标记为属于两个类别中的一个或另一个，SVM 训练算法创建一个将新的实例分配给两个类别之一的模型，使其成为非概率二元线性分类器。SVM 模型将实例表示为空间中的点，这样映射就使得单独类别的

绝望的乐园 2020-09-02

宅男大叔自学AI打造大师级水准，火爆推特

最近，一位日本宅男大叔佐藤做了一个AI生成肖像画的网站AI Gahaku，10天内用户访问量从0暴增到100万，引爆推特。简单易操作，上传一张人脸照片，就能生成一张大师级肖像画。而比技术更神奇的是佐藤自己，因为他是自学AI做出来的，不得不佩服的宅男创造力。

绝望的乐园 2020-08-18

联想口红电源mini45W对比GaN氮化镓65W外观哪个好?

thinkplus口红电源，相信大家应该不会感到陌生。在去年11月初，口红电源首发，至今将近一年，一经推出，便赢得了广泛好评，而小米65W氮化镓充电器具有小巧、高效、发热低等特点，并且支持小米10Pro超级快充，这两个哪个好呢，感兴趣的朋友不要错过了。至于

CSDNyun 2020-07-21

CNN、RNN、GAN都是什么？终于有人讲明白了

全连接、密集和线性网络是最基本但功能强大的架构。这是机器学习的直接扩展，将神经网络与单个隐藏层结合使用。全连接层充当所有架构的最后一部分，用于获得使用下方深度网络所得分数的概率分布。编码器和解码器可能是深度学习另一个最基本的架构之一。一个句子将被编码为中间

zhangsh00 2020-07-23

AAE对抗自编码器/GAN与VAE的区别

不幸的是，变分自动编码器通常会在先验分布的空间中留下一些区域，这些区域不会映射到数据中的实际样本。对抗性自动编码器旨在通过鼓励编码器的输出完全填充先验分布的空间来改善此情况，从而使解码器能够从先验采样的任何数据点生成逼真的样本。

zhangsh00 2020-06-16

course | 李宏毅lecture1-GAN基础知识

注意，这时候鉴别器部分是固定住的，虽说损失函数是接在鉴别器网络之后的，鉴别器有梯度反传，但梯度反传不对鉴别器的参数进行更新。因为它要输出可能它自己也没有看过的，也就是创造。机器得有大局观，图片中的各个构件之间是怎么组合的，传统的structured lea

Beryl 2020-05-31

轻松构建 PyTorch 生成对抗网络(GAN)

展现在您眼前的这幅图像中的人物并非自真实存在，其实她是由一个机器学习模型创造出来的虚拟人物。图片取自维基百科的 GAN 条目，画面细节丰富、色彩逼真，让人印象深刻。生成对抗网络是一种生成式机器学习模型，它被广泛应用于广告、游戏、娱乐、媒体、制药等行业，可

sayhaha 2020-05-28

生成对抗网络--Generative Adversarial Networks (GAN)

警察判断是否是假钞,如果认为是假钞,说明假钞与真钞存在区别。制造假钞的人按照警察给出的反馈改进假钞制造工艺。训练GAN的基本步骤:. 输入:长度为100的向量。如果对您有帮助，就打赏一下吧O(∩_∩)O

zhangsh00 2020-05-26

520快手送“男朋友”GAN生成对抗网络助力单身狗“顺利脱单”

“官宣官宣了，我男朋友帅吧”。昨天是520网络情人节，数万人在快手官宣脱单，这是怎么做到的？原来是快手上线了一款视频特效，让单身的小伙伴们瞬间甜蜜分身，“顺利脱单”。这是快手为用户准备的一系列520特效中的一款，受到用户欢迎。快手上线的520一系列魔表中还

Ephemeroptera 2020-05-21

Gan(一) - 一份来自香港理工大学的Gans综述

标题：Generative Adversarial Networks : Challenges, Solutions, and Future Directions

Ephemeroptera 2020-05-15

GAN Compression - 1 - 论文学习

GAN Compression: Efficient Architectures for Interactive Conditional GANs. 在不损失图像质量的前提下，我们将CycleGAN的计算量减少了20×以上，GauGAN的计算量减少了9×，

架构技术交流 2020-04-23

单张图像就可以训练GAN！Adobe改良图像生成方法 | 已开源

数据集太小了，无法训练GAN？试试从单个图像入手吧。去年谷歌就提出了SinGAN，是第一个拿GAN在单幅自然图像学习的非条件生成模型。而最近，来自Adobe和汉堡大学的研究人员，对这个方法做了改进，探讨了几种让GAN在单幅图像提高训练和生成能力的机制。研究

xmdxcsj 2020-03-30

一个模型击溃12种AI造假，各种GAN与Deepfake都阵亡，已开源

AI造出的假图片恐怕很难再骗过AI了。连英伟达本月刚上线的StyleGAN2也被攻破了。最新研究发现，只要用让AI学会鉴别某一只GAN生成的假图片，它就掌握了鉴别各种假图的能力。只要做好适当的预处理和后处理，以及适当的数据扩增，便可以鉴定图片是真是假，不论

朝花amp夕拾 2020-03-09

paper | Generative Adversarial Network-Based Intra Prediction for Video Coding

提出一种新的帧内预测方法，使用GAN来消除空间冗余。基于GAN的方法的方法使用更多的信息来产生更灵活的预测模式。帧内预测被建模为一个去瑕疵过程，使用GAN来充满重建帧中丢失的部分。GAN模型被加入到编码器和解码器中，与传统的预测模型进行率失真比较。HM、V

绝望的乐园 2020-02-15

GAN的数学原理

判别器D中D是一个函数，用来衡量PG和Pdata之间的差距，可用来取代极大似然估计。

算法与数学之美 2020-01-12

GAN的资料

GANs是一种以半监督方式训练分类器的方法，可以参考我们的NIPS paper和相应代码。GANs不需要蒙特卡洛估计来训练网络，人们经常抱怨GANs训练不稳定，很难训练，但是他们比训练依赖于蒙特卡洛估计和对数配分函数的玻尔兹曼机简单多了。GANs起码在Im

zhangsh00 2020-01-03

搜索速度快9倍！Uber创建新的GAN网络，可媲美当前最好架构

生成对抗网络可以分为两部分，创建样本的生成器和区分生成样本和真实样本的判别器。它的用途很多，其中之一就是生成合成数据。Uber的研究人员最近在题为“通过学习加快神经结构的搜索速度”的论文中利用这一点提出了一种特殊的GAN——生成式教学网络。论文指出，与仅使

liongxiong 2019-12-31

Detecting GAN-generated Imagery using Color Cues

生成器的对通道的内部表示类似于彩色RGB三通道像素合成的方式，但是所使用的权重与摄像机的类似光谱灵敏度完全不相同。工作重点主要放在GAN之间的共同特征和生成器靠后的几层，因为到达最后几层的线索不太可能被后续的连续的处理改变。

Ephemeroptera 2019-12-09

使用生成对抗网络（GAN）生成手写字

这就如同一个造假团伙一样，A负责生产，B负责就鉴定，刚开始的时候，两个人都是菜鸟，A随便画了一幅画拿给B看，B说你这不行，然后A再改进，当然需要改进的不止A，随着A的改进，B也得不断提升，B需要发现更细微的差异，直至他们觉得已经没什么差异了，他们便决定停止

zhangsh00 2019-12-08

wanfuchun

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号