斯坦福最新：用GAN补全镜头外的世界

wuxiaobingandbob

2018-07-30

关注关注

斯坦福最新：用GAN补全镜头外的世界

大数据文摘出品

作者：CoolBoy、魏子敏

被誉为最有想象力生成对抗网络GAN一出现就被Yann Lecun誉为“十年来机器学习领域最有趣的想法”，在图像领域更是催生了一批有趣的研究。

今天文摘菌介绍的这个研究来自斯坦福大学，用GAN的“想象力”补全一张图片镜头外的世界。

还不太了解GAN的同学，让我们先来简单复习一下：

如果你想更加擅长某种东西，比如下棋，你会怎么做？你可能会和比你更强的对手对弈。你会分析你做错了什么、对方做对了什么，并思考下一场比赛如何才能击败他（她）。

你会重复这一步骤，直到你击败对手。这个概念可以被纳入到构建更好的模型中。所以简单来说，要获得一个强大的英雄（即生成器generator），我们需要一个更强大的对手（即鉴别器discriminator）。

这就是生成对抗网络GAN的基本原理。

GAN被广泛用于了图片风格变换和补全的各种研究中，比如之前万圣节mit发布的恐怖片专题页“噩梦机器”，就是通过GAN实现的。

基于GAN的神奇效用，这一补全图片的研究成果可以将一张m x n大小的图片，补全成m x（n+2k）大小的图片。

这个模型的训练使用了36500张256 x 256 RGB的图片。只是目前这一补全还很受限制，只能基于原图片为中心扩展。当然，并且对图片风格也有一定要求，必须是写实风格的图片。

海滩图片及训练结果

斯坦福最新：用GAN补全镜头外的世界

迭代回归绘画

斯坦福最新：用GAN补全镜头外的世界

这一研究来自斯坦福大学两位同学CS230深度学习的课程作业，未来，两位同学希望可以将这一补全能力从图片扩展到视频上。

可以通过下边这页poster简单了解

斯坦福最新：用GAN补全镜头外的世界

研究成果可以通过其在github的链接查看

https://github.com/bendangnuksung/Image-OutPainting

斯坦福两位同学采取的方法是基于一项早稻田大学的研究。来自早稻田大学的三位老师提出了一种局部和全局一致的图像补全方法。在使用卷积神经网络，填充任意形状的缺失区域来补全图像后，使用全局和局部的情景鉴别器来区分真实图像和被补全图像。图像补全网络与鉴别器网络分别被训练后，再利用GAN损失函数统一训练。

与PatchMatch等基于补丁的方法相比，这个的方法可以生成图像中未出现的片段，能够自然地完成具有高度特定的结构（如面部）的图像。

在大数据文摘微信公众号后台对话框内回复“补图”可以获得这篇早稻田的论文（价值15美元，文摘粉丝免费收藏哟~~~）。

斯坦福最新：用GAN补全镜头外的世界

gan

安科网

斯坦福最新：用GAN补全镜头外的世界

wuxiaobingandbob

wuxiaobingandbob

相关推荐

这个模型脑补能力比GAN更强，ETH超分辨率模型SRFlow

当支持向量机遇上神经网络：SVM、GAN距离之间的关系

宅男大叔自学AI打造大师级水准，火爆推特

联想口红电源mini45W对比GaN氮化镓65W外观哪个好?

CNN、RNN、GAN都是什么？终于有人讲明白了

AAE对抗自编码器/GAN与VAE的区别

course | 李宏毅lecture1-GAN基础知识

轻松构建 PyTorch 生成对抗网络(GAN)

生成对抗网络--Generative Adversarial Networks (GAN)

520快手送“男朋友”GAN生成对抗网络助力单身狗“顺利脱单”

Gan(一) - 一份来自香港理工大学的Gans综述

GAN Compression - 1 - 论文学习

单张图像就可以训练GAN！Adobe改良图像生成方法 | 已开源

一个模型击溃12种AI造假，各种GAN与Deepfake都阵亡，已开源

paper | Generative Adversarial Network-Based Intra Prediction for Video Coding

GAN的数学原理

GAN的资料

搜索速度快9倍！Uber创建新的GAN网络，可媲美当前最好架构

Detecting GAN-generated Imagery using Color Cues

使用生成对抗网络（GAN）生成手写字

wuxiaobingandbob