DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

AndyViky

2018-02-05

新智元推荐

作者：Balaji Lakshminarayanan

【新智元导读】本文是DeepMind高级研究科学家Balaji Lakshminarayanan在SF AI Meetup上演讲的slides，总结了他以及 Ian Goodfellow，Shakir Mohamed, Mihaela Rosca等人最新的GAN工作。

PPT下载：http://www.gatsby.ucl.ac.uk/~balaji/Understanding-GANs.pdf

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

《理解生成对抗网络》

包括以下内容：

GAN与概率机器学习中的其他方法有哪些联系？
如何比较分布？
生成模型与算法
如何结合VAE和GAN来获得更好的结果？
缩小理论与实践之间的差距
其他一些有趣的研究方向和应用

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

问题陈述：

一个生成模型

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

我们的目标是：从真实分布

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

给定样本

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

，找到 θ

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

GAN概述

鉴别器（Discriminator）：训练一个分类器，使用样本区分两个分布

生成器（Generator）：生成愚弄鉴别器的样本

Minimax game：在训练鉴别器和生成器之间交替

对应JS散度的最小值的纳什均衡
在实践中为了稳定训练需要一些技巧

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

GAN的各种变体非常多

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

GAN与概率机器学习中的其他方法有哪些联系？

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

隐式模型：生成数据的随机过程

规定模型：提供有关观察的概率的知识，并指定一个条件对数似然函数。

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

通过比较学习：使用样本比较估计分布与真实分布

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

定义一个联合损失函数

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

，并在Comparison loss和Generative loss间交替

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

如何比较分布？

以下介绍了四种方法，包括：

类概率估计
散度最小化（f-GAN）
密度比估计
时矩匹配

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

如何比较分布？——方法小结

类概率估计

建立一个分类器来区分真实样本和真实样本
原始的GAN解决方案

密度比匹配

直接将真实比率与估计值之间的预期误差最小化

散度最小化

最小化真实密度 p* 和乘积 r(x)q(x) 之间的广义散度
f-GAN方法

时矩匹配（Moment matching）

匹配 p* 和 r(x)q(x) 的时矩
MMD，最优传输（ optimal transport），等

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

如何学习生成器？

在GAN中，生成器是可微分的

生成器loss有以下几种形式，例如：f-散度 D_f = E_q [f(r)]
可以利用再参数化的技巧

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

小结：在隐式生成模型中学习

密度比估计

但它们不专注于学习生成器

近似贝叶斯计算（ABC）和likelihood-free 推理

低维，理论更好理解
对参数的贝叶斯推断
模拟器通常是不可微分的

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

生成模型与算法

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

对一个固定模型，比较其推理算法

用最大似然估计（MLE）训练
通过Wasserstein GAN训练生成器
比较

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

小结：

Wasserstein距离可以比较模型。
通过训练critic可以近似估计Wasserstein距离。
通过WGAN进行训练能得到更好的样本，但对数概率显著更差。
通过WGAN训练的Latent code是非高斯的。

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

如何结合VAE和GAN来获得更好的结果？

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

Mode collapse问题：

“Unrolled GAN”论文中的MoG toy 的例子
VAE还有其他问题，但不会遭到Mode collapse

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

将自动编码器添加到GAN，及与VAE中Evidence Lower Bound (ELOB)的关系

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

评估不同的变体

我们的VAE-GAN的混合模型可与state-of-the-art的GANs相媲美

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

小结：VAEs和GANs

VAE:

变分推理：重构；编码器网络
后期的latent与先前的匹配

GAN：

隐式解码器
可以使用隐式编码器：用于匹配分布的鉴别器

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

缩小理论与实践之间的差距

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

GAN理论与实践的区别

已经有许多新的GAN变体被提出（例如Wasserstein GAN）

由新理论激发的损失函数和正则化项
理论与实践之间的有显着区别

如何弥补这个差距？

理论预测失败的综合数据集
将新的正规化项添加到原始non-saturating GAN

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

Jensen Shannon divergence失败时的合成数据集比较

Gradient penalty能得到更好的表现

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

在真实数据集上的结果

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

小结：

一些令人惊讶的发现：

梯度惩罚（gradient penalty）也能稳定（非Wasserstein的）GAN
不仅要考虑理想的损失函数，还要考虑优化

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

其他一些有趣的研究方向：

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

GAN用于模仿学习

使用一个单独的网络（鉴别器）来“学习”现实的动作
对抗模仿学习：RL奖励来自鉴别器

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

研究：

利用纳什均衡收敛的想法
与RL（actor-critic方法）的联系
控制理论

应用：

Class-conditional生成
文本-图像生成
图像-图像转换
单图像超分辨率
域适应

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

小结：

稳定GAN训练的方法

结合自动编码器
梯度惩罚

GAN文献中一些有用的工具：

密度比（density ratio）的技巧在其他领域也很有用（例如信息传递）
隐式变分逼近
学习一个现实的损失函数
如何处理不可微分的模拟器？——使用可微分近似进行搜索？

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

deepmind gan 研究员算法

AndyViky

0 关注 0 粉丝 0 动态

关注关注

超越BigGAN，DeepMind提出「史上最强非GAN生成器」VQ-VAE-2

能生成逼真图像的不只有 GAN。去年 9 月，BigGAN 横空出世，被誉为「史上最强 GAN 生成器」，其逼真程度众多研究者高呼「鹅妹子嘤」！相关论文也被 ICLR 2019 接收为 Oral 论文。今年 2 月，BigGAN 的一作又发布了更新版论文，

xmdxcsj 2019-06-05

DeepMind,哈佛造出了 AI「小白鼠」:从觅食,击球窥探神经网络奥秘

在一篇 ICLR 2020 Spotlight 论文中，DeepMind 和哈佛大学的研究者构建了一个基于 AI 的虚拟小鼠，能够执行跑、跳、觅食、击球等多项复杂任务。他们还尝试用神经科学技术来理解这个「人造大脑」如何控制其行为。或许这一成果可以为我们提供

天行九歌 2020-04-29

DeepMind发布神经网络、强化学习库，网友：推动JAX发展

DeepMind今日发布了Haiku和RLax两个库，都是基于JAX。而此次发布的两个库，分别针对神经网络和强化学习，大幅简化了JAX的使用。Haiku是基于JAX的神经网络库，允许用户使用熟悉的面向对象程序设计模型，可完全访问 JAX 的纯函数变换。RL

XuFangfang0 2020-02-21

大脑也在用分布式强化学习？DeepMind新研究登上《Nature》

分布式强化学习是智能体在围棋、星际争霸等游戏中用到的技术，但 DeepMind 的一项研究表明，这种学习方式也为大脑中的奖励机制提供了一种新的解释，即大脑也应用了这种算法。这一发现验证了分布式强化学习的潜力，同时也使得 DeepMind 的研究人员越发坚信

专注坚持 2020-01-16

102页PPT，DeepMind强化学习最新进展，含图文、公式和代码

本文提供涵盖了强化学习RL基础概念、策略梯度、动态规划以及D4PG、R2D3等RL算法的资源。[ 导读 ]在DeepMing任职的Nando de Freitas在KHIPU 2019上做了关于强化学习的教程，102页ppt。在KHIPU 2019上，在D

trillionpower 2019-11-23

Alphabet 的 DeepMind 损失在 2018 年飙升至5.7亿美元

根据英国公司大楼登记处周三提交的文件显示，负责创建人类级人工智能的谷歌人工智能公司 DeepMind 在2018年度过了昂贵的一年。其 2018 年的税前亏损额从 2017 年的 3.41 亿美元和 2016 年的 1.54 亿美元增长至 5.7 亿美元。

芋头 2019-11-03

DeepMind 开源 Spriteworld，灵活，可配置的强化学习环境

Spriteworld是一个基于python的RL环境，由一个可以自由移动的简单形状的二维竞技场组成。该环境是为文章“COBRA：基于数据有效模型的RL通过无监督对象发现和好奇心驱动的探索”中介绍的COBRA代理开发的。环境的动机是为程序生成多对象场景提供

专注坚持 2019-11-03

DeepMind一次性开源3个新框架！深度强化学习应用落地即将迎来春天？

本文转自雷锋网，如需转载请至雷锋网官网申请授权。深度强化学习一直是近年来人工智能的一些重大突破的核心。然而，尽管 DRL 有了很大的进步，但由于缺乏工具和库，DRL 方法在主流解决方案中仍然难以应用。就在最近，DeepMind 发布了一系列新的开源技术，包

luchi00 2019-09-20

DeepMind向星际玩家们下了战书！你的对手可能是AI，而你毫不知情

欧洲的星际争霸玩家们即日将有机会和Deepmind AI打场比赛了！出战的AI是由DeepMind和暴雪联合培养的，经过了“特别的训练方式”，在星际争霸界 II 早有过赫赫战绩，连续在10场比赛中击败了人类职业选手。另外10场比赛，代表人类出战的是职业选手

引力空间万物互联 2019-07-11

这部关于 AI 的纪录片，还是值得一看的

纪录片《 AlphaGo 》，是由 Google 与 DeepMind 团队出品，纪录片导演 Greg Kohs 和团队精心制作完成。讲述了 DeepMind 团队带领 AlphaGo 与人类顶尖棋手展开对决的几场关键性比赛。这部纪录片在去年自各个影展上小

ZLXiong 2019-06-28

Reddit热议！DeepMind最新研究解决灾难性遗忘难题

当遇到序列任务时，神经网络会遭受灾难性遗忘。DeepMind研究人员通过在函数空间中引入贝叶斯推理，使用诱导点稀疏GP方法和优化排练数据点来克服这个问题。今天和大家分享这篇Reddit高赞论文。该方法被称为用于持续学习的函数正则化，通过在底层任务特定功能上

panrenlong 2019-06-23

DeepMind游戏AI登上Science:雷神之锤多智能体合作，超越人类玩家

去年年中，DeepMind 介绍了其在游戏智能体方面的新进展，聚焦于雷神之锤 III 竞技场的夺旗模式。当时，DeepMind 设计的为 FTW 智能，达到了人类水平，能够与其它智能体或人类相互合作。今年，DeepMind 继续发力，提出基于 self-p

wesay 2019-06-03

结合符号主义和DL:DeepMind提出端到端神经网络架构PrediNet

DeepMind 最近的一项研究将符号人工智能和深度学习结合起来，提出了一种新型端到端神经网络架构 PrediNet。符号主义和连接主义是人工智能领域中的两大流派。连接主义，又称为仿生学派或生理学派，其主要原理为神经网络及神经网络间的连接机制与学习

hexianhao 2019-05-29

DeepMind论文：深度压缩感知，新框架提升GAN性能（附链接）

本文介绍一种将压缩感知和GAN联系起来的创新框架。[ 导读 ] DeepMind提出一种全新的“深度压缩感知”框架，将压缩感知与深度学习相结合，显著提高了信号恢复的性能和速度，并提出一种改进GAN的新方法。压缩感知是一种优雅的框架，用于从压缩信号中恢复稀疏

刀刀鱼 2019-06-01

DeepMind揭秘雷神之锤3背后AI真相：碾压人类只是个开始

虽然人类已经无望在电子竞技中打败AI多智能体，但DeepMind的研究仍在继续往前推进。最近他们公布了在强化学习方面的最新进展，并对未来进行了展望。AI智能体的能力还会继续提高吗？DeepMind的科学家也想知道。他们最近更新了博客，以雷神之锤为例，为我们

zourzh 2019-05-31

DeepMind论文：深度压缩感知，新框架提升GAN性能

DeepMind提出一种全新的“深度压缩感知”框架，将压缩感知与深度学习相结合，显著提高了信号恢复的性能和速度，并提出一种改进GAN的新方法。例如，CS可以利用自然图像的结构，仅从少量的随机测量中恢复图像。CS具有灵活性和数据效率高的优点，但由于其稀疏性和

tryhl 2019-05-23

没有地图也能导航？DeepMind用街景来认路

在童年记忆中，你是如何沿着路线去朋友家、学校或者商店的？那时候没有地图，只是简单的记住街景和沿途转向。因此，导航是一种很重要的认知任务，人类或者动物不需要地图就能够在复杂的世界中进行远距离穿越。请注意，这项研究适用于一般导航而不是汽车驾驶，在这里，我们既没

hello小工 2018-04-08

DeepMind科学家：AI对战《星际争霸》胜算几何？

AI科技大本营1月29日消息，在《麻省理工科技评论》与深科技举办的新兴科技峰会上，谷歌DeepMind科学家Oriol Vinyals在会上发表了主题为《AI对战星际争霸胜算几何？》的演讲。在加入谷歌AI团队之后，Oriol Vinyals参与了机器翻译、

yuyin 2018-01-29

学术 | DeepMind最新研究：使用更简单的环境就能检测AI是否安全

随着人工智能系统在现实生活中变得通用和实用，确保系统的安全运行变得越来越重要。迄今为止，大部分技术人工智能安全研究都集中在，对不安全行为的性质和原因的理论学习上。这九个环境被称为gridworlds。每一个都由一个类似棋盘的二维网格组成。除了标准的激励函数

coverse 2017-11-29

城会玩！DeepMind新AI竟然自己学会跑酷了

DeepMind在通用人工智能的道路上越走越远。最近，他们通过电脑动画和生物力学，让人工智能自己学会了如何在动画环境中运动，包括步行、跑动、跳跃、攀爬。另外，为了抗衡Google在通用人工智能方面的影响力，微软研究院在其雷德蒙总部成立了全新的人工智能实验室

脑极体 2017-07-13

安科网

DeepMind高级研究员：重新理解GAN，最新算法、技巧及应用（PPT）

AndyViky

AndyViky

相关推荐

超越BigGAN，DeepMind提出「史上最强非GAN生成器」VQ-VAE-2

DeepMind,哈佛造出了 AI「小白鼠」:从觅食,击球窥探神经网络奥秘

DeepMind发布神经网络、强化学习库，网友：推动JAX发展

大脑也在用分布式强化学习？DeepMind新研究登上《Nature》

102页PPT，DeepMind强化学习最新进展，含图文、公式和代码

Alphabet 的 DeepMind 损失在 2018 年飙升至5.7亿美元

DeepMind 开源 Spriteworld，灵活，可配置的强化学习环境

DeepMind一次性开源3个新框架！深度强化学习应用落地即将迎来春天？

DeepMind向星际玩家们下了战书！你的对手可能是AI，而你毫不知情

这部关于 AI 的纪录片，还是值得一看的

Reddit热议！DeepMind最新研究解决灾难性遗忘难题

DeepMind游戏AI登上Science:雷神之锤多智能体合作，超越人类玩家

结合符号主义和DL:DeepMind提出端到端神经网络架构PrediNet

DeepMind论文：深度压缩感知，新框架提升GAN性能（附链接）

DeepMind揭秘雷神之锤3背后AI真相：碾压人类只是个开始

DeepMind论文：深度压缩感知，新框架提升GAN性能

没有地图也能导航？DeepMind用街景来认路

DeepMind科学家：AI对战《星际争霸》胜算几何？

学术 | DeepMind最新研究：使用更简单的环境就能检测AI是否安全

城会玩！DeepMind新AI竟然自己学会跑酷了

AndyViky