只有条件GAN才能稳定训练？对抗+自监督的无监督方法了解一下

CSDNyun

2019-01-02

针对 GAN 在线对抗训练时出现的不稳定性问题，来自 UCLA 与谷歌大脑的研究者提出了对抗训练+自监督训练的新训练方法。该方法是无监督的，不需要标记数据，但可以达到和条件 GAN 相当的训练稳定性，同时 ImageNet 生成质量可以达到 FID33（这是在 ImageNet 上无条件训练获得的最佳结果。）。该研究入选了 NeurIPS 2018 Workshop。

生成对抗网络（GAN）是一类无监督的生成模型 [1]。GAN 涉及对抗地训练生成器和鉴别器模型，使得生成器可以从期望的数据分布中生成样本。训练 GAN 具有挑战性，因为它涉及在高维参数空间中搜索非凸博弈的纳什均衡。在实践中，GAN 通常使用交替的随机梯度下降进行训练，这通常是不稳定的并且缺乏理论保证 [2]。因此，训练可能表现出不稳定性、发散、循环行为或模式崩溃 [3]。为此，人们提出了许多稳定 GAN 训练的技术 [4,5,6,7,8,9,10]。导致训练不稳定的主要原因是生成器和鉴别器在非静态环境中学习。因为鉴别器是一种分类器，其中一类（假样本）的分布随着生成器在训练期间改变而改变。

在非稳态在线环境中，神经网络忘记了以前的任务 [11,12,13]。如果鉴别器忘记了先前的分类边界，则训练可能变得不稳定或循环。这个问题通常通过重复使用旧样本或应用连续学习技术来解决 [14,15,16,17,18,19]。在复杂数据集下，这些问题变得更加突出。其中的关键技术是条件化 [9,20,21,22]，由此生成器和鉴别器都可以访问标记数据。可以说，用监督信息增强鉴别器可以鼓励它学习更稳定的表征，防止灾难性的遗忘。此外，学习每个类的条件模型比学习联合分布更容易。此设置的主要缺点是标记数据的必要性。即使标记数据可用，它通常也是稀疏的，仅涵盖数量有限的高级抽象概念。

受上述挑战的驱使，来自 UCLA 与谷歌大脑的研究者的目标是表明人们可以在不需要标记数据的情况下实现条件化的好处。为了确保鉴别器学习的表征更稳定和有用，研究者为鉴别器添加辅助的自监督损失。这实现了更稳定的训练，因为鉴别器表征对生成器输出质量的依赖性降低。研究者引入了一种新的模型：自监督的 GAN（self-supervised GAN，SS-GAN），其中生成器和鉴别器在表征学习的任务上合作，并在生成任务上进行竞争。

本研究的贡献：研究者提出了一种无监督的生成模型，它将对抗训练与自监督学习相结合。该模型实现了条件 GAN 的优势，但不需要标记数据。特别是，在相同的训练条件下，自监督的 GAN 弥补了无条件和条件模型之间的自然图像合成的差距。在此设置中，鉴别器表征的质量大大提高，这在迁移学习中可能会有潜在的应用价值。该模型实现了大规模无条件 ImageNet 图像生成。研究者认为，这项工作是朝着高质量、完全无监督、自然图像合成方向迈出的重要一步。