ACM顶刊接收 | GAN的综述

原创

公号机器学习与AI生成创作 2021-07-21 16:49:18 ©著作权

文章标签 技巧 文章分类 代码人生

©著作权归作者所有：来自51CTO博客作者公号机器学习与AI生成创作的原创作品，请联系作者获取转载授权，否则将追究法律责任

新更：
Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy 已被《ACM Computing Surveys》接收。由于GAN的更新极快，相较于之前的版本，新版做了更及时详细的总结和报道。ACM Reference format: Zhengwei Wang, Qi She, and Tomás E. Ward. 2021. Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy. ACM Comput. Surv. 54, 2, Article 37 (February 2021), 38 pages. https://doi.org/10.1145/3439723

======= 旧版原文如下 =======

0 前言

前几天，一位英特尔的小伙伴给公众号发了他们最近更新的GAN综述论文，已经挂在arxiv上，总结得非常不错，今天强推一波！也欢迎各位读者进GAN交流群，与大家一起交流讨论哦！（文末扫码加入）
Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy
https://arxiv.org/pdf/1906.01529.pdf
作者：

Zhengwei Wang is with V-SENSE, School of Computer Science and Statistics, Trinity College Dublin, Dublin, Ireland. e-mail: villa.wang.zhengwei@gmail.com

Qi She is with Intel Labs, Beijing, China. e-mail: qi.she@intel.com

Tom´as E. Ward is with Insight Centre for Data Analytics, Dublin City University, Dublin, Ireland. e-mail: tomas.ward@dcu.ie
本文不做详细解读，具体内容可参考原文。

1 概要

过去几年，生成对抗网络（GAN）得到了广泛的研究；其最重要而明显的影响是在计算机视觉领域，如合理自然的图像生成，图像到图像的转换，人脸属性编辑等等。
将GAN应用于实际问题，仍存在挑战，在此本文重点关注其中三个：（1）高质量的图像生成；（2）图像生成的多样性；（3）稳定的训练。
本文对GAN相关研究的进展进行了详细回顾，讨论其在计算机视觉中引人注目的应用，并提出一些有关未来研究方向的建议。

2 典型网络结构

Fully-connected GAN (FCGAN)
Semi-supervised GAN (SGAN)

SGAN是在半监督学习的背景下提出的，与监督学习（其中每个样本都需要一个标签）和非监督学习（其中不提供标签）不同，半监督学习具有一小部分示例的标签。与FCGAN相比，SGAN的鉴别器是multi-headed的，即具有softmax和Sigmoid，以对真实数据进行分类并分别区分真实和生成样本。作者在MNIST数据集上训练SGAN，结果表明与原始GAN相比，SGAN中的鉴别器和生成器均得到了改进。 ACM顶刊接收 | GAN的综述_技巧_04