自发明以来,GAN一直被学术界和工业界的专家们誉为“深度学习中最重要的创新之一”,也被视为实现通用人工智能的重要基石。Facebook的人工智能研究主管Yann LeCun甚至表示,GAN及其变体是“过去20年来深度学习中最酷的想法”。


GAN的应用落地已非常广泛,包括图像生成(超分辨率)、语义分割、文字生成、数据增强、信息检索/排序、聊天机器人等还有近期席卷B站的AI视频换脸技术,因此GAN成为了更多准研究生的研究方向。


学GAN网络,如果想要在算法上有所创新,那就一定要理解并掌握GAN领域的经典Paper,我推荐GAN领域的基石论文——原生 GAN 。


原生 GAN , 2014 , NIPS 

《 Generative Adversarial Nets 》—— GAN 系列的奠基性论文

使得图像/视频的智能生成和编辑成为可能


论文介绍:

1. 提出了一个基于对抗的新生成式模型 GAN ;

2. 提出了 GAN 的价值函数和优化步骤,并进行相关理论证明; 

3. 提出 GAN 目前存在的缺点和未来的改进方法


那问题来了,有同学说他看GAN论文时是这样的:


面试官:原生GAN都没搞清楚,自己走还是我送你_深度学习


读论文的难点到底在哪里,我分析了一波:


1.重点难把握:动辄10多页的文字,看了半天找不出重点、关键点;

2.论文关系理不清:论文之间存在相互借鉴、引用,需要耗费大量的时间、精力才能理清,更何况大家阅历有限的情况下,根本就理不清;

3.公式图看不懂:公式复杂,步数过多,加大阅读理解难度,直接劝退新手;

4.无法复现论文代码:刚学python不久,python拓展c代码不会,编译问题不断,程序跑不起来,debugging....

5.坚持不下去:几乎以上任意一条就挺折磨人,如果你同时遇到上面三条困境,那就离放弃不远了。


如果你也有这些困惑,这里推荐深度之眼阿里云天池合作的:


面试官:原生GAN都没搞清楚,自己走还是我送你_深度学习_02