自发明以来,GAN一直被学术界和工业界的专家们誉为“深度学习中最重要的创新之一”,也被视为实现通用人工智能的重要基石。Facebook的人工智能研究主管Yann LeCun甚至表示,GAN及其变体是“过去20年来深度学习中最酷的想法”。
GAN的应用落地已非常广泛,包括图像生成(超分辨率)、语义分割、文字生成、数据增强、信息检索/排序、聊天机器人等,还有近期席卷B站的AI视频换脸技术,因此GAN成为了更多准研究生的研究方向。
但学GAN网络,如果想要在算法上有所创新,那就一定要理解并掌握GAN领域的经典Paper,我推荐GAN领域的基石论文——原生 GAN 。
原生 GAN , 2014 , NIPS
《 Generative Adversarial Nets 》—— GAN 系列的奠基性论文
使得图像/视频的智能生成和编辑成为可能
论文介绍:
1. 提出了一个基于对抗的新生成式模型 GAN ;
2. 提出了 GAN 的价值函数和优化步骤,并进行相关理论证明;
3. 提出 GAN 目前存在的缺点和未来的改进方法
那问题来了,有同学说他看GAN论文时是这样的:
读论文的难点到底在哪里,我分析了一波:
1.重点难把握:动辄10多页的文字,看了半天找不出重点、关键点;
2.论文关系理不清:论文之间存在相互借鉴、引用,需要耗费大量的时间、精力才能理清,更何况大家阅历有限的情况下,根本就理不清;
3.公式图看不懂:公式复杂,步数过多,加大阅读理解难度,直接劝退新手;
4.无法复现论文代码:刚学python不久,python拓展c代码不会,编译问题不断,程序跑不起来,debugging....
5.坚持不下去:几乎以上任意一条就挺折磨人,如果你同时遇到上面三条困境,那就离放弃不远了。
如果你也有这些困惑,这里推荐深度之眼与阿里云天池合作的: