最近Reddit 用户「ContributionSecure14」在机器学习社区疯狂吐槽:「我花了一个星期尝试复现一篇论文,结果失败了。上网搜了一下才发现,也有其他人说这篇论文的结果无法复现。」
另一位 Reddit 用户写道:「所有论文中可能有 50%-75%是不可复现的,可悲啊,但这却是事实。」
众所周知,计算机视觉中四个基本任务是:图像分类、目标检测、语义分割以及实体分割。
语义分割作为其中最重要的任务之一,很多粉丝都问我,其中最经典的基石论文是哪一篇呢?
当然是2015年神经网络大神 Jonathan Long 发表的《Fully Convolutional Networks for Semantic Segmentation》,简称“ FCN ”。获得了当时CVPR2015年最佳论文奖,论文的引用量已经达到了13136次。
全卷积网络FCN实现了第一次训练可以端到端的进行,也是第一次用监督预训练的方法。使其成为了语义分割主流算法的开山之作,后续工作也是基于FCN进行改造的,如U-Net、SegNet、Deeplab系列等,所以非常推荐大家阅读并进行复现:
FCN 开启深度学习语义分割新纪元
《Fully convolutional networks for semantic segmentation 》
论文介绍
① FCN 是深度学习语义分割的开山之作
② FCN 第一次在 CNN 网络中实现了端到端训练
③ FCN 为后续语义分割算法的发展做出了巨大贡献
但新问题来了,有同学说他看论文的过程就是:
选择-打开-烦躁-再选择-打开-烦躁(无限死循环……)
读论文的难点到底在哪里,我分析了一波:
1.重点难把握:动辄10多页的文字,看了半天找不出重点、关键点;
2.论文关系理不清:论文之间存在相互借鉴、引用,需要耗费大量的时间、精力才能理清,更何况大家阅历有限的情况下,根本就理不清;
3.公式图看不懂:公式复杂,步数过多,加大阅读理解难度,直接劝退新手;
4.无法复现论文代码:刚学python不久,python拓展c代码不会,编译问题不断,程序跑不起来,debugging....
5.坚持不下去:几乎以上任意一条就挺折磨人,如果你同时遇到上面三条困境,那就离放弃不远了。