最近Reddit 用户「ContributionSecure14」在机器学习社区疯狂吐槽:「我花了一个星期尝试复现一篇论文,结果失败了。上网搜了一下才发现,也有其他人说这篇论文的结果无法复现。」


另一位 Reddit 用户写道:「所有论文中可能有 50%-75%是不可复现的,可悲啊,但这却是事实。」




众所周知,计算机视觉中四个基本任务是:图像分类、目标检测、语义分割以及实体分割。



语义分割作为其中最重要的任务之一,很多粉丝都问我,其中最经典的基石论文是哪一篇呢?


当然是2015年神经网络大神 Jonathan Long 发表的《Fully Convolutional Networks for Semantic Segmentation》,简称“ FCN ”。获得了当时CVPR2015年最佳论文奖,论文的引用量已经达到了13136


全卷积网络FCN实现了第一次训练可以端到端的进行,也是第一次用监督预训练的方法。使其成为了语义分割主流算法的开山之作,后续工作也是基于FCN进行改造的,如U-Net、SegNet、Deeplab系列等,所以非常推荐大家阅读并进行复现:


FCN 开启深度学习语义分割新纪元

《Fully convolutional networks for semantic segmentation 》 


论文介绍 

① FCN 是深度学习语义分割的开山之作

② FCN 第一次在 CNN 网络中实现了端到端训练 

③ FCN 为后续语义分割算法的发展做出了巨大贡献


但新问题来了,有同学说他看论文的过程就是:


选择-打开-烦躁-再选择-打开-烦躁(无限死循环……)


读论文的难点到底在哪里,我分析了一波:


1.重点难把握:动辄10多页的文字,看了半天找不出重点、关键点;

2.论文关系理不清:论文之间存在相互借鉴、引用,需要耗费大量的时间、精力才能理清,更何况大家阅历有限的情况下,根本就理不清;

3.公式图看不懂:公式复杂,步数过多,加大阅读理解难度,直接劝退新手;

4.无法复现论文代码:刚学python不久,python拓展c代码不会,编译问题不断,程序跑不起来,debugging....

5.坚持不下去:几乎以上任意一条就挺折磨人,如果你同时遇到上面三条困境,那就离放弃不远了。