前言

文献浩如烟海,却是我们站在巨人肩上前行的资本,然而,作为一枚啃论文小白,面对如此庞大的知识资本,总是很难精准找到自己想要的文献,唯有经过长时间的精挑细选、几经折腾,才能找到些许值得一读文献。至于要如何在尽量短的时间内掌握尽量多的有价值的信息,这很大程度上取决于筛选文献的效率。 初次进入啃论文俱乐部学习,在参与了几次啃论文俱乐部的分享会后,也逐渐了解了啃论文俱乐部独特的啃论文方式,通过学习俱乐部的啃论文方法并且与彭明辉教授的研究生手册进行对比,对我的啃论文技能有了很大提升,也让我明白正确的啃论文姿势对科学研究的重要性,下面就分享一下自己的一些收获。

工欲善其事,必先利其器——检索网站和工具推荐

论文检索网站

  1. 常见中文文献检索网站: 中国知网(CNKI)(检索结果最多,学科覆盖最广,内容齐全), 万方数据知识服务平台(收录时间最短,年代稍远的文献查不到,但现刊收录最好) 维普期刊资源整合服务平台(收录时间最久,但医学类期刊文献较少)
  2. 常见英文文献检索网站: 谷歌学术(收录文献最全面,免费搜索) Web of Science(全球最大、覆盖学科最多的综合性学术信息资源网站,检索功能强大,需要所在单位有购买权限才能使用) Sci-Hub(论文下载利器) ACM(美国计算机协会)数据库(出版最具权威和前瞻性的文献) IEEE(质量高)
  3. 个人建议 在进行论文检索时可能会遇到论文付费无法下载的问题,除了可以通过将文献的doi号复制到sci-hub中,还可以充分利用高校图书馆电子资源,一般高校都会购买数据库电子资源用于老师学生科研等工作。可以在学校图书馆官网查看可以利用的数据库,一般只要连到校园网就可以免费访问这些电子资源,如果在校外的话还可以通过挂vpn(学校图书馆一般会提供)或者CARSI(中国教科网统一认证与资源共享基础设施)直接登录已经采购的电子资源网站即可访问。 image.png

在这里我也强烈推荐使用Web of Science(如果学校有的话),有强大的检索筛选,收录与引用,被引用,相关查询,检索结果分析,文献追踪等功能,下一次会出一期使用教程。

工具

论文管理:Zotero 论文翻译:知云 这两个工具啃论文俱乐部分享推荐的,亲测好用,记得我第一次读论文的时候也是被这两个问题困扰,论文的名字是乱码,管理起来不容易,我当时直接把想用的论文放在标签页面,点来点去查看,然后之后重新找这些论文的时候就很麻烦,而且窗口很多也不好管理。翻译当是也是找了很多能够划词翻译的插件,效果也一般。所以很推荐小白使用者两款工具,使用链接如下: 查找、翻译管理综述工具:啃论文小白如何拉满文献管理技能

啃论文方法(对比彭明辉教授研究生手册方法与啃论文俱乐部方法)

总览

image.png

一. 发现一个研究领域

  • 彭教授:在开始的时候,你可以没有明确的目标,只要张开你的所有触角,去看,去读,去感受,你会不自觉地爱看一些东西,那是你的兴趣,也是你的知识结构决定的,日子久了,也会出现几条路,这些路也都可以通向你要追求的目标。 学会倾听心音,让心来告诉你如何走,就不会被别人的价值观、流行的热点牵着跑
  • 俱乐部:在开发技术社区内了解相关领域的热门技术,为后续研究综述论文建立基本框架;通过类似ACM Survey这样的顶级期刊里面阅读高质量的综述或者老师给出的综述,来寻找适合自己的研究领域;通过盘各种顶会usenix.org、isca,发现热门的领域技术,最新的研究报告,来寻找适合自己的方向。

二. 进入一个研究领域

  • 彭教授:进入一个领域最简单也是最有效的办法是找一本这个领域最早的论述专著或教材当。你把这个领域的基本概念的内涵以及相互之间的关系搞清楚了之后,再去读这个领域的论文,你就会因为心中有数而能够很好地把握了。这种工作必须要先做,不可以在网上乱搜论文,否则,你会感到:看了 20 篇文章,对这个领域的识还没有形成,这些概念自相矛盾。有此认识还算幸运,有的人恐怕被偏见所引导,还不知道,这是最可怕的。
  • 俱乐部:综述是对某一方面的专题搜集大量情报资料后经综合分析而写成的一种学术论文,反映当前某一领域中某分支学科或重要专题的最新进展、学术见解和建议。它往往能反映出有关问题的新动态、新趋势、新水平、新原理和新技术等等。先读综述,可以更好地认识课题,知道已经做出什么,自己要做什么,还有什么问题没有解决。锁定领域综述论文,参考技术地图阅读论文,重点关注的是综述论文里面的图片以及表格,总结出相关领域的技术框架,对该领域形成一个初步的认识。

关于从Original Article(最早的论述专著或教材)还是Review(综述)入手比较,彭明辉教授总结了其中的优缺点: image.png 对于彭明辉教授的总结:Review和Original Article各有千秋,从Review vs Original Article这一话题说开去,我其实仍然在重复强调原始数据的至高无上性.同原始数据更短的距离是我更看好Original Article的原因,但合理利用Review可以为原始数据的寻找指明方向.然而,这么做的前提是,对于Review中的预测和方向,必须时刻有一种“革命尚未成功,同志还需努力”的谨慎和保留.如果这些预测和方向在原始数据铁铸的事实面前败下阵来了,那么需要有随时转向的勇气和准备。 对于我们啃论文俱乐部的大多数人来说,还是从综述论文读起会比较适合,读综述更容易让我们技术洞察,能让本科生理解技术,省力学习到最前沿的技术。直接单点突破单篇论文对不熟悉领域的我们还是挺困难的,也容易消磨我们啃论文的热情,通过读综述能让我们对领域技术有个大致框架,更容易寻找方向,两种方法各有优劣,可以根据自己的需要进行选择,适合自己最重要。

三. 发现一个研究课题

  • 彭教授: 1.浏览各有关协会的网站,看看最近召开的学术会议的议题 2.翻翻国内有关的期刊,看看最近这些年大家都在忙什么 根据你自己的知识结构,你会很自然地有所倾向,再多看看你感兴趣的话题,比较之后,也许就形成了你的论文选题了。

  • 俱乐部:通过综述自己总结出技术地图,再深入研究技术地图上的某个点,可以是感兴趣的点,比较热门的点等,进行深入研究,逐个攻破。

四. 数据检索

  • 彭教授:在给定(或自己拟定)的题目范围内,你必须有能力利用数据检索系统,查出所有相关的论文,而无任何遗漏(否则你可能在论文口试时才发现同一个题目已经有人发表过了).你到底要用什么样的关键词和查所程序去保证你已经找出所有相关的文献?这是第一个大的挑战.每一组关键词(包含联集与交集)代表一个论文所构成的集合,假如你用的关键词不恰当,你可能找到的集合太小,没有涵盖所有的相关文献;假如你用的关键词太一般化(譬如「image」),通常你找到的集合会太大,除了所有相关文献之外还加上好几十倍的毫不相关的文献.
  • 俱乐部:综述检索,可以通过学术搜索引擎搜索“a survey of + ”技术名”,搜索引擎最好用比较权威,顶级,例如ACM Survey,有效地建立起知识体系,获取高质量综述。

五. 资料筛选

  • 彭教授:只读论文的题目、摘要、简介和结论,尽量做到还没有完全看懂内文,就准确地判断出这篇论文中是否有值得你进一步参考的内容,通过这种方式从大量文献中筛选出二三十篇有价值的文献进一步精读。
  • 俱乐部: ①看大公司,比较贴近商业。(IBM Microsoft Facebook Adobe Google...) ②新老一起抓,整理论文引用与被引用的文献,“引用”能找过去,有助于更好了解我们的论题,“被引用”:能链接到未来,使我们了解到相关领域技术的最新发展。 image.png

六. 论文阅读与分析

  • 彭教授:
  1. 期刊论文是没头没尾的十几页文献,只交代最核心的创意,并援引许多其它论文的研究成果(但只注明文献出处,而完全没有交代其内容).因此,要读懂一篇论文,一定要同时读懂数篇或十数篇被援引的其它论文.偏偏,这十几篇被援引的论文又各自援引十数篇其它论文。所以需要有意培养从无组织的知识中检索,筛选,组织知识的能力,而这种能力需要大量而持续的时间去摸索。
  2. 彭教授对期刊论文的分析技巧与程序也做了详细的讲解,主要要求我们带着问题看论文,分析论文的优缺点,这这一点上ELT.ZIP团队总结得非常好啃论文俱乐部——学术科研方法论沉淀辑,这里我就懒得再总结一次了。 image.png
  3. 选择性阅读,一定要逐渐由粗而细地一层一层去了解。上面所规划的读论文的次序,就是由粗而细,每读完一轮,你对知识就增加一层。根据这一层知识就可以问出下一层更细致的问题,再根据这些更细致的问题去重读,就可以理解到更多的内容。因此,一定是一整批一起读懂到某个层次,而不是逐篇逐篇地整篇一次读懂。
  4. 硕士生和大学生最主要的差别:大学生读什么都必须要从头到尾都懂,硕士生只需要懂他用得着的部分就好了!大学生因为面对的知识是有固定的范围,所以他那样念.硕士生面对的知识是没有范围的,因此他只需要懂他所需要的细腻度就够了.硕士生必须学会选择性的阅读,而且必须锻炼出他选择时的准确度以及选择的速度,不要浪费时间在学用不着的细节知识!多吸收点子比较重要,而不是细部的知识
  • 俱乐部:抓住技术地图,有序地按照十八掌套路,按照发展历程、技术地图,根据场景、问题、技术、开源技术进行盘点。具体的阅读方法我觉得也和彭教授的方法有共通之处,具体的还没实践过,这里再借鉴一遍ELT.ZIP团队总结的方法。 image.png

七. 输出导向

  • 彭明辉:为什么要坚持培养阅读与分析期刊论文的能力我所以一直坚持要训练研究生阅读与分析期刊论文的能力,主要是为了学生毕业后中长期的竞争力着想.只要能够充分掌握阅读与分析期刊论文的技巧,就可以水到渠成地轻松进行创新的工作.所以,只要深入掌握到阅读与分析期刊论文的技巧,就可以掌握到大学生不曾研习过的三种能力: (1)自己从无组织的知识中检索,筛选,组织知识的能力 (2)对一切既有知识进行精确批判的独立自主判断能力 (3)创造新知识的能力

  • 俱乐部:对于大多数高校开发者来说,限于自身知识水平还不足以支撑自己对综述类论文做过高难度的深度解析,所以我们不需要耗费太多时间精力去深度研究原理,况且过于沉浸研究原理也容易打击我们的自信心、消耗啃论文的热情。综述类论文一般都会附上开源项目的地址,我们将其复制粘贴到网页里打开跳转到对应开源项目的使用文档里并将代码下载到本地去体验这些技术,对比寻找类似的技术。操作完以上步骤之后,我们可以输出相关的开发技术文章记录下自己的心得体会,后期可以参与到开源项目上来例如openharmony代码提交。以开源作为啃论文的出口,把啃论文的内功展现出来

后记

彭明辉教授和啃论文俱乐部的学习方法虽然有所不同,但皆可为我们所用,例如,我在检索文献时可以使用啃论文俱乐部的检索综述的方法,在阅读文献时可以采用彭明辉教授的阅读法来提高阅读效率,我们可以结合多种方法从而形成自己啃论文的方法论,适合当前阶段的学习才是最重要的,啃论文俱乐部建立其实也不是很久,方法也在不断完善创新。最后,啃论文的过程确实很枯燥,但能坚持下来的一定收货会很大,愿大家能苦中作乐,闯出自己的一片天地。

附件链接:https://ost.51cto.com/resource/2262

想了解更多关于开源的内容,请访问:

51CTO 开源基础软件社区

https://ost.51cto.com/#bkwz