专题导读:学术大数据

学术大数据是指由具有学术行业特征的多元实体及其之间的多样化关系构成的数据集合。其中,实体可以包括学者、机构、论文、学科等对象,而实体间的关系则可以体现为合作、引用、研究兴趣、领域归属等形式。对学术大数据进行挖掘与分析具有多方面的意义,如:更充分揭示学者情况和学科发展动态,更深层次促进科研人员的高效合作交流,为学术领域各类评价与考核提供有力的度量指标,为政府部门制定科技、教育发展战略提供重要的决策依据等。

随着我国“科技强国战略”和“创新驱动发展战略”的不断推进,学术大数据的应用已从学术研究领域逐渐渗透到现代社会生产生活的方方面面。一方面,学术大数据在科技管理、企业经营、学术评价等领域的应用,促进了对其数据价值的深层挖掘;另一方面,学术大数据因其涵盖学者、领域、机构、论文等众多元素,从而呈现出多元化、碎片化等特点,这对实际采集与处理数据提出了新的挑战。本专题汇集了国内活跃在一线的学术大数据研究者的5篇文章,从学术大数据在科技管理、学术评价领域的应用以及数据采集等多个角度,探索学术大数据在生产生活中应用的价值与挑战,希望能引起读者兴趣,推动相关领域的研究与实践。

梁英等人撰写的《学术大数据技术在科技管理过程中的应用》结合我国科技管理应用需求,设计了基于学术大数据的科技管理应用框架,分析了学术大数据在科研布局和资源统筹辅助决策、专家精准推荐、科技成果评估评价等方面的预期应用。

罗瑞丽等人撰写的《基于大数据的主动科研管理模式与优化决策机制》提出了开放知识网络模型方法,以构建“专家图谱”为例,融合分析了科研管理大数据中的关联知识和潜在信息,并探讨如何将传统被动的管理模式转变为主动的科研管理模式,进而建立基于大数据的新型管理模式与决策机制。

姚宇航等人撰写的《图灵指数——学术大数据下的跨领域跨年代学者影响力评估》基于310个领域、14 223 183位学者、126 438 664篇论文和533 556 856次引用的数据集,提出“图灵指数”,通过归一化消除指数膨胀的影响来衡量学者的绝对影响力,从而为国内外学者影响力评估和基金审理等提供参考。

贾韬等人撰写的《“科学学”视角下的科研工作者行为研究》从科研工作者研究兴趣的演化、科研合作的内在驱动因素、科研团队与科研team的异同、多维度科研评价与学术不端的监测等多种角度研究了“科学学”视角下的科研工作者行为。研究结果可以为科研管理等现实问题提供理论工具和实证支撑。

万猛等人撰写的《开放存取知识库及其数据采集规范的研究》调研了开放存取知识库在国内外的发展概况、地区分布特点、系统平台种类等,同时,结合产业界实际情况总结了数据采集的基本规范。最后,针对国内开放存取知识库当前面临的问题,提出了可行性建议。

本专题由于篇幅有限,不能涵盖学术大数据研究中的方方面面,希望通过阐述学术大数据在生产生活中应用的价值与挑战,推动学术大数据研究的进一步发展。