深度势能公众号



DeepModeling社区宣言_机器学习


本文发布自

​https://github.com/deepmodeling/community​

​https://gitee.com/deepmodeling/community​

下为翻译:

机器学习与物理建模的结合正在改变着科学研究的范式。那些希望通过计算建模突破科学边界、解决困难问题的人们正在以前所未有的新方式集结起来。他们需要新的基础设施——新的协作平台,新的代码框架,新的数据处理手段,新的算力使用方式;他们需要新的文化——追求通力协作、惠及大众;追求知识与工具的自由交流与分享;追求尊重并欣赏相互的成就、和而不同。

DeepModeling社区是这样的一群人的社区。


何为DeepModeling?

机器学习与物理建模是计算的两大战场。前者是处理复杂信息与数据的有效工具;后者是人们认知物理世界的科学方式。二者的有效结合所激发的活力正在影响着科学研究的方方面面。DeepModeling最终将是机器学习、物理建模与前沿计算模式极致结合的一套方法论和工具的沉淀。人们被DeepModeling社区所吸引,是因为它开放与包容的环境,以及它推动全球科学计算事业发展的使命。


为什么选择开源?

对“开源”一词有不同的解读。DeepModeling社区人对此的共识是,开源是一种基于开放共享精神的软件协同开发模式。机器学习和计算机科学领域的人或许对它早已熟悉,但它在科学计算领域还没有很盛行。我们所提倡的是,一个方法或软件,不应因发表文章的期刊好坏来分别高下,而应就解决问题的能力和对科学的实际贡献论英雄。方法软件的可持续发展需要持续投入人力、不断改进,并需要在开放的环境中把解决的一个个实际问题作为最朴素的测试。这往往是从事科学计算的个人或小组难以承担的。开源社区可以提供好的解决方案。


DeepModeling社区的历史

“DeepModeling社区”始于“deepmd-kit”项目的发起。“deepmd-kit”是将机器学习与分子动力学结合的软件工具,克服了分子动力学领域长期面临的效率与精度难以兼得的困难。deepmd-kit的早期开发者们用“DeepModeling”这一名字来表示利用深度学习(Deep Learning)工具解决传统多尺度建模(Multi-scale Modeling)中的高维灾难问题。DeepModeling也因此成为最初deepmd-kit项目所在的Github组织名称(https://github.com/deepmodeling)。在deepmd-kit之后,DeepModeling社区陆续发起了dpdata、dp-gen、dpdispatcher等项目,并通过deepks-kit、ABACUS等项目将建模尺度延伸至电子结构。DeepModeling现有项目的发展也让来自世界各地的、各个领域的做分子模拟的人们走在了一起。


DeepModeling社区的短期计划与长期愿景

短时间内,DeepModeling社区现有开发者将聚焦于原子尺度模拟方法和工具的发展。这包括薛定谔方程求解、电子结构计算、分子动力学模拟、粗粒化分子动力学模拟等;这还包括相应的数据生成、模型训练、高性能优化等内容;此外,这也包括针对不同体系、不同场景、不同目的的不同工作流及其管理工具、算力调度工具的发展,等等。

需要指出的是,物理模型与机器学习的结合往往从根本上改变了一个软件、一个流程的实现逻辑。因此,新基础设施的打造不会一劳永逸,而是必将在持续的迭代与频繁的重构中逐渐完善。

长期来看,DeepModeling社区致力于将所有尺度的物理模型与机器学习方法相结合,运用最前沿的计算工具,解决人类社会所面临的最有挑战性的科学技术问题。


你可以如何做出贡献?

如果你想在DeepModeling社区已有项目做贡献,请直接上,或者联系相应的开发者交流想法;如果你想在DeepModeling社区开辟新的项目,或者希望DeepModeling社区帮助你开发你的项目,请联系contact@deepmodeling.org。

如果你是热爱科学的程序员,被DeepModeling开源社区致力打造的未来科学计算平台所吸引,你不仅可以贡献新的算法,也可以贡献代码开发规范、文档写作规范、社区数据库、任务调度、工作流管理等工具,还可以为DeepModeling社区代码架构设计、高性能优化等工作做贡献。科学计算领域的人们将衷心欣赏你的才能和贡献。

如果你是熟悉电子结构、分子动力学、有限元方法等编程框架的硬核开发者,DeepModeling社区将是你大展身手的地方。机器学习的加入让我们从架构设计、每个任务的具体实现、到高性能优化都需要重新思考、反复琢磨。你将成为连接不同领域开发者、贡献者、用户的重要桥梁。

如果你只用过一些基本的科学软件,多多少少做过些后处理的脚本,DeepModeling社区会很需要你!试着在github/gitee和其他交流平台上提问交流、试着提意见,直到试着fork、commit、pr……你一点一滴的贡献会让DeepModeling社区变得更好,DeepModeling社区也将非常感谢你的贡献。

哪怕你只是一个旁观者,如果你支持DeepModeling社区的理念,你的认可和传播也将是对DeepModeling社区最大的肯定与支持。


结语

尽管人工智能与计算能力有了飞越式的发展,科学计算群体很大程度上仍习惯于传统的套路。很多地方严重依赖“祖传代码”,很多商用软件的核心算法也已经过时。这种自给自足的科学研究模式像是农业时代的“小农经济”模式,往往效率低下。直到近年来,计算科学领域涌现出一批有潜力的开源社区。但是,这些社区往往针对的是特定尺度的特定工具,且往往被特定学术课题组维护,在持续开发、用户体验等方面面临严重挑战。

DeepModeling项目将改变这一切。

机器学习与物理建模的结合呼唤新的模式——开源社区模式。这样的模式在计算机和电子工业历史上早有实现——Linux和安卓是最好的例子。从这个意义上,DeepModeling社区是将这些想法借鉴到了科学计算领域。对于所有做计算科学工程的人而言,高效、可复用、可持续优化的建模工具可以让他们摆脱无模型可用的尴尬,摆脱模型反复调参的困局;对于所有做机器学习的人而言,物理模型将会给他们提供新颖而广阔的场景。以开源社区的方式协同开发将使每个人的工作更高效、及时、可靠、透明。这种紧密合作、相互成就的精神也必将激励越来越多的人推动计算的发展、造福人类社会。这是一个振奋人心的机会。这是科学计算的未来!





End


DeepModeling社区宣言_建模_02