揭秘人工智能如何推动科学研究的发展

原创

BFT白芙堂机器人 2023-12-14 10:05:12 ©著作权

文章标签 人工智能数据数据集 文章分类 深度学习人工智能

©著作权归作者所有：来自51CTO博客作者BFT白芙堂机器人的原创作品，请联系作者获取转载授权，否则将追究法律责任

原创 | 文 BFT机器人

揭秘人工智能如何推动科学研究的发展_数据

人工智能发展到如今，已然渗入到我们工作、生活的方方面面。而人工智能的应用一直受到大家的关注，那么，今天小编带大家一起了解一下人工智能是如何推动科学研究发展的。

近年来人工智能 (AI) 越来越多地融入科学发现中，以增强和加速研究，帮助科学家提出假设、设计实验、收集和解释大型数据集，并获得仅使用传统科学方法可能无法获得的见解。

在这里，我们一起回顾一下人工智能在科学领域过去十年的突破，包括自我监督学习（允许在大量未标记数据上训练模型）和几何深度学习（利用有关科学数据结构的知识来提高模型的准确性和效率）。

生成式人工智能方法可以通过分析不同的数据模式（包括图像和序列）来创建小分子药物和蛋白质等设计。这些方法是如何在整个科学过程中起到帮助科学家的作用呢？尽管这些方法在发展过程中不断取得进步，但仍然存在着细微问题。

人工智能工具的开发人员和用户都需要更好地了解何时需要改进这些方法，而数据质量和管理不佳带来的挑战仍然存在。这些问题跨越科学学科，需要开发有助于科学理解或自主获取科学理解的基础算法方法，使它们成为人工智能创新的关键领域。

形成科学见解和理论的基础是如何收集、转换和理解数据。在2010年代初，深度学习的兴起极大地扩大了科学在探索发现的范围和野心。

人工智能 (AI) 越来越多地应用于各个科学学科，以集成海量数据集、完善测量、指导实验、探索与数据兼容的理论空间，并提供与科学工作流程集成的可操作且可靠的模型，以实现自主发现。

数据收集和分析是科学理解和发现的基础，是科学的两个核心目标，而定量方法和新兴技术，从显微镜等物理仪器到自助法等研究技术，长期以来一直用于实现这些目标。

20世纪50年代数字化的引入为计算在科学研究中的普遍应用铺平了道路。自2010年代以来数据科学的兴起使人工智能能够通过从大型数据集中识别科学相关的模式来提供有价值的指导。

尽管不同科学研究阶段的科学实践和程序有所不同，但人工智能算法的开发跨越了传统上孤立的学科。此类算法可以增强科学研究的设计和执行。它们正在成为研究人员不可或缺的工具，通过优化参数和函数，自动化收集、可视化和处理数据的程序，探索大量候选假设以形成理论，以及生成假设并估计其不确定性以建议相关实验。

揭秘人工智能如何推动科学研究的发展_数据_02

自2010年代初以来，由于大型数据集的可用性、快速大规模并行计算和存储硬件（图形处理单元和超级计算机）以及新算法的帮助，人工智能方法的功能已大大增强。

人工智能方法其中包含深度学习，特别是能够识别基本、紧凑特征的多层神经网络，这些特征可以同时解决科学问题背后的许多任务。
其中，几何深度学习已被证明有助于整合科学知识，以物理关系、先验分布、约束和其他复杂描述符（例如分子中原子的几何形状）的紧凑数学陈述的形式呈现。

自监督学习使在标记或未标记数据上训练的神经网络能够将学习到的表示转移到具有很少标记示例的不同域，例如，通过预训练大型基础模型并使其适应跨领域的不同任务不同的域。

此外，生成模型可以估计复杂系统的底层数据分布并支持新的创新。与人工智能的其他用途不同，强化学习方法通过探索许多的场景并根据指标（例如从经过考虑的实验中预期的信息增益）为不同的操作分配奖励来找到环境的最佳策略。

在人工智能驱动的科学发现中，可以使用适当的归纳偏差将科学知识纳入人工智能模型中，这些假设是将结构、对称性、约束和先验知识表示为紧凑的数学陈述。然而，应用这些定律可能会导致方程过于复杂，人类无法求解，即使使用传统的数值方法也是如此。

一种新兴方法正在将科学知识融入人工智能模型中，方法包含有关基本方程的信息，例如物理定律或分子结构原理和蛋白质折叠中的结合。这种归纳偏差可以通过减少达到相同准确度水平所需的训练样本数量来增强人工智能模型并将分析扩展到大量未经探索的科学假设中。

与利用人工智能的其他领域相比，使用人工智能进行科学创新和发现提出了独特的挑战。最大的挑战之一是科学问题中假设空间的巨大性，使得系统的探索变得不可行。例如，在生物化学中，估计存在1060种药物分子可供探索。

人工智能系统有潜力通过加速流程并提供接近实验精度的预测来彻底改变科学工作流程。然而，获得可靠注释的人工智能模型数据集存在挑战，这可能涉及到耗时且资源密集的实验和模拟。

揭秘人工智能如何推动科学研究的发展_人工智能_03

尽管存在着以上的挑战，但人工智能系统可以实现高效、智能和高度自主的实验设计和数据收集，其中人工智能系统可以在人类监督下运行，以评估、评价结果并根据结果采取行动。这些能力促进了人工智能代理的开发，这些智能代理可以在动态环境中持续交互，并且可以做出实时决策以导航平流层气球。

人工智能系统可以在解释科学数据集以及以通用方式从科学文献中提取关系和知识方面发挥重要作用。

最近的研究结果表明，无监督语言人工智能模型有可能捕获复杂的科学概念（例如元素周期表），并在功能材料中发现前数年预测应用，这表明有关未来发现的潜在知识可能嵌入在过去的出版物中。

最近的人工智能在科学研发的进展，包括成功解决50年前的蛋白质折叠问题以及人工智能驱动的具有数百万粒子的分子系统模拟，证明了人工智能解决具有挑战性的科学问题的潜力。然而，随着发现的巨大前景也伴随着“人工智能科学”（AI4Science）这一新兴领域的重大挑战。与任何新技术一样，AI4Science的成功取决于我们将其融入日常实践并了解其潜力和局限性的能力。

在科学发现中广泛采用人工智能的障碍包括发现过程每个阶段特有的内部和外部因素，以及对方法、理论、软件和硬件的实用性以及潜在滥用的担忧。我们探索AI4Science的发展并解决关键问题，包括科学行为、传统怀疑论和实施挑战。

结语：

任何事物都有双面性，有积极的一面，同样的也有消极的一面。人工智能在任何行业的发展带来红利的同时也带来了隐患，作为操盘者，能做的除了尽量降低危害风险外，还要正确监管人工智能的使用，这样才能运用好人工智能推动每一行的发展。

若您对该文章内容有任何疑问，请与我们联系，将及时回应。

揭秘人工智能如何推动科学研究的发展_数据_04