诺奖的AI年，带来哪些启示？

余元玺钟博子韬洪亮2024-10-20 08:51

今年的诺贝尔奖将人工智能（AI）推到了科学舞台的中央。这不仅是对几位杰出科学家的认可，也是对AI在科学进步中作用的肯定。这些奖项的颁发，标志着AI在科学研究中的重要地位得到了认可，预示着AI正在重塑我们的世界，尤其是在科学探索和创新的范式上掀起了新的浪潮。

工智能势不可挡，正在改变我们的世界和科学研究的方式：AI for science,Science all in AI（科学智能与人工智能中的科学）。展望未来，AI将继续引领科学的发展，为人类社会创造更大的福祉。我们正处于一个新的时代的开端：拥抱AI，将开启无限的可能。

AI与物理学的交汇

从霍普菲尔德网络到深度学习

先简单回顾一下今年两位新晋诺贝尔物理学奖得主的贡献。

1982年，约翰·霍普菲尔德提出了著名的霍普菲尔德网络，这是一种具有自组织能力的递归神经网络。霍普菲尔德网络模拟了生物神经网络的联想记忆功能，能够通过能量最小化的原理，实现对部分缺失信息的补全和模式识别。

霍普菲尔德网络的理论基础深扎根于物理学，类似于统计物理学中的伊辛模型（Ising Model）用于描述磁性材料中自旋相互作用的系统，通过能量函数的最小化来确定系统的稳定状态。霍普菲尔德巧妙地将这一概念应用于神经网络，使网络状态的演化可以被视为能量函数的下降过程，最终达到稳定的记忆存储状态。霍普菲尔德网络的出现，为神经网络的理论研究提供了坚实的物理学基础，也为后来的机器学习和人工智能发展奠定了重要的基石。

杰弗里·欣顿被誉为“深度学习之父”，他在1985年与特里·谢泽诺斯基在霍普菲尔德网络的基础上共同提出了玻尔兹曼（Boltzmann）机。这是一种基于随机性和能量函数的神经网络模型，可以通过模拟退火算法学习复杂的概率分布。玻尔兹曼机的名称来源于物理学中的玻尔兹曼分布（Boltzmann distribution），这是统计物理中描述粒子能量分布的基本概念。玻尔兹曼机利用这种分布来定义网络中神经元状态的概率，从而实现对数据的生成和特征学习，也为后续生成模型的发展提供了思路。

欣顿在1986年与大卫·罗密尔顿和罗纳德·威廉姆斯共同推广了反向传播算法，解决了神经网络做不深的问题，使得深层网络的训练成为可能。借助受限玻尔兹曼机（Restricted Boltzmann Machine）引入无监督的逐层预训练方法，他在2006年提出深度信念网络（Deep Belief Network），解决训练深层神经网络时梯度消失的问题。这一突破为深度学习的迅猛发展奠定了极为重要的基础。

诺贝尔奖委员会将他俩的成果评价为“为机器学习革命奠基性的工作”。我们由此可以看到，统计物理为机器学习的早期发展提供了思路，如今的深度学习也在可控核聚变、天文观测等研究方向惠及了物理学的研究。

生命科学重新认识AI潜力

从Rosetta软件到AI驱动的创新

人体内拥有数万种蛋白质，已知的蛋白质数量也超过数亿。然而，在浩瀚的蛋白质序列宇宙中，这不过是冰山一角。科学家们既希望优化现有的工具蛋白，也渴望探索蛋白质宇宙中的“暗物质”，即那些尚未发现的功能蛋白。这正是蛋白质设计的核心使命——通过这一技术，科学家们可以创造出全新、自然界中从未存在的蛋白质。这些蛋白质不再受限于传统进化规则，而是完全由人类设计，具备定制化功能特征。

在蛋白质设计领域，华盛顿大学大卫·贝克教授的团队无疑站在了最前沿。过去20年中，该团队致力于开发计算驱动的蛋白质设计方法，从蛋白质结构入手，从头开始设计出形态和功能各异的蛋白质。随着时间的推移，这一领域经历了巨大的进步：从最初基于物理和统计方法的Rosetta软件，到如今依靠深度学习的AI方法，如ProteinMPNN和RFdiffusion，蛋白质设计技术不断革新，但从头设计蛋白的目标始终不变。

如今，贝克团队设计的蛋白质已具备多种功能，包括从头设计的联合疫苗的RSV/hMPV、能够识别非天然底物的荧光素酶、以及用于药物研发的细胞因子类似物和抗体。蛋白质设计已经完成了概念验证阶段，正逐步拓展在各类生物医学领域的实际应用。

在生命科学领域，乃至整个自然科学中，AI最具影响力的应用莫过于AlphaFold。其诞生故事看似简单：一位横跨数学、物理、化学、生物、计算机的年轻博士约翰·江珀，与谷歌DeepMind CEO德米斯·哈萨比斯共同领导的顶尖跨学科团队，经过三年努力，打造出一个专门用于解决蛋白质结构预测任务的模型。

尽管AlphaFold2当时在蛋白质复合物结构预测以及药物分子、核酸、修饰蛋白等方面还存在局限，但三年后的AlphaFold3解决了这些问题。

这一突破性的成功使整个生物学界重新认识了AI的潜力，并推动了新的算法开发，如前文提到的蛋白质设计方法，也催生了生物技术公司的蓬勃发展和全新的科研模式。AlphaFold2毫无疑问改变了生物学家研究蛋白质的方式。

自AlphaFold问世以来，它已被广泛应用在各式各样的生物学研究中。在蛋白质结构数据库PDB中，通过实验方法解析的蛋白质结构数量已达到20万，这也成为了AlphaFold训练数据的重要来源。然而，借助AlphaFold等结构预测工具，科学家已经预测了近10亿个蛋白质的三维结构，其中大多数都具备很高的精度和质量。

AlphaFold正逐步成为生物学研究中的便捷且精准的AI工具，融入很多生物学领域的研究当中——曾经耗费大量时间和资金才能获得的蛋白质结构，现在“点击就送”。展望未来，AlphaFold的后续版本有望解决更多复杂问题，带来更多意想不到的应用场景。

AI获得诺奖

AI正深刻改变各学科研究方向

这次诺贝尔化学奖和物理学奖都给了AI，尤其是物理学奖直接颁发给了欣顿（一个计算机学家）还是令人非常震惊的。除了对欣顿基于物理启发的人工智能算法的开发的认可，更体现了诺奖委员会对科学范式变革的预见。

物理这门学科归根结底是探索理解这个世界的方法论。传统的物理方法论或者说占统治地位的方法论是搞清楚底层机理，通过不断地叠加近似来解读复杂事物。但AI反其道行之，是基于数据推断，端到端给出预测。这也能解决问题，就像诺贝尔化学奖的“蛋白质结构预测”，最开始研究这个问题的是统计物理学家，他们基于物理计算来预测蛋白结构，但深度学习在这个问题上获得了完胜传统物理计算的精度。

如果科学问题本身就是如何预测一个给定序列蛋白的三维结构，那么显然我们的物理底层知识和方程是不够的，但基于大数据的AI方法是能解决这个科学问题的。基于数据的推断就是在这个科学问题上更好的方法论。这无疑是对传统物理方法论的一种冲击。

这次诺奖的颁发显示了物理学的包容，我们期待看到更多基于数据推断的工具在物理学涌现，帮助我们找到更好的超导材料，帮我们找到更优的聚变控制方法等等。

诺贝尔奖一直以来被视为科学领域的最高荣誉，用于表彰在物理学、化学、生理学或医学等领域作出突出贡献的个人。然而，随着人工智能技术的飞速发展，AI正在深刻改变着各个学科的研究方式和方向，成为数据推断的新范式。此次诺奖将物理学奖和化学奖同时颁发给AI领域的先驱，正是对这一趋势的最好回应。

（作者单位：上海交通大学自然科学）

来源：文汇报

作者：余元玺钟博子韬洪亮

版权与免责：以上作品（包括文、图、音视频）版权归发布者【余元玺钟博子韬洪亮】所有。本App为发布者提供信息发布平台服务，不代表经观的观点和构成投资等建议