诺奖的AI年,带来哪些启示?

余元玺 钟博子韬 洪亮2024-10-20 08:51

今年的诺贝尔奖将人工智能(AI)推到了科学舞台的中央。这不仅是对几位杰出科学家的认可,也是对AI在科学进步中作用的肯定。这些奖项的颁发,标志着AI在科学研究中的重要地位得到了认可,预示着AI正在重塑我们的世界,尤其是在科学探索和创新的范式上掀起了新的浪潮。

工智能势不可挡,正在改变我们的世界和科学研究的方式:AI for science,Science all in AI(科学智能与人工智能中的科学)。展望未来,AI将继续引领科学的发展,为人类社会创造更大的福祉。我们正处于一个新的时代的开端:拥抱AI,将开启无限的可能。

AI与物理学的交汇

从霍普菲尔德网络到深度学习

先简单回顾一下今年两位新晋诺贝尔物理学奖得主的贡献。

1982年,约翰·霍普菲尔德提出了著名的霍普菲尔德网络,这是一种具有自组织能力的递归神经网络。霍普菲尔德网络模拟了生物神经网络的联想记忆功能,能够通过能量最小化的原理,实现对部分缺失信息的补全和模式识别。

霍普菲尔德网络的理论基础深扎根于物理学,类似于统计物理学中的伊辛模型(Ising Model)用于描述磁性材料中自旋相互作用的系统,通过能量函数的最小化来确定系统的稳定状态。霍普菲尔德巧妙地将这一概念应用于神经网络,使网络状态的演化可以被视为能量函数的下降过程,最终达到稳定的记忆存储状态。霍普菲尔德网络的出现,为神经网络的理论研究提供了坚实的物理学基础,也为后来的机器学习和人工智能发展奠定了重要的基石。

杰弗里·欣顿被誉为“深度学习之父”,他在1985年与特里·谢泽诺斯基在霍普菲尔德网络的基础上共同提出了玻尔兹曼(Boltzmann)机。这是一种基于随机性和能量函数的神经网络模型,可以通过模拟退火算法学习复杂的概率分布。玻尔兹曼机的名称来源于物理学中的玻尔兹曼分布(Boltzmann distribution),这是统计物理中描述粒子能量分布的基本概念。玻尔兹曼机利用这种分布来定义网络中神经元状态的概率,从而实现对数据的生成和特征学习,也为后续生成模型的发展提供了思路。

欣顿在1986年与大卫·罗密尔顿和罗纳德·威廉姆斯共同推广了反向传播算法,解决了神经网络做不深的问题,使得深层网络的训练成为可能。借助受限玻尔兹曼机(Restricted Boltzmann Machine)引入无监督的逐层预训练方法,他在2006年提出深度信念网络(Deep Belief Network),解决训练深层神经网络时梯度消失的问题。这一突破为深度学习的迅猛发展奠定了极为重要的基础。

诺贝尔奖委员会将他俩的成果评价为“为机器学习革命奠基性的工作”。我们由此可以看到,统计物理为机器学习的早期发展提供了思路,如今的深度学习也在可控核聚变、天文观测等研究方向惠及了物理学的研究。

生命科学重新认识AI潜力

从Rosetta软件到AI驱动的创新

人体内拥有数万种蛋白质,已知的蛋白质数量也超过数亿。然而,在浩瀚的蛋白质序列宇宙中,这不过是冰山一角。科学家们既希望优化现有的工具蛋白,也渴望探索蛋白质宇宙中的“暗物质”,即那些尚未发现的功能蛋白。这正是蛋白质设计的核心使命——通过这一技术,科学家们可以创造出全新、自然界中从未存在的蛋白质。这些蛋白质不再受限于传统进化规则,而是完全由人类设计,具备定制化功能特征。

在蛋白质设计领域,华盛顿大学大卫·贝克教授的团队无疑站在了最前沿。过去20年中,该团队致力于开发计算驱动的蛋白质设计方法,从蛋白质结构入手,从头开始设计出形态和功能各异的蛋白质。随着时间的推移,这一领域经历了巨大的进步:从最初基于物理和统计方法的Rosetta软件,到如今依靠深度学习的AI方法,如ProteinMPNN和RFdiffusion,蛋白质设计技术不断革新,但从头设计蛋白的目标始终不变。

如今,贝克团队设计的蛋白质已具备多种功能,包括从头设计的联合疫苗的RSV/hMPV、能够识别非天然底物的荧光素酶、以及用于药物研发的细胞因子类似物和抗体。蛋白质设计已经完成了概念验证阶段,正逐步拓展在各类生物医学领域的实际应用。

在生命科学领域,乃至整个自然科学中,AI最具影响力的应用莫过于AlphaFold。其诞生故事看似简单:一位横跨数学、物理、化学、生物、计算机的年轻博士约翰·江珀,与谷歌DeepMind CEO德米斯·哈萨比斯共同领导的顶尖跨学科团队,经过三年努力,打造出一个专门用于解决蛋白质结构预测任务的模型。

尽管AlphaFold2当时在蛋白质复合物结构预测以及药物分子、核酸、修饰蛋白等方面还存在局限,但三年后的AlphaFold3解决了这些问题。

这一突破性的成功使整个生物学界重新认识了AI的潜力,并推动了新的算法开发,如前文提到的蛋白质设计方法,也催生了生物技术公司的蓬勃发展和全新的科研模式。AlphaFold2毫无疑问改变了生物学家研究蛋白质的方式。

自AlphaFold问世以来,它已被广泛应用在各式各样的生物学研究中。在蛋白质结构数据库PDB中,通过实验方法解析的蛋白质结构数量已达到20万,这也成为了AlphaFold训练数据的重要来源。然而,借助AlphaFold等结构预测工具,科学家已经预测了近10亿个蛋白质的三维结构,其中大多数都具备很高的精度和质量。

AlphaFold正逐步成为生物学研究中的便捷且精准的AI工具,融入很多生物学领域的研究当中——曾经耗费大量时间和资金才能获得的蛋白质结构,现在“点击就送”。展望未来,AlphaFold的后续版本有望解决更多复杂问题,带来更多意想不到的应用场景。

AI获得诺奖

AI正深刻改变各学科研究方向

这次诺贝尔化学奖和物理学奖都给了AI,尤其是物理学奖直接颁发给了欣顿(一个计算机学家)还是令人非常震惊的。除了对欣顿基于物理启发的人工智能算法的开发的认可,更体现了诺奖委员会对科学范式变革的预见。

物理这门学科归根结底是探索理解这个世界的方法论。传统的物理方法论或者说占统治地位的方法论是搞清楚底层机理,通过不断地叠加近似来解读复杂事物。但AI反其道行之,是基于数据推断,端到端给出预测。这也能解决问题,就像诺贝尔化学奖的“蛋白质结构预测”,最开始研究这个问题的是统计物理学家,他们基于物理计算来预测蛋白结构,但深度学习在这个问题上获得了完胜传统物理计算的精度。

如果科学问题本身就是如何预测一个给定序列蛋白的三维结构,那么显然我们的物理底层知识和方程是不够的,但基于大数据的AI方法是能解决这个科学问题的。基于数据的推断就是在这个科学问题上更好的方法论。这无疑是对传统物理方法论的一种冲击。

这次诺奖的颁发显示了物理学的包容,我们期待看到更多基于数据推断的工具在物理学涌现,帮助我们找到更好的超导材料,帮我们找到更优的聚变控制方法等等。

诺贝尔奖一直以来被视为科学领域的最高荣誉,用于表彰在物理学、化学、生理学或医学等领域作出突出贡献的个人。然而,随着人工智能技术的飞速发展,AI正在深刻改变着各个学科的研究方式和方向,成为数据推断的新范式。此次诺奖将物理学奖和化学奖同时颁发给AI领域的先驱,正是对这一趋势的最好回应。

(作者单位:上海交通大学自然科学)

来源:文汇报

作者:余元玺 钟博子韬 洪亮

版权与免责:以上作品(包括文、图、音视频)版权归发布者【余元玺 钟博子韬 洪亮】所有。本App为发布者提供信息发布平台服务,不代表经观的观点和构成投资等建议
Baidu
map