人工智能(AI)再破纪录,这一次,它挑战的是奥数金牌!
谷歌DeepMind最新发布的几何推理模型AlphaGeometry,成功回答了国际数学奥林匹克竞赛(IMO)30个几何问题中的25个,这一成就接近于人类奥数金牌选手的水平。昨天,随着相关研究成果登上《自然》杂志,再次引发学术界的热议与讨论。
除了AI在数学领域表现出来的巨大潜力,一些业内人士指出,这项成果实际上代表着,AI再度向人类的推理能力迈进了一大步。在很短的时间里,这些开创性的工作正推动AI以惊人的速度迭代。
“AI的推理和建模能力已达到了一个新高度,其进化的速度比我们想象的快得多。”上海交通大学智能计算院长葛冬冬教授在接受本报记者采访时如是说。
AI在数学推理方面,取得开创性进展
在AlphaGeometry问世之前,AI的推理能力一直“不太行”,也难以解决几何和数学方面的复杂问题。
但现在,AlphaGeometry展示了AI最新具备的逻辑推理能力,以及发现和验证新知识的能力。在对30道奥数几何题的基准测试中,AlphaGeometry在标准奥数时限内解决了25道——与人类奥数金牌得主平均解决25.9个问题的水平不相上下。和之前最先进的AI系统解决其中10个几何问题的表现相比,AlphaGeometry可谓实现了史诗级升级。
在解决几何问题方面,该模型几乎赶上了最聪明的人类。一位IMO金牌得主受邀作为评审,连连称赞AlphaGeometry的输出结果不仅可以经得起验证,而且表述清晰。不仅如此,在回答奥数真题时,AlphaGeometry还发现了2004年国际数学奥林匹克竞赛定理的一个新版本。
在业界,具备更强的定理证明能力,一直是AI研究的焦点。比如,对于大模型来说,学习定理证明很困难。要知道,OpenAI去年发布的GPT-4,可是连一道奥数题都做不出来!
“可以说,AI在数学推理方面取得了开创性进展。”如今任教于高校的葛冬冬,在学生时代也曾是一位奥数选手。他直言,虽然AlphaGeometry表现抢眼,但也要看到其局限性。因为IMO的赛题通常有六道,分为好几种类型,此次的新模型专注于解决几何类赛题,范围相对狭窄。“但可以预见,类似AlphaGeometry的能力,应该在很短的时间里就可以覆盖到更多数学领域,比如数论、方程等等。”
正如DeepMind研究人员所说的那样,未来更大的挑战在于,AI是否能发现新的数学方法,解决迄今的未解之谜。AI的下一个目标就是:创建能够处理超越人类思维的数学问题的人工智能系统。
解决复杂问题,AI有机会取得更大进展
更大的影响,在数学之外。就在上个月,DeepMind还提出了一种名为FunSearch的新方法,首次利用大型语言模型在数学领域未解之谜及更多科学的挑战性问题上取得新发现。相关成果同样发表于《自然》。日前,DeepMind联合创始人兼首席AGI科学家谢恩·莱格明确表示,“离通用人工智能(AGI),越来越近了。”
复旦大学特聘教授林伟昨天接受本报记者采访时指出,谷歌Deepmind团队专注于一个垂直领域,生成了专业的、大规模的数据集。从目前AI的进展来看,精耕于某一领域,做好数据集标记和大规模专业数据收集测试,同时发展构建精调模型架构与参数,是通向AGI的关键之径。他认为,对于复杂问题的解决,AI有机会取得更大的进展。但实现的前提是,需要具备专业的数据、好的计算模型架构以及可计算的应用场景。
让人难忘的是,过去一年里,全球多个AI大模型各展所长,已然在应用领域掀起巨大变革。以GPT-4为例。通过适当的引导和训练,GPT-4可以根据不同制造业企业提出的小众需求,通过建立复杂的数学模型,帮助解决实际生产问题。
“在复杂建模、推理和设计能力方面,AI正在以前所未有的速度提升。”葛冬冬评论说,不仅GPT-4表现不俗,在建模等不少方面的能力甚至达到了人类研究生的水平,如今AI解决实际问题的能力,无论是广度还是深度,都出现了一个飞跃。“无论是现实领域的诸多复杂问题,还是长期存在且目前无解的科学难题,AI都开始逐步学习、理解,并进行复杂建模。”包括葛冬冬在内,不少业界人士给出预判:接下来,大模型的迭代和进化,一定会达到更令人不可思议的程度。
来源:文汇报 作者:储舒婷