去年 7 月,Google DeepMind 宣布其 AI 系统在国际数学奥林匹克竞赛(International Mathematical Olympiad, IMO)中取得银牌成绩,这是 AI 首次在这项赛事中达到奖牌水平。当时团队承诺会公布技术细节,如今,这一承诺得以兑现:11 月 12 日,完整论文发表在《自然》(Nature)杂志上,AlphaProof 系统的技术细节得以全面公开。
图片
图丨相关论文(来源:Nature)
作为汇集了全球最擅长数学的一批青少年的比赛,IMO 的试卷涵盖六道极具挑战性的题目,覆盖代数、组合数学、数论和几何等领域。这些题目的难度往往让人望而生畏,在 2024 年的比赛中,满分 42 分的试卷上,只有不到百分之一的参赛者能够获得满分。许多数学界的菲尔兹奖得主都曾是 IMO 的参赛者,这足以说明这项赛事在数学界的分量。而近年来,IMO 也逐渐成为衡量人工智能系统高级数学推理能力的标杆性挑战。
在 2024 年的 IMO 中,AlphaProof 与专门处理几何问题的 AlphaGeometry 2 系统联手,完成了六道题目中的四道,获得 28 分。这个成绩相当于当年 609 名参赛者中排名前列的银牌获得者的水平。此外,AlphaProof 还成功解决了被认为是当年最难的第六题,这道题目只有五名人类参赛者完全解答出来。这是人工智能系统首次在 IMO 中达到奖牌级别的表现,标志着机器数学推理能力的一个重要里程碑。
图片