谷歌 DeepMind 团队宣布,其一个高级版本的 Gemini Deep Think 模型,在国际数学奥林匹克(IMO)竞赛的问题上正式取得了金牌水平的成绩。
该模型在六道题目中完美解决了五道,总共获得 35 分(满分 42 分),达到了金牌分数线。IMO 主席 Gregor Dolinar 教授证实了这一里程碑式的成就,并评价其解决方案 “在许多方面都令人惊叹”,认为其清晰、精确且大部分易于理解。
谷歌 CEO Sundar Pichai 表示,“仅仅一年时间,从银牌到金牌——(其)数学推理方面的进步速度简直令人惊叹!恭喜Google DeepMind 团队!”马斯克转发并表示:“恭喜!”
此次成果使用了 Gemini Deep Think 模式的高级版本,这是一种针对复杂问题的增强推理模式,融合了包括并行思考在内的最新研究技术,使模型能同时探索和组合多种可能的解决方案。为了最大化 Deep Think 的推理能力,团队还利用新颖的强化学习技术对该版 Gemini 进行了训练,使其能更好地利用多步推理、问题解决和定理证明数据。
此外,模型还被提供了高质量数学问题解决方案的精选语料库,并在其指令中加入了一些关于如何解决 IMO 问题的一般性提示。谷歌 DeepMind 计划先向包括数学家在内的一组可信测试者提供该 Deep Think 模型的版本,之后再向 Google AI Ultra 订阅用户推出。
团队表示,虽然目前在自然语言方法上取得了突破,但他们仍在继续推进 AlphaGeometry 和 AlphaProof 等形式化系统。他们相信,将自然语言流畅性与形式化语言中的严谨、可验证推理相结合的 Agent,将成为数学家、科学家和研究人员的宝贵工具。
此次成果由 Thang Luong 领导整体技术方向,并与 Edward Lockhart 共同协调 IMO 2025 项目。IMO 官方确认了提交答案的完整性和正确性,但其审查不涉及对系统、流程或底层模型的验证。