谷歌 Gemini Deep Think AI 获官方认证奥数金牌

2025-07-23 發表於开源资讯

谷歌 DeepMind 团队宣布，其一个高级版本的 Gemini Deep Think 模型，在国际数学奥林匹克（IMO）竞赛的问题上正式取得了金牌水平的成绩。

该模型在六道题目中完美解决了五道，总共获得 35 分（满分 42 分），达到了金牌分数线。IMO 主席 Gregor Dolinar 教授证实了这一里程碑式的成就，并评价其解决方案 “在许多方面都令人惊叹”，认为其清晰、精确且大部分易于理解。

谷歌 CEO Sundar Pichai 表示，“仅仅一年时间，从银牌到金牌——（其）数学推理方面的进步速度简直令人惊叹！恭喜Google DeepMind 团队！”马斯克转发并表示：“恭喜！”

此次成果使用了 Gemini Deep Think 模式的高级版本，这是一种针对复杂问题的增强推理模式，融合了包括并行思考在内的最新研究技术，使模型能同时探索和组合多种可能的解决方案。为了最大化 Deep Think 的推理能力，团队还利用新颖的强化学习技术对该版 Gemini 进行了训练，使其能更好地利用多步推理、问题解决和定理证明数据。

此外，模型还被提供了高质量数学问题解决方案的精选语料库，并在其指令中加入了一些关于如何解决 IMO 问题的一般性提示。谷歌 DeepMind 计划先向包括数学家在内的一组可信测试者提供该 Deep Think 模型的版本，之后再向 Google AI Ultra 订阅用户推出。

团队表示，虽然目前在自然语言方法上取得了突破，但他们仍在继续推进 AlphaGeometry 和 AlphaProof 等形式化系统。他们相信，将自然语言流畅性与形式化语言中的严谨、可验证推理相结合的 Agent，将成为数学家、科学家和研究人员的宝贵工具。

此次成果由 Thang Luong 领导整体技术方向，并与 Edward Lockhart 共同协调 IMO 2025 项目。IMO 官方确认了提交答案的完整性和正确性，但其审查不涉及对系统、流程或底层模型的验证。

谷歌 Gemini Deep Think AI 获官方认证奥数金牌

相關推薦

谷歌 Gemini 2.5 Pro 新增“深度思考”模式，Gemini 2.5 Flash 模型全面上线

韩国 LG 开源 EXAONE Deep：争夺下一代 AI 推理主导地位

谷歌 CEO 皮查伊回应“谷歌已死”论

谷歌发布“目前最智能的 AI 模型” Gemini 2.5

谷歌 AI 编程工具 Gemini CLI v0.1.18 发布

谷歌 AI 聊天机器人 Gemini 全球每月活跃用户 3.5 亿

谷歌 AI 编程工具 Gemini CLI 定为每周三发布更新

谷歌 CEO 皮查伊：超 30% 的代码由 AI 生成

DeepMind CEO：谷歌最终将合并 Gemini 和 Veo AI 模型

谷歌 Gemini 增加 Imagen 选项并开放 llms.txt

谷歌以 47 美分价格向美政府提供 AI 服务

谷歌 Gemini Live 即将升级：实时画面提示与三大应用深度整合

谷歌 AI 编程工具 Gemini Code Assist 发布更新，增强上下文管理能力

谷歌 Gemini 2.5 Pro 免费开放