谷歌 Gemini Deep Think AI 获官方认证奥数金牌


谷歌 DeepMind 团队宣布,其一个高级版本的 Gemini Deep Think 模型,在国际数学奥林匹克(IMO)竞赛的问题上正式取得了金牌水平的成绩。

该模型在六道题目中完美解决了五道,总共获得 35 分(满分 42 分),达到了金牌分数线。IMO 主席 Gregor Dolinar 教授证实了这一里程碑式的成就,并评价其解决方案 “在许多方面都令人惊叹”,认为其清晰、精确且大部分易于理解。

谷歌 CEO Sundar Pichai 表示,“仅仅一年时间,从银牌到金牌——(其)数学推理方面的进步速度简直令人惊叹!恭喜Google DeepMind 团队!”马斯克转发并表示:“恭喜!”

此次成果使用了 Gemini Deep Think 模式的高级版本,这是一种针对复杂问题的增强推理模式,融合了包括并行思考在内的最新研究技术,使模型能同时探索和组合多种可能的解决方案。为了最大化 Deep Think 的推理能力,团队还利用新颖的强化学习技术对该版 Gemini 进行了训练,使其能更好地利用多步推理、问题解决和定理证明数据。

此外,模型还被提供了高质量数学问题解决方案的精选语料库,并在其指令中加入了一些关于如何解决 IMO 问题的一般性提示。谷歌 DeepMind 计划先向包括数学家在内的一组可信测试者提供该 Deep Think 模型的版本,之后再向 Google AI Ultra 订阅用户推出。

团队表示,虽然目前在自然语言方法上取得了突破,但他们仍在继续推进 AlphaGeometry 和 AlphaProof 等形式化系统。他们相信,将自然语言流畅性与形式化语言中的严谨、可验证推理相结合的 Agent,将成为数学家、科学家和研究人员的宝贵工具。

此次成果由 Thang Luong 领导整体技术方向,并与 Edward Lockhart 共同协调 IMO 2025 项目。IMO 官方确认了提交答案的完整性和正确性,但其审查不涉及对系统、流程或底层模型的验证。


相關推薦

2025-05-22

谷歌在 Google I/O 2025 大会上宣布为其旗舰AI模型Gemini 2.5 Pro引入名为“深度思考”(Deep Think)的增强推理模式。该模式允许模型在回应前考虑多个假设和答案,从而提升其在复杂查询,特别是数学和编码相关任务上的表现。 根据

2025-03-21

型在科学理解和数理逻辑方面超越了 OpenAI 的 GPT 模型、谷歌 DeepMind 的 Gemini 和 DeepSeek 等全球竞争对手。 共包括三个不同的尺寸:具有 320 亿个参数的 Exaone Deep 32B、具有 78 亿个参数的 Exaone Deep 7.8B 和具有 24 亿个参数的 Exaone Deep

2025-05-20

谷歌及其母公司Alphabet首席执行官桑达尔·皮查伊日前做客《All-In》播客节目,接受了企业家、投资人大卫·弗里德伯格的专访。探讨了人工智能浪潮下,谷歌如何主动颠覆自身,以保持技术领先地位。 随着AI对信息获取方式的

2025-04-01

谷歌正式推出新一代 AI 模型 Gemini 2.5,主打 “思考 - 验证 - 回答” 的智能推理能力,官方称其为 “目前最智能的 AI 模型”,首个发布的实验性版本为 Gemini 2.5 Pro,已面向 Google AI Studio 和 Gemini 应用的高级版用户(月费 20 美元

2025-04-25

根据谷歌正在进行的反垄断诉讼中披露的内部数据,截至 3 月份,谷歌 AI 聊天机器人 Gemini 在全球每月拥有 3.5 亿活跃用户。 《The Information》首先报道了这一统计数据,称谷歌人工智能产品的使用量在去年呈爆炸式增长。 根

2025-04-26

在最近的 Alphabet Q12025财报电话会议上,谷歌 CEO 皮查伊透露,谷歌目前超过30% 的代码是借助人工智能(AI)生成的。这意味着开发者在每三次代码更改中,就有一次是接受了 AI 的建议。 皮查伊指出,随着更强大的模型和主动工

2025-04-12

谷歌 DeepMind 首席执行官 Demis Hassabis 最近在 LinkedIn 联合创始人 Reid Hoffman 联合主持的播客 Possible 上表示,谷歌计划最终将其 Gemini AI 模型与其Veo 视频生成模型相结合,以提高前者对物理世界的理解。 Hassabis 表示:“我们从一开

2025-07-24

谷歌为其 AI 服务 Gemini 进行了一系列更新,用户可直接选择 Imagen 模型生成图像,并启用了 llms.txt 文件,方便 AI Agent 获取最新的 API 和 SDK 使用方法。 具体来说,用户现在可以在 Gemini 界面中直接看到并选择 Imagen 模型进行图像

2025-06-24

谷歌 AI 编程助手 Gemini Code Assist 近日发布更新,集成了最新的 Gemini 2.5 模型,带来了更强的个性化和更灵活的上下文管理。 用户现在可以创建自定义快捷命令来处理重复性任务,并在 VS Code 或 JetBrains IDE

2025-06-07

谷歌于6月5日推出其迄今为止最智能的模型——Gemini 2.5 Pro的升级预览版。该版本是基于5月份的版本进行了重要升级,并计划在未来几周内作为正式稳定版(GA)向所有用户提供,为企业级规模的应用做好准备。 谷歌CEO Sundar Pich

2025-04-01

谷歌宣布免费向所有 Gemini 应用用户提供最新、最先进的 Gemini AI 模型 ——Gemini 2.5 Pro。此前,只有 Gemini Advanced 用户才能使用这一实验模型,而现在,该模型从上周六开始向公众开放。 Gemini 2.5 Pro 由谷歌于上周早些时候推出

2025-07-23

谷歌Gemini模型的原生文本转语音(TTS)功能已适用于规模化的生产环境,该功能目前支持Gemini 2.5 Flash和Gemini 2.5 Pro两个模型。 https://x.com/OfficialLoganK/status/1947328086577492309 据官方人员透露,这项强大的功能适用于多种用例

2025-04-29

彭博社报道称,正在进行的谷歌反垄断审判本周的证词显示,谷歌每月向三星支付“巨额资金”,以在其设备上预装其Gemini人工智能应用程序。这一信息正值法官阿米特·梅塔(Amit Mehta)已裁定谷歌的搜索引擎构成非法垄断之后,

2025-06-07

谷歌搜索「AI 模式」现在可以提供数据可视化和自定义图表支持,让用户能用自然语言提示分析复杂数据集和创建自定义图表。 据介绍,更新后的「AI 模式」能比较分析特定时期的信息,生成交互式图表并提供全面解释,借助