谷歌 Gemini 2.5 Pro 新增“深度思考”模式,Gemini 2.5 Flash 模型全面上线


谷歌在 Google I/O 2025 大会上宣布为其旗舰AI模型Gemini 2.5 Pro引入名为“深度思考”(Deep Think)的增强推理模式。该模式允许模型在回应前考虑多个假设和答案,从而提升其在复杂查询,特别是数学和编码相关任务上的表现。

根据测试数据,Gemini 2.5 Pro Deep Think 版本在多个高难度基准上表现出色,超越了 OpenAI o3 和 o4-mini。其中包括:

  • 在 2025 年 USAMO(美国数学奥林匹克) 测试中取得了优异成绩;
  • 在面向竞赛级编程能力的高难度基准  LiveCodeBench 上领先;
  • 在 MMMU(多模态推理测试)中取得 84.0% 的高分,展现出卓越的多模态推理能力。

目前,“深度思考”模式仅供受信任的测试人员使用。

同时,谷歌宣布其Gemini 2.5 Flash模型已在Gemini应用程序中向所有用户提供,Google AI Studio中最新的gemini-2.5-flash-preview-05-20版本已可用。Gemini 2.5 Flash和2.5 Pro都将增加音频输出功能。

谷歌表示:

2.5 Flash 是我们最高效的主力模型,专为速度和低成本而设计——现在它在很多维度上都更优秀了。

它在推理、多模态、代码和长上下文的关键基准测试中都得到了改进,同时效率更高,在我们的评估中使用的令牌数量减少了 20-30%。

此外,谷歌为 Gemini API 添加了对模型上下文协议(Model Context Protocol, MCP)定义的原生 SDK 支持,以便更轻松地与开源工具集成。

详情查看:https://mp.weixin.qq.com/s/NCcmWcgZGEY6Qrg3yZSRCg


相關推薦

2025-08-07

备受瞩目的 Claude 3.5 Sonnet 、Claude Sonnet 4 首次参评,同时 Gemini 2.5 系列也正式迈入稳定版。更重要的是,我们针对数据库现代化迁移的真实痛点,对评测基准进行了重要升级,旨在更深度地考验模型在复杂、真实场景下的 SQL 处

2025-04-01

谷歌宣布免费向所有 Gemini 应用用户提供最新、最先进的 Gemini AI 模型 ——Gemini 2.5 Pro。此前,只有 Gemini Advanced 用户才能使用这一实验模型,而现在,该模型从上周六开始向公众开放。 Gemini 2.5 Pro 由谷歌于上周早些时候推出

2025-06-20

,带来了官方Roo Code Marketplace和20多项改进,其中包括对Gemini 2.5新模型的支持。 新功能上线 Roo Marketplace正式推出 :用户无需实验特性即可在Roo Code内浏览、安装社区创建的模型上下文协议(MCP)服务器和自定义模式,几下

2025-04-01

谷歌正式推出新一代 AI 模型 Gemini 2.5,主打 “思考 - 验证 - 回答” 的智能推理能力,官方称其为 “目前最智能的 AI 模型”,首个发布的实验性版本为 Gemini 2.5 Pro,已面向 Google AI Studio 和 Gemini 应用的高级版用户(月费 20 美元

2025-06-07

谷歌于6月5日推出其迄今为止最智能的模型——Gemini 2.5 Pro的升级预览版。该版本是基于5月份的版本进行了重要升级,并计划在未来几周内作为正式稳定版(GA)向所有用户提供,为企业级规模的应用做好准备。 谷歌CEO Sundar Pich

2025-05-28

Gemini 2.5 Flash 的语音功能已上线 AI Studio,支持中文,效果自然。用户可以使用包含多种风格和语气标记(如慢速、诗意感、正常、快速、热情等)的复杂文本进行测试。 该语音功能能够较好地遵循这些风格指令,并生成听起

2025-07-23

谷歌Gemini模型的原生文本转语音(TTS)功能已适用于规模化的生产环境,该功能目前支持Gemini 2.5 Flash和Gemini 2.5 Pro两个模型。 https://x.com/OfficialLoganK/status/1947328086577492309 据官方人员透露,这项强大的功能适用于多种用例

2025-08-06

OpenAI 的 o3 和 04-mini、Google LLC 的 Gemini 2.5 Pro 和 Gemini 2.5 Flash、Anthropic 的 Claude Opus 4 以及 xAI Corp. 的 Grok 4 等全球性能最强的人工智能模型将在棋盘上展开正面交锋。 这场为期三天的人工智能象棋对决是Google数据科学社区 Kaggle&n

2025-05-22

2025 年 5 月 20 日,谷歌在 I/O 大会上正式宣布 Google 搜索「AI Mode」(AI 模式)面向美国市场全面上线。 AI Mode 是 Google 搜索中的一个新选项卡,允许用户使用 Gemini AI 聊天机器人进行网络搜索,支持自然语言多轮对话式搜索。 A

2025-08-08

谷歌 Gemini 命令行工具 (Gemini CLI ) v0.1.18已发布,带来了一系列新功能和改进。 主要变化: 全面提升了Gemini 2.5 Pro的使用额度 新增多目录支持,用户可通过--include-directories参数在启动时加载多个目录,或在运行时使用/dir

2025-07-31

多模态模型的融合架构,使得文本和多模态推理能力超越Gemini 2.5 Pro和Claude-4 Sonnet,多模态交互能力超越Gemini 2.5 Flash和GPT-4o,同时性价比相较V6.0提升了3倍。

2025-06-07

谷歌搜索「AI 模式」现在可以提供数据可视化和自定义图表支持,让用户能用自然语言提示分析复杂数据集和创建自定义图表。 据介绍,更新后的「AI 模式」能比较分析特定时期的信息,生成交互式图表并提供全面解释,借助

2025-04-22

示之外,而无需每个项目进行配置。 新的模型,支持 Gemini 2.5 Pro、Gemini 2.5 Flash、Grok 3、Grok 3 Mini、GPT-4.1、o3 和 o4-mini。 支持将项目结构加入聊天上下文。 详情查看更新日志:https://www.cursor.com/cn/changelog/0-49

2025-06-24

谷歌 AI 编程助手 Gemini Code Assist 近日发布更新,集成了最新的 Gemini 2.5 模型,带来了更强的个性化和更灵活的上下文管理。 用户现在可以创建自定义快捷命令来处理重复性任务,并在 VS Code 或 JetBrains IDE