谷歌发布“目前最智能的 AI 模型” Gemini 2.5


谷歌正式推出新一代 AI 模型 Gemini 2.5,主打 “思考 - 验证 - 回答” 的智能推理能力,官方称其为 “目前最智能的 AI 模型”,首个发布的实验性版本为 Gemini 2.5 Pro,已面向 Google AI Studio 和 Gemini 应用的高级版用户(月费 20 美元)开放,面向规模化应用的定价策略则将在未来几周内公布。

据谷歌介绍,这个最新版本将 “显著增强的基础模型与经过改进的后训练设计” 结合起来,由此获得更好的整体性能。

Gemini 2.5 Pro 支持文本、图像、音频、视频及代码的多模态输入,上下文窗口达 100 万 token(约 75 万单词),可解析完整《指环王》系列文本,未来将升级至 200 万 token。这一能力使其在处理跨模态复杂问题时更具优势。

Gemini 2.5 Pro 在一系列需要高级推理能力的测试中表现出色,比如在无需多数投票采样、尽可能节省测试成本的前提下,依然能在 GPQA 和 AIME 2025 的数学、科学测试中取得领先。相比 Gemini 2.0 本次更新也大幅提升了 Gemini 的高级编码能力,同时其原生多模态和长上下文窗口特性则依然得到了保留。

谷歌宣称,Gemini 2.5 Pro 实验版在理解能力、数学能力、编码能力等常见的 AI 基准测试指标上均已领先于 OpenAI、Anthropic、xAI 乃至 DeepSeek。


相關推薦

2025-04-01

谷歌宣布免费向所有 Gemini 应用用户提供最新、最先进的 Gemini AI 模型 ——Gemini 2.5 Pro。此前,只有 Gemini Advanced 用户才能使用这一实验模型,而现在,该模型从上周六开始向公众开放。 Gemini 2.5 Pro 由谷歌于上周早些时候推出

2025-03-20

谷歌昨天为 Gemini 推出了「Canvas」功能,该功能与 OpenAI 的 ChatGPT Canvas 工具以及 Anthropic 的 Artifacts 在概念上相似,它为 Gemini 用户提供了一个互动空间,用户可以在其中创建、完善并分享写作和编程项目。 此类工作空间是 AI 公

2023-06-28

谷歌旗下研究实验室 DeepMind 的首席执行官 Demis Hassabis 向《连线》杂志表示,他们的工程师正在使用 AlphaGo 技术来开发一个名为 Gemini 的人工智能系统,比 OpenAI ChatGPT 背后的系统更为强大。 Gemini 本质上与 GPT-4 类似,是一个可以

2024-10-29

根据 The Information 的独家报道,谷歌正在开发一个专门针对 Chrome 浏览器进行了优化的 AI Agent,其代号为「Project Jarvis」,将为用户执行任务,包括“收集研究资料、购买产品或预订航班”。   报道称,Project Jarvis 将由 G

2024-06-26

下文窗口和高级推理为 AI Assistant 解锁大量新用例。最近发布的 Gemini 1.5 Flash 将有助于解决高容量和低延迟下成本效益至关重要的用例。 这些更新预计将在未来几周内推出。 详情可查看官方博客。

2025-03-21

型在科学理解和数理逻辑方面超越了 OpenAI 的 GPT 模型、谷歌 DeepMind 的 Gemini 和 DeepSeek 等全球竞争对手。 共包括三个不同的尺寸:具有 320 亿个参数的 Exaone Deep 32B、具有 78 亿个参数的 Exaone Deep 7.8B 和具有 24 亿个参数的 Exaone Deep

2024-05-28

18 系统提供一系列生成式 AI 功能。 此外,该公司仍在与谷歌进行一系列谈判,试图将 Gemini 作为另一种可选的方案内置在 iOS 系统中。 古尔曼表示,苹果公司预计将在下月举行的 WWDC 2024 上官宣与 OpenAI 达成的伙伴协议。 古尔

2024-03-14

Spring AI 0.8.1 现已发布,一些亮点更新包括: Google Gemini 对 Gemini 的多模态功能支持。 在此处阅读更多相关信息,并查看展示许多 Gemini 功能的示例应用程序。 流式和非流式聊天客户端 函数调用 Gemini 应用程序的 Nati

2022-08-03

的应用程序编程接口以支持复杂的第三方应用软件,例如谷歌 Chrome、VirtualBox 以及其他开发工具等。该系统对于虚拟云环境而言很有用,这得益于其甚低的硬件要求。 Q4OS 4.10 Gemini 稳定版近日正式发布,更新内容如下: 获得

2024-08-01

(12 个开源 LLM 和 10 个专有 LLM)领先的生成式 AI 大语言模型性能进行了比较排名。 Hallucination Index 使用 Galileo 专有的评估指标“context adherence”对开源和闭源模型进行了测试。测试模型的输入量从 1,000 到 100,000 token 不等,

2023-03-31

争,Google 和 DeepMind 的工程师和研究人员也大量流失。曾发布《BERT: Pre-Training of Deep Bidirectional Transformers for Language Understanding》论文,并为 GPT 等大语言模型奠定了基础的 AI 工程师 Jacob Devlin 就在今年 1 月离开了 Google,转投 OpenAI

2024-02-28

幻灯片、讲义以及撰写书籍。在未来的一个月内,我们会发布V1.2.5.1,以修复V1.2.5中仍旧存在的错误。后续的补丁版本会按需发布,欢迎教育工作者们使用墨干并反馈错误。 墨干 V1.2.5 LTS 保留了对Qt 5的支持,这是为了以一种比

2023-08-27

京站,聊聊 AI 大模型与底层技术 >>> go-carbon v2.2.5 已经发布,日期时间处理库。 此版本更新内容包括: 修复部分方法因并发读写造成的线程不安全的 bug 新增 SetTestNow, ClearTestNow , IsTestNow 等系列测试方法 详情查看:https:

2023-10-22

相约开源PHP办公室,我们一起聊 AI!>>> 极致CMS 2.5 已经发布,建站系统 此版本更新内容包括: 更新内容 优化图片处理 升级系统案例 修复已知bug 优化用户体验 详情查看:https://gitee.com/Cherry_toto/jizhicms/releases/2.5