DeepMind CEO:谷歌最终将合并 Gemini 和 Veo AI 模型


谷歌 DeepMind 首席执行官 Demis Hassabis 最近在 LinkedIn 联合创始人 Reid Hoffman 联合主持的播客 Possible 上表示,谷歌计划最终将其 Gemini AI 模型与其Veo 视频生成模型相结合,以提高前者对物理世界的理解。

Hassabis 表示:“我们从一开始就将 Gemini 打造成多模式的基础模型,我们这样做的原因是我们对通用数字助理这一理念有一个愿景,这种助理……能够在现实世界中真正为你提供帮助。”

AI 行业正逐渐走向“全能”模型——可以理解和合成多种媒体形式的模型。谷歌最新的 Gemini 模型可以生成音频、图像和文本,而 OpenAI 的 ChatGPT 中的默认模型可以原生创建图像,包括吉卜力工作室风格的艺术作品。亚马逊也宣布计划在今年晚些时候推出“any-to-any”模型。

而这些全能模型需要大量的训练数据,譬如图像、视频、音频、文本等等。Hassabis 暗示,Veo 的视频数据主要来自谷歌旗下的平台 YouTube。“基本上,通过观看 YouTube 视频--大量的 YouTube 视频,[Veo 2] 就能了解世界的物理原理。”

谷歌此前曾向 TechCrunch 表示,根据其与 YouTube 创作者的协议,其模型“可能”会使用“部分”YouTube 内容进行训练。据报道,谷歌去年扩大了服务条款, 部分原因是为了让该公司能够利用更多数据来训练其 AI 模型。


相關推薦

2023-06-28

谷歌旗下研究实验室 DeepMind 的首席执行官 Demis Hassabis 向《连线》杂志表示,他们的工程师正在使用 AlphaGo 技术来开发一个名为 Gemini 的人工智能系统,比 OpenAI ChatGPT 背后的系统更为强大。 Gemini 本质上与 GPT-4 类似,是一个可以

2023-03-31

在 2014 年,Google 以 4 亿英镑的价格收购了 DeepMind。这使得 DeepMind 成为了 Google 旗下的一个子公司,但它仍然保持着相对独立的运作方式。这也意味着 DeepMind 能够获得 Google 的技术和资源支持,同时也可以开展自己的研究和探索

2025-04-01

谷歌正式推出新一代 AI 模型 Gemini 2.5,主打 “思考 - 验证 - 回答” 的智能推理能力,官方称其为 “目前最智能的 AI 模型”,首个发布的实验性版本为 Gemini 2.5 Pro,已面向 Google AI Studio 和 Gemini 应用的高级版用户(月费 20 美元

2025-03-21

科学理解和数理逻辑方面超越了 OpenAI 的 GPT 模型、谷歌 DeepMind 的 Gemini 和 DeepSeek 等全球竞争对手。 共包括三个不同的尺寸:具有 320 亿个参数的 Exaone Deep 32B、具有 78 亿个参数的 Exaone Deep 7.8B 和具有 24 亿个参数的 Exaone Deep 2.4B

2025-04-01

谷歌宣布免费向所有 Gemini 应用用户提供最新、最先进的 Gemini AI 模型 ——Gemini 2.5 Pro。此前,只有 Gemini Advanced 用户才能使用这一实验模型,而现在,该模型从上周六开始向公众开放。 Gemini 2.5 Pro 由谷歌于上周早些时候推出

2023-01-20

也在研发属于自己的对话模型,并宣称即将通过子公司 DeepMind 推出一款与 ChatGPT 竞争的聊天机器人,名为“Sparrow”。 这个名为 Sparrow 的新聊天机器人是去年在一篇研究论文中作为概念验证引入的。DeepMind 首席执行官 Demis Hassabi

2024-08-06

2021 年 10 月离开谷歌。谷歌表示,Shazeer 重返后将加入 DeepMind 研究团队,但没有具体说明他或 De Freitas 的具体职责。 “我们特别高兴地欢迎机器学习领域的杰出研究员 Noam 的回归,他将与他的几位同事一起加入谷歌 DeepMind 的

2024-08-23

《时代周刊》最新消息称,谷歌 AI 研发部门 DeepMind 内部近 200 名员工签署了一封联名信,呼吁这家科技巨头取消与军事组织的合同。这封信是在 AI 实验室内部越来越担心其技术被出售给参与战争的军方的情况下流传开来的,工

2025-04-15

谷歌开源了首个Agent开发套件—ADK,这也是OpenAI之后第二家大厂发布的标准化智能体SDK。 ADK能帮助开发人员极大简化开发超复杂流程的智能体,从大模型选择、自动化流程编排、测试到应用部署可一站式完成,并且支持双向音

2023-06-01

始人 Sam Altman Anthropic 的首席执行官 Dario Amodei、 Google DeepMind 的首席执行官 Demis Hassabis 微软的首席技术官 Kevin Scott 此外还有一大堆涉略或 AI 领域的名校教授、官员记者、社会学家,其中亦有乏国内的清华大学教授、中国

2023-04-24

在上个月底,我们曾报道 Google 计划加强与 DeepMind 的合作,结束内斗,共同应对 OpenAI 对他们造成的冲击。 今天 Google 发布公告,正式宣告 DeepMind 将被合并进 Google,成为 Google DeepMind。 在 2014 年,Google 以 4 亿英镑的价格收购

2025-03-26

搜索开始自我变革。 以下是文章主要内容: 谷歌拥有DeepMind和Google Brain两大顶尖AI实验室,但其管理层对AI技术落地的态度始终谨慎。核心矛盾在于: 技术可靠性:生成式AI的答案准确性尚未达到搜索引擎的要求,可能引发

2025-04-16

谷歌旗下 AI 研究实验室 DeepMind 公布了一款名为「DolphinGemma」的 AI 模型,旨在帮助科学家理解海豚的声音,并生成类似海豚的声音序列。 DolphinGemma 基于谷歌开放的 Gemma 系列模型构建,其训练数据来源于专注于研究大西洋

2025-04-08

4许可的专业评估 为验证自己的观点,1littlecoder向Google的Gemini AI提出了问题:"这是开源吗?它符合开源许可吗?" Gemini的回答证实了创作者的疑虑:"这个许可证不完全符合基于普遍接受的开源定义和原则的开源许可证。" Gemini