谷歌发布世界模型 Genie 3


谷歌 DeepMind 宣布正式发布了其最新一代世界模型 Genie3,不仅在生成时长、分辨率和物理一致性上实现显著提升,还支持通过文本动态改变虚拟世界事件。

Genie3作为一款通用世界模型,能够以24帧每秒的速度生成720P分辨率的交互式3D环境,较前代Genie2(360P,10-20秒一致性)实现了显著飞跃。据谷歌DeepMind官方介绍,Genie3通过自回归方式逐帧生成虚拟世界,最长可维持数分钟的环境一致性,视觉记忆时长高达 一分钟。

同时,Genie3 引入了革命性的“可提示世界事件”功能,用户可以通过简单的文本指令动态修改虚拟世界。例如,在一个滑雪场景中,用户可以输入指令添加一群鹿,或改变天气条件,模型能够实时响应并保持环境的物理一致性。

这一功能不仅增强了交互性,还为游戏开发者、教育工作者和AI训练提供了灵活的工具。相比传统游戏引擎需要预先编程的固定场景,Genie3的动态生成能力让虚拟世界的创作更加即时和多样化。

Genie3 无需依赖传统物理引擎,而是通过大规模视频数据集训练,自主学习重力、物体运动和交互等物理规律。无论是火星表面越野车的颠簸、河流中喷射的水花,还是风吹草动的自然效果,Genie3都能以高度逼真的方式呈现。

例如,在模拟阿尔卑斯山或古希腊场景时,模型能够跨越地理和时间界限,生成具有真实物理特性的多样化环境。这种自学习能力为AI智能体(如DeepMind的SIMA智能体)提供了丰富的训练场景,支持复杂目标的达成和长期任务的训练。

Genie3的发布被DeepMind视为迈向人工通用智能(AGI) 的重要一步。研究主任Shlomi Fruchter表示,Genie3的通用性和实时交互能力使其成为训练AI智能体的理想平台。例如,机器人可以在模拟仓库中学习应对不可预测的场景,而无需真实世界的试错成本。此外,Genie3在教育、游戏和创意设计领域的潜力也不容小觑。教师可通过简单的文本提示生成沉浸式历史或科学场景,游戏开发者则能快速构建动态虚拟世界,极大地缩短开发周期。

尽管Genie3在技术上取得了显著突破,但仍存在一些局限性。例如,模型当前仅支持数分钟的连续交互,远未达到数小时的理想状态。此外,AI智能体在模拟环境中的交互能力有限,复杂多智能体交互仍需进一步探索。

谷歌DeepMind表示,Genie3目前以研究预览形式向部分学者和创作者开放,旨在进一步优化模型并评估潜在风险。未来,DeepMind计划逐步扩大测试范围,并探索将其应用于更广泛的场景。


相關推薦

2025-04-24

度的仿真评测环境,涵盖多种场景和物体,高度还原真实世界。Genie Sim的仿真评测环境能够模拟真实世界中影响算法性能的条件和变量,为模型评测提供高度真实的测试基准。 智元方面表示,经对比验证,GO-1模型仿真测试结果

2024-08-15

AI 初创公司 Cosine 宣布,他们已经打造出世界上最强的 AI 编程助手 Genie,并在行业评测基准 SWE-Bench 中获得 30.08% 的好成绩(SWE-Bench 是用来评估大模型解决现实中软件问题的基准),超过了 Devin 和 GPT-4。 Genie 的技术报告中列

2025-04-12

谷歌 DeepMind 首席执行官 Demis Hassabis 最近在 LinkedIn 联合创始人 Reid Hoffman 联合主持的播客 Possible 上表示,谷歌计划最终将其 Gemini AI 模型与其Veo 视频生成模型相结合,以提高前者对物理世界的理解。 Hassabis 表示:“我们从一开

2023-10-27

谷歌、微软、OpenAI 和 Anthropic 发布联合声明,任命美国智库学会高管 Chris Meserole 为前沿模型论坛 (Frontier Model Forum) 首任执行董事。并宣布设立 1000 万美元的 AI 安全基金,“以推动正在进行的工具开发研究,帮助社会能够有效地

2025-05-20

谷歌及其母公司Alphabet首席执行官桑达尔·皮查伊日前做客《All-In》播客节目,接受了企业家、投资人大卫·弗里德伯格的专访。探讨了人工智能浪潮下,谷歌如何主动颠覆自身,以保持技术领先地位。 随着AI对信息获取方式的

2023-10-26

人搜索功能让展示和查找作品更便捷。📰🤖📢AI新鲜事谷歌发布新规:AI应用禁止生成受限内容谷歌宣布要求 Android 应用改进对人工智能生成内容的审查,以确保用户可以方便举报冒犯性内容,并限制照片和视频权限。【AiBase提

2025-04-08

,因此推理将成为AI新阶段的核心动力。 3月25日,美国谷歌公司发布了号称最强推理模型的双子座 2.5 Pro。据介绍,它是谷歌旗下最先进的复杂任务模型,展示了强大的推理和代码能力,并拥有双子座系列此前各模型所具有的全

2025-04-25

谷歌一年一度的开发者大会 Google I/O 2025 将于 5 月 20 日至 21 日举行,目前谷歌已经提前公布了部分会议议程。 https://io.google/2025/explore 在本次大会中,Android 系统依旧是重头戏之一。谷歌表示将举办一场关于安卓“进阶版”用

2025-04-15

今天是世界量子日,为了纪念这一天,谷歌发文介绍了量子计算机可能帮助解决的三个现实世界问题。 世界量子日(World Quantum Day),即4月14日,是世界各地量子科学家发起的一项倡议,于2021年4月14日启动,并开始2022年4月

2025-05-22

国家网络与信息安全信息通报中心发布通告,经公安部计算机信息系统安全产品质量监督检验中心检测,在应用宝平台中发现35款移动应用存在违法违规收集使用个人信息的情况,其中涉及不少 AI 应用,如智谱清言、Kimi等。

2025-05-14

次大幅上升 2.2%,达到 25.35%。除了 2001 年 6 月(TIOBE 指数发布的第一个月份,跟踪的语言数量相对少得多)和 2001 年 10 月的 Java,这一 25.35% 的数值也是 TIOBE 指数历史上编程语言所占份额的最高值。 此外,Python 还打破了另一项

2023-06-28

谷歌旗下研究实验室 DeepMind 的首席执行官 Demis Hassabis 向《连线》杂志表示,他们的工程师正在使用 AlphaGo 技术来开发一个名为 Gemini 的人工智能系统,比 OpenAI ChatGPT 背后的系统更为强大。 Gemini 本质上与 GPT-4 类似,是一个可以

2023-01-20

enAI 投资,将其 AI 技术融入到 Windows 和其他微软产品中。谷歌也参与了 OpenAI 技术的开发,但它也在研发属于自己的对话模型,并宣称即将通过子公司 DeepMind 推出一款与 ChatGPT 竞争的聊天机器人,名为“Sparrow”。 这个名为 Sparr

2022-05-17

据俄罗斯媒体 kommersant 报道,自 5 月 9 日谷歌发布 Android  Chrome 101 版本后,大量俄罗斯用户在  Google Play 应用商店和社交软件中发声投诉,称其  Android 设备无法通过 Google Play 商店更新 Chrome 浏览器和 Android System WebView