​南洋理工与北大合作推出开源长记忆世界模型 WORLDMEM


南洋理工大学、北京大学王选计算机技术研究所与上海人工智能实验室的研究人员近日联合开源了名为 “WORLDMEM” 的长记忆世界模型。这一新模型旨在解决当前虚拟环境中长期一致性的问题,尤其是在视角变化或时间推移的情况下,仍能维持3D 空间的连贯性,从而显著提升用户体验。

WORLDMEM 的核心在于其创新的记忆机制。该机制构建了一个包含多个记忆单元的存储库,每个单元储存了与特定时间相关的场景信息和状态数据。通过这一机制,模型能够有效地从之前观察到的场景中提取信息,并在视角或时间变化时重新构建出精确的场景。这种方式突破了传统方法对短时间上下文窗口的限制,使得长期保留环境细节成为可能。

在生成新场景时,WORLDMEM 的记忆机制能够从庞大的记忆库中快速检索与当前场景最相关的信息。该过程涉及复杂的推理和匹配,以确保所提取的信息与当前的时间、视角和场景状态相契合。比如,当虚拟角色在环境中移动后返回原位置时,模型会迅速找到先前的记忆帧,确保场景的连贯性和一致性。

此外,WORLDMEM 具备动态更新的能力,随着虚拟世界的发展,新的场景和信息会不断被添加到记忆库中。这一特性保证了模型对最新环境状态的准确记录,从而提升了场景生成的质量。该模型采用了基于条件扩散变换器的架构,能够整合外部动作信号,实现虚拟世界的第一人称视角生成,使得角色可以灵活地在虚拟环境中移动和互动。

WORLDMEM 还使用了扩散强迫技术进行训练,使得模型能够在时间维度上进行长期模拟。这一训练方式确保了场景生成的连贯性,并使模型能够有效应对不同的动作指令和场景变化。通过将动作信号投影到嵌入空间,并结合去噪时间步嵌入,模型提升了对动作信号的响应能力。


相關推薦

2024-03-13

腾讯与中国信息通信研究院、中国科学技术大学、新加坡南洋理工大学、中原消费金融、微众银行等科研院校及金融机构联合制定了全球范围内首个金融风控领域的大模型国际标准。 人工智能技术会为金融风控带来什么?理论

2025-05-14

奇瑞汽车发文称,开阳实验室与新加坡南洋理工大学在安徽芜湖签约,标志着奇瑞全球开源计划首个海外协同创新中心落地。 开阳实验室是奇瑞打造的“没有围墙的研究院”,其以“科学-技术-产业”三位一体模式构建开放创

2025-05-23

里程碑式突破:在去年发布的机器人4D世界模型基础上,推出动作序列驱动的世界模型框架 EVAC(EnerVerse-AC),同时配套提出全球首个具身世界模型评测基准 EWMBench,构建从世界模型从训练到评测的全链路闭环。 这两大创新成果

2025-04-03

3月29日,在2025中关村论坛通用人工智能论坛上,北京通用人工智能学院院长,北京大学人工智能研究院、智能学院院长朱松纯表示,目前,行业对AI的讨论几乎被大模型能力所占据,而基础学科、原始创新与智能本质的研究却被

2024-08-16

张江节点正式揭牌;世纪互联与开源PHP宣布正式开启战略合作,共同推动智算互联的深化发展。主论坛总体围绕开源生态合作与发展、 RISC-V、多模态具身智能、深度学习平台、企业引入开源、开源 AI 发展、垂域大模型技术等话

2025-05-21

智元机器人宣布开源全球首个基于机器人动作序列驱动的具身世界模型EVAC (EnerVerse-AC),以及具身世界模型评测基准EWMBench。 根据介绍,EVAC 是一个能够动态复现机器人与环境复杂交互的世界模型,标志着从传统仿真到生成式模

2023-10-26

代理和HomeRobot。3. 支持机器人和人形化身协作,拓宽人机合作研究领域。思科发布Webex新AI战略,增强视频会议功能思科在年度WebexOne大会上宣布了新AI战略,通过Webex视频会议平台提供自动支持、会议摘要和音视频增强功能,以

2022-11-24

召开。本次研讨会由openKylin社区秘书长余杰主持,邀请了南洋理工大学刘杨教授、北京航空航天大学孙海龙教授、中国信通院云大所郭雪副主任、国家工业信息安全发展研究中心邓昌义高工、红山开源平台运营负责人易比一、红

2024-06-28

方面入手,详细阐述了openKylin社区的相关情况,让在场的北大留学生们对openKylin社区有了更加全面的了解,并围绕openKylin国际用户组介绍及加入流程和要求进行分享,鼓励在座的北大留学生们积极参与其中。 随后,在社区陪同

2025-06-28

和上下文工程的提升。Agent TARS 仍在快速发展中,未来将推出带有动态规划推理的版本,并致力于成为随时随地可用的 Agent 开发者工具。

2025-07-17

Mistral AI 宣布推出其首个针对企业的音频模型系列 Voxtral。包含两种规模:适用于生产规模应用的 24B 版本,以及适用于本地和边缘部署的 3B 版本。两个版本均基于 Apache 2.0 许可证发布。 公告称,Voxtral 解决了开发者需要在低成

2023-11-29

南京大学、新疆大学、山东女子学院、内蒙古大学、洛阳理工学院、深圳职业大学等33所985、双一流、普通本科和头部职业院校加入openKylin社区并建立高校站,与社区开展了多种形式的合作。 未来,openKylin欢迎更多高校合作伙

2025-03-21

3月20日,华为召开Pura先锋盛典,作为鸿蒙生态合作伙伴,百度也在会上宣布,最新的AI搜索模式“百看计划”在鸿蒙首发。 据介绍 ,“百看计划”让鸿蒙真正实现了软硬件生态的全新突破,意在为用户带来“百看不厌”的搜

2025-06-09

化的高效创新。英特尔与面壁智能从模型开发阶段就紧密合作,实现了长短文本多重推理效率的提升,端侧AI PC在Day 0全面适配,128K长上下文窗口等多方面突破。 双方开展了深度技术协同,基于英特尔硬件架构定制投机解码配