智源发布 RoboOS 2.0,支持 MCP 机制


北京智源人工智能研究院正式发布跨本体具身大小脑协作框架 RoboOS 2.0 与具身大脑 RoboBrain 2.0,并全面开源,包括框架代码、模型权重、数据集与评测基准。

跨本体具身大小脑协作框架 RoboOS 2.0 是全球首个基于具身智能SaaS平台、支持无服务器一站式轻量化机器人本体部署的开源框架。同时,RoboOS 2.0也是全球首个支持MCP的跨本体具身大小脑协作框架,旨在构建具身智能领域的“应用商店”生态。

在该框架下,可一键下载并部署来自全球开发者创建的相同型号机器人本体的小脑技能,完成大小脑的无缝整合。RoboOS 2.0实现了小脑技能的免适配注册机制,显著降低开发门槛,典型场景下,相关代码量仅为传统手动注册方式的1/10。

相较于1.0,RoboOS 2.0对端到端推理链路进行了系统级优化,整体性能提升达30%,全链路平均响应时延低至3ms以下,端云通信效率提升27倍。在功能层面,新增了多本体时空记忆场景图(Scene Graph)共享机制,支持动态环境下的实时感知与建模;同时引入多粒度任务监控模块,实现任务闭环反馈,有效提升机器人任务执行的稳定性与成功率。

RoboBrain 2.0 是开源具身大脑大模型。在任务规划方面,RoboBrain 2.0相比于RoboBrain 1.0的基于Prompt的多机任务规划机制和初级空间理解能力,进一步扩展了基于多本体-环境动态建模的多机协同规划能力,可实时构建包含本体定位的场景图(Scene Graph),并自动完成跨本体的任务规划。

实验数据显示,RoboBrain 2.0的任务规划准确率相较RoboBrain 1.0实现了74%的效果提升。

在空间智能方面,RoboBrain 2.0在原有可操作区域(Affordance)感知与操作轨迹(Trajectory)生成能力的基础上,实现了17%的性能提升。同时,RoboBrain 2.0增加了空间推理能力(Spatial Referring),既包含机器人对相对空间位置(如前后、左右、远近)及绝对距离的基础感知与理解能力,也实现了对复杂空间的多步推理能力。

此外,RoboBrain 2.0还新增了闭环反馈以及具身智能的深度思考能力。智源方面表示,已与全球20多家具身智能企业达成合作,共同打造开放、繁荣、协同的智能机器人生态体系。


相關推薦

2025-06-07

继“悟道”系列大模型之后,智源研究院推出“悟界”系列大模型。其中包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0以及全原子微观生命模型OpenC

2024-09-27

近日,智源研究院正式发布中文互联网语料库 CCI 3.0 (Chinese Corpora Internet,简称 CCI),包括 1000GB 的数据集以及 498GB 的高质量子集 CCI 3.0-HQ。 智源研究院于 2023 年 11 月首次开源 CCI 1.0,并在 2024 年 4 月发布 CCI 2.0。目前,CCI 系列

2025-04-03

AutoDev 是一个开源的 AI 编程工具,最近发布了 2.0 版本!在 AutoDev 2.0 中,你可以: 编码智能体 Sketch 进行自动化编程 自动化编程的规划器 AutoDev Planner 系统迁移 Bridge 辅助旧系统重构 观察者 Observer,动态观察 IDE 中

2023-03-02

tGPT成为现象级应用,人工智能进入普及应用的新时期。 智源研究院2020年搭建大模型攻关团队,2021年6月推出当时规模最大、性能领先多模态大模型“悟道2.0”。为了推动大模型方向的协同创新,在“科技创新2030”新一代人工

2025-05-24

Solon AI 正式发布了(版号,随 Solon v3.3.1)。历时小半年。 1、简介 Solon AI 是一个 Java AI(智能体) 全场景应用开发框架,提供有丰富的接口能力。主要支持的的智能体开发场景有:Chat;RAG;MCP;AiFlow。 其中 ChatModel 是 Solon AI

2025-04-16

力及保护用户拥有更高的隐私性。 近日,慢雾安全团队发布了一份 MCP 安全检查清单,涵盖了从用户交互界面、客户端组件、服务插件,到多 MCP 协作机制及特定领域(如加密货币场景)的安全要点,旨在帮助开发者系统性地识

2025-05-21

的连接方式,此前 OpenAI 和 Google 也已表示支持。 为了确保安全性,Windows 11 将提供以下安全控制: 代理中介通信 (Proxy-Mediated Communication):所有 MCP 客户端-服务器交互都通过一个可信的 Windows 代理进行路由,

2025-05-22

次 ,近半年下载量1200万次。 有透明可预期的《版本发布与维护计划》 有“【社区交流】”和“【商业服务】”双重技术支持 同时支持运行时环境(不基于 java-ee 构建,所以可以同时兼容): java8, java11, java17, java21, j

2025-05-14

次 ,近半年下载量1200万次。 有透明可预期的《版本发布与维护计划》 有“【社区交流】”和“【商业服务】”双重技术支持 有什么特点(相对 Java Spring 方案)? 特点 描述 更高的计算性价比 并发高

2025-05-09

智源研究院宣布已发布大型开源文本数据集CCI 4.0,兼顾多样性与高质量,从单一语言数据集扩展为多语种数据集。 根据介绍,本次发布包括了中、英语两种语言,并将在随后的发布中,开源更多语言的版本。此外,CCI 4.0首次

2024-10-23

智源研究院宣布正式发布原生多模态世界模型 Emu3。该模型只基于下一个token预测,无需扩散模型或组合方法,即可完成文本、图像、视频三种模态数据的理解和生成。 目前 Emu3 已开源了关键技术和模型。 公告称,Emu3在图像

2025-04-08

智源研究院联合南开大学计算机学院人类语言技术实验室 HLT Lab 正式发布并开源ChildMandarin和SeniorTalk两大语音数据集,覆盖3-5岁低幼儿童和75岁及以上的超高龄老年人。 “这两项数据集的发布,将为面向儿童与老年人的语音识别

2025-04-15

源了首个Agent开发套件—ADK,这也是OpenAI之后第二家大厂发布的标准化智能体SDK。 ADK能帮助开发人员极大简化开发超复杂流程的智能体,从大模型选择、自动化流程编排、测试到应用部署可一站式完成,并且支持双向音频、视

2025-05-28

智源研究院发文宣布,为了推动不同架构 AI 硬件系统的创新和落地,打造开源、统一的 AI 系统软件生态,联合多家机构开源 AI 编译器 FlagTree。 FlagTree 的开源,是开源、统一 AI 系统软件生态 FlagOS 发展进程中又一个重要的里