全球首个人形机器人 3D 视觉系统诞生


北京人形机器人创新中心近日宣布推出名为"Humanoid Occupancy"的革命性视觉感知系统,这项技术被业界认为是人形机器人环境理解能力的重大突破。

长期以来,机器人感知系统面临着严峻挑战。现有的感知技术大多只能适应单一或特定场景,当面对复杂多变的真实环境时,往往表现不佳。更为严重的是,许多系统无法有效整合来自不同传感器的数据,导致大量有价值的环境信息被浪费,甚至出现感知盲区,这直接影响了机器人的移动、导航和操作精度。

"Humanoid Occupancy"系统的核心创新在于引入了语义占用表征技术。该技术能够对三维空间进行精细化建模,通过体素单元直接描述每个空间位置的占用状态和物体类别信息。与传统的鸟瞰图表征方式相比,这种方法能够提供更加立体和全面的环境信息。

该系统展现出三大技术优势。在空间信息处理方面,系统实现了对三维环境的完整编码,每个空间单元都能被准确识别和分类。在数据融合层面,语义占用表征天然支持多模态传感器协同工作,能够将RGB摄像头、深度传感器、激光雷达等设备采集的数据进行统一处理和分析。在系统架构上,研发团队通过优化传感器配置、构建专门的全景占用感知数据集,并设计了高效的多模态融合网络,确保了感知的准确性和响应速度。

项目团队还解决了数据稀缺这一行业痛点。他们构建了一个涵盖家庭生活、工业生产等多种应用场景的大规模数据集,并提供了详细的语义标注信息。这个数据集不仅为当前系统提供了训练基础,也为整个人形机器人研究领域提供了宝贵的资源支持。

业内专家认为,"Humanoid Occupancy"系统的问世标志着人形机器人感知技术进入了新的发展阶段。随着这项技术的成熟和推广,人形机器人有望在家庭服务、工业制造、医疗护理等领域发挥更大作用,真正实现与人类的和谐共存。

论文地址:https://arxiv.org/pdf/2507.20217


相關推薦

2025-05-27

由中央广播电视总台主办的《CMG 世界机器人大赛・系列赛》机甲格斗擂台赛于5月25日晚在浙江杭州举行,这是全球首个以人形机器人为参赛主体的格斗竞技赛事。 正式开赛前,四台宇树G1人形机器人戴着不同颜色的护具亮相,

2025-05-22

据央视新闻,由中央广播电视总台主办的《CMG世界机器人大赛·系列赛》机甲格斗擂台赛将于5月25日在杭州举行,这是全球首个以人形机器人为参赛主体的格斗竞技赛事。 据了解,宇树科技将以合作方身份参加比赛。 今年4月

2025-07-17

有机会参与AI革命。 “十年内,工厂将由软件和AI指挥的机器人团队运营,与人类一起打造智能产品。”黄仁勋认为,“AI将成为每个行业、每家公司、每项产品与服务的核心,为中国卓越的供应链生态系统开启新工业革命和增

2024-08-16

eepin V23真正实现了操作系统的每个层级均有自研模块,为全球开源操作系统爱好者提供了优异的源自中国的开发工具。 deepin V23搭载Linux 6.6 LTS内核,从仓库到应用层,针对操作系统核心组件,采用了大量自研方案: 独立构建

2023-09-07

官方博文宣布为 Android 启用新版品牌标识。 新的 Android 机器人图标据称从 Material Design 和 Google 品牌配色中汲取灵感,相比旧版图标 3D 效果更强同时可根据使用场景搭配更加灵活的光影和色彩效果。 Android 品牌的文本徽标也

2023-04-04

2023年3月26日,默认搭载openKylin操作系统的全球首款RISC-V笔记本电脑ROMA正式发布。ROMA一经亮相,便收获了开发者的广泛关注。作为全球首款原生RISC-V开发笔记本电脑,ROMA的发布为RISC-V的生态应用提供了更多可能,真正实现了RISC-

2025-06-25

这一模型此前曾与DeepSeek-V3、通义千问Qwen2.5-Omni一起登上全球最大的开源社区HuggingFace全球趋势榜前三。 作为一款将大语言模型扩展到3D空间理解任务中的模型,SpatialLM能从3D点云输入生成结构化的空间场景描述,这一过程突破

2024-08-20

昆仑万维发布全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成于一体,旨在让创作者“一键成剧”,轻松制作高质量AI视频。 SkyReels平台集成了昆仑万维自研剧

2025-05-23

近日,智元机器人重磅发布具身智能领域双重里程碑式突破:在去年发布的机器人4D世界模型基础上,推出动作序列驱动的世界模型框架 EVAC(EnerVerse-AC),同时配套提出全球首个具身世界模型评测基准 EWMBench,构建从世界模型

2025-07-15

推出单机版产品线及RoboSkill技能商店,通过深度集成实现机器人技能模块智能匹配与一键适配功能,标准化接口有效消除厂商与硬件适配流程差异。同步推出开箱即用镜像,支持"三行指令"极速部署,全面赋能开发者高效构建智

2023-06-14

担任公司 CEO。同时宣布即将推出首款产品「乐天派桌面机器人」,这是面向极客和发烧友的一款 AI +机器人的桌面小型机器人。 昨日,李明公布了乐天派桌面机器人的系统,号称是「全球首款 Android 桌面机器人」,支持安装 App

2025-05-23

成等一系列多模态模型同步“上新” 混元TurboS模型在全球公认的Chatbot Arena评测平台上已跻身前八名,在国内排名仅次于DeepSeek。其在代码和数学等理科领域的能力显著提升,得益于创新的预训练和后训练技术。 深度思考模

2025-03-20

晨的GTC2025主题演讲上,英伟达发布全球首个开源仿人形机器人基础模型 Isaac GR00T N1 和仿真框架。 NVIDIA 创始人兼 CEO 黄仁勋表示:“通用机器人的时代已经到来,借助 NVIDIA Isaac GR00T N1 以及新的数据生成和机器人学习框架,全球

2025-05-21

智元机器人宣布开源全球首个基于机器人动作序列驱动的具身世界模型EVAC (EnerVerse-AC),以及具身世界模型评测基准EWMBench。 根据介绍,EVAC 是一个能够动态复现机器人与环境复杂交互的世界模型,标志着从传统仿真到生成式模