英伟达发布了 Cosmos-Reason1 系列模型,这是一组专注于物理常识理解和具身推理的 Physical AI 模型。
该系列模型基于 Qwen2.5-VL-7B-Instruct 进行后训练,结合了监督微调和强化学习方法,旨在理解空间、时间及基础物理学,并能作为规划模型为具身智能体(如机器人、自动驾驶汽车)的下一步行动进行推理。
Cosmos-Reason1-7B 模型能够接收文本提示和输入视频,通过长链式思维过程生成答案。模型支持商业用途,并已在 Hugging Face 上以 NVIDIA Open Model License 发布。
相关的代码、论文和评估数据集(Cosmos-Reason1-Benchmark)也已公开,数据集涵盖机器人、以自我为中心的人类演示和自动驾驶视频数据等领域。
https://huggingface.co/nvidia/Cosmos-Reason1-7B
https://github.com/nvidia-cosmos/cosmos-reason1