香港大学 XLANG Lab 联合月之暗面、斯坦福大学等机构,正式开源了一个名为 OpenCUA 的完整框架,旨在帮助开发者低门槛地构建和扩展 CUA(Computer-Use Agent,计算机使用智能体)。
该框架包括:
- 无缝捕获人类计算机使用演示的注释基础设施
- 第一个跨越 3 个操作系统以及超 200 个应用程序和网站的大规模计算机使用任务数据集 AgentNet
- 一个可扩展的、能将演示转换为具有反思性长思维链推理 “状态 - 动作” 对的工作流程。
香港大学计算机科学系助理教授 Tao Yu(余涛)为项目负责人,月之暗面、斯坦福大学、滑铁卢大学、卡内基梅隆大学的研究人员参与,月之暗面创始人、CEO 杨植麟在作者名单之列。
据介绍,OpenCUA 通过开源完整的数据、工具和模型,让 “人人都能打造自己的专属电脑智能体”,并已在关键基准上超越 GPT-4o,成为当前最强的开源 CUA 方案。
相关链接
- 论文地址:https://arxiv.org/pdf/2508.09123
- OpenCUA主页(工具、模型、数据集):https://opencua.xlang.ai
- Hugging Face地址:https://huggingface.co/collections/xlangai/opencua-open-foundations-for-computer-use-agents-6882014ebecdbbe46074a68d