Hugging Face 发布 ScreenSuite：开源 GUI 智能体评测套件

2025-06-13 發表於开源资讯

Hugging Face 开源了专用于评估 GUI 智能体的综合测试套件 ScreenSuite。

什么是 GUI Agent？简单说，就是“能像人一样操作屏幕”的 AI！它能识别界面内容、点击按钮、输入文字、滚动页面……实现真实的“虚拟助手”体验。

现在，Hugging Face 推出了全新的开源工具 ScreenSuite，帮助开发者和研究者评估这类视觉语言模型的实际操作能力！

ScreenSuite 能做什么？

它整合了 13 个评测集，覆盖：

屏幕感知与 UI 定位
单步操作指令执行
多步骤任务规划与完成

ScreenSuite 已在多个主流 VLM 上完成评测，包括：

Qwen2.5-VL 系列（3B~72B）
UI-TARS、Holo1 等优秀开源模型
GPT-4o 等闭源模型

ScreenSuite 支持 Ubuntu、Android、Windows 多平台评测，结合虚拟机环境还原真实交互场景，适用于科研评估与模型迭代。与其他评测不同的是，ScreenSuite 完全基于视觉输入，不依赖 DOM 或辅助树，更贴近人类的使用方式，挑战也更真实。

相關推薦

百川智能发布 70 亿参数开源中英文大模型 baichuan-7B

2023-06-16

上下文窗口长度为 4096。目前 baichuan-7B 大模型已在 Hugging Face、GitHub 以及 Model Scope 平台发布。baichuan-7B 代码采用 Apache-2.0 协议，模型权重采用了免费商用协议，只需进行简单登记即可免费商用。 Hugging Face：https://huggingfac

Hugging Face 发布 Open Computer Agent，文字指令远程操控虚拟电脑

2025-05-10

Hugging Face 推出了免费云端 AI 智能体工具 Open Computer Agent，支持用户通过文本指令，远程操控基于 Linux 的虚拟计算机，使用 Firefox 等应用。 https://huggingface.co/spaces/smolagents/computer-agent 据介绍，Open Computer Agent 工具集成 smolagents

阶跃星辰图像编辑模型 Step1X-Edit 登上 Hugging Face 趋势热榜

2025-04-30

像编辑模型 Step1X-Edit，上线次日就在海外开源社区平台 Hugging Face 登上 Spaces 趋势热榜，该榜单反映了模型实际应用价值的受欢迎程度。 Step1X-Edit 提供强大的改图能力，可以帮用户完成日常工作和生活中最高频的 11 类图像编辑

Hugging Face 桌面机器人 Reachy Mini 开始接受预定

2025-07-10

Hugging Face 的桌面机器人 Reachy Mini 已于 2025 年 7 月 9 日正式开放预订。根据官网信息，Reachy Mini 提供了两个版本：无线版（Reachy Mini Wireless）：内置 Raspberry 5 微型计算机，售价 449 美元（约合人民币 3224 元）。精简版（Reachy

RWKV7-G1 1.5B 发布！全球语言推理模型，特别适合端侧手机运行

2025-05-01

g 数据，总数据为 5.16T tokens。快速体验 G1 1.5B ：https://huggingface.co/spaces/RWKV-Red-Team/RWKV-LatestSpace 我们也开源发布了 RWKV 模型端聊天 APP，方便大家体验 RWKV-7 模型。APP 下载链接在本文靠后位置。模型客观指标评测英语和多语

Hugging Face 被限制访问

2023-10-24

一起寻宝 AI 时代根据 Yahoo 新闻的报道，人工智能公司 Hugging Face 发言人在周五的一封电子邮件中写道：中国的人工智能社区非常出色，我们希望他们能更好地访问 HF，但目前我们对于政府的法规无能为力。 The Chinese AI

RWKV7-G1 2.9B 推理模型开源发布，展示数学/代码/全球语言能力，已适配手机 App

2025-05-22

g 数据，总数据为 5.16T tokens。快速体验 G1 2.9B ：https://huggingface.co/spaces/RWKV-Red-Team/RWKV-LatestSpace 我们也开源发布了 RWKV 模型端聊天 APP，方便大家体验 RWKV-7 G1 模型，APP 下载链接在本文靠后位置。模型客观指标评测英语和多

Salesforce 领投 Hugging Face 新一轮融资，预计筹集 2 亿美元

2023-08-24

科技媒体 The Information 的报道，开源模型库公司 Hugging Face 正进行一轮新的融资，本轮融资由 Salesforce 旗下投资机构 Salesforce Ventures 领投，Salesforce CEO Marc Benioff 在推特证实了这一消息。Hugging Face 此次融资预计将筹集约

英伟达推出 Cosmos 与 Nemotron 模型，推动物理 AI 与智能体发展

2025-08-13

开发者可在 NVIDIA API 目录预览相关模型，并从 NGC 目录和 Hugging Face 下载模型系列与微调框架。 https://docs.nvidia.com/cosmos/

字节跳动旗下开源多模态智能体 Agent TARS 发布 Beta 版本

2025-06-28

字节跳动正式发布了 Agent TARS 的 Beta 版本，将其定位为一个开源的多模态 AI Agent 工具，旨在提供与各种现实世界工具的无缝集成能力，并实现“随时随地可用”。 Agent TARS 的早期预览版已于三月份开源。此

LongRoPE 可扩展至 131,072 token。目前，模型已在 Github、Hugging Face、魔搭社区开源 🔗Github：https://github.com/OpenBMB/MiniCPM 🔗Hugging Face: https://huggingface.co/openbmb/MiniCPM4.1-8B 🔗ModelScope:https://modelscope.cn/models/OpenBMB/MiniCPM4.1-8B

Hugging Face 发布 AI 编程模型，对抗 GitHub Copilot

2023-05-06

Hugging Face 日前联合 ServiceNow 发布了一个免费的大型语言模型 StarCoder（150 亿参数），该模型经过训练主要用途是可以生成代码，目的是为了对抗 GitHub Copilot 和亚马逊 CodeWhisperer 等基于 AI 的编程工具。目前像是 GitHub Copilot 这

Hugging Face 发布两款开源人形机器人，最低仅售 250 美元

2025-05-31

AI 开发平台 Hugging Face 发布了 HopeJR 和 Reachy Mini 两款开源人形机器人。 HopeJR 是全尺寸人形机器人，具备 66 个驱动自由度（即 66 个独立动作），包括行走和手臂运动能力。Reachy Mini 则是桌面版机器人

Hugging Face 加入 PyTorch 基金会，成为首要成员

2023-08-09

PyTorch 基金会宣布 Hugging Face 已加入为首要成员。与此同时，Hugging Face 开源负责人 Lysandre Debut 也成为了 PyTorch 基金会治理委员会的一员。 Hugging Face 是一个致力于降低机器学习和深度学习入门门槛的社区和公司，其模型