南京大学发布 Hugging Face 知识图谱


南京大学Websoft研究团队构建了HuggingKG,这是一个基于Hugging Face社区的大型知识图谱,以及配套的多任务基准测试HuggingBench

这两项资源的推出,将为开源资源的推荐、分类和溯源带来全新的解决方案。两项资源均已在Hugging Face社区开源,同时,为了确保资源的的可持续性和实验结果的可复现性,研究团队在GitHub开源了知识图谱构建和基准测试的代码。这将允许社区成员根据自身需求定制和扩展这些资源。

1. HuggingKG:开源机器学习资源的知识图谱

HuggingKG是首个专注于开源机器学习资源管理的知识图谱,它整合了来自Hugging Face社区的260万节点和620万条边,涵盖了模型、数据集、用户、任务等多种实体类型,以及它们之间的复杂关系。这些关系不仅包括模型演化(如adapter、finetune)和用户互动(如like、follow),还包含了丰富的文本属性(如model card、dataset card)。

通过这种结构化的表示,HuggingKG能够支持复杂的查询和分析任务,例如追踪模型的演化历史、推荐相关数据集以及识别资源类别等。

2. HuggingBench:多任务基准测试

为了评估开源资源管理中的实际挑战,研究团队还开发了HuggingBench,这是一个包含三个创新测试集的多任务基准测试,涵盖了资源推荐(resource recommendation)、任务分类(task classification)和模型溯源(model tracing)等任务。这些测试集利用 HuggingKG 的结构化数据,提供了独特的分析视角和挑战。

论文:https://arxiv.org/abs/2505.17507

代码:https://github.com/nju-websoft/HuggingBench

数据:https://huggingface.co/collections/cqsss/huggingbench-67b2ee02ca45b15e351009a2


相關推薦

2023-08-09

PyTorch 基金会宣布 Hugging Face 已加入为首要成员。与此同时,Hugging Face 开源负责人 Lysandre Debut 也成为了 PyTorch 基金会治理委员会的一员。 Hugging Face 是一个致力于降低机器学习和深度学习入门门槛的社区和公司,其模型

2023-08-05

IBM 宣布在 Hugging Face 上开源其 watsonx.ai 地理空间基础模型 -- 基于美国国家航空航天局 (NASA) 的卫星数据构建。这将是 Hugging Face 上最大的地理空间基础模型,也是首个与 NASA 合作构建的开源 AI 基础模型。 公告指出,作为与 NASA

2023-06-29

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的

2025-05-31

AI 开发平台 Hugging Face 发布了 HopeJR 和 Reachy Mini 两款开源人形机器人。 HopeJR 是全尺寸人形机器人,具备 66 个驱动自由度(即 66 个独立动作),包括行走和手臂运动能力。Reachy Mini 则是桌面版机器人

2023-08-24

科技媒体 The Information 的报道,开源模型库公司 Hugging Face 正进行一轮新的融资,本轮融资由 Salesforce 旗下投资机构 Salesforce Ventures 领投,Salesforce CEO Marc Benioff 在推特证实了这一消息。Hugging Face 此次融资预计将筹集约

2023-10-24

一起寻宝 AI 时代 根据 Yahoo 新闻的报道,人工智能公司 Hugging Face 发言人在周五的一封电子邮件中写道: 中国的人工智能社区非常出色,我们希望他们能更好地访问 HF,但目前我们对于政府的法规无能为力。 The Chinese AI

2025-05-17

Hugging Face 宣布联合多家机构推动将transformers库作为模型架构标准,提升 AI 生态兼容性。 Hugging Face 表示正与 vLLM、LlamaCPP、SGLang、Mlx、Qwen、Glm、Unsloth、Axoloth、Deepspeed、IBM、Gemma、Llama、Deepseek、Microsoft、Nvidia、InternLM、Llava

2025-05-10

Hugging Face 推出了免费云端 AI 智能体工具 Open Computer Agent,支持用户通过文本指令,远程操控基于 Linux 的虚拟计算机,使用 Firefox 等应用。 https://huggingface.co/spaces/smolagents/computer-agent 据介绍,Open Computer Agent 工具集成 smolagents

2023-05-06

Hugging Face 日前联合 ServiceNow 发布了一个免费的大型语言模型 StarCoder(150 亿参数),该模型经过训练主要用途是可以生成代码,目的是为了对抗 GitHub Copilot 和亚马逊 CodeWhisperer 等基于 AI 的编程工具。 目前像是 GitHub Copilot 这

2025-04-30

像编辑模型 Step1X-Edit,上线次日就在海外开源社区平台 Hugging Face 登上 Spaces 趋势热榜,该榜单反映了模型实际应用价值的受欢迎程度。 Step1X-Edit 提供强大的改图能力,可以帮用户完成日常工作和生活中最高频的 11 类图像编辑

2023-07-25

外,开源PHP继“Gitee”平台后,今年还将推出其自己的“Hugging Face”平台,届时JIANG或将成为第一批开源的中国本土的大模型之一。 本次发布会的主讲人为知未智能的联合创始人兼CTO段清华,毕业于北京大学计算机系,长期以

2023-09-22

流大模型。同年 9 月,智谱 AI 完成数亿元 B 轮融资,并发布 130 亿参数规模的代码生成模型 CodeGeeX。2023 年 3 月,对话模型 ChatGLM-6B 及千亿对话模型 ChatGLM(内测版)发布。 相关阅读: 美团投资大模型公司智谱 AI,占股超 10%

2023-10-21

流大模型。同年 9 月,智谱 AI 完成数亿元 B 轮融资,并发布 130 亿参数规模的代码生成模型 CodeGeeX。2023 年 3 月,对话模型 ChatGLM-6B 及千亿对话模型 ChatGLM(内测版)发布。 目前,智谱 AI 的开源模型在全球下载量已超过 1000 万

2023-07-22

流大模型。同年 9 月,智谱 AI 完成数亿元 B 轮融资,并发布 130 亿参数规模的代码生成模型 CodeGeeX。2023 年 3 月,对话模型 ChatGLM-6B 及千亿对话模型ChatGLM(内测版)发布。 相关阅读: 清华系公司智谱 AI 开源 ChatGLM-6B 大模型