Hugging Face 牵头推动 Transformers 库模型架构标准化


Hugging Face 宣布联合多家机构推动将transformers库作为模型架构标准,提升 AI 生态兼容性。

Hugging Face 表示正与 vLLM、LlamaCPP、SGLang、Mlx、Qwen、Glm、Unsloth、Axoloth、Deepspeed、IBM、Gemma、Llama、Deepseek、Microsoft、Nvidia、InternLM、Llava、AllenAI、Cohere、TogetherAI 等众多生态系统参与者共同努力,将 transformers 库中的模型定义代码作为标准,旨在为所有模型提供一个统一的真实来源。

Hugging Face 目前正在与最流行的推理引擎(vLLM、SGLang、TGI、...)紧密合作,让它们使用transformers作为后端:只要模型被添加到transformers,便支持在这些推理引擎中使用,同时利用每个引擎的优势:推理优化、专用内核、动态批处理等。

这项联合工作将极大地提高不同模型架构在整个 AI 生态系统中的兼容性和互操作性。


相關推薦

2023-06-29

,我们发布了一个音频处理课程,旨在让学员学习使用 transformers 处理音频,涵盖了包括音频数据处理技术、不同任务的 transformers 模型应用(如音频分类和语音识别)、音频 transformers 模型的架构和音频任务实践等一系列内容。

2025-04-23

与中国科学院研究人员2023年发布名为《BitNet: Scaling 1-bit Transformers for Large Language Models》的论文,首度发布为大语言模型设计的1-bit Transformer架构,称为BitNet。 https://arxiv.org/pdf/2310.11453 微软表示,这是第一个参数20亿的开

2023-08-09

PyTorch 基金会宣布 Hugging Face 已加入为首要成员。与此同时,Hugging Face 开源负责人 Lysandre Debut 也成为了 PyTorch 基金会治理委员会的一员。 Hugging Face 是一个致力于降低机器学习和深度学习入门门槛的社区和公司,其模型

2023-08-24

科技媒体 The Information 的报道,开源模型库公司 Hugging Face 正进行一轮新的融资,本轮融资由 Salesforce 旗下投资机构 Salesforce Ventures 领投,Salesforce CEO Marc Benioff 在推特证实了这一消息。Hugging Face 此次融资预计将筹集约

2023-05-06

Hugging Face 日前联合 ServiceNow 发布了一个免费的大型语言模型 StarCoder(150 亿参数),该模型经过训练主要用途是可以生成代码,目的是为了对抗 GitHub Copilot 和亚马逊 CodeWhisperer 等基于 AI 的编程工具。 目前像是 GitHub Copilot 这

2025-04-30

像编辑模型 Step1X-Edit,上线次日就在海外开源社区平台 Hugging Face 登上 Spaces 趋势热榜,该榜单反映了模型实际应用价值的受欢迎程度。 Step1X-Edit 提供强大的改图能力,可以帮用户完成日常工作和生活中最高频的 11 类图像编辑

2025-05-10

Hugging Face 推出了免费云端 AI 智能体工具 Open Computer Agent,支持用户通过文本指令,远程操控基于 Linux 的虚拟计算机,使用 Firefox 等应用。 https://huggingface.co/spaces/smolagents/computer-agent 据介绍,Open Computer Agent 工具集成 smolagents

2023-10-24

一起寻宝 AI 时代 根据 Yahoo 新闻的报道,人工智能公司 Hugging Face 发言人在周五的一封电子邮件中写道: 中国的人工智能社区非常出色,我们希望他们能更好地访问 HF,但目前我们对于政府的法规无能为力。 The Chinese AI

2023-07-25

外,开源PHP继“Gitee”平台后,今年还将推出其自己的“Hugging Face”平台,届时JIANG或将成为第一批开源的中国本土的大模型之一。 本次发布会的主讲人为知未智能的联合创始人兼CTO段清华,毕业于北京大学计算机系,长期以

2025-04-22

升创作灵活性。 AI Playground不直接附带模型,用户需从Hugging Face或CivitAI下载模型并放置于指定文件夹,平台提供直观的模型加载界面,确保操作简便。 技术架构:OpenVINO优化本地性能 AI Playground基于Intel的OpenVINO框架,针对Arc

2024-07-25

3.5 Sonnet 等领先闭源模型。 Llama 3.1 现已于 Meta 官网和 Hugging Face 开放下载。 Llama 3.1 论文:https://ai.meta.com/research/publications/the-llama-3-herd-of-models/ Llama 3.1 官方文档:https://llama.meta.com/docs/overview/

2023-08-05

IBM 宣布在 Hugging Face 上开源其 watsonx.ai 地理空间基础模型 -- 基于美国国家航空航天局 (NASA) 的卫星数据构建。这将是 Hugging Face 上最大的地理空间基础模型,也是首个与 NASA 合作构建的开源 AI 基础模型。 公告指出,作为与 NASA

2025-03-27

新推理模型QwQ-32B,在开源当日就登顶全球主流AI开源社区Hugging Face的趋势榜。 DeepSeek(深度求索)达成过“开源周”,其在2月末连续五天发布五个代码库,并于近日继续开源上线了升级后的DeepSeek-V3模型。 阶跃星辰则在一个月左

2025-04-08

ta的模型却设置了多重障碍: "Meta的模型要求你首先登录Hugging Face账户,这点我能理解,他们可能有垃圾邮件问题。然后填写表格,务必提供你的法定全名。我是说,为什么下载PyTorch权重或一些随机二进制文件需要提供我的法