Hugging Face 发布开放权重模型贡献榜:Qwen 与 DeepSeek 跻身 TOP15


Hugging Face 近日发布开放权重模型贡献榜,中国团队Qwen和DeepSeek成功入围前15名。该榜单表彰为开源社区提供高质量模型权重的团队,其模型广泛应用于学术与产业创新。

由阿里巴巴云智能集团支持的Qwen团队,以Qwen3系列模型在指令跟随、代码生成等任务中的优异表现受到社区青睐。Qwen2.5-72B系列位列开源大语言模型前列,其轻量化模型QwQ-32B通过强化学习优化,在数学推理和代码生成中媲美大型模型,大幅降低部署成本。

DeepSeek则以低成本、高性能的R1系列模型闻名。R1-0528在LiveCodeBench排行榜中超越多个国际竞品,仅次于OpenAI顶尖模型。其轻量化版本DeepSeek-R1-0528-Qwen3-8B通过知识蒸馏技术,单GPU即可运行,在AIME2025数学测试中击败Google的Gemini2.5Flash,展现了在特定领域的竞争优势。

Qwen和DeepSeek的入榜反映了中国AI团队在开源生态中的崛起。Hugging Face负责人表示,两团队的贡献为全球开发者提供了高效资源。NVIDIA首席执行官黄仁勋也赞扬其性能与成本平衡正在重塑AI格局。未来,Qwen计划探索多模态技术,DeepSeek则将推出R2模型,持续推动AI创新。


相關推薦

2025-04-08

显得异常复杂。1littlecoder指出,即使是中国公司的模型如DeepSeek和Qwen,用户只需点击几下即可下载。而Meta的模型却设置了多重障碍: "Meta的模型要求你首先登录Hugging Face账户,这点我能理解,他们可能有垃圾邮件问题。然后填

2025-04-03

端到端全模态大模型 Qwen2.5-Omni 成功登顶。紧随其后的是 DeepSeek-V3-0324和群核的 SpatialLM-Llama-1B。 Qwen2.5-Omni 是一种端到端多模态模型,旨在感知文本、图像、音频和视频等多种模态,同时以流式方式生成文本和自然语音响应。

2025-06-10

单的全球开源冠军、国产模型冠军。 Qwen3推理成本仅为DeepSeek R1三分之一,在产业链上下游引发新浪潮,吸引包括英伟达、英特尔、ARM、联发科、AMD 等多家头部芯片厂商,北上津杭等十余地算力平台,以及华为昇腾、百度千帆

2023-06-16

上下文窗口长度为 4096。 目前 baichuan-7B 大模型已在 Hugging Face、GitHub 以及 Model Scope 平台发布。baichuan-7B 代码采用 Apache-2.0 协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用。 Hugging Face:https://huggingfac

2025-05-17

Mlx、Qwen、Glm、Unsloth、Axoloth、Deepspeed、IBM、Gemma、Llama、Deepseek、Microsoft、Nvidia、InternLM、Llava、AllenAI、Cohere、TogetherAI 等众多生态系统参与者共同努力,将 transformers 库中的模型定义代码作为标准,旨在为所有模型提供一

2025-03-27

源当日就登顶全球主流AI开源社区Hugging Face的趋势榜。 DeepSeek(深度求索)达成过“开源周”,其在2月末连续五天发布五个代码库,并于近日继续开源上线了升级后的DeepSeek-V3模型。 阶跃星辰则在一个月左右时间开源三款多模态大

2025-03-27

考和推理能力显著提升,AIGC已成为全网增速最快赛道,DeepSeek APP上线次月活跃用户规模突破1.8亿,豆包APP破亿,腾讯元宝、纳米AI搜索在DeepSeek大模型加持下,跻身TOP5。 QuestMobile数据显示,纳米AI搜索、腾讯元宝APP在接入DeepS

2025-05-10

Hugging Face 推出了免费云端 AI 智能体工具 Open Computer Agent,支持用户通过文本指令,远程操控基于 Linux 的虚拟计算机,使用 Firefox 等应用。 https://huggingface.co/spaces/smolagents/computer-agent 据介绍,Open Computer Agent 工具集成 smolagents

2025-04-11

关注的是,英伟达新模型的性能逼近拥有 6710 亿参数的 DeepSeek R1,但只用了不到一半的参数量。 测试结果显示,GPQA(76 vs. 71.5)、IFEval 指令遵循(89.5 vs. 88.8)和 LiveCodeBench 编码任务(66.3 vs. 65.9)。并且,Llama-3.1-Nemotron-Ultra-25

2025-06-13

Hugging Face 开源了专用于评估 GUI 智能体的综合测试套件 ScreenSuite。 什么是 GUI Agent?简单说,就是“能像人一样操作屏幕”的 AI!它能识别界面内容、点击按钮、输入文字、滚动页面……实现真实的“虚拟助手”体验。

2025-04-22

上表现出色。 大型语言模型:兼容Safetensor PyTorch格式的DeepSeek R1、Phi3、Qwen2、Mistral,以及GGUF格式的Llama3.1、Llama3.2,结合OpenVINO优化的TinyLlama、Mistral7B、Phi3mini和Phi3.5mini,提供高效的本地聊天与推理能力。 ComfyUI工作流:通过

2025-04-30

像编辑模型 Step1X-Edit,上线次日就在海外开源社区平台 Hugging Face 登上 Spaces 趋势热榜,该榜单反映了模型实际应用价值的受欢迎程度。 Step1X-Edit 提供强大的改图能力,可以帮用户完成日常工作和生活中最高频的 11 类图像编辑

2023-08-09

PyTorch 基金会宣布 Hugging Face 已加入为首要成员。与此同时,Hugging Face 开源负责人 Lysandre Debut 也成为了 PyTorch 基金会治理委员会的一员。 Hugging Face 是一个致力于降低机器学习和深度学习入门门槛的社区和公司,其模型

2025-05-01

g 数据,总数据为 5.16T tokens。 快速体验 G1 1.5B :https://huggingface.co/spaces/RWKV-Red-Team/RWKV-LatestSpace 我们也开源发布了 RWKV 模型端聊天 APP,方便大家体验 RWKV-7 模型。APP 下载链接在本文靠后位置。 模型客观指标评测 英语和多语