阿里 Qwen 团队提醒 Qwen3-embedding GGUF 模型使用注意事项

2025-07-15 發表於开源资讯

阿里巴巴 Qwen 团队提醒开发者，在使用 Qwen3-embedding GGUF 模型时需在末尾添加特殊 token<|endoftext|> 以保证精度，并预告将发布自动处理此问题的更新版本。

阿里巴巴 Qwen 团队表示，他们在社区讨论中注意到，部分开发者在使用 Qwen3-embedding 的 GGUF 模型时，未在上下文末尾附加特殊 token<|endoftext|>，这可能会严重影响模型精度。详细信息可查阅其 Hugging Face 模型卡。

团队表示，llama.cpp 在转换 GGUF 文件时已支持自动添加此 token。他们将很快发布一个更新的 GGUF 模型包，届时开发者将无需再手动处理此问题。

相關推薦

阿里通义 Qwen3 开源系列模型支持 100 万 token 超长上下文

2025-08-12

阿里通义Qwen团队宣布，Qwen3-30B-A3B-2507 和 Qwen3-235B-A22B-2507 系列模型现已支持高达100万token的超长上下文处理。此次升级集成了两项关键技术：Dual Chunk Attention (DCA) 和 MInference。 DCA 是一种长度外推方法，

xinference 0.13.0 版本发布

2024-07-10

临，Mac 上加速高达 40% 🚀。目前已支持 qwen2 和 gemma-2。阿里云镜像也如约而至，且容量大幅缩减，解决大家在国内拉取 docker 的痛点。详细更新内容如下： - 新增内置支持模型 📦 - qwen2 gguf格式 📝 - gemma-2-it 💻 - 新

阿里发布 Qwen2-Math，超越 GPT-4o

2024-08-10

阿里通义团队开源新一代数学模型Qwen2-Math，包含1.5B、7B、72B三个参数的基础模型和指令微调模型。 Qwen2-Math基于通义千问开源大语言模型Qwen2研发，旗舰模型 Qwen2-Math-72B-Instruct在权威测评集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、

阿里通义开源音频语言模型 Qwen2-Audio

2024-08-14

通义千问团队开源音频语言模型 Qwen2-Audio。这是 Qwen-Audio 的下一代版本，它能够接受音频和文本输入，并生成文本输出。具有以下特点：语音聊天：用户可以使用语音向音频语言模型发出指令，无需通过自动语音识别（ASR）

阿里云开源通义千问多模态大模型 Qwen-VL

2023-08-26

26 日「源创会」北京站，聊聊 AI 大模型与底层技术 >>> 阿里云推出大规模视觉语言模型Qwen-VL，并宣布直接开源。开源地址 ModelScope魔搭社区： Qwen-VL：https://modelscope.cn/models/qwen/Qwen-VL/summary Qwen-VL-Chat：https://modelscope.cn/m

阿里通义千问 Qwen3 全系适配 MLX

2025-06-18

阿里通义千问团队宣布正式开源 Qwen3 全系列 32 款 MLX 量化模型。 MLX 是开源机器学习框架，专为苹果芯片深度适配。MLX 框架可高效地训练和部署 AI 大模型，被越来越多的 AI 开发者采用。为更好服务开发者，通义团队推

Qwen 发布全新偏好建模模型系列 WorldPM 模型

2025-05-20

阿里巴巴旗下Qwen团队宣布推出全新偏好建模模型系列——WorldPM（World Preference Modeling），包括WorldPM-72B及其衍生版本WorldPM-72B-HelpSteer2、WorldPM-72B-RLHFLow和WorldPM-72B-UltraFeedback。根据官方介绍，该模型通过对1500万条偏好数据的超

Intel 开源专为本地生成式 AI 设计的 AI Playground

2025-04-22

ground软件正式开源，为Intel Arc GPU用户提供了一个强大的AI模型运行平台。AI Playground支持多种图像、视频生成模型以及大型语言模型（LLMs），通过优化本地计算资源，显著降低了AI应用的硬件门槛。核心功能：多模态AI模型一

阿里通义发布 Qwen3-30B-A3B-Instruct-2507 模型

2025-07-31

Qwen3-30B-A3B 模型迎来了新版本：Qwen3-30B-A3B-Instruct-2507。这是一个非思考模式（non-thinking mode）的新模型，仅激活3B参数，就能取得可媲美 Gemini 2.5-Flash（non-thinking）、GPT-4o等顶尖闭源模型的超强性能。 Qwen3-30B-A3B-Instruct-2507&nb

模力方舟 17 款 Embedding 和 Reranker 模型全部免费使用

2025-06-24

eranker 模型全部开放免费使用——其中包括最新的 4096 维 Qwen3-Embedding-8B。 RAG 架构必备的检索向量和重排序能力，即刻零成本上手！更多免费模型，尽在模力方舟模型广场：https://ai.gitee.com/serverless-api

Xinference 最新版本 v1.5.1 发布！🌟文生视频模型大升级，vLLM 功能增强！

2025-05-08

性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/infere

Qwen2.5-Omni 登顶全球开源模型榜单

2025-04-03

Hugging Face 发布了最新的大模型榜单，阿里巴巴通义千问所推出的端到端全模态大模型 Qwen2.5-Omni 成功登顶。紧随其后的是 DeepSeek-V3-0324和群核的 SpatialLM-Llama-1B。 Qwen2.5-Omni 是一种端到端多模态模型，旨在感知文本、图像、音频

Hugging Face 发布开放权重模型贡献榜：Qwen 与 DeepSeek 跻身 TOP15

2025-06-12

权重的团队，其模型广泛应用于学术与产业创新。由阿里巴巴云智能集团支持的Qwen团队，以Qwen3系列模型在指令跟随、代码生成等任务中的优异表现受到社区青睐。Qwen2.5-72B系列位列开源大语言模型前列，其轻量化模型QwQ-32B

阿里云通义千问 14B 模型开源

2023-09-26

阿里云宣布开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat，免费可商用。据阿里云CTO周靖人介绍，Qwen-14B在多个权威评测中超越同等规模模型，部分指标甚至接近Llama2-70B。 Qwen-14B是一款支持多种语言的高性能开源模