DeepSeek 即将联合 vLLM 开源推理引擎 (DeepSeek Inference Engine)

2025-04-15 發表於开源资讯

DeepSeek 在其 GitHub 仓库发布预告称，即将开源推理引擎 DeepSeek Inference Engine。

考虑到代码分支和维护资源等问题，他们选择了直接和 vLLM 等现有开源项目合作的方式进行开源。

下面是官方公告：

几周前，在开源周期间，我们开源了几个库。社区的反应非常积极——激发了许多鼓舞人心的合作、富有成效的讨论和宝贵的错误修复。

受到这一鼓舞，我们决定再迈出一大步：将我们的内部推理引擎贡献给开源社区。

我们对开源生态系统深表感激，没有它，我们向通用人工智能（AGI）的进步将不可能实现。我们的训练框架依赖于 PyTorch，我们的推理引擎建立在 vLLM 之上，这两者都在加速深度探索模型的训练和部署方面发挥了至关重要的作用。

随着对部署 DeepSeek-V3 和 DeepSeek-R1 等模型的需求不断增长，我们希望尽可能地为社区做出贡献。虽然我们最初考虑开源我们的完整内部推理引擎，但我们发现了一些挑战：

代码库改动大：我们的引擎基于一年多前的 vLLM 早期分支。尽管结构相似，但我们已经为 DeepSeek 模型进行了大量定制，这使得它难以扩展到更广泛的应用场景。

基础设施依赖：该引擎与我们的内部基础设施紧密耦合，包括集群管理工具，这使得在没有重大修改的情况下进行公开部署变得不切实际。

维护资源有限：作为一个专注于开发更好模型的中小研究团队，我们缺乏维护大型开源项目的资源。

鉴于这些挑战，我们决定与现有的开源项目合作，作为更可持续的替代方案。

未来，我们将与现有的开源项目紧密合作，以：

提取独立功能：模块化并贡献可重用的组件作为独立库。

分享优化：直接贡献设计改进和实现细节。

详情查看：

https://github.com/deepseek-ai/open-infra-index/blob/main/OpenSourcing_DeepSeek_Inference_Engine/README.md

DeepSeek 即将联合 vLLM 开源推理引擎 (DeepSeek Inference Engine)

相關推薦

🔥Xinference v1.4.1 重磅发布！分布式推理全面升级，AI 模型效率大幅提升

Xinference v1.7.0 重磅发布：Qwen3 全家桶 + 图生视频黑科技，7 大更新

🚀 Xinference v1.6.1 新增 Deepseek-R1 模型，语言能力升级！

🚀 Xinference v1.4.0｜探索 Gemma-3与 DeepSeek-v3 强大功能！

xinference 0.13.0 版本发布

Hugging Face 牵头推动 Transformers 库模型架构标准化

Xinference 1.8.1 震撼发布！GLM 4.5 & Qwen3 全系列模型一键体验

🔍Xinference v0.15.3 深度解读：新功能、新特性，助力智能推理！

Xinference 0.14.1发布：文生视频 CogVideoX 等新功能齐上阵！

Xinference 最新版本 v1.5.1 发布！🌟文生视频模型大升级，vLLM 功能增强！

🎁Xinference v0.16.0 正式发布！注册即送 500 积分，畅享云上推理新体验🎉

📢Xinference v0.15.4 来袭！Audio 模型&Tool Call 功能大升级！

国产开源推理引擎“赤兔”发布 v0.4 版本

3 月全球人工智能领域新看点