OpenBMB 发布并开源 MiniCPM 4.1-8B

2025-09-09 發表於开源资讯

OpenBMB 正式推出并开源 MiniCPM4.1-8B，这是首个开源的混合推理大语言模型，该模型通过系统性创新实现了端侧极致效率，支持深度推理模式与非推理模式一键切换。

该系列在 8B 参数规模下通过模型架构、训练数据、训练算法和推理系统四个维度的系统性创新，实现端侧极致效率。

模型亮点

首个原生稀疏架构的深思考模型，通过可训练稀疏注意力创新，代码、数学推理等任务的推理速度比同尺寸开源模型快 3 倍以上
知识、推理、编程、指令遵循等 15 个评测基准，取得综合平均分同尺寸模型第一
支持高效双频换挡：长文本用稀疏，短文本用稠密
端侧友好，在 128K 长文本场景下，MiniCPM 4.1 相较于 Qwen3-8B 仅需 25% 的缓存存储空间

MiniCPM4.1-8B 采用 InfLLM v2 可训练稀疏注意力机制，在 128K 长文本场景下每个 token 仅与不到 5% 的 token 计算相关性，显著降低长文本计算开销；原生支持 65,536 token 上下文，通过 LongRoPE 可扩展至 131,072 token。

目前，模型已在 Github、Hugging Face、魔搭社区开源

🔗Github：https://github.com/OpenBMB/MiniCPM
🔗Hugging Face: https://huggingface.co/openbmb/MiniCPM4.1-8B
🔗ModelScope:https://modelscope.cn/models/OpenBMB/MiniCPM4.1-8B

OpenBMB 发布并开源 MiniCPM 4.1-8B

相關推薦

OpenBMB 开源轻量级 CUDA 推理框架 CPM.cu

面壁智能开源 MiniCPM-V 2.6 模型，端侧能力全面对标 GPT-4V

MiniCPM 端侧客户端正式发布并开源

OpenBMB 开源社区推出代码 Agent「卷姬」

AI PC 新突破端侧首次支持 128K 上下文窗口实现 2.2 倍推理优化

清华&面壁团队队开源 AgentCPM-GUI，面向中文 APP 的端侧 GUI Agent

🎁Xinference v0.16.0 正式发布！注册即送 500 积分，畅享云上推理新体验🎉

🔍Xinference v0.15.3 深度解读：新功能、新特性，助力智能推理！

Xinference 0.14.1发布：文生视频 CogVideoX 等新功能齐上阵！

Xinference v1.7.0 重磅发布：Qwen3 全家桶 + 图生视频黑科技，7 大更新

🚀 Xinference v1.6.1 新增 Deepseek-R1 模型，语言能力升级！

英伟达发布并开源两款多语言语音模型，支持商用

月之暗面发布并开源 Kimi K2：擅长代码与 Agentic 任务

Swift Foundation 框架将用 Swift 重写，并开源