网易有道宣布正式开源“子曰3”系列大模型的数学模型(英文名称Confucius3-Math),这是国内首个专注于数学教育,可在单块消费级GPU上高效运行的开源推理模型。
据了解,Confucius3-Math 是由网易有道 AI 团队开发的140 亿参数开源推理大语言模型,专门针对 K-12 数学教育场景进行优化。与通用模型不同,Confucius3-Math 具有以下特点:
✅数学任务上的顶尖性能
通过专门的强化学习训练,在中文 K-12 数学问题上的表现超越了参数规模更大的模型
✅高性价比的部署方案
可在单张消费级 GPU(如 RTX 4090D)上高效运行
✅文化与课程体系的深度契合
针对中国国家数学课程标准和解题方法论进行了优化
Confucius3-Math 采用纯强化学习的后期训练流程,结合创新的数据调度策略和改进的组相对优势估计器开发而成。Confucius3-Math在解决国内数学问题任务中展现出了显著优势。其通过大规模增强学习以及一系列的创新算法,训练成本仅为2.6万美元,推理性能约为DeepSeek R1的15倍。
附1:Demo地址,欢迎试用
https://confucius.youdao.com/
附2:模型开源地址
https://github.com/netease-youdao/Confucius3-Math
附3:论文地址
https://github.com/netease-youdao/Confucius3-Math/blob/main/Confucius3-Math.pdf