上月底,智谱 AI 正式发布新一代旗舰模型 GLM-4.5,专为智能体应用打造的基础模型。官方称 “GLM-4.5 在包含推理、代码、智能体的综合能力达到开源 SOTA 水平,在真实代码智能体的人工对比评测中,实测国内最佳。”
GLM-4.5 不仅首次突破性地在单个模型中实现了推理、编码和智能体能力的原生融合,还在 12 项全球公认的硬核测试中取得了全球第三的综合成绩。
今天 GLM-4.5 技术报告正式发布。报告不仅详述了 GLM-4.5 的预训练与后训练细节,还介绍了为其打造的开源强化学习(RL)框架 slime,它兼具灵活性、效率与可扩展性,可为模型高效 RL 训练保驾护航。
报告地址:https://arxiv.org/abs/2508.06471
智谱 AI 和清华大学研究团队采用了多阶段的训练策略,包括在 23T tokens 数据上进行预训练,以及结合领域特定数据的 “中训练”(Mid-training),最后通过专家模型迭代和强化学习进行 “后训练”(Post-training) 。
模型的特点是与外部工具交互的 “智能体”(Agentic)能力、解决多步问题的 “推理”(Reasoning)能力,以及处理真实软件工程的 “编码”(Coding)能力 三中能力都很强,填补了没有能同时精通这三大核心领域的开源模型的空白。