360 开源升级自研 7B 参数模型 360Zhinao3-7B

2025-05-08 發表於开源资讯

360集团宣布对其自研的7B参数模型360Zhinao3-7B进行了开源升级，可免费商用。

公告称，模型各项能力得到全面提升，在多个benchmark上表现优秀。本次开源推出的360Zhinao3-7B-O1.5模型，不止是数学和科学的单点模型，在通用能力上表现优秀，可以在端侧应用上发挥更大价值。

本次升级的360Zhinao3-7B模型，在模型参数量不变的情况下，仅增量训练了700B的高质量token（相比360Zhinao2-7B的10.1T token成本小得多），模型效果取得了显著提升。

360 方面表示，其在内部实践中的多个版本，增量训练了更多的token，但是模型效果大多增益不明显，效果不达预期。因此得到一条启示：训练数据的质量重要性，远大于训练数据的token量，不断提升训练数据的质量，是一条有前途的Scaling Law发展方向，而且模型的训练成本大幅降低，且也不会增加模型推理成本。

在数据筛选方面，项目团队加大了筛选力度，离线训练了多种数据筛选模型，对不同种类的数据进行分档打分，显著提升了数据质量。其次还进一步加大了数学、代码、指令这三种数据的占比，大幅降低网页和书籍的占比，从而进一步提升了模型的指令遵循和推理能力。

360Zhinao3-7B模型还增加了长文本预训练阶段，将最大窗口长度从4k提升至32k，ROPE的base从1w改为100w。在长文本预训练阶段，团队增加了超长文本和长代码的比例，进一步优化了模型的长文本处理能力。

基础模型效果

在模型效果方面，360方面使用开源工具opencompass对模型进行了多维度评估。结果显示，模型的benchmark平均分在10B尺寸附近的模型中，具备竞争力。

Instruct模型效果

在IFEval、MT-bench、CF-Bench三个流行的评测上对360Zhinao3-7B-Instruct模型进行了评测比较，MT-bench 和CFBench，IFEval 均在同级别开源模型中表现抢眼，具备较强竞争力。

长思维链模型效果

从以下结果可以看出，在math和science数据上，360zhinao3-7B-O1.5 模型与从0训练的7B推理模型具备一定竞争力，但可以看到目前较火的推理模型在通用多轮对话，角色扮演及复杂指令遵循上效果较差，而360zhinao3-7B-O1.5 综合效果更佳，不止是数学和科学的单点模型，可以在端侧应用上发挥更大价值。

360 开源升级自研 7B 参数模型 360Zhinao3-7B

相關推薦

AI 专区上新啦！豆包、通义、360 AI、天工 AI、澜舟智库等入驻麒麟软件商店

360 智脑大模型面向公众开放：千亿参数规模，十大核心能力

360 智脑推出 Light-IF 系列模型

周鸿祎宣布360安全大模型免费

360 浏览器全面升级为 AI 浏览器

DALL·E 3 绘图来啦，开源 AI 聊天、绘图软件 AIdea 现已支持 DALL·E 3

周鸿祎：大模型降低攻击门槛，人人皆可“注入攻击”

RePlugin v3.0.0 发布，奇虎 360 开源的插件化方案

11Labs 发布对话式 AI 2.0，集成话轮转换和知识库，多语言多角色多模态

360 旗下纳米 AI 发布“MCP 万能工具箱”

阿里通义实验室发布 OmniAudio，可从 360° 视频生成空间音频

著名开源贡献者贺师俊在 GitHub 公开与 360 的劳动争议诉讼

周鸿祎：“360 无法卸载”是彻底的谣言

美团投资大模型公司智谱 AI，占股超 10%