中国移动“九天”3.0 发布，多项核心技术同步开源

2025-07-30 發表於开源资讯

中国移动发布了其自主研发的 “九天”基础大模型3.0。根据介绍，“九天众擎语言大模型”实现了架构上的突破性创新，采用可扩展至万亿级的 MoE 架构。通过15T token 的多阶段配比预训练数据与全流程治理体系，其推理能力得到显著强化。

该模型还创新构建了113域 ×53能力的二维分级后训练框架，结合动态强化学习策略，使复杂推理能力提升了 35%。测评结果显示，“九天”语言大模型：

在 GPQA-Diamond 评测中，以 77.67分斩获全球第二，超越 DeepSeekR1和 Qwen3。
在 ArenaHard V1.0 中，以 67.2分位居全球第一。
在 BFCL V3 评测中，达到 68分。

在性能大幅跃升的同时，模型进一步强化了可控生成能力，通过精确流程内置等技术细节，实现了专业场景下的零幻觉，破解了沉浸式角色演绎难题。

基于最新的语言大模型，中国移动还同步推出了多个专项模型:

九天代码大模型：采用两阶段持续训练技术，支持代码生成、注释生成、单元测试生成、代码智能问答等任务，覆盖 Python、Java、JS、TS、Go、C++ 等10余种主流编程语言。在 EvalPlus、MHPP、LivecodeBenchv6等多个代码生成榜单上表现领先。
九天数学大模型：在短思考、长思考模式下均达到业界 SOTA 水平，多项指标超越 Qwen2.5Math、Qwen3、DeepSeek Math、DeepSeek R1-Distill 等同参数量级模型。

“九天善智多模态大模型”引入复杂时空建模、流匹配图片视频渐进式联合训练、端到端局部可控注意力机制等创新技术。同时，通过融合多模态理解信息和联合图文交织数据训练，显著提升了模型对文本指令和输入条件图像视频的感知能力。这意味着模型不仅能生成高质量的图像视频，还能进行多轮对话式高可控精确编辑操作，大幅提升了视觉生成的灵活便利性。例如，在图片生成方面可支持多轮精准局部修改，如修改文字、修改背景、增加元素等。

模型的图理解和视频理解性能也得到了全面提升：

图理解方面：在 MMStar、HallusionBench 和 OCRBench 等图理解任务中，九天模型分别获得了 82.2、64.3和94.9的高分，处于业界领先水平。
视频理解方面：在 Videomme 和 MVbench 两个任务中均表现领先，超越 Qwen2-VL 和 InternVideo2。

目前，中国移动已将多项模型及核心技术进行开源：

开源九天数童结构化数据大模型：包括 JT-DA-8B 模型及后续演进版本，支持下载模型权重、微调代码、推理代码等。
开源九天数学大模型：包括 JT-Math-8B 系列模型，支持下载模型权重、推理代码、技术报告。
开源九天代码大模型：包括 JT-Coder-8B 系列模型，支持下载模型权重、推理代码、技术报告。
开源业界首创的结构化数据模型评测数据及 TReB 评测体系：涵盖6大任务、34个能力，包括高质量、全面的数据、推理模式及评价指标，支持下载评测数据集、测试代码。
开源 CCR-Bench 行业场景复杂指令遵循评测数据集：包含174条高质量、多样化、高难度复杂指令数据，高度模拟健康专家、智能客服、医疗助手等典型工业场景，支持下载数据集。

中国移动“九天”3.0 发布，多项核心技术同步开源

相關推薦

扒一扒极狐 GitLab 的底裤

FlagOpen 大模型技术开源体系，开启大模型时代“新 Linux”生态

OpenShot 3.0 发布，非线性视频编辑器

Automerge 3.0 发布，本地优先的开源数据同步引擎

Gitee 移动软件工厂：突破网络限制的开发新模式

面向中国企业级用户，PingCAP 发布平凯数据库

阿里云数据库专家于巍荣获 PostgreSQL 中国技术大会 “最具价值专家 MVP” 奖

源雀 SCRM 开源版更新：移动素材库+操作日志，高效协作更安全

开源 AI 客户端 Cherry Studio v1.3.3 正式发布

阿里巴巴 1688 发布“AI 版”App 与“88 查”

九章云极 DataCanvas 公司完成 D1 轮融资！

AI 重塑千行百业华为云发布盘古大模型 3.0 和昇腾 AI 云服务

WhaleStudio 2.6 正式发布，WhaleTunnel 同步性能与连接器数量再创新高！

中国电信星辰 AI 大模型开源