中国移动“九天”3.0 发布,多项核心技术同步开源


中国移动发布了其自主研发的 “九天”基础大模型3.0。根据介绍,“九天众擎语言大模型”实现了架构上的突破性创新,采用可扩展至万亿级的 MoE 架构。通过15T token 的多阶段配比预训练数据与全流程治理体系,其推理能力得到显著强化。

该模型还创新构建了113域 ×53能力的二维分级后训练框架,结合动态强化学习策略,使复杂推理能力提升了 35%。测评结果显示,“九天”语言大模型:

  • 在 GPQA-Diamond 评测中,以 77.67分斩获全球第二,超越 DeepSeekR1和 Qwen3。
  • 在 ArenaHard V1.0 中,以 67.2分位居全球第一。
  • 在 BFCL V3 评测中,达到 68分

在性能大幅跃升的同时,模型进一步强化了可控生成能力,通过精确流程内置等技术细节,实现了专业场景下的零幻觉,破解了沉浸式角色演绎难题。

基于最新的语言大模型,中国移动还同步推出了多个专项模型:

  • 九天代码大模型:采用两阶段持续训练技术,支持代码生成、注释生成、单元测试生成、代码智能问答等任务,覆盖 Python、Java、JS、TS、Go、C++ 等10余种主流编程语言。在 EvalPlus、MHPP、LivecodeBenchv6等多个代码生成榜单上表现领先。

  • 九天数学大模型:在短思考、长思考模式下均达到业界 SOTA 水平,多项指标超越 Qwen2.5Math、Qwen3、DeepSeek Math、DeepSeek R1-Distill 等同参数量级模型。

“九天善智多模态大模型”引入复杂时空建模、流匹配图片视频渐进式联合训练、端到端局部可控注意力机制等创新技术。同时,通过融合多模态理解信息和联合图文交织数据训练,显著提升了模型对文本指令和输入条件图像视频的感知能力。这意味着模型不仅能生成高质量的图像视频,还能进行多轮对话式高可控精确编辑操作,大幅提升了视觉生成的灵活便利性。例如,在图片生成方面可支持多轮精准局部修改,如修改文字、修改背景、增加元素等。

模型的图理解和视频理解性能也得到了全面提升:

  • 图理解方面:在 MMStar、HallusionBench 和 OCRBench 等图理解任务中,九天模型分别获得了 82.2、64.3和94.9的高分,处于业界领先水平。

  • 视频理解方面:在 Videomme 和 MVbench 两个任务中均表现领先,超越 Qwen2-VL 和 InternVideo2。

目前,中国移动已将多项模型及核心技术进行开源:

  1. 开源九天数童结构化数据大模型:包括 JT-DA-8B 模型及后续演进版本,支持下载模型权重、微调代码、推理代码等。

  2. 开源九天数学大模型:包括 JT-Math-8B 系列模型,支持下载模型权重、推理代码、技术报告。

  3. 开源九天代码大模型:包括 JT-Coder-8B 系列模型,支持下载模型权重、推理代码、技术报告。

  4. 开源业界首创的结构化数据模型评测数据及 TReB 评测体系:涵盖6大任务、34个能力,包括高质量、全面的数据、推理模式及评价指标,支持下载评测数据集、测试代码。

  5. 开源 CCR-Bench 行业场景复杂指令遵循评测数据集:包含174条高质量、多样化、高难度复杂指令数据,高度模拟健康专家、智能客服、医疗助手等典型工业场景,支持下载数据集。


相關推薦

2022-07-02

对于我们来说绝对不容遗忘! 2019年11月,GitLab在官网上发布一项声明称,他们决定为有权访问客户数据的团队成员启用 “工作家庭国家/地区封锁”令,且只针对中国和俄罗斯 。更新的招聘流程里明确规定:GitLab 不会给中国/

2023-03-02

目前该项目已和天数智芯、百度PaddlePaddle、昆仑芯科技、中国移动等深度合作,共同推进AI硬件评测建设。围绕FlagPerf,也将有更多厂商和团队加入共同贡献的大家庭。 项目地址:https://github.com/FlagOpen/FlagPerf 3. FlagEval:多领域

2022-12-12

OpenShot 3.0 现已发布,此版本包含了 12 个月以来的 1000 多项改进。OpenShot 是跨平台的开源视频剪辑软件,该项目在 2008 年 8 月由 Jonathan Thomas 发起,其目标是提供稳定、自由且易于使用的视频编辑器。OpenShot 的核心视频编辑功能

2023-07-15

宣布 TiDB Serverless 正式商用。会上,PingCAP 携手用户代表发布平凯数据库,以更加完善的国产化生态兼容和企业级服务支持能力降低中国企业升级数据基础设施的成本和复杂性。30 多位来自各行业、深耕数据库领域多年的意见领

2023-03-09

代码贡献超3000+行,主导MiniPolarDB架构设计开发等。参与多项社区组织的如《黑客松》、《开源认证》、《开源学堂》活动及规划,在阿里云等平台开办免费《PostgreSQL 数据库内核解读系列》课程十余讲、《数据库内核从入门到精

2025-07-02

​​与​​「操作日志」​​两大核心功能,并同步优化多项体验细节,助力企业实现标准化运营与精细化管控! 一、移动端素材中心:统一分发,高效触达客户 痛点解决:员工手动编辑素材易出错?资料版本混乱难管理?

2025-07-31

阿里巴巴旗下的B2B批发平台1688近日正式发布多项AI新品和升级举措,旨在通过人工智能技术全面赋能中小企业,提升采购效率。此次发布的核心亮点包括推出全新的“1688AI版”App、上线免费企业查询工具“88查”,并对现有“阿

2025-05-17

面客户端,兼容 Windows、Mac 和 Linux 系统。 该项目近日发布新版本 v1.3.0,包含了大量变更。 一、新增功能亮点 v1.3.0 在模型支持、核心体验及界面交互等方面均有显著增强: 模型与服务商拓展: 新增 Grok / X 

2023-10-11

国信通院的战略合作单位、标准核心参编单位,共同编订发布全球首个AI模型开发管理标准、全国首个商用人工智能开发平台等多项人工智能基础软件领域、大模型领域的标准。作为大模型生态共同体中的通用大模型代表企业,

2023-07-08

的大会主题演讲中,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0和昇腾AI云服务。其中,盘古大模型3.0围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提

2024-07-02

流一体数据集成工具,WhaleTunnel随着WhaleStudio 2.6版本正式发布,带来了多项功能增强和新特性,性能大幅提升,连接器和功能方面也有大量更新。 上周,关于数据调度平台WhaleScheduler的更新状况在 《WhaleStudio 2.6重磅发布!调

2024-01-13

多模态大模型完备的基础框架。其中语义大模型于11月份发布千亿参数版本,在大模型知名榜单CSL排名第五、GAOKAO排名第七、AGIEval排名第八。 视觉大模型赋能100+城市治理下游任务,算法日均调用量达3.3亿次;多模态大模型聚焦

2024-07-27

自百度、华为、世纪互联、复旦微电子、蓝芯算力、华大九天、开源PHP、LF AI & Data 基金会、PyTorch 基金会的高管将带来分享与洞见。 高峰论坛(上):开源生态与商业化 高峰论坛(下):AIGC 产业前沿 专题论坛:全球

2025-05-14

一体模式构建开放创新生态。此次合作中,双方完成混动核心部件交接并揭牌“协同创新中心”,未来将在电池、新材料、智能化等领域展开深度研发。 据介绍,双方将围绕新能源智能网联汽车关键技术研发如电动化、智能化