蚂蚁回应 AI 训练降本：基于不同芯片持续调优，将逐步开源

2025-03-25 發表於开源资讯

彭博社援引知情人士报道称，蚂蚁集团使用中国制造的半导体开发训练人工智能模型的技术，可将成本降低20%。对此，蚂蚁方面回应称：蚂蚁针对不同芯片持续调优，以降低AI应用成本，目前取得了一定的进展，也会逐步通过开源分享。

事件背景：

蚂蚁集团的 Ling 团队近日在预印版 Arxiv 平台上发布了题为《每一个 FLOP 都至关重要:无需高级 GPU 即可扩展3000亿参数混合专家 LING 大模型》的技术论文，介绍了他们研发的两款新型大语言模型:百灵轻量版（Ling-Lite）和百灵增强版(Ling-Plus)。这两款模型在设计上采用了多项创新，能够在低性能硬件上高效训练，显著降低了成本。

百灵轻量版的参数规模为168亿，其中激活参数为27.5亿。而增强版的基座模型则拥有高达2900亿的参数，激活参数为288亿。这两款模型的性能均达到行业领先水平，尤其是增强版，其3000亿参数的 MoE 模型在使用国产 GPU 的低性能设备上进行训练时，表现与高端英伟达芯片的模型相当。

通常，MoE 模型的训练需要依赖昂贵的高性能 GPU，如英伟达的 H100和 H800，这不仅成本高昂，还受到芯片短缺的限制，从而影响了其在资源有限环境中的应用。为此，蚂蚁集团 Ling 团队提出了一个全新的目标 ——“不使用高级 GPU” 扩展模型，突破了资源和预算的限制。他们的创新训练策略包括动态参数分配、混合精度调度、以及升级的训练异常处理机制，这些策略有效地缩短了中断响应时间，并且优化了模型评估流程，压缩了验证周期超过50%。

在实验中，Ling 团队对9万亿个 token 进行了 Ling-Plus 的预训练。结果显示，使用高性能硬件配置训练1万亿 token 的成本约为635万元人民币，而采用蚂蚁的优化方法后，低规格硬件训练成本降至508万元左右，节省了近20%。同时，性能与阿里通义 Qwen2.5-72B-Instruct 和 DeepSeek-V2.5-1210-Chat 相当。

蚂蚁回应 AI 训练降本：基于不同芯片持续调优，将逐步开源

相關推薦

谷歌 CEO 皮查伊回应“谷歌已死”论

蚂蚁集团副总裁、前基础大模型负责人徐鹏离职

马斯克回应 Dojo 团队解散：同时开发两种 AI 芯片无意义

字节跳动回应与博通合作开发 AI 芯片：消息不实

昆仑万维 Q3 报告：实现经营性现金流 7.6 亿

蚂蚁集团证实正研发语言和多模态大模型，命名“贞仪”

FlagOpen 大模型技术开源体系，开启大模型时代“新 Linux”生态

语雀网络故障持续大约 10 小时，现已恢复正常

源雀 SCRM 开源 V20250507 版，AI 企微客服｜RAG 知识中枢+自训练闭环

深度解读飞桨框架3.0，“大模型训推一体”等五大新特性，引领深度学习框架代际变革

英伟达或将推出针对中国区的最新改良版 AI 芯片

苹果设备端和服务器端基础语言模型的更新

国家发改委：AI 终端产业规模有望迎来“排浪式”增长

中国 AI 初创公司「硅基流动」获近亿元天使+轮融资