AI 推理大模型或在一年内减缓增长

2025-05-16 發表於开源资讯

AI 研究机构 Epoch AI 发布《推理模型能扩展多远（How far can reasoning models scale?）》报告，其中对推理模型的现状和未来作出了分析总结。

Epoch AI 通过各家开源的技术报告，来分析了目前推理模型的训练成本，同时也进一步总结，目前前沿的推理模型其推理训练规模仍未见顶，还能持续扩展（scalable），并且推理模型还有潜力在短期内快速实现能力拓展。

Epoch AI 的分析表明，人工智能行业可能无法在更长的时间内从推理人工智能模型中获得巨大的性能提升。根据该报告的研究结果，推理模型的进展最快可能在一年内放缓。

近几个月来，OpenAI 的 o3 等推理模型在人工智能基准测试中取得了大幅提升，尤其是在衡量数学和编程技能的基准测试中。这些模型可以对问题进行更多计算，从而提高性能，但缺点是它们完成任务的时间比传统模型更长。

Epoch AI 提到，如果推理阶段的算力需求见顶，那么其带来的增长率将收敛，大概是每年增长 4 倍，不会像 o1 到 o3 那样拥有「跳跃式增长」——几个月增长 10 倍的态势。

基于上述情况，Epoch AI 表示，如果推理模型的训练阶段只比前沿推理模型低几个（比如说不到三个）数量级，这种增长率可能在一年内减缓。

相關推薦

《2025 年人工智能指数报告》发布

2025-04-09

。今年的报告新增了对 AI 硬件发展状况的深入分析、对推理成本的新估算，以及对 AI 出版和专利申请趋势的分析。他们还引入了有关企业采用负责任的 AI 实践的最新数据，并扩大了对 AI 在科学和医学中日益重要作用的报道。

2026 年将有 80% 的企业将采用 GenAI，增长 16 倍

2023-10-14

将使用生成式人工智能 (GenAI) 应用程序编程接口 (API) 或模型，和/或在生产环境中部署支持 GenAI 的应用程序。而在 2023 年，这一比例还不到 5%；这意味着在短短三年内，采用或创建生成式 AI 模型的企业数量将增长 16 倍。 Gartner

中国电信将于年内开源千亿级参数大模型

2024-04-18

内容、性能和应用等方面整体效果提升了30%。其中，多轮推理、安全问题等领域提升超40%。另外，据了解，中国电信将于年内开源千亿级参数大模型。根据介绍，TeleChat-12B将7B版本1.5T训练数据提升至3T，优化数据清洗、标注策

“互联网女皇”发布 340 页 AI 趋势报告

2025-06-06

司实现高年经常性收入的速度是史无前例的； AI 模型的推理成本下降速度是史无前例的——虽然训练一个大模型的成本最高要 10 亿美元，但推理成本两年内下降了 99%； AI 公司以极低成本匹配竞争对手模型功能的速度也是史

阿里财报：AI 收入连续 8 季度三位数增长

2025-08-30

通义AI大模型表现抢眼，接连开源千问3非思考基础模型、推理模型和AI编程模型，分别夺得基础模型、编程模型、推理模型等主流领域全球开源冠军。同时开源的还包括视频生成模型Wan2.2、文生图模型Qwen-Image等多模态产品。据

黄仁勋演讲实录：夸赞“中国开源AI已成为世界进步催化剂”

2025-07-17

人类在真实世界并肩工作。下一波AI是理解物理世界、能推理并执行任务的机器人系统。十年内，工厂将由软件和AI指挥的机器人团队运营，与人类一起打造智能产品。AI将成为每个行业、每家公司、每项产品与服务的核心，为

互联网女皇” Mary Meeker 发布 340 页 AI 报告

2025-06-06

DeepSeek、阿里Qwen、百度文心一言等模型在代码生成与数学推理等核心任务中表现优异。斯坦福HAI发布的Chatbot Arena数据显示，截至2025年2月，中国顶尖模型评分已达1362分，仅次于美国模型的1385分，差距进一步缩小。与此同时，

京东推出“顶尖青年技术天才计划”争夺 AI 人才

2025-05-10

上限。根据海报内容，该项目研究方向涵盖多模态大模型与应用、机器学习、搜索推荐广告、空间与具身智能、高性能与云计算、大数据、AI Infra、安全等方向。京东希望招聘的人才在权威期刊或顶级会议发表过高质量、有

Mistral AI 发布开源代码大模型 Codestral Mamba、数学大模型 Mathstral

2024-07-18

与更常见的基于 Transformer 的模型不同，基于 Mamba 的模型推理时间更快，上下文时间更长。包括 AI21 在内的其他公司和开发者已经发布了基于 Mamba 的新人工智能模型。现在，Mistral 的 Codestral Mamba 7B 采用了这种新架构，

Xinference v1.7.0 重磅发布：Qwen3 全家桶 + 图生视频黑科技，7 大更新

2025-06-19

nference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型 - ht

阿里云最新财报：AI 收入实现三位数增长

2024-08-17

性能最强的开源模型Qwen2-72B，该模型提升了代码、数学、推理、指令遵循、多语言理解等能力。Qwen2-72B发布后即登顶HuggingFace 的Open LLM Leaderboard开源模型榜单。中文大模型测评基准SuperCLUE在2024上半年报告中指出，Qwen2-72B成为排名

英伟达开源 2530 亿参数推理大模型，效果直逼 DeepSeek-R1

2025-04-11

英伟达开源了 NVIDIA Llama Nemotron 中最大尺寸的推理模型 Llama-3.1-Nemotron-Ultra-253B-v1，可用于聊天机器人开发、AI Agent 工作流、检索增强生成（RAG）和代码生成等场景。根据英伟达开放模型许可证及 Llama 3.1 社区许可协议，

全新高效模型架构！RWKV-7s 闪耀 WAIC

2025-07-30

信 × RWKV 打造“轻量AI大脑” 凭借RWKV架构“资源占用和推理速度恒定”的特性，RWKV系列模型在端侧部署具有天然优势。现在，RWKV已与多家芯片厂商、具身智能厂商合作将RWKV模型部署在芯片及机器人上，如：高通、联发科、Inte

Meta 宣布全球首个 1GW+ 能耗超级计算机集群即将上线

2025-07-16

展 Meta 的 AI 基础设施，目标是支持更复杂的模型训练和推理任务。有分析指出，Hyperion 的能耗相当于 xAI 30 万张 GPU 集群的 20 倍。xAI 近期宣布其 Memphis 超级计算机集群（约30万块 GPU）功耗在200-300兆瓦，而微软与 OpenAI 合作

熱門推薦