AI 推理大模型或在一年内减缓增长


AI 研究机构 Epoch AI 发布《推理模型能扩展多远(How far can reasoning models scale?)》报告,其中对推理模型的现状和未来作出了分析总结。

Epoch AI 通过各家开源的技术报告,来分析了目前推理模型的训练成本,同时也进一步总结,目前前沿的推理模型其推理训练规模仍未见顶,还能持续扩展(scalable),并且推理模型还有潜力在短期内快速实现能力拓展。

Epoch AI 的分析表明,人工智能行业可能无法在更长的时间内从推理人工智能模型中获得巨大的性能提升。根据该报告的研究结果,推理模型的进展最快可能在一年内放缓。

近几个月来,OpenAI 的 o3 等推理模型在人工智能基准测试中取得了大幅提升,尤其是在衡量数学和编程技能的基准测试中。这些模型可以对问题进行更多计算,从而提高性能,但缺点是它们完成任务的时间比传统模型更长。

Epoch AI 提到,如果推理阶段的算力需求见顶,那么其带来的增长率将收敛,大概是每年增长 4 倍,不会像 o1 到 o3 那样拥有「跳跃式增长」——几个月增长 10 倍的态势。

基于上述情况,Epoch AI 表示,如果推理模型的训练阶段只比前沿推理模型低几个(比如说不到三个)数量级,这种增长率可能在一年内减缓。


相關推薦

2025-04-09

。 今年的报告新增了对 AI 硬件发展状况的深入分析、对推理成本的新估算,以及对 AI 出版和专利申请趋势的分析。他们还引入了有关企业采用负责任的 AI 实践的最新数据,并扩大了对 AI 在科学和医学中日益重要作用的报道。

2023-10-14

将使用生成式人工智能 (GenAI) 应用程序编程接口 (API) 或模型,和/或在生产环境中部署支持 GenAI 的应用程序。而在 2023 年,这一比例还不到 5%;这意味着在短短三年内,采用或创建生成式 AI 模型的企业数量将增长 16 倍。 Gartner

2024-04-18

内容、性能和应用等方面整体效果提升了30%。其中,多轮推理、安全问题等领域提升超40%。另外,据了解,中国电信将于年内开源千亿级参数大模型。 根据介绍,TeleChat-12B将7B版本1.5T训练数据提升至3T,优化数据清洗、标注策

2024-07-18

与更常见的基于 Transformer 的模型不同,基于 Mamba 的模型推理时间更快,上下文时间更长。 包括 AI21 在内的其他公司和开发者已经发布了基于 Mamba 的新人工智能模型。 现在,Mistral 的 Codestral Mamba 7B 采用了这种新架构,

2025-05-10

上限。 根据海报内容,该项目研究方向涵盖多模态大模型与应用、机器学习、搜索推荐广告、空间与具身智能、高性能与云计算、大数据、AI Infra、安全等方向。 京东希望招聘的人才在权威期刊或顶级会议发表过高质量、有

2024-08-17

性能最强的开源模型Qwen2-72B,该模型提升了代码、数学、推理、指令遵循、多语言理解等能力。Qwen2-72B发布后即登顶HuggingFace 的Open LLM Leaderboard开源模型榜单。中文大模型测评基准SuperCLUE在2024上半年报告中指出,Qwen2-72B成为排名

2025-04-11

英伟达开源了 NVIDIA Llama Nemotron 中最大尺寸的推理模型 Llama-3.1-Nemotron-Ultra-253B-v1,可用于聊天机器人开发、AI Agent 工作流、检索增强生成(RAG)和代码生成等场景。 根据英伟达开放模型许可证及 Llama 3.1 社区许可协议,

2025-03-25

nference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源模型 - ht

2025-03-27

动互联网行业。 随着AI大模型的不断升级,深度思考和推理能力显著提升,AIGC已成为全网增速最快赛道,DeepSeek APP上线次月活跃用户规模突破1.8亿,豆包APP破亿,腾讯元宝、纳米AI搜索在DeepSeek大模型加持下,跻身TOP5。 Que

2023-10-28

报告称,在国内AGI与AIGC领域,其“天工”大模型在逻辑推理、文本理解、多模态能力等多个方面均取得了显著突破。基于大模型核心能力的提升,“天工”APP进行了全面迭代升级,整合了AI搜索、AI阅读、AI创作等核心功能,覆

2023-03-21

排名前五。 目前,腾讯已发布了 3 款自研芯片,面向AI推理、视频处理和高性能网络三大场景;腾讯自主研发的移动机器人 Max 和 Ollie 发布新版本,并首次融合了智能体、深度学习、Sim2Real和触觉传感器等技术。 35% 的需求一天

2025-05-16

频生成占有率。 Poe 还在报告中提到,发送给 Poe 内的推理模型的消息文本份额,从约 2% 增加至约 10%,其中 DeepSeek「病毒式」传播期间达到了峰值。 另外,Poe 订阅者对 Gemini 2.5 Pro 的使用正在迅速增长,该模型在发布仅约 6

2025-04-30

B 为 Mixture-of-Experts(MoE)模型,覆盖从轻量部署到高性能推理的多元应用需求,助力开发者轻松拥抱新一代大模型能力。 在线体验:https://ai.gitee.com/serverless-api?model=Qwen3-30B-A3B 全面升级的 Qwen3 模型性能表现 1. 基准测试结果

2025-03-27

全新的视觉模型Qwen2.5-VL,再到本月初发布并开源了全新推理模型QwQ-32B,在开源当日就登顶全球主流AI开源社区Hugging Face的趋势榜。 DeepSeek(深度求索)达成过“开源周”,其在2月末连续五天发布五个代码库,并于近日继续开源上