《2025 年人工智能指数报告》发布


李飞飞联合斯坦福大学人工智能研究所(Stanford HAI)发布了《2025人工智能指数报告》(Artificial Intelligence Index Report 2025)

报告于2025年4月7日发布,由来自学术界和产业界的跨学科专家组成的AI指数指导委员会主导编制。

该报告持续追踪人工智能领域多项关键进展,主要包括:年度重大技术突破、基准测试新纪录、生成式AI投资动向、教育领域应用趋势、技术监管立法进程等核心维度

今年的报告新增了对 AI 硬件发展状况的深入分析、对推理成本的新估算,以及对 AI 出版和专利申请趋势的分析。他们还引入了有关企业采用负责任的 AI 实践的最新数据,并扩大了对 AI 在科学和医学中日益重要作用的报道。

下面看看这份报告揭示的 2024 年 AI 行业 12 大趋势:

1.AI 在苛刻基准上的表现持续提升

2023 年,研究人员引入了新的基准——MMMU、GPQA 和 SWE-bench,以测试高级 AI 系统的极限。仅仅一年后,性能大幅提升:在 MMMU、GPQA 和 SWE-bench 上的得分分别提高了 18.8、48.9 和 67.3 个百分点。在基准测试之外,AI 系统在生成高质量视频方面也取得了重大进展,在某些场景下,语言模型智能体(language model agents)甚至在有限时间预算的编程任务中超越了人类。

图|选择的 Al 指数技术性能基准 vs. 人类表现

2.AI 正越来越多地融入到日常生活中

从医疗保健到交通运输,AI 正迅速从实验室走向日常生活。2023 年,FDA 批准了 223 种 AI 医疗设备,而 2015 年仅为 6 种。在道路上,自动驾驶汽车不再是实验性的:美国最大的运营商之一 Waymo 每周提供超过 15 万次自动驾驶出行,而百度的经济型“萝卜快跑” (Apollo Go)自动驾驶出租车车队现在已在中国多个城市提供服务。

图|FDA 批准的 AI 医疗设备数量(1955-2023)

3.企业全力投入 AI,推动投资和使用创历史新高

2024 年,美国私营部门对 AI 的投资增长到 1091 亿美元——几乎是中国(93 亿美元)的 12 倍,是英国(45 亿美元)24 倍。生成式 AI 尤其强劲,全球吸引私营投资 339 亿美元——比 2023 年增长 18.7%。AI 的商业应用也在加速:2024 年,78% 的组织报告称在使用 AI,比前一年增长 55%。同时,越来越多的研究证实,AI 提高了生产力,在大多数情况下,有助于缩小劳动力中的技能差距。

图|2017-2024 年,表示其所在组织至少在一项职能中使用 AI 的受访者比例

4.在创造顶级 AI 模型方面,中国正在缩小与美国的差距

2024 年,美国机构推出了 40 个引人注目的 AI 模型,显著超过中国的 15 个和欧洲的 3 个。虽然美国在数量上保持领先,但中国模型在质量上迅速缩小了差距:在 MMLU 和 HumanEval 等主要基准上的性能差异从 2023 年的两位数缩小到 2024 年的接近相等。同时,中国在 AI 出版物和专利方面继续领先。与此同时,模型开发越来越全球化,中东、拉丁美洲和东南亚等地区也推出了引人注目的新模型。

图|美国顶尖模型与中国顶尖模型在 LMSYS 聊天机器人竞技场中的表现

5.负责任的 AI 生态系统不断发展,但不均衡

人工智能相关事件急剧上升,但在主要工业模型开发者中,标准化的 RAI 评估仍然很少。然而,新的基准如 HELM Safety、AIR-Bench 和 FACTS 为评估事实性和安全性提供了有希望的工具。在公司中,识别 RAI 风险和采取有意义的行动之间存在差距。相比之下,政府表现出更大的紧迫性:2024 年,全球在人工智能治理方面的合作加强,包括经合组织、欧盟、联合国和非盟在内的组织发布了关注透明度、可信度和其他核心负责任人工智能原则的框架。

图|已公布的针对热门基础模型的安全性和负责任 AI 基准

6. 全球 AI 乐观情绪上升,但地区间深层次分歧依然存在

在中国(83%)、印度尼西亚(80%)和泰国(77%)等国家的大多数人认为,人工智能产品和服务是利大于弊的。相比之下,加拿大(40%)、美国(39%)和荷兰(36%)等地的乐观情绪仍然远低于其他国家。然而,情绪正在转变:自 2022 年以来,包括德国(+10%)、法国(+10%)、加拿大(+8%)、英国(+8%)和美国(+4%)在内的几个先前持怀疑态度的国家,乐观情绪显著增长。

图 | 2022-2024 年,按国家划分认为“使用 AI 的产品和服务利大于弊”的比例

7.AI 变得更加高效、经济实惠和易于获取

由越来越强大的小型模型驱动,在达到 GPT-3.5 水平上的系统推理成本在 2022 年 11 月到 2024 年 10 月间下降了 280 倍。在硬件层面,成本每年下降 30%,而能效每年提高 40%。开放权重模型也在缩小与封闭模型的差距,在某些基准测试中,一年内性能差异从 8%减少到仅 1.7%。这些趋势共同迅速降低了高级人工智能的门槛。

图 | 2022-2024 年,在 MMLU 中得分超过 60% 的最小规模 AI 模型

8.各国政府正在加强对 AI 的监管和投资

2024 年,美国联邦机构出台了 59 项与 AI 相关的法规,是 2023 年的两倍多,发布法规的机构数量也是 2023 年的两倍。在全球范围内,自 2023 年以来,75 个国家的 AI 立法提及率上升了 21.3%,自 2016 年以来增长了 9 倍。在日益受到关注的同时,各国政府也在进行大规模投资:加拿大承诺投资 24 亿美元,中国启动了 475 亿美元的半导体基金,法国承诺投资 1090 亿欧元,印度承诺投资 12.5 亿美元,沙特阿拉伯则发起了一项 1000 亿美元的倡议。

9.AI 和计算机科学教育正在扩大,但普及程度仍不够

如今,已有 2/3 的国家提供或计划提供 K-12 计算机科学教育,是 2019 年的两倍,其中非洲和拉丁美洲取得的进展最大。在美国,拥有计算机学士学位的毕业生人数在过去 10 年中增加了 22%。然而,在许多非洲国家,由于电力等基础设施的不足,获得计算机学位的机会仍然有限。在美国,81% 的 K-12 计算机科学教师表示,AI 应该成为计算机科学基础教育的一部分,但只有不到一半的教师认为自己有能力教授 AI。

10.工业界依然一路领先

2024 年,近 90% 的著名人工智能模型来自工业界,高于 2023 年的 60%,而学术界仍然是高引用率研究的首要来源。模型规模持续快速增长——训练计算每 5 个月翻一番,数据集每 8 个月翻一番,耗电量每年翻一番。然而,性能差距正在缩小:排名第一和第十的模型之间的得分差距在一年内从 11.9% 降至 5.4%,排名前两位的差距现在仅为 0.7%。前沿领域的竞争越来越激烈。

图 | 部分 LLM 供应商的顶尖模型在 LSYS 聊天机器人竞技场中的表现

11.AI 因其对科学的影响而斩获最高荣誉

AI 的重要性与日俱增,这一点从重大科学奖项中就可见一斑:两项诺贝尔奖表彰了 AI 在深度学习(物理学)和蛋白质折叠(化学)中的应用,而图灵奖则表彰了 AI 在强化学习方面的开创性贡献。

图|AlphaFold 3 与用于蛋白质 - 配体对接的基线方法的性能对比

12.复杂推理仍是一项挑战

人工智能模型在国际数学奥林匹克竞赛问题等任务中表现出色,但在 PlanBench 等复杂推理基准测试中仍然面临挑战。即使存在可证明正确的解决方案,它们也常常无法可靠地解决逻辑任务,这限制了它们在精度至关重要的高风险环境中的有效性。

图|PlanBench 基准下正确的实例数量


附:来自 AI Index 联合主任 Yolanda Gil 和 Raymond Perrault 的一封信

随着人工智能不断重塑我们的生活、企业界和公共讨论,AI Index 将继续跟踪其进展--提供一个独立的、数据驱动的视角,跨越时间和地域,观察人工智能的发展、应用和影响。

对于人工智能来说,2024 年是多么美好的一年。诺贝尔物理学奖和化学奖,以及因强化学习方面的奠基性工作而获得的图灵奖,都体现了对人工智能在推动人类知识进步方面作用的认可。曾经困难重重的图灵测试已不再被视为一个难以挑战的目标,今天的尖端系统已经超越了它。与此同时,人工智能的应用正以前所未有的速度加速发展,数以百万计的人们正经常在专业工作和休闲活动中使用人工智能。随着高性能、低成本和开放模型的普及,人工智能的可及性和影响力必将进一步扩大。

在经历了短暂的放缓之后,企业对人工智能的投资出现反弹。新近获得融资的生成式人工智能初创企业数量增加了近两倍,在经过多年的低迷之后,企业采用人工智能的速度在 2024 年显著加快。人工智能已从边缘领域成为商业价值的核心驱动力。

政府也在加大参与力度。政策制定者们不再只是在讨论人工智能,而是在投资人工智能。一些国家启动了价值十亿美元的国家人工智能基础设施计划,包括扩大能源能力以支持人工智能发展的重大努力。全球协调不断加强,地方倡议也初具规模。

然而,信任仍是一大挑战。越来越少的人相信人工智能公司会保护他们的数据,对公平性和偏见的担忧依然存在。错误信息继续构成风险,尤其是在选举和深度伪造泛滥的情况下。对此,各国政府正在推进新的监管框架,旨在促进透明度、问责制和公平性。公众的态度也在转变。虽然怀疑的态度依然存在,但 2024 年的一项全球调查显示,人们对人工智能带来广泛社会效益的潜力的乐观态度明显上升。

人工智能不再只是一个关于可能性的故事,而是一个关于现在正在发生的事情,以及我们如何共同塑造人类未来的故事。

Yolanda Gil、Raymond Perrault

AI Index 联合主任

原文:https://hai.stanford.edu/ai-index/2025-ai-index-report


相關推薦

2025-03-26

,呈现出开放、开源、全球化三大趋势。专家认为,面对人工智能在各行各业加快应用带来的海量算力需求,我国计算产业亟须抓住机遇,构建算力新体系,打造世界级新产品。 数字基础设施量质齐升 工业和信息化部3月17日

2025-04-04

全的公司 Sonatype 公布了 2025 年第一季度的开源恶意软件指数报告指出,1 月 1 日至 3 月 31 日共发现了 17,954 个开源恶意软件;其中包括几个被劫持的 npm 加密包、一个伪装成 Truffle for VS Code 扩展的恶意 npm 包,以及假冒的 Solana 包

2023-09-19

23年)》显示,算力多元化发展持续推进。以AIGC为代表的人工智能应用、大模型训练等新应用、新需求快速崛起都对算力提出更高要求。预计到2025年全球算力规模超过3ZFlops(ZFlops:每秒十万亿亿次浮点数运算),至2030年超过20Z

2025-04-12

技术。” TIOBE 4 月 TOP 20 编程语言 TOP 10 编程语言 TIOBE 指数走势(2002-2024) 第 21-50 名编程语言排行 第 51-100 名如下,由于它们之间的数值差异较小,仅以文本形式列出(按字母排序): ActionScript, Algol, Alice, Apex, APL, Ap

2025-04-03

2025 年 Dapr 状态报告现已发布,提供了有关项目加速采用、开发者生产力影响和在 AI 驱动应用中扩展角色的新见解。 报告指出,接近一半的受访者表示正在生产环境中运行 Dapr 应用,这一比例较往年显著增加。随着组织寻求可

2025-04-02

工信部电子知识产权中心发布了《2024生成式人工智能全栈技术专利分析报告》,阐析了生成式人工智能全栈技术创新的新发展新突破,并围绕模型能力的最新拓展,由算力芯片和软件框架构成的基础层、大模型打造的模型层协

2025-04-04

根据Similarweb投资者情报报告(截至2025年3月28日)的全面数据,以下是当前生成式AI市场在各个领域的详细分析。 整体AI市场趋势 AI工具市场经历了显著增长,在截至2025年3月28日的12周期间内同比增长了45%。这比2025年3月中旬记

2025-04-10

更新 满足安全性和合规性要求 维护停产 (EOL) 版本 报告作者写道:“这三者当然紧密相连——及时更新和修补程序,并维护已停产的版本,是满足安全性和合规性要求的关键。每年对这个问题的回答都提醒我们,对于组织

2024-02-23

是前瞻性、颠覆性重大创新,例如未来信息产业中的通用人工智能和量子信息、未来健康产业中的基因工程、未来材料产业中的超导材料等技术创新;未来产业生产要素配置不是传统要素线性叠加,而是现代要素相互融合和配置

2024-06-28

速许多其他技术的发展。 TuringBots 图灵机器人是由人工智能驱动的软件机器人,可帮助开发人员构建应用程序。随着语言 genAI 技术的进步,这些由人工智能驱动的软件机器人可以帮助开发人员构建不仅仅提供代码生成的应

2023-06-07

2023 年 6 月的编程语言排行榜。 受益于数据科学和人工智能领域的推动,Python 编程语言的受欢迎程度实现了疯狂增长;在过去 5 年中曾成功斩获 3 次 TIOBE 年度编程语言。TIOBE CEO Paul Jansen 指出,Python 的这一增长历程始

2025-03-28

2025年春招中,人工智能领域招聘需求大幅增长,算法、机器学习等方面的人才成为企业高薪争抢的“香饽饽”,人工智能讲师岗位招聘量也在激增。 随着AI技术加快应用,未来还会缺哪些方面的人才?如何捕捉到其中的就业新

2025-04-11

目的是减少 Flutter 小部件代码中不必要的冗余。 工具和人工智能 我们将继续与人工智能解决方案集成,为核心编程任务提供人工智能协助。 我们将继续投资于我们的工具套件,其中包括 Flutter DevTools、VS Code、Android Studio/Intell

2023-10-18

办公室,我们一起聊 AI!>>> stateof.ai 发布了 2023 年度人工智能现状报告 (State of AI Report 2023)。 这份报告由英国知名风投公司 Air Street Capital 的合伙人 Nathan Benaich 等作者联合撰写,报告从研究进展 (Research)、行业局势 (Industry