OpenAI 研究员姚顺雨:AI 将由解决问题转为定义问题


上半场是预训练,是用算法、架构解决问题;

下半场,是 RL 终于起作用了,要做的是定义问题和评估。

日前,毕业于清华大学姚班,现任 OpenAI 研究院的姚顺雨发布博文,探讨了其对 AI 未来的发展预测。

姚顺雨回顾了 AI 的发展历史。其表示,几十年来 AI 主要致力于开发新的训练方法和模型,取得了显著成就,而这些成就都源于基础性创新,例如搜索、深度强化学习(Deep RL)和推理能力。而如今,深度强化学习终于开始泛化,AI 为人类赋能的局面也得到了变化。

姚顺雨认为,随着强化学习的突破,AI 开始解决多样化的任务,如软件工程、创意写作和 IMO 级别的数学问题。通过语言和推理的引入,AI 能够跨领域泛化任务,解决复杂问题。姚顺雨还提到,AI 的下半场将由解决问题转向定义问题,评估方法的创新将成为关键。

此外,姚顺雨还表示,传统的评估方法已难以应对复杂的现实需求,AI 需要具备长时记忆和适应能力。他强调,新的评估方式应着眼于实际应用,推动 AI 产品的效用和商业价值,为行业带来更大的创新和影响。


相關推薦

2023-07-07

时还希望了解和控制他们的模型是如何将监督推广到人类研究员无法监督的任务上。 为了验证系统的一致性,研究人员自动搜索了有问题的行为,以及存在问题的内部结构。 最后计划可以通过故意训练未对准的模型来测试整

2023-04-24

Google 计划加强与 DeepMind 的合作,结束内斗,共同应对 OpenAI 对他们造成的冲击。 今天 Google 发布公告,正式宣告 DeepMind 将被合并进 Google,成为 Google DeepMind。 在 2014 年,Google 以 4 亿英镑的价格收购了 DeepMind。这使得 DeepMind

2023-01-18

微软早已开始布局 Windows & AI ,比如早在 2019 年就向 OpenAI 投资了 10 亿美元,本月初还将 ChatGPT 技术整合到其 Bing 搜索引擎中,以挑战谷歌搜索引擎。

2024-09-30

eg Brockman 开始休假,直至年底。联合创始人兼备受尊敬的研究员 John Schulman 离职。 2024年9月25日 OpenAI 首席技术官 Mira Murati 辞职,她在 2023 年 Altman 被解职期间曾短暂担任临时 CEO。 “我们深切致力于我们的使命,并为我们发布

2024-07-16

据路透社 7 月 12 日报道,OpenAI 正在开发一项代号为「草莓」(Strawberry)的 AI 模型技术。 内部文件显示,这一项目旨在提升 AI 的高级推理能力,使其不仅能够生成查询答案,还能自主规划并开展复杂研究。 据知情人士透露

2023-03-31

者之间的长期竞争,联合起来对付共同的 “敌人” —— OpenAI。 Google 与 DeepMind 的这项合作在內部被成为 Gemini(双子座),由 Google Brain 的负责人 Jeff Dean 主管技术,力图开发出能够比肩 GPT-4 的模型。 自 ChatGPT 推出之后,AI 领

2025-03-25

技术未来的成本会持续下降。尽管目前的推理模型(例如OpenAI 的 o1 模型)需要大量算力和能源消耗,但克里希纳认为,新兴的技术(例如中国初创公司 DeepSeek 展示的方案)能够极大降低AI能耗,使之降到当前能耗的1%以下:

2023-10-26

智能生成内容,但不包括总结书籍等用途的应用。微软、OpenAI等投入1000万美元用于增强生成式AI产品的安全微软、OpenAI等公司合资1000万美元,任命Chris Meserole为“前沿模型论坛”的执行董事,旨在提高生成式AI产品的安全,并建

2025-04-04

本也远低于典型的人类承包商或员工的收费。但正如 AI 研究员 Toby Ord 指出的那样,这些模型可能效率不高。例如,o3 high 需要在 ARC-AGI 中的每个任务上尝试 1024 次才能获得最佳成绩。

2025-04-02

上述 AGI 实验室推出的首款公开产品,该项目由前 OpenAI 研究员 David Luan 和 Pieter Abbeel 共同领导。两人之前都创立过自己的初创公司——Luan 创办了Adept,而 Abbeel 共同创办了Covariant——去年亚马逊聘请他们来领导其 AI 代理工作。

2023-10-27

谷歌、微软、OpenAI 和 Anthropic 发布联合声明,任命美国智库学会高管 Chris Meserole 为前沿模型论坛 (Frontier Model Forum) 首任执行董事。并宣布设立 1000 万美元的 AI 安全基金,“以推动正在进行的工具开发研究,帮助社会能够有效地

2025-04-17

绝对优势的市场地位,流量商业化成为字节面临的 Top 级问题,AI Lab 在字节内部重要性下降。2020年,AI Lab 定位从集团级前瞻性项目转为技术中台,为字节商业化团队业务提供支持,马维英的汇报对象也从张一鸣变为抖音负责人

2024-08-07

OpenAI 联合创始人之一 John Schulman 已离开该公司,跳槽到由前 OpenAI 研究人员成立的的竞争对手公司 Anthropic。 今年 5 月份,OpenAI 原安全主管、超级对齐(Superalignment)团队负责人 Jan Leike 宣布从 OpenAI 离职,并公开发文抨击了该

2023-04-02

透社、纽约时报等外媒报道,意大利隐私监管机构已对 OpenAI 的 ChatGPT 发布临时禁令,称该聊天机器人以不当方式收集和存储信息。目前OpenAI 已在意大利区域禁用 ChatGPT,停止处理属于意大利用户的数据。 意大利数据保护机构