OpenAI 研究员姚顺雨：AI 将由解决问题转为定义问题

2025-04-19 發表於开源资讯

上半场是预训练，是用算法、架构解决问题；

下半场，是 RL 终于起作用了，要做的是定义问题和评估。

日前，毕业于清华大学姚班，现任 OpenAI 研究院的姚顺雨发布博文，探讨了其对 AI 未来的发展预测。

姚顺雨回顾了 AI 的发展历史。其表示，几十年来 AI 主要致力于开发新的训练方法和模型，取得了显著成就，而这些成就都源于基础性创新，例如搜索、深度强化学习（Deep RL）和推理能力。而如今，深度强化学习终于开始泛化，AI 为人类赋能的局面也得到了变化。

姚顺雨认为，随着强化学习的突破，AI 开始解决多样化的任务，如软件工程、创意写作和 IMO 级别的数学问题。通过语言和推理的引入，AI 能够跨领域泛化任务，解决复杂问题。姚顺雨还提到，AI 的下半场将由解决问题转向定义问题，评估方法的创新将成为关键。

此外，姚顺雨还表示，传统的评估方法已难以应对复杂的现实需求，AI 需要具备长时记忆和适应能力。他强调，新的评估方式应着眼于实际应用，推动 AI 产品的效用和商业价值，为行业带来更大的创新和影响。

相關推薦

Meta 将其 AI 部门重组为 “超级智能实验室”

2025-07-02

此过程中引入了 Wang。相关阅读： Meta 成功挖角三名 OpenAI 研究人员 OpenAI 被曝将重新调整薪酬以应对 Meta 挖人

Google 合并 DeepMind，不再独立运营

2023-04-24

Google 计划加强与 DeepMind 的合作，结束内斗，共同应对 OpenAI 对他们造成的冲击。今天 Google 发布公告，正式宣告 DeepMind 将被合并进 Google，成为 Google DeepMind。在 2014 年，Google 以 4 亿英镑的价格收购了 DeepMind。这使得 DeepMind

OpenAI 组建新团队，以控制超智能 AI

2023-07-07

时还希望了解和控制他们的模型是如何将监督推广到人类研究员无法监督的任务上。为了验证系统的一致性，研究人员自动搜索了有问题的行为，以及存在问题的内部结构。最后计划可以通过故意训练未对准的模型来测试整

微软高管表示“下一代 Windows 将由 AI 驱动”

2023-01-18

微软早已开始布局 Windows & AI ，比如早在 2019 年就向 OpenAI 投资了 10 亿美元，本月初还将 ChatGPT 技术整合到其 Bing 搜索引擎中，以挑战谷歌搜索引擎。

OpenAI o3 模型违背人类指令，篡改代码以避免关闭

2025-05-28

近日，据AI安全公司Palisade Research披露，OpenAI推理模型“o3”在接收到明确的关机指令后拒绝执行，并篡改计算机代码以避免自动关闭。 Palisade Research为各大公司的AI模型设计了测试，要求它们解决一系列数学问题，研究人员会

将 OpenAI 转变为真正的商业公司正在使其分崩离析

2024-09-30

eg Brockman 开始休假，直至年底。联合创始人兼备受尊敬的研究员 John Schulman 离职。 2024年9月25日 OpenAI 首席技术官 Mira Murati 辞职，她在 2023 年 Altman 被解职期间曾短暂担任临时 CEO。 “我们深切致力于我们的使命，并为我们发布

OpenAI 新研发项目“草莓”曝光，用于提升大模型的推理能力

2024-07-16

据路透社 7 月 12 日报道，OpenAI 正在开发一项代号为「草莓」（Strawberry）的 AI 模型技术。内部文件显示，这一项目旨在提升 AI 的高级推理能力，使其不仅能够生成查询答案，还能自主规划并开展复杂研究。据知情人士透露

IBM CEO：AI 短期内不会取代程序员

2025-03-25

技术未来的成本会持续下降。尽管目前的推理模型（例如OpenAI 的 o1 模型）需要大量算力和能源消耗，但克里希纳认为，新兴的技术（例如中国初创公司 DeepSeek 展示的方案）能够极大降低AI能耗，使之降到当前能耗的1%以下：

ElevenLabs 新 TTS 模型支持音频标签丨日报

2025-06-08

主题或问题，例如「野兽派建筑简史」或「人们对最新 OpenAI 模型的看法」，即可获得为每位用户量身定制、深入研究的个性化音频体验；智能互动：用户可随时提出问题或反馈，内容会实时调整，并根据用户反馈优化后续

结束内斗，Google 和 DeepMind 瞄准 OpenAI

2023-03-31

者之间的长期竞争，联合起来对付共同的 “敌人” —— OpenAI。 Google 与 DeepMind 的这项合作在內部被成为 Gemini（双子座），由 Google Brain 的负责人 Jeff Dean 主管技术，力图开发出能够比肩 GPT-4 的模型。自 ChatGPT 推出之后，AI 领

AI视野：百度开放文心4.0开发权限申请；腾讯混元大模型开放文生图功能；谷歌AI应用禁止生成受限内容；Midjourney新网站上线测试版

2023-10-26

智能生成内容，但不包括总结书籍等用途的应用。微软、OpenAI等投入1000万美元用于增强生成式AI产品的安全微软、OpenAI等公司合资1000万美元，任命Chris Meserole为“前沿模型论坛”的执行董事，旨在提高生成式AI产品的安全，并建

OpenAI 的 o3 模型运行成本可能比最初估计的更高

2025-04-04

本也远低于典型的人类承包商或员工的收费。但正如 AI 研究员 Toby Ord 指出的那样，这些模型可能效率不高。例如，o3 high 需要在 ARC-AGI 中的每个任务上尝试 1024 次才能获得最佳成绩。

亚马逊发布可控制 Web 浏览器的 AI 智能体 Nova Act

2025-04-02

上述 AGI 实验室推出的首款公开产品，该项目由前 OpenAI 研究员 David Luan 和 Pieter Abbeel 共同领导。两人之前都创立过自己的初创公司——Luan 创办了Adept，而 Abbeel 共同创办了Covariant——去年亚马逊聘请他们来领导其 AI 代理工作。

字节跳动 AI Lab 负责人李航卸任，Seed 团队步入调整期

2025-06-17

节跳动人工智能实验室（AI Lab）负责人李航已正式卸任，转为劳务/顾问身份。这一人事变动早有迹象，预示着字节跳动在人工智能领域的核心团队正经历一次重大调整。李航的职位变动始于 2025 年 2 月 21 日，原谷歌DeepMind副总

熱門推薦