在最新一期的《Latent Space》访谈中,OpenAI 总裁 Greg Brockman 深入阐述了公司迈向 AGI 的整体路线图,核心可概括为“三个转向”:
- 技术转向:从“一次性预训练”到“强化学习推理”
- 资源转向:把“算力”视为唯一稀缺资源
- 落地转向:从“科研样品”到“可审计的生产 Agent”
Greg Brockman 透露,GPT-4 发布之后,团队内部复盘“它为何还不是 AGI”,结论是仅靠大规模预训练无法解决可靠性不足的问题,必须让模型在与真实世界的交互中“试错—反馈—再训练”。因此 GPT-5 首次引入强化学习驱动的“动态推理”范式:模型边使用边生成数据,再用这些数据进行再训练,逼近人类“边做边学”的循环。
他将这种“推理-重训”飞轮称为“超临界学习”(supercritical learning):当算力放大 10× 乃至 10 000× 时,模型不仅能掌握任务本身,还能推演出二阶、三阶后果,从而快速逼近 AGI。
Greg Brockman 还把“算力”视为唯一稀缺资源,他认为算法壁垒往往可通过堆算力解决;AGI 进度条几乎与可用计算量线性相关。OpenAI 已把“持续投入大规模计算”写入长期资源策略,并认为未来 AGI 的形态会是“一个模型管理器”——本地小模型按需调用云端大算力,实现自适应计算。
总的来说,OpenAI 的 AGI 路线图可概括为“用强化学习把模型放进真实世界,用算力把反馈循环推到极致,用安全可控的 Agent 形态把能力嵌入千行百业”。