OpenAI 新研发项目“草莓”曝光，用于提升大模型的推理能力

2024-07-16 發表於开源资讯

据路透社 7 月 12 日报道，OpenAI 正在开发一项代号为「草莓」（Strawberry）的 AI 模型技术。

内部文件显示，这一项目旨在提升 AI 的高级推理能力，使其不仅能够生成查询答案，还能自主规划并开展复杂研究。

据知情人士透露，OpenAI 希望通过 Strawberry 项目显著提高其 AI 模型的推理能力，克服当前 AI 在常识性问题上的不足。

Strawberry 的前身是去年首度披露的突破性项目 Q*。今年早些时候，OpenAI 小范围展示了用 Q* 解决当前模型难以应对的科学和数学难题。Strawberry 的关键在于「后训练」，这是在现有模型「预训练」过程之后附加的步骤，可以进一步优化 AI 模型的性能。这类似于斯坦福大学 2022 年发布的「自学推理」（Self-Taught Reasoner, STaR），都是通过训练数据的迭代来提升水平。

OpenAI 还计划让 Strawberry 有能力执行「长线任务」（long-horizon tasks, LHT），即需要提前计划并在较长时间内执行一系列操作的复杂任务。

内部文件提到，OpenAI 正在创建和评估所谓的「深度研究」数据集，并希望其 AI 模型能够在计算机助理（computer-using agent, CUA）的帮助下自主浏览互联网进行研究，并且完成软件和机器学习工程师的工作。

OpenAI 新研发项目“草莓”曝光，用于提升大模型的推理能力

相關推薦

ElevenLabs 新 TTS 模型支持音频标签丨日报

AI视野：百度开放文心4.0开发权限申请；腾讯混元大模型开放文生图功能；谷歌AI应用禁止生成受限内容；Midjourney新网站上线测试版

🚀 Xinference v1.6.1 新增 Deepseek-R1 模型，语言能力升级！

深度解读飞桨框架3.0，“大模型训推一体”等五大新特性，引领深度学习框架代际变革

科大讯飞推出升级版星火 X1 深度推理大模型

腾讯重构混元大模型研发体系，加大 AI 投入

“JIANG”大模型发布，参数1400亿，聚焦金融和商业垂直领域

3 月全球人工智能领域新看点

李开复 AI 创业公司发布下首个智能体（AI Agent）产品

小米开源首个推理大模型“Xiaomi MiMo”——为“Reasoning”而生

讯飞星火 X1 全新升级，基于全国产算力训练的深度推理大模型

聚焦人工智能技术，AICON 2022 全议程曝光

OpenAI 正在打造“最强”开源模型，计划今年初夏发布

OpenAI 即将发布 GPT-5，但性能或许没那么震撼