OpenAI 新研发项目“草莓”曝光,用于提升大模型的推理能力


据路透社 7 月 12 日报道,OpenAI 正在开发一项代号为「草莓」(Strawberry)的 AI 模型技术。

内部文件显示,这一项目旨在提升 AI 的高级推理能力,使其不仅能够生成查询答案,还能自主规划并开展复杂研究。

据知情人士透露,OpenAI 希望通过 Strawberry 项目显著提高其 AI 模型的推理能力,克服当前 AI 在常识性问题上的不足。

Strawberry 的前身是去年首度披露的突破性项目 Q*。今年早些时候,OpenAI 小范围展示了用 Q* 解决当前模型难以应对的科学和数学难题。Strawberry 的关键在于「后训练」,这是在现有模型「预训练」过程之后附加的步骤,可以进一步优化 AI 模型的性能。这类似于斯坦福大学 2022 年发布的「自学推理」(Self-Taught Reasoner, STaR),都是通过训练数据的迭代来提升水平。

OpenAI 还计划让 Strawberry 有能力执行「长线任务」(long-horizon tasks, LHT),即需要提前计划并在较长时间内执行一系列操作的复杂任务。

内部文件提到,OpenAI 正在创建和评估所谓的「深度研究」数据集,并希望其 AI 模型能够在计算机助理(computer-using agent, CUA)的帮助下自主浏览互联网进行研究,并且完成软件和机器学习工程师的工作。


相關推薦

2023-10-26

智能生成内容,但不包括总结书籍等用途的应用。微软、OpenAI等投入1000万美元用于增强生成式AI产品的安全微软、OpenAI等公司合资1000万美元,任命Chris Meserole为“前沿模型论坛”的执行董事,旨在提高生成式AI产品的安全,并建

2024-08-02

传播网络则交由框架自动完成。 飞桨作为中国首个自主研发、功能丰富、开源开放的深度学习平台,从默认使用静态图的1.0版本,到默认采用动态图并可实现动静统一与训推一体的2.0版本发布,飞桨框架已经可以完美融合动态

2025-04-08

有双子座系列此前各模型所具有的全部功能。 同一天,OpenAI也正式推出了基于GPT-4o模型的原生图像生成功能,能够直接从文本提示生成图像,同时支持多轮迭代优化图像时保持角色形象一致。 作为AI领域的新兴竞争者,DeepSeek3

2023-07-25

的大语言模型——“JIANG”大语言模型,以及基于该模型研发的一系列产品,包括KDF智讯、KDF绝未、KDF中书等。 知未智能成立于2019年,是一家先进的人工智能和自然语言处理技术公司,致力于在商业信息和金融分析领域为用

2025-04-22

数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。 ✨融入了更多场景复杂类型数据,模型的泛化

2023-08-01

型迭代速度,显著提升了模型效果和安全性。同时,百度研发团队创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,进一步提升模型效果及场景适配能力。 在

2025-04-09

接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,让

2025-04-16

有消息称,OpenAI在刚刚发布的GPT-4.1系列模型中评测其函数调用能力时采用了ComplexFuncBench,这是由智谱团队提出的专用于评估大模型复杂函数调用能力的测试基准。 ComplexFuncBench主要评测大模型在128K的长上下文下进行多步带约

2022-09-22

随着人工智能(Artificial Intelligence,简称 AI )技术快速发展、数据和算力资源日益丰富,真实的应用场景不断涌现,全球 AI 产业保持高速发展态势。9 月 26日,由 LF AI & DATA 基金会主办 AICON 2022 将于在杭州举行。大会

2023-06-08

自然语言推荐代码、自动查找代码错误,全面提升开发者研发效率。未来,开发者可以通过插件等形式,在主流开发软件中使用“Comate”代码助手。 ▲ Comate 多行代码推荐 百度智能云方面表示,辅助代码撰写是第一阶段的主

2025-04-01

成复杂任务。 「AutoGLM沉思」融合了以上三大能力。与OpenAI 的 Deep Research不同,它不仅能深入研究,还能真正执行任务,推动AI Agent从单纯的思考者,进化为能交付结果的智能执行者。 「AutoGLM沉思」模型的背后,是智谱自主

2024-08-16

等国内外主流GPU芯片;大模型层开放接口,支持接入所有OpenAI接口格式的大模型,用户可根据自身需求,自行适配专属模型。 发布会现场,Intel开源技术高级研发经理田俊带来了Intel在deepin上的平台支持及AI PC最新进展。deepin的I

2025-04-16

OpenAI 今日正式推出了备受期待的GPT-4.1系列,完整阵容包括旗舰版GPT-4.1、高性价比的GPT-4.1 mini和超轻量的GPT-4.1 nano。 OpenAI 发布 GPT-4.1 系列模型 这次更新的焦点并非面向大众用户,仅通过API接口提供服务,OpenAI官方文档直

2024-10-04

接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。 * 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,