OpenAI 新研发项目“草莓”曝光,用于提升大模型的推理能力


据路透社 7 月 12 日报道,OpenAI 正在开发一项代号为「草莓」(Strawberry)的 AI 模型技术。

内部文件显示,这一项目旨在提升 AI 的高级推理能力,使其不仅能够生成查询答案,还能自主规划并开展复杂研究。

据知情人士透露,OpenAI 希望通过 Strawberry 项目显著提高其 AI 模型的推理能力,克服当前 AI 在常识性问题上的不足。

Strawberry 的前身是去年首度披露的突破性项目 Q*。今年早些时候,OpenAI 小范围展示了用 Q* 解决当前模型难以应对的科学和数学难题。Strawberry 的关键在于「后训练」,这是在现有模型「预训练」过程之后附加的步骤,可以进一步优化 AI 模型的性能。这类似于斯坦福大学 2022 年发布的「自学推理」(Self-Taught Reasoner, STaR),都是通过训练数据的迭代来提升水平。

OpenAI 还计划让 Strawberry 有能力执行「长线任务」(long-horizon tasks, LHT),即需要提前计划并在较长时间内执行一系列操作的复杂任务。

内部文件提到,OpenAI 正在创建和评估所谓的「深度研究」数据集,并希望其 AI 模型能够在计算机助理(computer-using agent, CUA)的帮助下自主浏览互联网进行研究,并且完成软件和机器学习工程师的工作。


相關推薦

2023-10-26

智能生成内容,但不包括总结书籍等用途的应用。微软、OpenAI等投入1000万美元用于增强生成式AI产品的安全微软、OpenAI等公司合资1000万美元,任命Chris Meserole为“前沿模型论坛”的执行董事,旨在提高生成式AI产品的安全,并建

2024-08-02

传播网络则交由框架自动完成。 飞桨作为中国首个自主研发、功能丰富、开源开放的深度学习平台,从默认使用静态图的1.0版本,到默认采用动态图并可实现动静统一与训推一体的2.0版本发布,飞桨框架已经可以完美融合动态

2023-07-25

的大语言模型——“JIANG”大语言模型,以及基于该模型研发的一系列产品,包括KDF智讯、KDF绝未、KDF中书等。 知未智能成立于2019年,是一家先进的人工智能和自然语言处理技术公司,致力于在商业信息和金融分析领域为用

2023-08-01

型迭代速度,显著提升了模型效果和安全性。同时,百度研发团队创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,进一步提升模型效果及场景适配能力。 在

2023-06-08

自然语言推荐代码、自动查找代码错误,全面提升开发者研发效率。未来,开发者可以通过插件等形式,在主流开发软件中使用“Comate”代码助手。 ▲ Comate 多行代码推荐 百度智能云方面表示,辅助代码撰写是第一阶段的主

2024-10-04

接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。 * 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,

2022-09-22

随着人工智能(Artificial Intelligence,简称 AI )技术快速发展、数据和算力资源日益丰富,真实的应用场景不断涌现,全球 AI 产业保持高速发展态势。9 月 26日,由 LF AI & DATA 基金会主办 AICON 2022 将于在杭州举行。大会

2024-08-16

等国内外主流GPU芯片;大模型层开放接口,支持接入所有OpenAI接口格式的大模型,用户可根据自身需求,自行适配专属模型。 发布会现场,Intel开源技术高级研发经理田俊带来了Intel在deepin上的平台支持及AI PC最新进展。deepin的I

2024-08-24

由llama.cpp与OpenVINO推理。 自定义语言模型集成 UOS AI遵循OpenAI的模型通信协议,实现了自定义语言模型的添加功能,支持与各种在线大型语言模型的接口兼容,确保了系统的可扩展性和灵活性。 RAG技术应用 通过采用Retrieval-Augm

2024-10-24

接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。 * 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,

2024-07-18

API 上免费使用,可处理多达 256000 个词元的输入,是 OpenAI 的 GPT-4o 的两倍。 在基准测试中,Mistral 显示 Codestral Mamba 在 HumanEval 测试中的表现优于竞争对手开源模型 CodeLlama 7B、CodeGemma-1.17B 和 DeepSeek。 开发人员可以从 GitHub

2024-09-30

Kimi、DeepSeek等),以及国外公共大模型(包括OpenAl、Azure OpenAI、Gemini等); ■ 灵活编排:内置强大的工作流引擎和函数库,支持编排AI工作流,有效满足复杂业务场景下的应用需求; ■ 无缝嵌入:支持零编码快速嵌入至第三

2023-07-08

安表示。如今,盘古大模型已在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值。 在政务领域,华为云携手深圳市福田区政务服务数据管理局,上线了基于盘古政务大模型的福田政务智慧助手小福,能够

2024-08-15

接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。 * 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,