OpenAI 宣布将开源推理模型


今日凌晨,OpenAI CEO Sam Altman 正式宣布,将在未来几个月内推出一款具备推理能力的强大开放权重语言模型,并期待与开发者共同探索如何最大化其潜力。

据 Altman 透露,这是自 GPT-2 以来 OpenAI 首次计划发布开放权重语言模型。他坦言,虽然这一想法已酝酿许久,但此前其他优先事项占据了主导地位。如今,发布这款模型的时机变得尤为重要。

作为参考,开放权重(open weight)是指将 AI 模型(尤其是神经网络)的训练参数(即权重)公开,供公众使用、检查或进一步开发。用户可以在这些权重的基础上进行修改,并将修改后的权重重新分发。虽开放权重不能完全等同于开源,但它是开源理念在 AI 领域的一种延伸和部分实现,包括此前宣称开源的 DeepSeek V3/R1 同样只开放了权重。

在正式发布前,OpenAI 将依据其「准备框架」对模型进行评估,确保其安全性与可靠性。考虑到模型发布后可能被修改,团队还将开展额外测试与优化工作。为进一步完善开发流程,OpenAI 计划举办一系列开发者活动,以收集反馈并展示早期原型:首场活动将于数周后在旧金山启动,随后在欧洲和亚太地区陆续展开。

Sam Altman 刚刚还发文表示:

我们不会做任何愚蠢的事情,比如说我们的平台月活用户超 7 亿后,就不能使用我们的开源模型。我们希望每个人都使用它。

此外,当地时间 3 月 31 日,OpenAI 宣布完成了一轮规模巨大的私募融资,融资金额高达 400 亿美元(约合 2902 亿人民币),公司估值在融资完成后达到 3,000 亿美元。这被认为是有史以来规模最大的私募融资轮之一。

据 OpenAI 官方信息显示,此次融资由软银集团领投。此外,微软、Coatue、Altimeter 和 Thrive 等公司也参与了本轮投资。而据 CNBC 援引知情人士消息称,本次融资中有 180 亿美元将用于 OpenAI 的 Stargate 项目基础设施建设。

附上报名链接 https://openai.com/open-model-feedback


相關推薦

2025-04-25

今年3月下旬,OpenAI宣布将在年内推出自GPT-2以来的首个"开源"语言模型。随着该公司与AI开发者社区的交流持续推进,关于这款模型的更多细节也逐步浮出水面。 据 TechCrunch 报道,知情人士透露,OpenAI研究副总裁艾丹·克拉克(A

2025-04-08

OpenAI CEO Sam Altman 在 X 上宣布了新模型发布计划的调整: o3 和 o4-mini 将在几周内发布,在多个方面大幅改进了预览版本的 o3; GPT-5 将在几个月内发布。 而根据他此前说法,OpenAI 将直接发布内置了推理能力的 GPT-5,以后也

2025-04-04

Windows 10、Windows 11 新版 Copilot 应用已摘掉 Beta 标签,开始面向所有用户推送。 今年 3 月初,微软确认正在开发原生 Copilot 应用程序。与之前的版本不同,这个新版本完全采用原生架构,通过 XAML 框架调用系统 API 处理 AI 请求,

2025-04-19

为了更积极地与 Google 等竞争对手的人工智能公司竞争,OpenAI 推出了 Flex 处理 (Flex processing),这是一种 API 选项,它提供更低的人工智能模型使用价格,但响应时间较慢且“偶尔资源不可用”。 「Flex processing 」可以显

2025-03-21

并声称其 AI 推理模型在科学理解和数理逻辑方面超越了 OpenAI 的 GPT 模型、谷歌 DeepMind 的 Gemini 和 DeepSeek 等全球竞争对手。 共包括三个不同的尺寸:具有 320 亿个参数的 Exaone Deep 32B、具有 78 亿个参数的 Exaone Deep 7.8B 和具有 24

2025-04-10

OpenAI 宣布推出 Evals API。根据介绍,Evals API支持用户通过编程方式定义测试、自动化运行评估流程,并实现对提示(Prompt)的快速迭代优化。这一功能的发布,不仅将模型评估从手动操作推向了高度自动化的新阶段,也为开发者

2024-07-16

据路透社 7 月 12 日报道,OpenAI 正在开发一项代号为「草莓」(Strawberry)的 AI 模型技术。 内部文件显示,这一项目旨在提升 AI 的高级推理能力,使其不仅能够生成查询答案,还能自主规划并开展复杂研究。 据知情人士透露

2023-01-19

微软方面宣布了 Azure OpenAI 服务的全面上市,这是微软对人工智能民主化的持续承诺以及与 OpenAI 持续合作的一部分。微软在 2021 年 11 月推出了 Azure OpenAI 服务,允许通过 REST API 访问 OpenAI 的强大语言模型;但彼时该服务只对

2023-10-26

智能生成内容,但不包括总结书籍等用途的应用。微软、OpenAI等投入1000万美元用于增强生成式AI产品的安全微软、OpenAI等公司合资1000万美元,任命Chris Meserole为“前沿模型论坛”的执行董事,旨在提高生成式AI产品的安全,并建

2024-07-18

API 上免费使用,可处理多达 256000 个词元的输入,是 OpenAI 的 GPT-4o 的两倍。 在基准测试中,Mistral 显示 Codestral Mamba 在 HumanEval 测试中的表现优于竞争对手开源模型 CodeLlama 7B、CodeGemma-1.17B 和 DeepSeek。 开发人员可以从 GitHub

2025-04-09

接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,让

2025-04-16

OpenAI 今日正式推出了备受期待的GPT-4.1系列,完整阵容包括旗舰版GPT-4.1、高性价比的GPT-4.1 mini和超轻量的GPT-4.1 nano。 OpenAI 发布 GPT-4.1 系列模型 这次更新的焦点并非面向大众用户,仅通过API接口提供服务,OpenAI官方文档直

2023-03-16

OpenAI 刚刚宣布正式推出 GPT-4。GPT-4 是 Generative Pre-trained Transformer 4 的缩写,即生成型预训练变换模型 4。 公告写道,GPT-4 是一个多模态大型语言模型(支持接受图像和文本输入,以文本形式输出),也是 OpenAI 努力扩展深度学

2023-06-10

用。聊天模型建立在完全开源的数据之上,不使用来自 OpenAI 等封闭模型的提炼数据 - 确保在开放或商业应用程序中的使用。 其中,Base 模型是基础大语言模型,在 RedPajama 数据集上进行了训练,采用和 Pythia 模型一样的架构。