OpenAI 宣布将开源推理模型


今日凌晨,OpenAI CEO Sam Altman 正式宣布,将在未来几个月内推出一款具备推理能力的强大开放权重语言模型,并期待与开发者共同探索如何最大化其潜力。

据 Altman 透露,这是自 GPT-2 以来 OpenAI 首次计划发布开放权重语言模型。他坦言,虽然这一想法已酝酿许久,但此前其他优先事项占据了主导地位。如今,发布这款模型的时机变得尤为重要。

作为参考,开放权重(open weight)是指将 AI 模型(尤其是神经网络)的训练参数(即权重)公开,供公众使用、检查或进一步开发。用户可以在这些权重的基础上进行修改,并将修改后的权重重新分发。虽开放权重不能完全等同于开源,但它是开源理念在 AI 领域的一种延伸和部分实现,包括此前宣称开源的 DeepSeek V3/R1 同样只开放了权重。

在正式发布前,OpenAI 将依据其「准备框架」对模型进行评估,确保其安全性与可靠性。考虑到模型发布后可能被修改,团队还将开展额外测试与优化工作。为进一步完善开发流程,OpenAI 计划举办一系列开发者活动,以收集反馈并展示早期原型:首场活动将于数周后在旧金山启动,随后在欧洲和亚太地区陆续展开。

Sam Altman 刚刚还发文表示:

我们不会做任何愚蠢的事情,比如说我们的平台月活用户超 7 亿后,就不能使用我们的开源模型。我们希望每个人都使用它。

此外,当地时间 3 月 31 日,OpenAI 宣布完成了一轮规模巨大的私募融资,融资金额高达 400 亿美元(约合 2902 亿人民币),公司估值在融资完成后达到 3,000 亿美元。这被认为是有史以来规模最大的私募融资轮之一。

据 OpenAI 官方信息显示,此次融资由软银集团领投。此外,微软、Coatue、Altimeter 和 Thrive 等公司也参与了本轮投资。而据 CNBC 援引知情人士消息称,本次融资中有 180 亿美元将用于 OpenAI 的 Stargate 项目基础设施建设。

附上报名链接 https://openai.com/open-model-feedback


相關推薦

2025-04-04

Windows 10、Windows 11 新版 Copilot 应用已摘掉 Beta 标签,开始面向所有用户推送。 今年 3 月初,微软确认正在开发原生 Copilot 应用程序。与之前的版本不同,这个新版本完全采用原生架构,通过 XAML 框架调用系统 API 处理 AI 请求,

2025-03-21

并声称其 AI 推理模型在科学理解和数理逻辑方面超越了 OpenAI 的 GPT 模型、谷歌 DeepMind 的 Gemini 和 DeepSeek 等全球竞争对手。 共包括三个不同的尺寸:具有 320 亿个参数的 Exaone Deep 32B、具有 78 亿个参数的 Exaone Deep 7.8B 和具有 24

2024-07-16

据路透社 7 月 12 日报道,OpenAI 正在开发一项代号为「草莓」(Strawberry)的 AI 模型技术。 内部文件显示,这一项目旨在提升 AI 的高级推理能力,使其不仅能够生成查询答案,还能自主规划并开展复杂研究。 据知情人士透露

2023-01-19

微软方面宣布了 Azure OpenAI 服务的全面上市,这是微软对人工智能民主化的持续承诺以及与 OpenAI 持续合作的一部分。微软在 2021 年 11 月推出了 Azure OpenAI 服务,允许通过 REST API 访问 OpenAI 的强大语言模型;但彼时该服务只对

2023-10-26

智能生成内容,但不包括总结书籍等用途的应用。微软、OpenAI等投入1000万美元用于增强生成式AI产品的安全微软、OpenAI等公司合资1000万美元,任命Chris Meserole为“前沿模型论坛”的执行董事,旨在提高生成式AI产品的安全,并建

2024-07-18

API 上免费使用,可处理多达 256000 个词元的输入,是 OpenAI 的 GPT-4o 的两倍。 在基准测试中,Mistral 显示 Codestral Mamba 在 HumanEval 测试中的表现优于竞争对手开源模型 CodeLlama 7B、CodeGemma-1.17B 和 DeepSeek。 开发人员可以从 GitHub

2023-03-16

OpenAI 刚刚宣布正式推出 GPT-4。GPT-4 是 Generative Pre-trained Transformer 4 的缩写,即生成型预训练变换模型 4。 公告写道,GPT-4 是一个多模态大型语言模型(支持接受图像和文本输入,以文本形式输出),也是 OpenAI 努力扩展深度学

2023-06-10

用。聊天模型建立在完全开源的数据之上,不使用来自 OpenAI 等封闭模型的提炼数据 - 确保在开放或商业应用程序中的使用。 其中,Base 模型是基础大语言模型,在 RedPajama 数据集上进行了训练,采用和 Pythia 模型一样的架构。

2025-03-20

划在未来几个月内发布多个 Llama 模型,其中包括类似于 OpenAI 的 o3-mini 的 “推理” 模型,以及具备多模态能力的版本。扎克伯格还暗示可能会推出具有 “代理” 功能的模型,意味着某些模型可能具备自主操作的能力。 去年10

2024-10-04

接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。 * 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,

2024-11-01

OpenAI 公司正在与博通(Broadcom)及台积电(TSMC)合作,设计并制造首款用于支持其人工智能系统的自研芯片,OpenAI 希望借此减少对单一芯片供应商的依赖,分散其芯片供应,并满足 AI 模型对高计算需求的支持。 OpenAI 的原计

2024-08-15

接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。 * 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,

2024-09-25

接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。 * 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,

2024-06-26

8 个小时的工作时间。 JetBrains 表示,AI Assistant 将结合 OpenAI 的 GPT-4o 、Gemini 模型和 JetBrains 的几种专有模型的功能,自动为每项任务选择最合适的 LLM。“这确保你可以专注于编码的创造性方面,而 AI 则处理重复性工作。” Goo