OpenAI 正在打造“最强”开源模型,计划今年初夏发布


今年3月下旬,OpenAI宣布将在年内推出自GPT-2以来的首个"开源"语言模型。随着该公司与AI开发者社区的交流持续推进,关于这款模型的更多细节也逐步浮出水面。

据 TechCrunch 报道,知情人士透露,OpenAI研究副总裁艾丹·克拉克(Aidan Clark)正主导这项开发工作,目前仍处于初期阶段。

OpenAI计划在今年初夏发布该模型,目标是打造一个在开源推理模型中达到顶尖水平的产品。这款模型定位为推理能力模型,类似于OpenAI现有的o系列产品。

知情人士称,OpenAI正考虑为该模型采用一种高度宽松的开源许可协议,几乎不设使用或商业限制。这与Meta的Llama、谷歌的Gemma等开源模型形成对比,后者因使用条款过于繁琐而受到批评。OpenAI显然希望避免步其后尘。

目前,OpenAI面临来自包括中国AI实验室DeepSeek在内的开源策略竞争者的挑战。这些"开源"竞争者将模型提供给AI社区用于实验,在某些情况下还允许商业化使用,与OpenAI此前更为封闭的做法形成鲜明对照。

这种开放策略已被证明对部分企业极其成功。Meta在3月初宣布,Llama系列模型的累计下载量已突破10亿次。而DeepSeek也迅速积累了大量用户,并获得本土投资者的关注。

据悉,OpenAI此次推出的开源模型将支持纯文本输入输出,可在高端消费级硬件上运行。开发者还可能可以选择是否启用“推理模式”——推理功能虽能提升准确性,但会以增加延迟为代价,这与Anthropic等公司近期发布的推理模型相似。

如果此次发布反响积极,OpenAI还计划后续推出更多开源模型,可能包括更小规模的模型版本。

OpenAI首席执行官山姆·奥特曼(Sam Altman)此前曾公开表示,公司在技术开源方面“站在了历史的错误面”,并呼吁重新审视开源战略。

奥特曼在今年1月参加问答活动时指出:“我个人认为,我们需要制定一种新的开源策略。尽管并非所有OpenAI员工都认同这一观点,目前这也不是我们的首要任务,但今后我们会推出更好的模型,不过领先优势可能不像以往那样显著。”

他还表示,这款即将发布的模型将经历严格的“红队测试”和安全评估流程。知情人士透露,OpenAI将为该模型发布“模型卡片”(Model Card),即一份全面的技术文档,详尽展示模型在内部与外部基准测试、安全性评估等方面的结果。

奥特曼上月发文称:“我们会在发布前,依据‘模型准备度框架’对其进行全面评估,并在已知该模型发布后可能被修改的前提下,做更多的安全准备工作。”

尽管如此,OpenAI近年来也因对部分新模型仓促推进安全测试、未及时发布模型卡等问题,受到人工智能伦理学者的批评。奥特曼本人也曾在2023年11月被短暂罢免前,在模型安全审查方面误导高管。

阅读更多

OpenAI 宣布将开源推理模型

OpenAI CEO 奥特曼 :DeepSeek 教训了我们,GPT-5 将免费开放

OpenAI 即将开源新模型,CEO 发起投票公开征求意见


相關推薦

2024-09-30

今年以来,由于公司价值观的争议和领导层之间的斗争,OpenAI 的高管和研究人员纷纷离职。 不到两年的时间里,OpenAI 从一个鲜为人知的非营利实验室,迅速转型为一个举世闻名的企业,其首席执行官已成为人工智能革命的代

2024-11-01

OpenAI 公司正在与博通(Broadcom)及台积电(TSMC)合作,设计并制造首款用于支持其人工智能系统的自研芯片,OpenAI 希望借此减少对单一芯片供应商的依赖,分散其芯片供应,并满足 AI 模型对高计算需求的支持。 OpenAI 的原计

2024-07-16

据路透社 7 月 12 日报道,OpenAI 正在开发一项代号为「草莓」(Strawberry)的 AI 模型技术。 内部文件显示,这一项目旨在提升 AI 的高级推理能力,使其不仅能够生成查询答案,还能自主规划并开展复杂研究。 据知情人士透露

2023-01-19

微软方面宣布了 Azure OpenAI 服务的全面上市,这是微软对人工智能民主化的持续承诺以及与 OpenAI 持续合作的一部分。微软在 2021 年 11 月推出了 Azure OpenAI 服务,允许通过 REST API 访问 OpenAI 的强大语言模型;但彼时该服务只对

2023-03-28

限公司,出资5千万美元,估值2亿美元,称将打造中国的OpenAI。随后,王兴在朋友圈中表示:“……既然他决心拥抱这次大浪潮,那我必须支持。”据王慧文透露,公司75%的股份用于邀请顶级研发人员。 2月15日,光年之外迎来

2023-07-25

可能考虑将其用于客户支持。 上周,外媒报道称,随着OpenAI旗下AI聊天机器人ChatGPT和谷歌旗下AI聊天机器人Bard的兴起,苹果也在开发自己的聊天机器人,这款机器人在该公司内部称之为“Apple GPT”。 今日,一位长期关注苹果

2023-10-27

谷歌、微软、OpenAI 和 Anthropic 发布联合声明,任命美国智库学会高管 Chris Meserole 为前沿模型论坛 (Frontier Model Forum) 首任执行董事。并宣布设立 1000 万美元的 AI 安全基金,“以推动正在进行的工具开发研究,帮助社会能够有效地

2024-07-11

的综合测评结果。 从代表通用能力的一级总分来看,OpenAI的GPT-4o以81分高居榜首,Claude-3.5-Sonnet与通义千问开源模型Qwen2-72B-Instruct并列第二,得分均为77。 通义千问(Qwen2-72B)既是排名最高的中国大模型,也是全球最强的开源大

2023-09-12

p;Siliconangle 的报道,Meta 正在寻求在生成式 AI 领域与 OpenAI 展开竞争,将发布新的开源大模型,其性能或将与GPT-4 不相上下。 报道称,这款新模型比 Llama 2 强大数倍,将提供文本、图像生成以及分析等功能。目前该模型正

2023-11-10

爆料者 Tech_Reve 发表推文表示,苹果公司正在使用大语言模型 (LLM) 将 Siri 彻底改造成“终极虚拟助理”,并准备将其开发为“最强大的杀手级 AI 应用”。 目前苹果正在积极推进这项开发工作,首款产品预计将在 WWDC 2024 上亮相

2024-09-30

Kimi、DeepSeek等),以及国外公共大模型(包括OpenAl、Azure OpenAI、Gemini等); ■ 灵活编排:内置强大的工作流引擎和函数库,支持编排AI工作流,有效满足复杂业务场景下的应用需求; ■ 无缝嵌入:支持零编码快速嵌入至第三

2025-04-12

。谷歌最新的 Gemini 模型可以生成音频、图像和文本,而 OpenAI 的 ChatGPT 中的默认模型可以原生创建图像,包括吉卜力工作室风格的艺术作品。亚马逊也宣布计划在今年晚些时候推出“any-to-any”模型。 而这些全能模型需要大量

2023-12-07

马斯克于今年 7 月份宣布 xAI 公司正式成立,并将与 OpenAI 的 ChatGPT、谷歌的 Bard 或 Anthropic 的 Claude 展开竞争。Grok 是 xAI 团队发布其首个 AI 大模型产品,一款仿照《银河系漫游指南》设计的人工智能。 根据 xAI 的说法,Grok

2023-06-28

用 AlphaGo 技术来开发一个名为 Gemini 的人工智能系统,比 OpenAI ChatGPT 背后的系统更为强大。 Gemini 本质上与 GPT-4 类似,是一个可以处理文本的大语言模型;目前仍在开发当中,大概需要耗费几个月的时间,预计可能要花费数千