OpenAI 发布重磅更新:增加函数调用能力、支持处理更长上下文、降低价格


OpenAI 昨晚宣布为其生成式 AI 模型 GPT-3.5 Turbo 和 GPT-4 发布重磅更新。

值得关注的亮点:

  • Chat Completions API 中新的函数调用功能
  • 更新并增加可控制性gpt-4gpt-3.5-turbo版本
  • gpt-3.5-turbo的新 16k 上下文版本(与标准 4k 版本对比)
  • 最先进的嵌入模型的价格降低了 75%
  • gpt-3.5-turbo输入 token 的价格降低了 25%
  • 公布gpt-3.5-turbo-0301gpt-4-0314模型的弃用时间线

1. 函数调用

在Chat Completions API中添加了新的函数调用能力,能让模型在需要的时候调用函数并生成对应的JSON对象作为输出。这让开发人员能更准确地从模型获取结构化数据,实现从自然语言到API调用或数据库查询的转换,也可以用于从文本中提取结构化数据。

这意味着经过OpenAI的微调后,你跟它说人话,它就能识别后给你转换成函数,进一步不需要编程也能实现编程的能力了,并且还能更方便从混乱结构里获取结构化数据。

举个例子:当向 ChatGPT 提问「波士顿的天气怎么样?」时,该问题会被模型解读为调用第三方天气 API,这时候它就会去检索相关的数据,输出准确的回答。OpenAI 相当于提供了一个规范的接口调用方式,这将会给基于 GPT 开发应用的开发者们更高的灵活性。

2. 模型更新

大语言模型 (LLM) 的“上下文窗口(context window)”相当于一个短期记忆,可以存储输入的内容或者聊天机器人的对话内容。

在语言模型中,增加上下文窗口大小已经成为一种技术竞赛,Anthropic 公司最近宣布其 Claude 语言模型可以提供 75000 个 token 上下文窗口选项。此外,OpenAI 也开发了一个 32000 个 token 的 GPT-4 版本,但尚未公开推出。

OpenAI 刚刚发布的gpt-3.5-turbo-16k模型支持 16000 tokens 的上下文长度,这意味着可以一次处理大约 20 页的文本,这对于需要模型处理和生成较大文本块的开发者来说是一个很大的提升。

另外,OpenAI 此次一同发布的gpt-4-0613gpt-3.5-turbo-0613改进模型,均支持函数调用功能,并且提升了可控制性(more steerable)。所谓可控制性是“通过系统消息更可靠地控制”的功能。系统消息是 API 中一种特殊的指令输入,可以告诉模型如何行事,例如“你是格林姆斯,你只谈论奶昔”。

3. 模型弃用

公布了gpt-3.5-turbo-0301和gpt-4-0314模型的弃用时间线。这些模型的用户可以在特定时间之前选择升级到新的模型,过了这个时间后,旧模型将不再可用。

4. 价格下降

除了功能上的改进之外,OpenAI 还大幅降低了价格。

  • 嵌入模型: text-embedding-ada-002模型的成本降低了 75%,每 1000 个标记价格为$0.0001
  • gpt-3.5-turbogpt-3.5-turbo的输入标记价格降低了 25%。现在,开发者只需支付$0.0015每 1000 个输入标记和$0.002每 1000 个输出标记的价格,相当于每美元可支持大约 700 页文本
  • gpt-3.5-turbo-16k的价格为每 1000 个输入标记$0.003,每 1000 个输出标记$0.004

OpenAI 还强调称,所有的这些模型都继续保持在3月1日推出的数据隐私和安全保证 —— 客户拥有他们请求生成的所有输出,他们的 API 数据不会被用于训练。通过这些更新,他们将邀请更多的等待名单上的人尝试 GPT-4,期待看到更多用户使用 GPT-4 构建的项目!


相關推薦

2024-08-01

x,一个以检索增强生成 (RAG) 为重点的评估框架,对来自 OpenAI、Anthropic、Google 和 Meta 等品牌的 22 个(12 个开源 LLM 和 10 个专有 LLM)领先的生成式 AI 大语言模型性能进行了比较排名。 Hallucination Index 使用 Galileo 专有的评估指标

2023-04-04

天机器人系统,从而实现了前所未有的智能水平,譬如 OpenAI 的 ChatGPT。但 ChatGPT 的训练和架构细节仍不清楚,阻碍了该领域的研究和开源创新。受 Meta LLaMA 和 Stanford Alpaca 项目的启发,来自加州大学伯克利分校、CMU、斯坦福大学

2023-10-31

10月30日,百川智能发布Baichuan2-192K大模型,其上下文窗口长度高达192K,是目前全球最长的上下文窗口。 上下文窗口长度是大模型的核心技术之一,通过更大的上下文窗口,模型能够结合更多上下文内容获得更丰富的语义信息

2024-07-05

StarRocks 3.3 的发布标志着 Lakehouse 架构在数据分析领域迈向了一个新的高度。作为下一代 Lakehouse 架构的代表,StarRocks 3.3 在稳定性、计算性能、缓存设计、物化视图、存储优化和 Lakehouse 生态系统等方面进行了全方位的优化和创

2024-09-26

余个业务,用以提升效率和优化产品体验。 此次活动还发布了视频生成模型、音乐模型、同声传译模型。在谭待的展示下,视频生成模型生成的多主体多动作交互镜头,人物表情流露真实,动作流畅自然。对于同一个场景,模

2024-06-26

8 个小时的工作时间。 JetBrains 表示,AI Assistant 将结合 OpenAI 的 GPT-4o 、Gemini 模型和 JetBrains 的几种专有模型的功能,自动为每项任务选择最合适的 LLM。“这确保你可以专注于编码的创造性方面,而 AI 则处理重复性工作。” Goo

2024-07-26

在 Meta 推出开源 Llama 3.1 模型之后不久,OpenAI 宣布对其 GPT-4o Mini 模型提供免费微调,允许用户免费使用额外数据训练模型,以便在特定用例中获得更高的性能。 GPT-4o mini 微调适用于 OpenAI 的 Tier 4 和 5 使用层级的开发人员,这

2023-08-11

​StarRocks 自 4 月底发布 3.0 版本,拥抱云原生,开启极速统一的湖仓新范式;8月7日,StarRocks 正式发布全新 3.1 版本,全面提升云原生存算分离构架、极速数据湖分析、物化视图等重量级特性,让用户更简单的实现极速统一的湖

2024-06-22

地表达各种业务逻辑。仓颉是一门多范式编程语言,支持函数式、命令式和面向对象等多种范式,包括值类型、类和接口、泛型、代数数据类型、模式匹配、以及高阶函数等特性。此外,仓颉还支持类型推断,能够降低开发者类

2023-05-16

排 Prompt:通过界面化编写 prompt 并调试,只需几分钟即可发布一个 AI 应用。 接入长上下文(数据集):全自动完成文本预处理,使用你的数据作为上下文,无需理解晦涩的概念和技术处理。 基于 API 开发后端即服务。你可以

2024-10-01

使用重排模型进行多路召回,支持自定义全局变量,支持OpenAI Compatible API调用格式,支持支持ECharts图表和HTML页面的渲染;知识库方面,支持上传Excel和CSV表格文档,支持对多个文档进行批量重新向量化操作,支持问题批量关联

2024-08-08

OpenAI 在其 API 中引入了结构化输出功能,这意味着模型的输出可以可靠地遵循开发人员提供的 JSON 模式。 对复杂 JSON 模式进行评估时,具有结构化输出的新模型 gpt-4o-2024-08-06 得分为 100%。相比之下,gpt-4-0613 得分不到 40%。 这

2023-06-07

p;ChatGPT 本地终端来使用,只要在 .env 文件中配置 OpenAI API Key 即可。 参考应用: 应用 介绍 仓库地址 Neo 给 AI 助手 添加自定义指令的应用示例 https://github.com/YaoApp/yao-examples/tree/main/neo Knowledge AI

2024-08-14

量数据库真正走进大众视野却是近年来,这主要得益于 OpenAI 的兴起和商业数据库巨头们的加入。   2022 年,向量数据库领域融资热潮涌现,多家专有向量数据库厂商获得了巨额投资。然而,技术潮流瞬息万变。今年 6 月