OpenAI 推出"Flex processing"API：用于更便宜、更慢的 AI 任务

2025-04-19 發表於开源资讯

为了更积极地与 Google 等竞争对手的人工智能公司竞争，OpenAI 推出了 Flex 处理 (Flex processing)，这是一种 API 选项，它提供更低的人工智能模型使用价格，但响应时间较慢且“偶尔资源不可用”。

「Flex processing 」可以显著降低 Chat Completions 或 Responses 请求的成本，但会以较慢的响应时间和偶尔的资源不可用为代价。它非常适合非生产或低优先级任务，如模型评估、数据丰富化或异步工作负载。

OpenAI 表示， Flex 处理是 OpenAI 最近发布的 o3 和 o4-mini 推理模型的测试版，旨在处理模型评估、数据丰富和异步工作负载等低优先级和 “非生产” 任务。

它将 API 成本降低了整整一半。对于 o3，Flex 处理价格为每百万输入词元（约 75 万字）5 美元，每百万输出词元 20 美元，而标准价格为每百万输入词元 10 美元，每百万输出词元 40 美元。

对于 o4-mini，Flex 将价格从每百万输入词元 1.10 美元和每百万输出词元 4.40 美元降至每百万输入词元 0.55 美元和每百万输出词元 2.20 美元。

Flex 处理的推出正值前沿人工智能价格持续攀升之际，而竞争对手也纷纷推出更便宜、更高效的预算导向型模型。周四，Google 推出了 Gemini 2.5 Flash ，这款推理模型的性能与 DeepSeek R1 相当，甚至更胜一筹，而且输入词元成本更低。

OpenAI 在致客户的一封宣布推出 Flex 定价的电子邮件中还指出，其使用等级体系中 1-3 级的开发者必须完成新引入的身份验证流程才能访问 o3。（等级由在 OpenAI 服务上花费的金额决定。）O3 的推理摘要和流式 API 支持也需要经过身份验证。

OpenAI 此前表示，身份验证旨在阻止不良行为者违反其使用政策。

了解更多：https://platform.openai.com/docs/guides/flex-processing

相關推薦