为了更积极地与 Google 等竞争对手的人工智能公司竞争,OpenAI 推出了 Flex 处理 (Flex processing),这是一种 API 选项,它提供更低的人工智能模型使用价格,但响应时间较慢且“偶尔资源不可用”。
「Flex processing 」可以显著降低 Chat Completions 或 Responses 请求的成本,但会以较慢的响应时间和偶尔的资源不可用为代价。它非常适合非生产或低优先级任务,如模型评估、数据丰富化或异步工作负载。
OpenAI 表示, Flex 处理是 OpenAI 最近发布的 o3 和 o4-mini 推理模型的测试版,旨在处理模型评估、数据丰富和异步工作负载等低优先级和 “非生产” 任务。
它将 API 成本降低了整整一半。对于 o3,Flex 处理价格为每百万输入词元(约 75 万字)5 美元,每百万输出词元 20 美元,而标准价格为每百万输入词元 10 美元,每百万输出词元 40 美元。
对于 o4-mini,Flex 将价格从每百万输入词元 1.10 美元和每百万输出词元 4.40 美元降至每百万输入词元 0.55 美元和每百万输出词元 2.20 美元。
Flex 处理的推出正值前沿人工智能价格持续攀升之际,而竞争对手也纷纷推出更便宜、更高效的预算导向型模型。周四,Google 推出了 Gemini 2.5 Flash ,这款推理模型的性能与 DeepSeek R1 相当,甚至更胜一筹,而且输入词元成本更低。
OpenAI 在致客户的一封宣布推出 Flex 定价的电子邮件中还指出,其使用等级体系中 1-3 级的开发者必须完成新引入的身份验证流程才能访问 o3。(等级由在 OpenAI 服务上花费的金额决定。)O3 的推理摘要和流式 API 支持也需要经过身份验证。
OpenAI 此前表示,身份验证旨在阻止不良行为者违反其使用政策。
了解更多:https://platform.openai.com/docs/guides/flex-processing