OpenAI 对 GPT-4o Mini 模型进行免费微调


在 Meta 推出开源 Llama 3.1 模型之后不久,OpenAI 宣布对其 GPT-4o Mini 模型提供免费微调,允许用户免费使用额外数据训练模型,以便在特定用例中获得更高的性能。

GPT-4o mini 微调适用于 OpenAI 的 Tier 4 和 5 使用层级的开发人员,这是 OpenAI 计划中价格最高的层级。OpenAI 计划逐步将免费微调扩展到所有层级。免费微调将从现在开始持续到 9 月 23 日。

开发人员可以通过访问微调仪表板,点击“create”,然后从基础模型下拉菜单中选择 “GPT-4o mini”,开始免费微调 GPT-4o mini。每个组织每 24 小时可获得 200 万个 token 用于训练模型。超出部分每 100 万个 token 收取 3 美元。有关免费微调的更多详情,可参阅 OpenAI 的微调文档。

与使用 OpenAI 的 GPT 3.5 Turbo 进行微调相比,GPT-4o mini 的定位是更具成本效益和更强大的功能,具有更长的上下文和更低的延迟。GPT -4o mini 于 7 月 18 日推出,旨在通过让智能更实惠来扩大使用 AI 构建的应用程序范围。它支持一系列任务,例如链接或并行化模型调用的应用程序、将大量上下文传递给模型或通过快速实时文本响应与客户互动的应用程序(例如客户支持聊天机器人)。


相關推薦

2024-08-08

OpenAI 在其 API 中引入了结构化输出功能,这意味着模型的输出可以可靠地遵循开发人员提供的 JSON 模式。 对复杂 JSON 模式进行评估时,具有结构化输出的新模型 gpt-4o-2024-08-06 得分为 100%。相比之下,gpt-4-0613 得分不到 40%。 这

2024-08-10

阿里通义团队开源新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型。 Qwen2-Math基于通义千问开源大语言模型Qwen2研发,旗舰模型 Qwen2-Math-72B-Instruct在权威测评集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、

2024-07-18

API 上免费使用,可处理多达 256000 个词元的输入,是 OpenAI 的 GPT-4o 的两倍。 在基准测试中,Mistral 显示 Codestral Mamba 在 HumanEval 测试中的表现优于竞争对手开源模型 CodeLlama 7B、CodeGemma-1.17B 和 DeepSeek。 开发人员可以从 GitHub

2024-08-07

在 6 月份因不明原因撤回诉讼后,马斯克再次对 OpenAI 及其首席执行官 Sam Altman 提起了新的诉讼,声称 OpenAI 将利润和商业利益置于公众利益之上,还违背了免费共享或开源公司技术的承诺,选择向微软提供技术的独家许可。 马

2024-09-30

今年以来,由于公司价值观的争议和领导层之间的斗争,OpenAI 的高管和研究人员纷纷离职。 不到两年的时间里,OpenAI 从一个鲜为人知的非营利实验室,迅速转型为一个举世闻名的企业,其首席执行官已成为人工智能革命的代

2024-07-11

的综合测评结果。 从代表通用能力的一级总分来看,OpenAI的GPT-4o以81分高居榜首,Claude-3.5-Sonnet与通义千问开源模型Qwen2-72B-Instruct并列第二,得分均为77。 通义千问(Qwen2-72B)既是排名最高的中国大模型,也是全球最强的开源大

2024-08-14

ROR_API_PREFIX 参数详情 字段 描述 model 模型名称 gpt-4o-mini gpt-4o gpt-4 gpt-4-mobile messages 消息内容 stream 是否流式返回 conversation_id 会话 ID parent_message_id 父消息 ID hatd 同上述环境变量的

2024-07-30

外媒报道称,OpenAI 可能在 12 个月内濒临破产,目前预计损失达 50 亿美元,因此可能需要新一轮融资才能维持运营。 概要 - OpenAI 正处于破产边缘,预计亏损达 50 亿美元。 - 这家初创公司在训练其 AI 模型上花费 70 亿美元,

2024-08-01

x,一个以检索增强生成 (RAG) 为重点的评估框架,对来自 OpenAI、Anthropic、Google 和 Meta 等品牌的 22 个(12 个开源 LLM 和 10 个专有 LLM)领先的生成式 AI 大语言模型性能进行了比较排名。 Hallucination Index 使用 Galileo 专有的评估指标

2024-09-27

Meta 今天发布了 Llama 3.2 系列开源模型,其中包括小型和中型视觉 LLMs(11B 和 90B),以及适合边缘和移动设备的小型纯文本模型(1B 和 3B),包括预训练和指令调整版本。 LLaMA 3.2 支持同时处理文本、图像和视频,能够理解并生

2024-06-26

8 个小时的工作时间。 JetBrains 表示,AI Assistant 将结合 OpenAI 的 GPT-4o 、Gemini 模型和 JetBrains 的几种专有模型的功能,自动为每项任务选择最合适的 LLM。“这确保你可以专注于编码的创造性方面,而 AI 则处理重复性工作。” Goo

2023-12-24

工具,建议下载使用: https://github.com/devlive-community/dbm OpenAI Java SDK 主要为 Java 开发人员提供方便易用的 SDK 来与开放 AI 模型的 API 进行交互依赖库。 发布版本 发布时间 2023.12.1 2023-12-23 创建微调作业

2023-07-13

业内人士近日对 OpenAI 今年 3 月发布的 GPT-4 大模型进行了大揭秘,其中包括 GPT-4 模型架构、训练和推理的基础设施、参数量、训练数据集、token 数、成本、混合专家模型 (Mixture of Experts, MoE) 等非常具体的参数和信息。 文章作

2023-04-04

天机器人系统,从而实现了前所未有的智能水平,譬如 OpenAI 的 ChatGPT。但 ChatGPT 的训练和架构细节仍不清楚,阻碍了该领域的研究和开源创新。受 Meta LLaMA 和 Stanford Alpaca 项目的启发,来自加州大学伯克利分校、CMU、斯坦福大学