OpenAI 不再使用 API 数据训练模型


AI 工具都会随着用户越来越多地使用而不断进化,其中一个最主要的原因就是这些工具会使用用户输入的内容来进行训练,强化自身的功能。

ChatGPT 也同样如此,只不过 OpenAI 的首席执行官 Sam Altman 近日在接受 CNBC 的采访时确认,如果用户通过 API 来调用服务,那么他们将不会使用这些用户的数据来训练模型。但是,如果你是直接访问 ChatGPT 的网页来使用,那么所有的数据仍将被用于训练,除非用户提前在设置中手动关闭了对应了选项。

Sam Altman 表示:

用户显然希望我们不要使用他们的数据进行训练,所以我们改变了计划。

实际上,OpenAI 在 3 月 1 日悄悄更新了他们的服务条款,条款中也明确规定该公司不再使用任何 API 数据进行训练。众所周知,大家一般也不会仔细看服务条款,所以这件事情直到最近才被大家知道。

ChatGPT 自诞生以来就伴随着大众对其隐私和安全担忧,比如意大利政府就曾因隐私和数据处理等问题禁止公民使用 ChatGPT、三星也因为员工在 ChatPGT 上泄漏了公司机密信息而决定完全禁止员工使用这类服务。

不再使用任何 API 数据训练也意味着,很多与 OpenAI 保持商业合作的企业其用户数据不会再被 OpenAI 使用,比如微软、Salesforce、Duolingo,以及众多基于 GPT 而诞生的服务,还包括了订阅 OpenAI API 服务的用户。


相關推薦

2023-06-15

OpenAI 昨晚宣布为其生成式 AI 模型 GPT-3.5 Turbo 和 GPT-4 发布重磅更新。 值得关注的亮点: Chat Completions API 中新的函数调用功能 更新并增加可控制性的gpt-4和gpt-3.5-turbo版本 gpt-3.5-turbo的新 16k 上下文版本(与标准 4k 版本对比

2023-04-04

但它的访问越来越受到限制。最新的大型语言模型 —— OpenAI 的 GPT4 发布时没有关于其模型架构、训练数据、训练硬件或超参数的信息。公司越来越多地使用封闭数据集构建大型模型,并仅通过 API 访问提供模型输出。为了使 LLM

2023-07-13

业内人士近日对 OpenAI 今年 3 月发布的 GPT-4 大模型进行了大揭秘,其中包括 GPT-4 模型架构、训练和推理的基础设施、参数量、训练数据集、token 数、成本、混合专家模型 (Mixture of Experts, MoE) 等非常具体的参数和信息。 文章作

2023-08-17

OpenAI 发文介绍了其最新的研究发现,即 GPT-4 可以帮助在线平台更有效地管理用户内容。 “使用 GPT-4 的内容审核系统可以更快地迭代政策变更,将周期从数月缩短至数小时。GPT-4 还能解释冗长的内容政策文档中的规则和

2023-04-27

OpenAI 宣布在 ChatGPT 中引入了一项新功能,允许用户关闭聊天记录。相关控件目前已面向所有用户推出,可以在 ChatGPT 的设置中找到,并且可以随时更改。 公告指出,用户在禁用聊天历史记录后开始的对话不会被用于训练和改进

2024-07-16

据路透社 7 月 12 日报道,OpenAI 正在开发一项代号为「草莓」(Strawberry)的 AI 模型技术。 内部文件显示,这一项目旨在提升 AI 的高级推理能力,使其不仅能够生成查询答案,还能自主规划并开展复杂研究。 据知情人士透露

2023-04-04

天机器人系统,从而实现了前所未有的智能水平,譬如 OpenAI 的 ChatGPT。但 ChatGPT 的训练和架构细节仍不清楚,阻碍了该领域的研究和开源创新。受 Meta LLaMA 和 Stanford Alpaca 项目的启发,来自加州大学伯克利分校、CMU、斯坦福大学

2024-07-26

在 Meta 推出开源 Llama 3.1 模型之后不久,OpenAI 宣布对其 GPT-4o Mini 模型提供免费微调,允许用户免费使用额外数据训练模型,以便在特定用例中获得更高的性能。 GPT-4o mini 微调适用于 OpenAI 的 Tier 4 和 5 使用层级的开发人员,这

2023-07-06

私政策主要是受流行人工智能聊天机器人 ChatGPT 开发商 OpenAI 的影响,后者因涉嫌通过互联网窃取用户私人信息而在加利福尼亚州被指控并发起集体诉讼。 诉讼称,OpenAI 在未经事先同意的情况下,使用了社交媒体、博客、维基

2023-09-12

p;Siliconangle 的报道,Meta 正在寻求在生成式 AI 领域与 OpenAI 展开竞争,将发布新的开源大模型,其性能或将与GPT-4 不相上下。 报道称,这款新模型比 Llama 2 强大数倍,将提供文本、图像生成以及分析等功能。目前该模型正

2023-03-16

le 的基础技术,带有 Nvidia 和 AMD GPU 的 TorchInductor 将依赖 OpenAI Triton 深度学习编译器来生成高性能代码,并隐藏低级硬件细节。OpenAI Triton 生成的内核实现的性能,与手写内核和 cublas 等专门的 cuda 库相当。 Accelerated Transformers

2023-01-19

微软方面宣布了 Azure OpenAI 服务的全面上市,这是微软对人工智能民主化的持续承诺以及与 OpenAI 持续合作的一部分。微软在 2021 年 11 月推出了 Azure OpenAI 服务,允许通过 REST API 访问 OpenAI 的强大语言模型;但彼时该服务只对

2023-03-16

OpenAI 刚刚宣布正式推出 GPT-4。GPT-4 是 Generative Pre-trained Transformer 4 的缩写,即生成型预训练变换模型 4。 公告写道,GPT-4 是一个多模态大型语言模型(支持接受图像和文本输入,以文本形式输出),也是 OpenAI 努力扩展深度学

2023-06-25

GPT-3 所需的数千万美元。此外,MPT-30B 模型的质量超过了 OpenAI 在 2020 年发布的初版 GPT-3。由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并部署在本地硬件设备上。 MosaicML 使用了 Alibi 和 FlashAttention 技术来优化