OpenAI 提出 GPT-4 可改进在线平台内容审核工作


OpenAI 发文介绍了其最新的研究发现,即 GPT-4 可以帮助在线平台更有效地管理用户内容。

“使用 GPT-4 的内容审核系统可以更快地迭代政策变更,将周期从数月缩短至数小时。GPT-4 还能解释冗长的内容政策文档中的规则和细微差别,并即时适应政策更新,从而使标签更加一致。我们相信,这为数字平台的未来提供了一个更积极的愿景,即人工智能可以根据平台特定的政策帮助节制在线流量,减轻大量人工版主的精神负担。任何拥有 OpenAI API 访问权限的人都可以实施这种方法来创建自己的人工智能辅助审核系统。”

OpenAI 声称,他们的大型语言模型(例如 GPT-4)可以理解并生成自然语言,使其适用于内容审核。这些模型可以根据提供给他们的政策指南做出适度判断。

一项新的内容政策发布后,首先得人工了解政策的执行;然后收集反馈意见以确定新政策是否可行,以及对反馈中的问题进行纠正。某些情况下,这一过程可能需耗时几个月,但 OpenAI 研究认为,GPT-4 可以在几个小时内完成该任务。 

  • 一旦制定了政策指南,政策专家就可以通过识别少量示例并根据政策为其分配标签来创建一组黄金数据。  
  • 然后,GPT-4 读取策略并将标签分配给同一数据集,而不会看到答案。 
  • 通过检查 GPT-4 的判断与人类判断之间的差异,政策专家可以要求 GPT-4 提出其标签背后的推理,分析政策定义中的模糊性,解决混乱并相应地在政策中提供进一步的澄清。可以重复步骤 2 和 3,直到对策略质量感到满意为止。

在内部测试中,OpenAI 还将 GPT-4 与人类内容审核团队进行了比较得出,受过内容审核训练的 GPT-4 比受过轻度训练的人类审核员表现更好。不过,受过严格训练且经验丰富的人类审核员表现仍要优于两者。

OpenAI 透露,他们还在积极探索进一步提高 GPT-4 的预测质量,包括纳入链式推理或自我批评;以及尝试检测未知风险的方法。

更多详情可查看官方博客。


相關推薦

2023-04-04

天机器人系统,从而实现了前所未有的智能水平,譬如 OpenAI 的 ChatGPT。但 ChatGPT 的训练和架构细节仍不清楚,阻碍了该领域的研究和开源创新。受 Meta LLaMA 和 Stanford Alpaca 项目的启发,来自加州大学伯克利分校、CMU、斯坦福大学

2023-09-12

p;Siliconangle 的报道,Meta 正在寻求在生成式 AI 领域与 OpenAI 展开竞争,将发布新的开源大模型,其性能或将与GPT-4 不相上下。 报道称,这款新模型比 Llama 2 强大数倍,将提供文本、图像生成以及分析等功能。目前该模型正

2023-06-15

OpenAI 昨晚宣布为其生成式 AI 模型 GPT-3.5 Turbo 和 GPT-4 发布重磅更新。 值得关注的亮点: Chat Completions API 中新的函数调用功能 更新并增加可控制性的gpt-4和gpt-3.5-turbo版本 gpt-3.5-turbo的新 16k 上下文版本(与标准 4k 版本对比

2025-04-08

OpenAI CEO Sam Altman 在 X 上宣布了新模型发布计划的调整: o3 和 o4-mini 将在几周内发布,在多个方面大幅改进了预览版本的 o3; GPT-5 将在几个月内发布。 而根据他此前说法,OpenAI 将直接发布内置了推理能力的 GPT-5,以后也

2023-03-16

OpenAI 刚刚宣布正式推出 GPT-4。GPT-4 是 Generative Pre-trained Transformer 4 的缩写,即生成型预训练变换模型 4。 公告写道,GPT-4 是一个多模态大型语言模型(支持接受图像和文本输入,以文本形式输出),也是 OpenAI 努力扩展深度学

2025-04-08

扎克伯格的宣言表明Meta正全力押注开源AI战略,试图在与OpenAI、Google等闭源模型巨头的竞争中,通过开源路线赢得主导地位。Meta在官方发布中反复强调Llama 4的"开源"性质,将其视为企业AI战略的核心优势。 然而,这一"开源"的

2025-04-16

有消息称,OpenAI在刚刚发布的GPT-4.1系列模型中评测其函数调用能力时采用了ComplexFuncBench,这是由智谱团队提出的专用于评估大模型复杂函数调用能力的测试基准。 ComplexFuncBench主要评测大模型在128K的长上下文下进行多步带约

2023-03-18

写作、寻找资源和编辑时间。 你甚至可以对文档的语气提出更改要求,从专业到热情,从随意到感恩等。Copilot 还可以通过建议来加强你的论点或消除不一致之处,从而帮助改进写作。 PPT 写作方面,你只需提供简单的提示(

2023-04-02

解能力,NGPTL++ 可以对程序员编写的代码进行智能审查,提出改进意见,帮助开发者更好地遵循编程规范和最佳实践。 交互式编程助手:NGPTL++ 提供了一个基于 GPT-4 的交互式编程助手,帮助程序员在编程过程中解决问题、查

2025-04-16

OpenAI 今日正式推出了备受期待的GPT-4.1系列,完整阵容包括旗舰版GPT-4.1、高性价比的GPT-4.1 mini和超轻量的GPT-4.1 nano。 OpenAI 发布 GPT-4.1 系列模型 这次更新的焦点并非面向大众用户,仅通过API接口提供服务,OpenAI官方文档直

2025-04-16

2025 年 4 月 15 日凌晨,OpenAI 重磅推出 GPT-4.1 系列模型。发布会直播上,OpenAI邀请了 Windsurf 创始人兼 CEO Varun Mohan 分享经验。 Varun 透露,其内部基准测试显示,GPT-4.1 性能比 GPT-4 提升了 60%。鉴于 GPT-4.1 的出色表现,Windsurf 决定

2025-03-22

日前, OpenAI CEO奥特曼在与硅谷知名分析师Ben Thompson对谈中提到DeepSeek。 奥特曼认为DeepSeek确实是个很棒的团队,也做出了很优秀的模型,但他们真正走红的原因,并不完全是模型本身的能力。   “这对我们来说是一个

2023-07-13

业内人士近日对 OpenAI 今年 3 月发布的 GPT-4 大模型进行了大揭秘,其中包括 GPT-4 模型架构、训练和推理的基础设施、参数量、训练数据集、token 数、成本、混合专家模型 (Mixture of Experts, MoE) 等非常具体的参数和信息。 文章作

2023-04-01

必须有充分的理由,并随着系统潜在影响的大小而增加。OpenAI 最近关于通用人工智能的声明指出,“在某些时候,在开始训练未来系统之前进行独立审查可能很重要,并且对于最先进的努力来说,同意限制用于创建新模型的