OpenAI 提出 GPT-4 可改进在线平台内容审核工作

2023-08-17 發表於开源资讯

OpenAI 发文介绍了其最新的研究发现，即 GPT-4 可以帮助在线平台更有效地管理用户内容。

“使用 GPT-4 的内容审核系统可以更快地迭代政策变更，将周期从数月缩短至数小时。GPT-4 还能解释冗长的内容政策文档中的规则和细微差别，并即时适应政策更新，从而使标签更加一致。我们相信，这为数字平台的未来提供了一个更积极的愿景，即人工智能可以根据平台特定的政策帮助节制在线流量，减轻大量人工版主的精神负担。任何拥有 OpenAI API 访问权限的人都可以实施这种方法来创建自己的人工智能辅助审核系统。”

OpenAI 声称，他们的大型语言模型（例如 GPT-4）可以理解并生成自然语言，使其适用于内容审核。这些模型可以根据提供给他们的政策指南做出适度判断。

一项新的内容政策发布后，首先得人工了解政策的执行；然后收集反馈意见以确定新政策是否可行，以及对反馈中的问题进行纠正。某些情况下，这一过程可能需耗时几个月，但 OpenAI 研究认为，GPT-4 可以在几个小时内完成该任务。

一旦制定了政策指南，政策专家就可以通过识别少量示例并根据政策为其分配标签来创建一组黄金数据。
然后，GPT-4 读取策略并将标签分配给同一数据集，而不会看到答案。
通过检查 GPT-4 的判断与人类判断之间的差异，政策专家可以要求 GPT-4 提出其标签背后的推理，分析政策定义中的模糊性，解决混乱并相应地在政策中提供进一步的澄清。可以重复步骤 2 和 3，直到对策略质量感到满意为止。

在内部测试中，OpenAI 还将 GPT-4 与人类内容审核团队进行了比较得出，受过内容审核训练的 GPT-4 比受过轻度训练的人类审核员表现更好。不过，受过严格训练且经验丰富的人类审核员表现仍要优于两者。

OpenAI 透露，他们还在积极探索进一步提高 GPT-4 的预测质量，包括纳入链式推理或自我批评；以及尝试检测未知风险的方法。

更多详情可查看官方博客。

OpenAI 提出 GPT-4 可改进在线平台内容审核工作

相關推薦

低成本开源聊天机器人 Vicuna：可达到 ChatGPT/Bard 90% 以上水平

Meta 正在构建新开源大模型，性能超越 Llama 2、比肩 GPT-4

OpenAI 发布重磅更新：增加函数调用能力、支持处理更长上下文、降低价格

ElevenLabs 新 TTS 模型支持音频标签丨日报

OpenAI 改进 GPT-4o 模型，带来更强的智能和个性

OpenAI 将在几个月内发布 GPT-5

OpenAI 正式发布 GPT-4

Llama 4 不是真开源，比 DeepSeek 格局差多了

微软将 GPT-4 融入 Office，发布 Microsoft 365 Copilot

新开源！跨时代 AI 编程语言 NGPTL++

OpenAI 即将发布 GPT-5，但性能或许没那么震撼

ChatGPT 为 Deep research 添加 GitHub “连接器”，可回答代码问题

消息称 OpenAI 采用智谱标准评测最新模型

未来一周，Windsurf 用户可免费无限量使用 GPT-4.1 模型