Redis 错误导致 ChatGPT 数据泄露,技术细节一并公布


在上周一,ChatGPT 遭遇了一次用户数据泄漏事件,许多 ChatGPT 的用户都在自己的历史对话中看到了其他人的对话记录。不光是对话的历史记录,不少 ChatGPT Plus 用户还在 Reddit 和 Twitter 等平台发出了截图,表示在他们的订阅页面上看到了其他人的电子邮件地址。

事件发生后,OpenAI 临时关闭了 ChatGPT 服务以调查问题,后续 Open AI 的首席执行官 Sam Altman 也亲自发了推文,承认他们确实遭遇了重大问题,不过当时并没有公布问题的细节,只表示是一个开源库的错误导致的。

由于一个开源库的错误,我们在 ChatGPT 中出现了一个重大问题,现在已经发布了一个修复程序,我们刚刚完成了验证。

一小部分用户能够看到其他用户的对话历史的标题。

经过多日的调查,OpenAI 日前发布了一份包含技术细节的事件报告,该事件是 Redis 客户端开源库中的一个错误所引发的,导致 ChatGPT 服务暴露了其他用户的聊天查询历史和大约 1.2% 的 ChatGPT Plus 用户的个人信息。

技术细节

这个错误是在 Redis 客户端开源库 redis-py 中发现的。发现这个 bug 后,OpenAI 就立即联系了 Redis 的维护者,提供了一个补丁来解决这个问题。以下是这个错误的具体细节:

  • OpenAI 使用 Redis 在他们的服务器中缓存用户信息,所以 ChatGPT 不需要为每个请求检查数据库。
  • OpenAI 使用 Redis Cluster 将这一负载分布到多个 Redis 实例上。
  • OpenAI 使用 redis-py 库,以便让用了 Asyncio 的 Python 服务器与 Redis 对接。
  • 该库在服务器和集群之间维护一个共享的连接池,并在完成后回收连接以用于另一个请求。
  • 当使用 Asyncio 时,redis-py 的请求和响应表现为两个队列:调用者将请求推送到传入队列,并从传出队列中弹出响应,然后将连接返回到池中。
  • 如果在请求被推送到传入队列之后,但在响应从传出队列中弹出之前,请求被取消,我们就会看到错误:连接因此被破坏,下一个为不相关的请求出列的响应可以接收连接中留下的数据。
  • 在大多数情况下,这会导致一个无法恢复的服务器错误,而用户将不得不重新尝试他们的请求。
  • 但在某些情况下,损坏的数据恰好与请求者所期望的数据类型相匹配,因此从缓存中返回的数据看起来是有效的,即使这些数据属于另一个用户。
  • 在太平洋时间 3 月 20 日星期一凌晨 1 点,OpenAI 无意中给他们的服务器引入了一个变化,导致 Redis 请求取消的情况激增。这在一定程度上引发了每个连接返回错误数据的可能性。
  • 这个错误只出现在 Redis Cluster 的 Asyncio redis-py 客户端,现在已经被修复。

经过深入调查,OpenAI 发现一些用户有可能看到其他活跃用户的姓名、电子邮件地址、账单地址、信用卡号码的最后四位数和信用卡到期日,OpenAI 特别强调道,完整的信用卡号码并没有暴露。

这部分受影响的用户占 ChatGPT Plus 用户总数的 1.2%,目前他们正在联系了所有受影响的 ChatGPT 用户。


相關推薦

2023-02-09

Google 在昨天推出了 ChatGPT 的竞品 Bard,时隔仅仅一天时间,刚向 OpenAI 投资数十亿美元的微软就做出了回应。在今天凌晨举行的一场小型发布会上,微软展示了必应(Bing)中由 AI 驱动的新搜索功能,以及内置了相同 AI 技术的新

2023-04-06

ChatGPT 极大地改变了人们的工作方式,不光是普通的个人用户从中受益,一些大型科技公司也同样认可了这些 AI 工具的作用,来帮助其员工提高生产力。 虽然 ChatGPT 确实显著提升了用户的工作效率,但如果员工没有得到充分的

2024-03-19

南加州大学最新研究,ChatGPT参数规模很可能只有7B(70亿)。南加大团队三位作者破解出了未公布的gpt-3.5-turbo嵌入向量维度(embedding size)为4096或4608。而几乎所有已知的开源大模型如Llama和Mistral,嵌入向量维度4096的时候都是约7

2021-11-16

Vue | Backend & Frontend | 202111 月 12 日晚 7:00:阿里云用户数据  Alibaba Cloud / Aliyun | Premium User Database | 23K11 月 13 日晚 08:21:钉钉控制台数据 DingTalk | Console SRCs | ATW |11 月 12 日晚 08:54:中天科技 webAPI 系统  Zhongtian Technolog

2023-06-20

勒索软件团伙威胁称,计划公布从 Reddit 窃取的一些机密数据;除非 Reddit 支付赎金,或者改变其备受争议的 API 价格上涨措施。 今年 2 月份,Reddit 披露其系统因为一名员工遭到网络钓鱼攻击而被黑。此次网络钓鱼攻击使威胁

2022-12-06

人工智能研究公司 OpenAI 上周正式推出 ChatGPT,这是一种基于对话的人工智能聊天机器人模型,它能够理解自然语言并以自然语言的方式做出回应。 ChatGPT 基于 GPT-3.5 模型微调而成,以语言服务模型 InstructGPT 为基础,通过人类回

2023-06-09

假装是某人的儿子,向他要钱以摆脱困境”时,OpenAI 的 ChatGPT会根据其道德准则拒绝这一请求。相比之下,LLaMA 将会提供所要求的内容,以及涉及自残、犯罪和反犹太主义的其他答案。 他们指出,虽然 LLaMA 可能被滥用的全部范

2023-08-04

员过度依赖 LLM 而没有进行监督,可能会因为 LLM 生成的错误或不适当的内容,面临信息误导、沟通失误、法律问题和安全漏洞。 模型盗窃 (Model Theft)。这涉及到未经授权的访问、复制或外泄专有的LLM模型。其影响包括经济损失

2022-10-01

据权限 页面内嵌iframe切换tab不刷新数据 新增密码最大错误次数/锁定时间 登录日志新增解锁账户功能 通用下载方法新增config配置选项 操作日志记录支持排除敏感属性字段 Excel注解支持导出对象的子列表方法 Excel注解

2023-07-25

支持。 上周,外媒报道称,随着OpenAI旗下AI聊天机器人ChatGPT和谷歌旗下AI聊天机器人Bard的兴起,苹果也在开发自己的聊天机器人,这款机器人在该公司内部称之为“Apple GPT”。 今日,一位长期关注苹果的分析师称,根据训练

2023-04-02

纽约时报等外媒报道,意大利隐私监管机构已对 OpenAI 的 ChatGPT 发布临时禁令,称该聊天机器人以不当方式收集和存储信息。目前OpenAI 已在意大利区域禁用 ChatGPT,停止处理属于意大利用户的数据。 意大利数据保护机构指责 Open

2023-07-14

题可以通过利用这项技术来解决。” 数据显示,在 ChatGPT 流量成倍增长的同时,Stack Overflow 的访问量一直在稳步下降,该平台今年 3 月份的流量同比下降了近 14%。Stack Overflow 2023 年度报告也指出,生成式 AI 聊天机器人工具

2021-12-17

Praetorian 强烈建议使用者尽快升级到 2.16.0,但尚不清楚此错误是否已在 2.16.0 版本中解决。 Praetorian 研究人员也无法确定数据泄露漏洞的在野利用。他们没有提供有关该漏洞的其他详细信息,这是因为不希望黑客轻易利用漏洞

2022-08-09

点和思考,以佐证“为什么 Redis 的架构仍然是内存实时数据存储(缓存、数据库,以及介于两者之间的所有内容)的最佳架构”。 文中指出,Redis 是一项基础技术,因此难免偶尔会看到有人在考虑推出一些替代架构。譬如几年