Reddit 起诉 Anthropic 未经许可使用其数据训练 AI 模型


Reddit 于 2025 年 6 月 4 日向北加州法院提交诉讼,指控 AI 初创公司 Anthropic 未经授权使用其网站数据训练 AI 模型,且未支付相应费用。Reddit 认为,Anthropic 的行为违反了其用户协议,且未经授权将 Reddit 数据用于商业用途是违法的。

https://redditinc.com/hubfs/Reddit Inc/Content/PDFs/Docket Stamped Complaint.pdf

Reddit 称已与包括 OpenAI 和谷歌在内的其他 AI 模型提供商达成了数据许可协议,允许这些公司在特定条款下使用 Reddit 数据训练模型,这些条款旨在保护用户利益和隐私。

Reddit 首席法务官 Ben Lee 表示,公司不会容忍像 Anthropic 这样的营利实体在没有为 Reddit 用户带来任何回报或尊重其隐私的情况下,商业利用 Reddit 内容获取数十亿美元的利益。

诉状中,Reddit 声称曾与 Anthropic 接触,明确指出该 AI 初创公司无权抓取或使用 Reddit 的内容,但 Anthropic “拒绝接触”。Reddit 还指控 Anthropic 的爬虫机器人无视其 robots.txt 文件(一种告知自动化系统不要抓取网站的标准)。Reddit 声称,在 Anthropic 于 2024 年声称已阻止其机器人抓取 Reddit 后,Anthropic 的机器人仍继续抓取该平台超过 10 万次。

Reddit 要求 Anthropic 支付赔偿金,并归还因抓取 Reddit 内容而获得的收益。此外,Reddit 还请求法院发布禁令,禁止 Anthropic 继续使用 Reddit 的内容。Anthropic 发言人 Danielle Ghighlieri 则表示,公司不同意 Reddit 的主张,并将积极为自己辩护。

值得注意的是,OpenAI 的首席执行官 Sam Altman 持有 Reddit 8.7% 的股份,是其第三大股东,并曾是该公司董事会成员。


相關推薦

2023-01-18

terick 发起了诉讼。其中 Butterick 和 Joseph Saveri 目前也正在起诉微软、GitHub 和 OpenAI,该案涉及 AI 编程模型 CoPilot,起诉的理由与本案类似,只不过一个涉及艺术品生成,另一个涉及代码生成。 律师 Butterick 将此案描述为「朝着使

2024-07-13

开源许可的情况下使用了他们的代码。 作为开发者的起诉方认为,GitHub Copilot 基于公开的 GitHub 代码仓库来训练他们的 AI 系统,此举侵犯了大量创作者的合法权利,因为这些公开仓库大多数都采用了开源 License,这些 License 都

2025-05-30

品。 相关报道称,Getty已投入数百万美元在英美两国提起诉讼,CEO克雷格·彼得斯坦承诉讼成本“高得令人却步”,但强调“证据非常有力”。 彼得斯坦承这场斗争并不轻松:“我认为我方证据非常有力。但需要说明:我们

2025-03-26

txt」文件引导机器人避开特定页面。但一些AI公司,例如Anthropic、Perplexity AI等,屡次被指控忽视这种协议,擅自抓取数据,导致网站与机器人之间形成技术上的持续对抗。 Cloudflare表示,每日大约有500亿次爬虫访问请求。尽管

2025-04-29

TechCrunch 报道称,在 Anthropic 的 Claude Code 和 OpenAI 的 Codex CLI 两款“智能体”式 AI 编程工具的较量中,后者获得了更多开发者的青睐。部分原因在于,Anthropic 向一位试图逆向工程 Claude Code 的开发者发出了删除通知,而 Claude Code

2023-07-06

加利福尼亚州被指控并发起集体诉讼。 诉讼称,OpenAI 在未经事先同意的情况下,使用了社交媒体、博客、维基百科上数百万条评论的数据,以及用户的其他个人信息来训练 ChatGPT。该诉讼的结论是,这侵犯了互联网上数百万用

2022-12-22

Stable Diffusion 的图像数据基本都是直接从网上抓取收集,未经原作者的许可。 有人指出,Stability AI 这个”选择退出“的机制,不符合欧洲通用数据保护条例,该条例规定抓取信息需要原作者主动同意,而不是默认假定。沿

2025-03-30

们使用的AI助手如何「思考」一直是个谜。近日,AI公司Anthropic发布了两篇重磅论文,首次深入揭示了大语言模型Claude的内部思维过程,这一突破性研究被形象地称为「AI显微镜」技术。 打造「AI显微镜」 Anthropic的研究人员面临

2024-10-22

也有自己的缺点。专家们质疑这项技术的可靠性,以及在未经许可使用受版权保护的数据训练生成式 AI 模型的情况下,专家们还质疑其合法性。 但风险投资公司实际上在押注生成式 AI 将在大型盈利行业中站稳脚跟,而且其长

2024-08-01

以检索增强生成 (RAG) 为重点的评估框架,对来自 OpenAI、Anthropic、Google 和 Meta 等品牌的 22 个(12 个开源 LLM 和 10 个专有 LLM)领先的生成式 AI 大语言模型性能进行了比较排名。 Hallucination Index 使用 Galileo 专有的评估指标“context

2022-10-20

一名开源软件作者决定对 GitHub Copilot 发起诉讼。 Matthew Butterick 是拥有多重身份的程序员,他从 1998 年开始深度参与开源社区,曾在 Red Hat 工作了两年,同时也是作家、设计师和律师,写过两本关于排版的书——《Prac­ti­cal

2022-07-02

3)在许多情况下,不要因为软件专利(不应该存在)而起诉我或其他使用了我所写的代码的人。 如果有一天,copyright 消失了,我们可以自由地复制和分享任何目前的专有软件和其他作品的代码,我会庆祝。在那之前,我不希

2025-04-08

Source!),对Meta的开源主张提出了强烈质疑,指出Llama 4的许可条款与真正的开源精神相去甚远。 一、Meta的Llama 4发布与开源宣言 马克·扎克伯格在Llama 4发布视频中充满热情地宣布:"今天是Llama 4的日子。我们的目标是构建世

2023-08-04

操纵来自外部的输入。 不安全的输出处理。当 LLM 输出未经审查即被接受,从而暴露后端系统时,就会出现此漏洞。滥用可能导致严重后果,如 XSS、CSRF、SSRF、权限升级或远程代码执行。 训练数据投毒。当 LLM 训练数据被篡