GitHub Copilot 被指控以“降低查重”的方式避免版权指控


一份针对微软、GitHub 和 OpenAI 的最新投诉文件内容指出,GitHub 通过对其 Copilot 编程助手进行了细微调整,以避免一些版权指控。

具体表现为,为了回应公众对 Copilot 的批评,GitHub 在 2022 年 7 月推出了一个用户可调整的 Copilot 过滤器,名为"Suggestions matching public code"。当过滤器启用时,GitHub Copilot 会将代码建议及其周围的代码与 GitHub 上的公共代码进行约 150 个字符的检查。如果有一个匹配或接近匹配,该建议将不会提供给用户。

但原告认为,该过滤器基本上毫无价值,因为它只检查完全匹配的内容,但凡稍作修改就检测不到了。GitHub 试图通过改变 Copilot 的输出,使内容看起来不是完全复制的,来逃避版权和许可侵权行为

“在 GitHub 的手中,Copilot 输出中微小的表面变化倾向是一个特点,而不是一个错误。这意味着 GitHub 可以向 Copilot 客户提供无限的许可材料的修改副本,而不会触发 Copilot 的 verbatim-code 过滤器......Copilot 是一种巧妙的软件盗版方法。”

该诉讼最初于去年 11 月由四名身份不明的("J. Doe")原告提出,声称 Copilot 以违反版权法和软件许可要求的方式对公开发布的代码进行训练,并将他人的代码作为自己的代码呈现。彼时,微软、GitHub 和 OpenAI 试图驳回此案,但最终只避免了一些索赔。法官依旧保留了主要的版权和许可问题,并允许原告补充更多的证据细节。

目前,修改后的投诉文件涵盖了八项罪名,保留了对违反《数字千年版权法》(美国著作权法律)、违约(违反开放源代码许可)、不公平致富和不公平竞争方面的指控。以及增加了几项指控:违约(违反 GitHub 的政策出售许可材料),故意干扰未来的经济关系和过失干扰未来的经济关系。

修订后的起诉书中还增加了一名原告,声称 Copilot 复制了他的代码,并提供了其代码样本。且该原告的代码样本被进行了编辑,以防止身份被识别。监督此案的法官也允许原告在法庭文件中保持匿名,以防止他们受到威胁。

针对这些指控,微软发言人则进行了坚决否认,并回应称,"我们坚信,人工智能将改变世界构建软件的方式,从而提高生产力;最重要的是,让开发者更快乐。我们相信 Copilot 遵守了适用的法律,我们从一开始就致力于以负责任的方式对 Copilot 进行创新。我们将继续投资并倡导未来的人工智能驱动的开发者体验"。

OpenAI 没有回应置评请求。


相關推薦

2024-07-13

程序员对微软、GitHub 和 OpenAI 提起集体诉讼,指控 GitHub Copilot 违反版权法,在没有适当归属或遵守开源许可的情况下使用了他们的代码。 作为开发者的起诉方认为,GitHub Copilot 基于公开的 GitHub 代码仓库来训练他们的 AI 系统

2023-01-18

也正在起诉微软、GitHub 和 OpenAI,该案涉及 AI 编程模型 CoPilot,起诉的理由与本案类似,只不过一个涉及艺术品生成,另一个涉及代码生成。 律师 Butterick 将此案描述为「朝着使人工智能对每个人都公平和道德的方向迈出的又一

2022-06-30

“有限的”开源。原因则在于:7-Zip 的代码没有托管在 Github、Gitlab 或任何一个公共代码托管平台上,只有一个 Sourceforge 官方页面上的 src.7z。“没有历史、没有 committer、没有名字、也没有文档,只有一个存档”。 他还引用了

2022-07-02

" 据悉,造成 SFC 与 GitHub 决裂的关键因素是最近的 GitHub Copilot 普遍性可用事件。此前,SFC 并没有太在意这件事,因为他们认为前期的 Copilot 似乎更像是研究原型而不是产品。但当 GitHub 宣布 Copilot 是一个商业性的、盈利性的产

2024-10-21

。 Automattic 发言人表示:“Automattic 坚决否认 WP Engine 的指控,这些指控完全歪曲了事实,Automattic 保留所有权利。Automattic 对自己的法律地位充满信心,将积极针对这一毫无根据的指控提起诉讼,并寻求针对 WP Engine 的所有补救

2023-09-19

亚州总检察长宣布,谷歌将支付 9300 万美元,以了结一项指控其违反美国消费者保护法的隐私诉讼。 “谷歌告诉用户,一旦他们选择退出,谷歌就不会追踪他们的位置;但它却阳奉阴违,继续使用位置数据追踪、存储和销售

2022-11-16

谷歌又被罚款啦!这次指控不在海外业务,而是由美国 40 个州的检察机构联合发起,理由是谷歌公司在收集个人位置数据方面误导用户,用户以为他们已经在账户设置中关闭了位置跟踪,事实上谷歌仍在继续收集他们的位置信

2023-07-06

因涉嫌通过互联网窃取用户私人信息而在加利福尼亚州被指控并发起集体诉讼。 诉讼称,OpenAI 在未经事先同意的情况下,使用了社交媒体、博客、维基百科上数百万条评论的数据,以及用户的其他个人信息来训练 ChatGPT。该诉

2023-07-26

的报道,英国有超过 1500 名开发者向法院提起集体诉讼,指控苹果的 App Store 存在“不公平”行为,要求赔付 7.85 亿英镑(约 72.38 亿元人民币)。 这项集体诉讼由肖恩・恩尼斯 (Sean Ennis) 代表 1566 名开发者提起,指控苹果垄断

2023-06-08

AI 整合到 Qt 中的方法,目前公布的初步成果是将 GitHub Copilot 接入他们的 Qt Creator 集成开发环境。 GitHub Copilot 集成将作为技术预览(而非正式的新功能)在 Qt Creator 11 中发布,在编写 C++/Qt 代码时, GitHub Copilot 能够提供 AI

2022-04-04

发布了该软件。值得注意的是,被告在法庭上否认了这些指控,并声称其对"Commons Clause"的删除是合法的,是被允许的。但法院在裁决中同意了删除 Commons Clause 是不恰当的行为,并列出了一系列针对被告的禁止条款。 Kuhn 指出

2022-10-20

一名开源软件作者决定对 GitHub Copilot 发起诉讼。 Matthew Butterick 是拥有多重身份的程序员,他从 1998 年开始深度参与开源社区,曾在 Red Hat 工作了两年,同时也是作家、设计师和律师,写过两本关于排版的书——《Prac­ti­cal

2021-11-12

ppna Skolplattformen 以及警方、安全调查机构并不认为政府的指控成立。 使用 Öppna Skolplattformen,家长需要注册登录,之后便可查看孩子们的信息。斯德哥尔摩市教育主任 Lena Holmdahl 表态:“我们作为权威必须对个人数据负责

2021-12-01

的方式,被称为“入站 = 出站”(“inbound=outbound”)。 GitHub 已经将这一方式加入其服务条款中,并默认开启。也就是说,贡献者在 GitHub 上提交 PR,则表示他同意以“入站 = 出站”的方式许可自己的贡献。  CLA 中除了有