开源软件作者拿起律师执业证,准备起诉 GitHub Copilot


一名开源软件作者决定对 GitHub Copilot 发起诉讼。

Matthew Butterick 是拥有多重身份的程序员,他从 1998 年开始深度参与开源社区,曾在 Red Hat 工作了两年,同时也是作家、设计师和律师,写过两本关于排版的书——《Prac­ti­cal Typog­ra­phy》和Typog­ra­phy for Lawyers》,设计了多款字体:Equity,Con­course 和 Trip­li­cate。Matthew 目前是 Racket 的贡献者,自己也写了不少开源软件(托管在自建的仓库),包括用来出版在线书籍的 Pollen ,以及在工作中使用的 AI 软件。

今年 6 月份,Matthew 撰写文章指出 GitHub Copilot 存在法律问题,尤其是对开源 License 的不当处理。近日,对于 GitHub Copilot 的法律问题,Matthew 做出了进一步举动,他重新激活了自己的加州律师执业证,并联合多名其他优秀律师,准备对 GitHub Copilot 发起集体诉讼——理由是它违反了对开源作者和用户的法律责任

GitHub Copilot 自称是 “AI 编程助手”,基于机器学习技术来提供代码建议/自动补全。Copilot 的底层技术采用了由 OpenAI 打造的新 AI 系统 Codex——经过了数十亿行公开代码的训练。

Matthew 认为,Copilot 基于公开代码的训练生成代码建议均存在法律问题。

  • 训练中存在的法律问题

大多数开源软件采用的 License 都明确描述了授予使用者的权利和义务,比如保留代码的归属信息 (attri­bu­tion)。而且原作者依旧拥有开源软件的版权 (Copyright)。

作为使用者,在面对开源软件时通常有两个选择:

  1. 如果软件代码有明确的 License,遵循开源 License 规定的义务
  2. 如果公开的部分代码没有明确指定开源 License,由于作者拥有软件的版权,使用者可在满足 fair-use 的条件下进行使用

Matthew 指出,GitHub Copilot 肯定无法满足上面的第一条要求,因为如果它在遵守开源 License 的前提下使用公开代码,那么就需要提供大量的 attri­bu­tion 信息,这几乎是每个开源 License 的最低要求。但现实情况是几乎看不到 GitHub Copilot 提供的任何 attri­bu­tion 信息。

因此,GitHub Copilot 对公开代码的使用需要满足 fair-use 条件。虽然 GitHub 的前任 CEO Nat Fried­man 曾表示,GitHub Copilot 基于公开代码进行机器学习训练属于 fair-use。但 Matthew 认为,这是涉及到法律的问题,而不是谁说了就算的。

软件自由保护组织 (Software Freedom Conservancy,SFC) 不同意 Nat Fried­man 的说法,并要求微软提供证据来支持其立场。SFC 负责人曾透露:

我们在 2021 年 6 月私下询问了 Fried­man 和其他微软、GitHub 的代表,要求他们为 GitHub 的公开法律立场提供可靠的法律参考…… 但他们什么都没有提供。

为什么微软不能为他们的立场提供一些法律依据?因为 SFC 是对的:他们根本就没有依据。尽管一些法院已经考虑了相关问题,但目前还没有一个判例直接解决 AI 训练的 fair-use 问题。

  • 使用中存在的法律问题

对于 GitHub Copilot 生成的建议代码,微软表示“不主张任何权利”。不过微软也没有对生成代码的正确性、安全性或引申出的知识产权问题作出任何保证。一旦使用者接受了 Copilot 的建议,所有这些都将成为自己的问题。

Matthew 举了一个最近的例子。得克萨斯农工大学教授 Tim Davis 在使用 GitHub Copilot 时,得到的建议代码竟然完全和他自己公开的代码一模一样。但这段代码并不是真正的“开源”代码,因为它没有采用开源 License。

我们都知道,使用了开源代码就要遵守其 License 规定的义务。但根据 Copilot 的设计,用户根本看不到生成代码的来源、作者,以及 License 等信息,所以他们如何遵守 License?

Matthew 最后谈到了 GitHub Copilot 对开源社区的影响。他认为,也许大多数人不会介意 GitHub Copilot 在没有告知你的情况下就使用你的代码,但如果 Copilot 在抹去开源社区各种痕迹的前提下,随意使用他们的开源代码,你会有什么感想?

延伸阅读

  • GitHub 被 "GitHub Copilot" 倒逼成为开源项目?
  • GitHub Copilot 对开发者生产力和幸福指数的影响

相關推薦

2024-07-13

程序员对微软、GitHub 和 OpenAI 提起集体诉讼,指控 GitHub Copilot 违反版权法,在没有适当归属或遵守开源许可的情况下使用了他们的代码。 作为开发者的起诉方认为,GitHub Copilot 基于公开的 GitHub 代码仓库来训练他们的 AI 系统

2023-01-18

也正在起诉微软、GitHub 和 OpenAI,该案涉及 AI 编程模型 CoPilot,起诉的理由与本案类似,只不过一个涉及艺术品生成,另一个涉及代码生成。 律师 Butterick 将此案描述为「朝着使人工智能对每个人都公平和道德的方向迈出的又一

2021-12-01

可模式,即 SSPL 1.0 和 Elastic 许可。二者都没有获得 OSI 的开源认证。  对此,开源社区非常不满。为 Elasticsearch 做出贡献的开发人员约有 1600 名,但除了谴责之外,无能为力。因为每一个贡献者在提交代码之前,都签署了

2023-09-18

一款 Unity 引擎游戏,你一般会认为除了订购 Unity 编辑器软件本身之外,你不会被收取额外的版税或其他费用。 如果你在周二开发了同一款游戏,你就会突然受到令人震惊的新条款的限制,在达到一定的单个游戏收入和安装阈

2022-01-17

业协会 RIAA 的诉求删除了 YouTube-DL 的代码,从而引发了开源界的争议。彼时,RIAA 引用了 DMCA 的反规避条款,声称该工具可用于从 YouTube 下载他们艺术家的音乐作品,违反了版权。 鉴于在美国没有什么支持性的案例,RIAA 参考

2023-06-11

GitHub 和 OpenAI 的最新投诉文件内容指出,GitHub 通过对其 Copilot 编程助手进行了细微调整,以避免一些版权指控。 具体表现为,为了回应公众对 Copilot 的批评,GitHub 在 2022 年 7 月推出了一个用户可调整的 Copilot 过滤器,名为"Sugg

2022-11-21

一年多之前,开源国际象棋引擎 Stockfish 发布公告称,他们已向国际象棋软件公司 ChessBase 发起诉讼。 据介绍,Stockfish 在德国版权法律师的支持,以及在开发社区的广泛支持下,在慕尼黑法院对 ChessBase 提起诉讼,要求对方执行

2022-07-02

" 据悉,造成 SFC 与 GitHub 决裂的关键因素是最近的 GitHub Copilot 普遍性可用事件。此前,SFC 并没有太在意这件事,因为他们认为前期的 Copilot 似乎更像是研究原型而不是产品。但当 GitHub 宣布 Copilot 是一个商业性的、盈利性的产

2023-05-30

纽约一名律师在一起法庭案件中因借助 ChatGPT 进行法律文献检索,而导致整个职业生涯面临危机。 据纽约时报消息称,该事件最初起源于一名男子因涉嫌人身伤害起诉航空公司的案件。在双方角力过程中,该男子的律师团队提

2024-10-19

2024年10月16日,第一届数字经济开源创新学术会议暨经管法高校开源创新教育论坛在上海对外经贸大学古北校区召开。此次会议是在党中央、国务院高度重视开源体系建设的背景下,上海开源信息技术协会在上海市经济和信息化

2024-05-09

己是土木工程专业毕业的,转行当程序员,现在51岁了,软件架构师,也算 半个程序员。我女儿现在读大一,已经表现出对编程序有浓厚兴趣。我元旦去她 学校看她,刚好遇到她为了交作业熬通宵写代码。我估计,她未来也会

2022-10-08

知他们,也没有给他们解释的机会。 VLC 是一款自由开源且免费的多媒体播放器及框架,负责维护 VLC 的 VideoLAN 基金会是非营利组织,项目目团队成员位于巴黎。 VideoLAN 基金会主席 Jean-Baptiste Kempf 表示,尽管印度政府封杀

2023-06-08

AI 整合到 Qt 中的方法,目前公布的初步成果是将 GitHub Copilot 接入他们的 Qt Creator 集成开发环境。 GitHub Copilot 集成将作为技术预览(而非正式的新功能)在 Qt Creator 11 中发布,在编写 C++/Qt 代码时, GitHub Copilot 能够提供 AI

2023-05-25

分值得开发者关注的亮点进行汇总。 微软推出 Windows Copilot 微软宣布在 Windows 11 中加入名为 Windows Copilot 的 AI 助手。这是一个集成在操作系统中的侧边栏工具,可以帮助用户完成各种任务,如内容摘要、重写、解释等。微软