Apache 孵化项目被公然抄袭,开源世界真的会变得更好吗?


Apache StreamPark(incubating) 是一个流处理应用程序开发管理框架。初衷是让流处理更简单,旨在轻松构建和管理流处理应用程序,提供使用 Apache Flink 和 Apache Spark 等编写流处理应用程序的开发框架。同时,StreamPark 提供了一个流处理应用管理平台,核心能力包括但不限于流应用开发、调试、交互查询、部署、运维、实时数仓等。2021 年 4月 以 StreamX 为名进行开源,于 2022 年 8 月更名为 StreamPark,随后通过投票于 9 月 正式成为 Apache 开源软件基金会的孵化项目。

被抄袭侵权

前几天,有开发者跟我们反馈,有项目 copy StreamPark 的代码并且没有声明版权,起初我们不相信,以 Apache 项目的知名度和 Apache 开源协议的宽松程度一般不会有项目这么干,毕竟直接在代码中注明引用即可,协议对代码分发没有任何限制。带着疑惑和不解,我们在 GitHub 上找到了赤兔实时计算平台这一项目的主页以及代码,令人触目惊心的发现确实存在大量对 Apache StreamPark 代码的抄袭、并且所有引用代码的地方都删除了 Apache License 抬头,将 Apache License 2.0 协议修改成了 GPL 3.0

在这里列举了几个证据来证明这一点,每个读者可自行下载源码进行对比。

赤兔代码:
https://github.com/streamxhub/chitu-sdp

StremaPark:

https://github.com/apache/streampark

注:这里的赤兔代码是 fork 到我们仓库的,非原始仓库,原始仓库可自行查阅

   拷贝 StreamParm 源码的事实

在其 flink 模块中存在大量的 StreamPark 项目源码, 由于篇幅有限,这里只罗列部分内容的对比,我们先看 common模块, 可以看到目录结构如下:

接着我们随便打开几个文件进行源码对比:

对比后发现整个 common 模块代码全部来自 StreamPark只是更换了包名接着我们看 flink-submit 模块 :

我们再打开一个源码文件进行对比:

对比结果看到:除了部分包名和类名发生变化之外,源码部分基本都来自 StreamPark 。结论:整个 chitu-sdp-flink 模块下 80% 以上的代码都 copy 自 StreamPark。

  未声明来源

Apache 软件许可的软件允许对代码进行修改,但是代码在使用的过程中需要进行相关的声明。赤兔的开发团队更改了所有软包名称,删除了 Apache 软件基金会的抬头,在重新发行时没有保留 Apache 软件基金会和 Apache StreamPark 的 LICENSE(许可证)和 NOTICE(告知)文件。

此外,我们在对方的网站上和公众号等媒体平台也找不到任何关于使用 StreamPark 代码的版权的声明赤兔团队也从来未曾提及这部分代码来自 StreamPark。

   更改 License 再发行不合规

Apache StreamPark 使用的是 Apache-2.0 license 开源许可证,赤兔采用 GPL 3 开源许可。被 copy 的代码再次分发未保留 Apache License Header,则默认和项目的开源协议一致是 GPL 3.0 开源许可, 根据 Apache 2.0 License 的相关规定,这是明确禁止的, 不能将 Apache 2.0 许可证下的代码未经授权的情况下转换为另一种许可证。

以上事实证明赤兔实时平台违反了 Apache 2.0 许可证,没有尊重 Apache 软件基金会和 Apache StreamPark 的知识产权和品牌。

关于赤兔高调宣布开源

该团队不仅没有认识到侵权这一客观事实,反而高调的宣称项目开源,完全视开源协议为无物,不尊重他人付出。请问该团队在如此重要的大会上宣称开源的时候,是抱着什么心理?有对代码的敬畏吗?有对原作者的尊重吗?这份拿来主义换的荣耀您揣着踏实吗?

以下内容摘自赤兔官方公众号:

作为 O**** 开源合作方,跨越速运集团受邀参加其 3月25日 在北京举办的开源生态大会-O**** DevCon 。届时跨越速运集团高级架构师 ** 将作为受邀嘉宾与大家共同分享 《赤兔+ O**** 构建实时应用》 ,并同时宣布“赤兔”产品开源。

除此之外可以看到在其官方公众号里看到,该团队多次参加相关技术峰会,做主题演讲

以下内容摘自赤兔官方公众号:

赤兔实时计算平台已于3月25日的 O****e 开发者大会上,正式宣布开源,赤兔的开源,已经引起了业界的广泛关注。

为了让更多的开发者了解赤兔,赋能更多的企业用户,*** 老师将于4月1日再赴苏州,参加 Suzhou GDG “AIGC 与数据科学” 专场分享会,进一步向与会嘉宾、业界专家等分享赤兔实时计算平台的应用场景和使用方法,从而推动赤兔在企业中的落地及应用,拓展业界对跨越速运的品牌认知度。

这两年经常听到大家说软件改变世界,开源吞噬软件,从国家政策到各种形式的开源组织都在鼓励大家踊跃参与各种开源项目,这是好的,国内的开源发展一路狂飙。但是随之而来的代码抄袭,开源合规,知识产权等问题也随之而来,这些相关的意识是否同步跟上,是个值得讨论的问题我相信 StreamPark 不是第一个被侵权也不是最后一个,广大的开发者该如何维护自己的合法权益,也是我们不得不去面对的问题不知道针对这种拿着别人项目的源码,剔除声明,修改开源协议,参加行业峰会,呼吁大家积极加入的行为,大家如何看待?

我们的要求

Apache StreamPark(incubating)从最初的构想到开发出来,是开发者们用汗水换来的,而该项目也在我们的努力下被更多的人知道,有了更多的开发者加入,有了大量的企业去使用,有培训学校出了相关的教程逐渐获得了一些业内专业人士的认可和一些奖项,万万没想的是我们的项目面临被抄袭的困境,被非法侵权,针对赤兔这种侵权行为我们已经提出了相关意见并保留采用法律手段维权的权利

1.  copy 的源码必须遵守 Apache-2.0 license 的合规要求,保留 Apache-2.0 License Header,声明来源

2.  公开回应,并且道歉,消除影响,合规使用开源代码

最后我们想说:作为项目的维护团队,我们深知自己力量渺小更无意与大厂抗衡,只希望以我们的经历向大家切身说法,呼吁对开源协议和知识产权的保护,开源是因为热爱才诞生,技术也是因为开源才变的更好。身为每一个技术从业者的我们,更要坚守开源的底线才能让开源世界得到更好的发展。希望这类事件能少一些,原创项目多一些,真诚奉献多一些,不要寒了广大开发者的心,也败了自己的名。


相關推薦

2023-05-05

友们大家好: 关于近日 "赤兔" 实时计算平台违规使用 Apache  StreamPark (Incubating) 代码一事[1], 赤兔开发团队已经重新按照 Apache 的合规要求, 更新了相关代码, 并且公开在官网[2] 做出了道歉声明: 在 Github[3]

2023-02-03

Apache 软件基金会(ASF)孵化器于2022年12月03日,通过了 Apache Linkis 计算中间件项目的孵化毕业投票。2023年01月18日,Apache 软件基金会官方宣布 Apache Linkis 顺利毕业,成为 Apache 顶级项目(TLP)。 以上截图来自 Apache 官网

2023-02-07

2023年1月26日,Apache 软件基金会(ASF)官方宣布 Apache bRPC 正式毕业,成为 Apache 顶级项目(TLP)。                     以上截图来自Apache官网 Apache官网原文链接:https://news.apache.org/found

2022-09-10

p;月 1 号顺利通过投票,正式成为全球最大的开源基金会 Apache 软件基金会 (ASF) 的孵化项目。这是 StreamPark 项目的新起点,意味着开源社区化协作将会变得更加规范以及国际化。   什么是 StreamPark StreamPark 原名 Strea

2022-05-24

日,开源研发数据平台 DevLake 通过投票决议,正式成为 Apache 软件基金会 (ASF) 的孵化项目。 进入孵化器后,Apache DevLake 将遵循 The Apache Way[1],在导师们的引导下,坚持以人为本、社区高于代码的理念,持续建设包容、多元、

2024-02-15

CNCF 孵化项目。 Strimzi 专注于在 Kubernetes 上部署和运行 Apache Kafka 集群。Apache Kafka 是构建基于事件的微服务架构和实时数据流水线的领先平台,它在设计上具有水平可扩展性和容错性。在 Kubernetes 上运行 Apache Kafka 可能会很复杂

2023-03-28

Apache 软件基金会(ASF)孵化器于2023年2月15日,通过了 Apache EventMesh 项目的孵化毕业投票。2023年03月22日,Apache 软件基金会董事会通过了Apache EventMesh 毕业,成为 Apache 顶级项目(TLP)。  一、关于 Apache EventMesh Apache EventMesh

2022-01-21

的介绍,2002 年春天,Igor Sysoev 开始开发 NGINX。当时还是 Apache HTTP Server 占主导地位的时代,Igor Sysoev 观察到了互联网的飞速发展,他发现 Apache HTTP Server 处理连接的方式不能扩展,无法满足互联网不断发展的需求。因此他开始着

2023-08-22

学会托管的开源云原生可观测工具,最早由滴滴于 2020 年孵化并开源,并于 2022 年正式捐赠予中国计算机学会。夜莺采用 All-in-One 的设计理念,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,融入了

2023-10-18

情况。我被婉转地告知:“我们需要以这种方式实施这个项目。我知道这将需要多一个月的时间,但我需要以这种方式进行(以便在我的宣传包上看起来更好)。 马克·兰道夫是Netflix的联合创始人。 步骤二:引入不必要的,

2023-07-21

it 等两千家初创公司。 在公司成为口口相传的美国创业孵化器的同时,格雷厄姆也拥有了硅谷教父的称号。 下面是用 ChatGPT(GPT-4) 对《How To Do Great Work》的全文翻译: 如果你收集了很多不同领域做出伟大工作的技巧列表,

2022-07-21

点领域涌现了一批优质开源项目,部分开源项目已经从 Apache 软件基金会、CNCF 基金会等国际开源基金会成功毕业;此外,国内开源社区数量已超过 300 个,包括 OSCHINA 社区、CSDN 社区、Openl启智开源社区、openEuler 开源社区

2024-01-03

转换许可。但这一事件可能会鼓励用户更多地考虑开源和项目开放治理之间的区别,从而可能会加强基金会的作用。“当你选择依赖某个开源项目时,你可能会问自己这个问题。它是否只是开源,任何一家专有公司都可以随时打

2022-03-21

获益。 以下是一些最重要的开源项目背后的创新者: Apache Kafka:Jay Kreps、Neha Narkhede 和 Jun Rao 数据流可能听起来很枯燥和技术性,就像数字时代的管道。但是,随着公司需要从越来越多的来源摄取和处理越来越多的数据来进