自由软件基金会 (FSF) 宣布开始关注机器学习(ML)应用的自由。该组织正在制定一份自由机器学习应用程序的标准声明,该声明将要求软件以及原始训练数据和相关脚本授予用户四项自由。
该声明由 FSF 董事会成员、员工和管理层组成的工作组负责,同时咨询了多位外部专家。在历经几个月的讨论后,工作组目前正在起草构成自由机器学习应用程序定义的确切文本。
免费 ML 应用程序中包含的所有软件都必须向每位用户提供定义自由软件的四项自由。这既适用于处理训练数据的软件,也适用于将模型参数解释为提示上下文以产生人类可用输出的软件。这是必要的,但还不够。此外,根据我们目前对 ML 应用程序的理解,我们认为,除非 ML 应用程序的所有训练数据和处理它的相关脚本都尊重所有用户并遵循四项自由,否则我们不能说 ML 应用程序“is free”。此外,授予用户四项自由可能会转化为一项要求,即 ML 应用程序的发布包括代表其训练的模型参数,并且允许用户使用和重新分发这些参数及其修改版本。
根据定义,如果机器学习应用程序不能向所有用户提供这四项自由,那么它们就是非自由的,即使它们的软件组件是自由的。
FSF 认为所有非自由软件对用户都是不公平的,因为它们剥夺了用户控制自己计算的自由。另一个问题是,所有非自由机器学习应用程序是否在道德上都是不公平的。一些非自由机器学习可能有正当的道德理由不发布训练数据,例如个人医疗数据。在这种情况下,我们会将整个应用程序描述为非自由的。但如果它能帮助你完成对社会至关重要的专业工作,例如诊断疾病或伤害,那么使用它在道德上是可以原谅的。要让 FSF 认为使用这种非自由机器学习应用程序是公正的,其组件软件必须是自由的,并且整个机器学习应用程序必须以合理灵活的形式和方式分发给用户,以支持增量训练或从头开始以不同的方式重新训练,或两者兼而有之。
目前相关内容尚在起草中,感兴趣的可以发送邮件参与讨论,associate members 则可加入 FSF member forum 进行讨论。