这几天 AI 领域热度不减、新闻层出不穷 —— Google 公布了 Bard、微软将 AI 集成进必应搜索和 Edge 浏览器、百度也公布类 ChatGPT 项目文心一言,近日 LAION 也开源了一个类 ChatGPT 项目 —— Open Assistant。
LAION 是一个德国非营利组织,这个名字你可能不太熟悉,但 Stable Diffusion 和 Imagen 这两个知名的「文本转图像」模型所使用的训练数据集就来自于 LAION,而该组织的目标就是「向公众提供大规模机器学习模型、数据集和相关代码」。
LAION 开发的类 ChatGPT 项目名为 Open-Assistant,这是一个 AI 聊天机器人项目,能够理解自然语言问题,可以与第三方系统交互并动态检索相关信息。该项目代码是用 Python 编写的,并在 Apache 2.0 许可下发布。
官方在项目愿景中写道:
我们不会止步于复制 ChatGPT。我们希望建立未来的助手,不仅能够写电子邮件和求职信,而且能够做有意义的工作,使用 API、动态研究信息等,并能够由任何人进行个性化定制和扩展。我们希望以一种开放和可访问的方式做到这一点,这意味着我们不仅要建立一个伟大的 AI 助手,而且要使它足够小和高效,能够在消费者硬件上运行。
正如开源项目 Stable Diffusion 的诞生,催生出了一大批文本转图像工具,预计 Open-Assistant 也同样会影响内容生成和自然语言查询的发展。
Open-Assistant 目前还处于研发的初期阶段,将会使用一个公开的语言模型和大量的数据集进行训练(训练数据也会公开),并正在参照现有研究将 RLHF 应用在大型语言模型中。
在未来,为了提高系统的效率,避免必须存储数十亿的预定义参数,该项目将使用一个动态更新的知识库,能够通过搜索引擎检索所需的信息。该项目还将提供工具,允许不受限制地使用准备好的模型,根据自己的喜好进行开发,并在其基础上创建应用程序和服务。
项目地址:https://github.com/LAION-AI/Open-Assistant