Databricks 开源 LLM，训练只需三个小时、30 美元

2023-03-28 發表於开源资讯

大数据分析公司 Databricks Inc 近日也加入了生成式 AI 领域的竞争之中，发布了一个名为 Dolly 的开源大型语言模型，将模型命名为 Dolly 是为了向第一只克隆羊多莉致敬。

像 ChatGPT 和 Bard 这样的生成式 AI，它们使用的数据通常来自于在成千上万不同网站，使用的数据量十分惊人，而且想要使用这些数据训练 AI 还需要数以千计的强大 GPU 在背后提供支持。

Databricks 希望通过开源 Dolly 及其训练数据，让任何人都能开发出一个真正像人类的 AI，而无需投资数百万美元，也让这类 AI 不再是只有大型科技公司才能负担得起的东西，数以百万计的小公司也将能够从中受益。

除此之外，让各个小公司构建自己的模型，而不将数据通过 API 发送给专有模型背后的服务提供商，也可以保护小公司的敏感数据和专有的知识产权。此外，一些公司可能在模型质量、成本和期望行为方面有不同的权衡，这些公司也可以根据需求调整模型。

Databricks 首席执行官 Ali Ghodsi 表示，Dolly 只需要非常少的数据和非常短的时间就能完成训练。

只需 30 美元、一台服务器和三个小时，我们就能教 Dolly 开始进行人类级别的交互。

Databricks 没有从头开始创建自己的模型，而是基于 EleutherAI 在 2021 年开源的自然语言处理模型 —— GPT-J。GPT-J 是一个基于 GPT-3，由 60 亿个参数组成的自然语言处理 AI 模型。该模型在一个 800GB 的开源文本数据集上进行训练，并且能够与类似规模的 GPT-3 模型相媲美。

Databricks 说，尽管模型小得多，只有 60 亿个参数，以及较小的数据集和训练时间（ChatGPT 的参数是 1750 亿个），但 Dolly 仍然表现出了 ChatGPT 所展示的同样的 "神奇的人类互动能力"。

Databricks 目前已经在 GitHub 上开源了一个简单的 Databricks notebook，开发者可以使用它在 Databricks 上自己构建 Dolly。

Databricks 开源 LLM，训练只需三个小时、30 美元

相關推薦

大数据巨头 Databricks 斥资 13 亿美元收购 MosaicML

摩尔线程开源音频理解大模型 MooER

Databricks 正洽谈以约 10 亿美元收购开源数据库初创公司 Neon

2023 年中程序员薪酬报告：OpenAI 以 92.5 万美元“空降”榜单

Databricks 官宣收购开源数据库引擎初创公司 Neon

Databricks 融资逾 5 亿美元，英伟达参投

Databricks 将融资 10 亿美元，估值达 1000 亿

BentoML 完成 900 万美元种子轮融资

2022 全球程序员薪酬报告：字节在榜，上海薪资近 9 万美元

Tilde AI 发布开源 TildeOpen LLM

微软开源“原生 1-bit”模型：超过 20 亿参数、大幅减少内存占用

AI 重塑千行百业华为云发布盘古大模型 3.0 和昇腾 AI 云服务

两行代码解决大语言模型对话局限！港中文贾佳亚团队联合 MIT 发布超长文本扩展技术

麻省理工利用 AI 技术迅速 15 世纪名画，仅需三个半小时