1000 多名研究人员参与，BigScience 开源迄今最大规模语言模型

2022-07-16 發表於开源资讯

BigScience 的研究人员近日发布了一个名为 Bloom 的自然语言处理模型，该模型具有 1760 亿个参数，一举超越市面上的所有竞争对手，成为目前规模最大的语言模型。

该项目始于去年，由人工智能初创公司 Hugging Face Inc.（最近融资了 1 亿美元）与法国研究机构 CNRS 和 GENCI 合作，他们共同成立了一个名为 BigScience 的研究小组来领导 Bloom 的开发。该项目汇集了 70 多个国家/地区、250 多个机构、1000 多名研究人员参与开发。

语言模型的开发成本历来很高，以现在知名度很高的 GPT-3 为例，其成本高达 2760 万美元。这也是这类模型通常被牢牢掌握在微软、Meta、Google 和 OpenAI 等大型科技公司手中的原因。

除此之外，这类大型科技公司开发的语言模型在使用上也有一些限制条件，比如 OpenAI 开发的 GPT-3 并不开源；Meta 开发的 OPT-175B 虽然开源，但完整的模型只有在提出申请后才能获得，并且只能用于非商业用途。而 Bloom 就完全不同，并没有这些限制，任何个人或机构都可以免费获得 1760 亿个参数的完整模型。

Bloom 拥有 1760 亿个参数，一个人工智能系统包含的此类参数越多，它能够执行的任务就越高级。所以 Bloom 目前支持 46 种语言（包括中文）和 13 种编程语言，可以用来回答问题、翻译文本、从文件中提取信息片段，还能像 GitHub Copilot 一样用于生成代码。

BigScience 的研究人员使用巴黎附近的 Jean Zay 超级计算机对 Bloom 进行了训练。这台超级计算机配备了英伟达专为 AI 优化的显卡，其最高速度超过 28 petaflops，其中 1 petaflop 等于每秒 1 千万亿次的计算量。

在未来，该研究小组计划开发一个具有更先进功能的新版 Bloom。BigScience 还打算增加对更多语言的支持，优化人工智能，使其更容易在公司自己的基础设施上运行。除此之外，他么还会积极研究并消除这类模型对宗教、性别、种族和残障人士所怀有的偏见。

Bloom 项目的代码放在了 Hugging Face 的官网上（链接），并没有放在常见的 GitHub 等代码托管平台。

1000 多名研究人员参与，BigScience 开源迄今最大规模语言模型

相關推薦

开发者报告：Java 社区规模翻番，区块链技术未来可期

70 亿参数大语言模型 RedPajama 7B 完整版发布，开源可商用

彭博推出 BloombergGPT，金融领域的大型语言模型

中英双语多模态对话模型 LLaSM，李开复零一万物参与

OpenAI、谷歌微软等设立 1000 万美元 AI 安全基金

Mistral AI 发布 73 亿参数模型，“碾压” Llama 2 13B

Meta Llama 团队多名顶尖研究成员已出走

腾讯阿里参投，智谱 AI 完成 B-4 轮融资

智谱 AI：2023 年已完成超 25 亿元融资

统信软件宣布旗下 Deepin 社区全新规划：打造全球桌面系统根社区

CodeGeeX2-6B 开源，最低 6GB 显存，性能优于 StarCoder

Hugging News #0626: 音频课程更新、在线体验 baichuan-7B 模型

Siri 迄今为止最大的升级计划：“Linwood”和“Glenwood”亮相

OpenAI 宣布将开源推理模型