Meta 开源基于 Llama 2 的 AI 代码生成大模型:Code Llama


8 月 26 日「源创会」北京站,聊聊 AI 大模型与底层技术 >>>

Meta 刚刚开源了号称是编程领域“最先进的大语言模型”——Code Llama,可根据代码和自然语言提示生成代码和有关代码的自然语言,支持多种主流编程语言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash

Code Llama 完全免费,可用于研究和商业用途,并已在 GitHub 发布:https://github.com/facebookresearch/codellama。

Code Llama 基于 Llama 2 大语言模型打造,提供了三种模型:

  • Code Llama - 基础代码模型
  • Code Llama - Python - 专门针对 Python 进行优化
  • Code Llama - Instruct - 专门用于理解自然语言指令

它们具有开放式模型中领先的性能、填充能力、对大型输入上下文的支持以及用于编程任务的零指令跟随能力。所有模型都是基于 16k 标记序列进行训练,并在最多 100k 标记输入上显示出改进。

运行示例

  • 根据自然语言生成代码

  • 解释代码功能/结构

Code Llama 提供了三种不同大小的模型,分别具有 7B、13B 和 34B 参数,可以用于代码补全和调试。每个模型都使用 500B 代码 tokens 和代码相关数据进行训练,此外 7B 和 13B 基础模型和指令模型经过了中间填充 (FIM) 功能的训练,支持在现有代码中插入代码的功能。

Meta 表示这三种不同大小模型满足了不同的服务和延迟要求。例如,7B 模型可以在单个 GPU 上运行。 34B 模型返回最佳结果并提供更好的编码辅助,但较小的 7B 和 13B 模型速度更快,更适合需要低延迟的任务,例如实时代码补全。

根据 Meta 提供的数据,Code Llama 在流行的编码基准测试 HumanEval 和 Mostly Basic Python Programming (MBPP)上的性能优于现有解决方案,并与 ChatGPT 相当。


相關推薦

2023-10-28

Belebele,涵盖 122 种语言变体 Meta 开源基于 Llama 2 的 AI 代码生成大模型:Code Llama Meta 推出 SeamlessM4T,可转录和翻译近 100 种语言 Meta 发布开源 AI 工具 AudioCraft,文本自动生成音乐 Meta 放大招:发布开源大语言模型 Llama 2

2023-09-12

正在寻求在生成式 AI 领域与 OpenAI 展开竞争,将发布新的开源大模型,其性能或将与GPT-4 不相上下。 报道称,这款新模型比 Llama 2 强大数倍,将提供文本、图像生成以及分析等功能。目前该模型正处于开发之中,最终功能尚

2023-06-09

在面向公众开放的短时间里,都经历了危险地滥用 —— 开源模型则进一步加剧了这种风险。” 信中还举例指责了 Meta 在审查方面的缺失:当被要求“写一张纸条,假装是某人的儿子,向他要钱以摆脱困境”时,OpenAI 的 ChatGPT

2023-08-19

根据 The Informaiton 的报道,Meta 正计划推出一款帮助开发人员自动生成代码的软件,名为 Code Llama。 据称 Code Llama 最早或在下周推出,这是一款开源软件,构建在 Llama 2 的基础之上。如果消息属实,Code Llama 将会对 Op

2024-04-10

Information 的报道,Meta 计划在下周推出两款小型的 Llama 3 模型,为即将在今年夏季发布的正式版 Llama 3 模型预热。 Meta 相信,这两款小模型的发布有助于激发人们对于Llama 3 模型的兴趣。Meta希望Llama 3能赶上OpenAI的GPT-4,后者能

2024-03-01

划在7月发布Llama 3,但发布时间表仍可能调整。作为一款开源大语言模型,Llama 3不仅将支持Meta旗下的人工智能助手,还将向外部开发者免费提供,以便他们开发自己的聊天机器人。 Llama作为Meta人工智能战略的核心,对公司具有

2023-07-27

OpenBuddy-LLaMA2-13B 是一个基于 Llama 2 的全新跨语言对话模型。 Llama 2 是 Meta 最新发布的模型基座,它的数据比前一代模型更为充分,且对月活7亿以下的商用予以支持。这意味着,更多的公司和团队可以使用这个模型进行商业开发

2023-02-28

GPT-3 不同,我们只使用公开的数据集,使我们的工作与开源兼容并可重现,而大多数现有模型依赖的数据要么不公开,要么没有记录。 目前 LLaMA 的一个精简版可在 GitHub 上找到,Meta 暂时还没有要公开发布完整模型和权重的

2023-10-26

InfoWorld 公布了 2023 年最佳开源软件榜单,旨在表彰年度领先的软件开发、数据管理、分析、人工智能和机器学习开源工具。 InfoWorld 是致力于引领 IT 决策者走在科技前沿的国际科技媒体品牌,每年 InfoWorld 都会根据软件对开源

2023-07-14

根据英国《金融时报》的报道,Meta 准备发布其人工智能模型 LLaMA 的商用版本,允许初创公司和企业在该技术的基础上构建定制软件。 此举将使 Meta 与微软支持的 OpenAI 和谷歌展开竞争。今年早些时候,Meta 面向研究人员和学

2023-09-30

为止同规模产品中最强大的语言模型;在 Apache-2.0 许可下开源,可完全免费使用,不受任何限制。 Mistral AI 是一个成立仅六个月的初创公司,于 6 月份筹集了 1.18 亿美元的巨额种子轮资金,据称是欧洲历史上最大的种子轮融资

2023-10-19

【源创会预告】1024 程序员节(的前两天),相约开源PHP办公室,我们一起聊 AI!>>> 英伟达发布了 Windows 版本的 TensorRT-LLM 库,称其将大模型在 RTX 上的运行速度提升 4 倍。 GeForce RTX 和 NVIDIA RTX GPU 配备了名为 Tensor Core 的专用

2023-09-27

IOS 版本恢复上架啦,看这里 喜大普奔,开源 AI 聊天、绘图软件 AIdea 终于在 Apple Store 恢复上架了。 大约在 4 周前,我发布了 花了小半年开发了一个 AI 套壳 APP,然而大势已过,直接开源了 这篇文章,将开发了近半年的 APP

2023-06-10

其 RedPajama 7B 已完成所有训练,并在 Apache 2.0 许可下全部开源。 RedPajama 是一个开源可商用大模型项目,由 TOGETHER 联合蒙特利尔大学的 AAI CERC 实验室、EleutherAI 和 LAION 共同发起。目前包括一个基于 LLaMA 论文的 RedPajama 基础数据