​Meta Llama 模型下载量突破十亿


Meta 发文宣布,旗下开源 AI 模型 Llama 已被下载超过 10 亿次。与2024年12月的6.5亿次下载相比,Llama 的下载量在短短三个月内激增了153%。

“开源 AI 对于确保世界各地的人们都能享受 AI 的好处至关重要,而 Llama 的每一次下载都让我们更接近这一目标。 ”

Meta 生成式人工智能副总裁 Ahmad Al-Dahle 称,在过去两年里,Llama 从一个研究项目发展成了最广泛使用的开源人工智能模型。Llama 的下载量代表了对开源人工智能的信任,也体现了大家共同构建未来的信念。

为了进一步推动 Llama 的发展,Meta 计划在未来几个月内发布多个 Llama 模型,其中包括类似于 OpenAI 的 o3-mini 的 “推理” 模型,以及具备多模态能力的版本。扎克伯格还暗示可能会推出具有 “代理” 功能的模型,意味着某些模型可能具备自主操作的能力。

去年10月,扎克伯格在公司第三季度财报电话会议上确认,Llama4将在2025年初发布。他对 Llama4的开发表示了更大的热情,并透露,Llama4的训练规模超过了100,000个 H100芯片,远远超出了其他公司目前已知的规模。


相關推薦

2024-07-25

Meta 在今天凌晨正式发布新一代开源大模型 Llama 3.1 系列。与此同时,Meta 创始人兼首席执行官马克·扎克伯格也发布了一封名为“Open Source AI Is the Path Forward”的公开信,描绘了 AI 发展的未来愿景。 他以闭源版 Unix 和开源 Linux

2024-07-25

今天凌晨,Meta 正式发布新一代开源大模型 Llama 3.1 系列,提供 8B、70B 及 405B  参数版本。 Llama 3 使用了超过 1.6 万个 H100 GPU、以及超过 15T token 的公开数据进行训练。 架构方面,该模型选择标准的仅解码器 transformer 模型架

2023-06-09

近日致信马克·扎克伯格 (Mark Zuckerberg),就 Meta 的大语言模型 LLaMA 泄露一事提出了质疑。 他们担忧该模型可能被滥用于垃圾邮件、欺诈、恶意软件、侵犯隐私、骚扰以及其他不法行为,从而造成伤害。因此在信中质询了 Meta 在

2022-07-08

为世界上大多数语言开发出高质量的机器翻译。 该 AI 模型名为 NLLB-200,可以翻译超过 200 种不同的语言。为了评估新模型的输出质量,Meta 创建了一个测试数据集,包括该模型所涵盖的每种语言的 3001 个句子对,每个句子都由

2024-04-10

Information 的报道,Meta 计划在下周推出两款小型的 Llama 3 模型,为即将在今年夏季发布的正式版 Llama 3 模型预热。 Meta 相信,这两款小模型的发布有助于激发人们对于Llama 3 模型的兴趣。Meta希望Llama 3能赶上OpenAI的GPT-4,后者能

2024-03-01

Information 的报道,Meta 计划在 7 月发布最新版本的大语言模型 —— Llama 3。 Meta 的一位员工透露,由于研究人员尚未开始对模型进行微调,因此公司尚未决定Llama 3是否是多模态的。Meta员工还说,Llama 3最高可能拥有超过1400亿个

2023-08-26

8 月 26 日「源创会」北京站,聊聊 AI 大模型与底层技术 >>> Meta 刚刚开源了号称是编程领域“最先进的大语言模型”——Code Llama,可根据代码和自然语言提示生成代码和有关代码的自然语言,支持多种主流编程语言,包括 Python

2024-07-06

今在 HuggingFace 上发布了使用这种方法完成代码的预训练模型。 “大型语言模型(例如 GPT 和 Llama)都是通过下一个标记预测损失进行训练。在这项工作中,我们认为训练语言模型同时预测多个未来标记会带来更高的样本效率

2023-09-12

求在生成式 AI 领域与 OpenAI 展开竞争,将发布新的开源大模型,其性能或将与GPT-4 不相上下。 报道称,这款新模型比 Llama 2 强大数倍,将提供文本、图像生成以及分析等功能。目前该模型正处于开发之中,最终功能尚不确定

2024-09-27

Meta 今天发布了 Llama 3.2 系列开源模型,其中包括小型和中型视觉 LLMs(11B 和 90B),以及适合边缘和移动设备的小型纯文本模型(1B 和 3B),包括预训练和指令调整版本。 LLaMA 3.2 支持同时处理文本、图像和视频,能够理解并生

2023-07-14

根据英国《金融时报》的报道,Meta 准备发布其人工智能模型 LLaMA 的商用版本,允许初创公司和企业在该技术的基础上构建定制软件。 此举将使 Meta 与微软支持的 OpenAI 和谷歌展开竞争。今年早些时候,Meta 面向研究人员和学

2023-10-28

转向从事AI工作。 上月曾报道过,Meta 正在构建新开源大模型,据称性能超越 Llama 2、比肩 GPT-4,最终目标是加速开发下一代生成式人工智能模型,使其能够生成更多类似人类的表达。 长期以来,Meta 一直在采用开源方法公开

2023-02-28

地涌入 AI 军备竞赛中,这也为 AI 领域又带来了一个新的模型与潜在竞争对手 —— LLaMA。 LLaMA 语言模型全称为 "Large Language Model Meta AI",是 Meta 近日公布的一个全新的大型语言模型(LLM),这是一个模型系列,根据参数规模进

2023-08-19

odeCompose 是 Meta 在 5 月份透露的内部 AI 编码助手。其编码模型是根据编程数据合法训练的,将避免其他人工智能编码助手出现的潜在版权问题。