AI 军备竞赛，Meta 推出全新大型语言模型

2023-02-28 發表於开源资讯

ChatGPT 持续火热，大型科技公司争先恐后地涌入 AI 军备竞赛中，这也为 AI 领域又带来了一个新的模型与潜在竞争对手 —— LLaMA。

LLaMA 语言模型全称为 "Large Language Model Meta AI"，是 Meta 近日公布的一个全新的大型语言模型（LLM），这是一个模型系列，根据参数规模进行了划分（分为 70 亿、130 亿、330 亿和 650 亿参数不等）。

值得注意的是，其中 LaMA-13B（130 亿参数的模型）尽管模型参数相比 OpenAI 的 GPT-3（1750 亿参数）要少了十几倍，但在性能上反而可以超过 GPT-3 模型。更小的模型也意味着开发者可以在 PC 甚至是智能手机等设备上本地运行类 ChatGPT 这样的 AI 助手，无需依赖数据中心这样的大规模设施。

项目成员 Guillaume Lample 表示：

与 Chinchilla、PaLM 或 GPT-3 不同，我们只使用公开的数据集，使我们的工作与开源兼容并可重现，而大多数现有模型依赖的数据要么不公开，要么没有记录。

目前 LLaMA 的一个精简版可在 GitHub 上找到，Meta 暂时还没有要公开发布完整模型和权重的计划。Meta 提供了一个登记页面，感兴趣的开发者可以申请登记，从而获得完整的代码和权重。

AI 军备竞赛，Meta 推出全新大型语言模型

相關推薦

苹果 WWDC 25 视觉智能 AI 升级开放，微美全息以多模态模型驱动场景革新提升竞争力

AI视野：百度开放文心4.0开发权限申请；腾讯混元大模型开放文生图功能；谷歌AI应用禁止生成受限内容；Midjourney新网站上线测试版

Meta 推迟发布旗舰级 AI 模型 Behemoth

互联网女皇” Mary Meeker 发布 340 页 AI 报告

Meta 开发了实时翻译闽南语的 AI

扎克伯克：Meta 明年投入更多工程和计算资源到 AI 领域

Meta 开源基于 Llama 2 的 AI 代码生成大模型：Code Llama

Meta 开源新的“多标记预测”语言模型

Meta 推出 SeamlessM4T，可转录和翻译近 100 种语言

Alluxio AI 全新产品发布：无缝对接低成本对象存储 AI 训练解决方案

Meta 开源 LlamaFirewall，面向 AI 智能体的安全框架

Meta 下周将发布两款小型的 Llama 3 模型

字节跳动推出 QuaDMix：大型语言模型预训练数据质量与多样性的统一框架

Llama 4 不是真开源，比 DeepSeek 格局差多了