Meta 下周将发布两款小型的 Llama 3 模型

2024-04-10 發表於开源资讯

根据 The Information 的报道，Meta 计划在下周推出两款小型的 Llama 3 模型，为即将在今年夏季发布的正式版 Llama 3 模型预热。

Meta 相信，这两款小模型的发布有助于激发人们对于Llama 3 模型的兴趣。Meta希望Llama 3能赶上OpenAI的GPT-4，后者能根据用户上传到聊天机器人上的图片回答问题。正式版的Llama 3 将支持多模态，它将能够理解并生成文本和图像。相比之下，下周发布的两款小型机将不具备多模态功能。

一般而言，较小的模型成本更低，运行更快，尤其在运行大型模型成本高昂的当下，其价值尤为凸显。小型模型还便于开发者在移动设备上开发人工智能软件。

Meta 此前发布了三种 Llama 2 模型，其中最大的模型有 700 亿个参数，这些参数设置编码了模型在训练过程中的学习内容。另外两个模型分别有 130 亿个参数和 70 亿个参数。而最近几个月，Meta 公司的领导认为 Llama 2 在回答有争议的问题时过于保守，因此该公司生成 AI 部门的员工一直在努力让 Llama 3 更开放地回答有争议的问题。

据报道，Meta 或将会在今年7月之后发布正式版的Llama 3大模型，该版本的 Llama 3 可能拥有超过 1400 亿个参数。

相關推薦

欧洲 AI 创企发布"鸡脑"和"蝇脑"模型

2025-08-20

欧洲知名AI初创公司Multiverse Computing近日发布了两款极其微小的AI模型，小到可以用鸡脑和蝇脑来命名。该公司声称这是全球最小但仍保持高性能的模型，能够处理聊天、语音识别，其中一款甚至具备推理能力。这些超小型模型

研究：Meta Llama 3.1 能回忆《哈利波特》42% 的内容

2025-06-18

就被标记为 “已记住”。令人惊讶的是，Meta 于2024年发布的 Llama3.170B 模型在回忆《哈利波特》第一部的表现中，竟能记住42% 的内容。而相比之下，Meta 在2023年发布的 Llama165B 模型仅能回忆起 4.4% 的内容。研究人员还发现，

Meta 发布 Llama 3.2 多模态 AI 模型

2024-09-27

Meta 今天发布了 Llama 3.2 系列开源模型，其中包括小型和中型视觉 LLMs（11B 和 90B），以及适合边缘和移动设备的小型纯文本模型（1B 和 3B），包括预训练和指令调整版本。 LLaMA 3.2 支持同时处理文本、图像和视频，能够理解并生

Meta 将推出自动代码生成软件 Code Llama

2023-08-19

码的软件，名为 Code Llama。据称 Code Llama 最早或在下周推出，这是一款开源软件，构建在 Llama 2 的基础之上。如果消息属实，Code Llama 将会对 OpenAI 等公司构成挑战。目前尚不清楚 Code Llama 是否与 CodeCompose 有关。CodeCompose

Llama 4 不是真开源，比 DeepSeek 格局差多了

2025-04-08

可条款与真正的开源精神相去甚远。一、Meta的Llama 4发布与开源宣言马克·扎克伯格在Llama 4发布视频中充满热情地宣布："今天是Llama 4的日子。我们的目标是构建世界领先的AI，将其开源，并使其普遍可访问，让全世界都能

Meta 计划 7 月发布 Llama 3

2024-03-01

根据 The Information 的报道，Meta 计划在 7 月发布最新版本的大语言模型 —— Llama 3。 Meta 的一位员工透露，由于研究人员尚未开始对模型进行微调，因此公司尚未决定Llama 3是否是多模态的。Meta员工还说，Llama 3最高可能拥有超过1

Meta 发布新一代开源大模型 Llama 3.1

2024-07-25

今天凌晨，Meta 正式发布新一代开源大模型 Llama 3.1 系列，提供 8B、70B 及 405B 参数版本。 Llama 3 使用了超过 1.6 万个 H100 GPU、以及超过 15T token 的公开数据进行训练。架构方面，该模型选择标准的仅解码器 transformer 模型架

美国参议员就 LLaMA 模型泄露事件致函质询扎克伯格

2023-06-09

其他不法行为，从而造成伤害。因此在信中质询了 Meta 在发布 LLaMA 之前是如何评估的风险、采取了哪些措施来防止该模型被滥用，以及如何根据其不受限制的可用性更新政策和实践。 “Meta 发布了其高级 AI 模型 LLaMA，似乎没有

Meta Llama 模型下载量突破十亿

2025-03-20

为了进一步推动 Llama 的发展，Meta 计划在未来几个月内发布多个 Llama 模型，其中包括类似于 OpenAI 的 o3-mini 的 “推理” 模型，以及具备多模态能力的版本。扎克伯格还暗示可能会推出具有 “代理” 功能的模型，意味着某些模

马斯克宣布 Grok2 将于下周开源

2025-08-07

马斯克于8月6日通过社交媒体透露，他的人工智能公司 xAI 即将开源其新款 AI 模型 Grok2。马斯克表示:“现在是时候开源 Grok2了。” 这一消息无疑引发了广泛关注，期待的用户也纷纷表示期待这一模型的推出。 Grok2于2024年8月13日

Meta 正在构建新开源大模型，性能超越 Llama 2、比肩 GPT-4

2023-09-12

道，Meta 正在寻求在生成式 AI 领域与 OpenAI 展开竞争，将发布新的开源大模型，其性能或将与GPT-4 不相上下。报道称，这款新模型比 Llama 2 强大数倍，将提供文本、图像生成以及分析等功能。目前该模型正处于开发之中，最终

Meta 将发布商用版 LLaMA

2023-07-14

根据英国《金融时报》的报道，Meta 准备发布其人工智能模型 LLaMA 的商用版本，允许初创公司和企业在该技术的基础上构建定制软件。此举将使 Meta 与微软支持的 OpenAI 和谷歌展开竞争。今年早些时候，Meta 面向研究人员和学

Meta 组建新实验室牵头开发新版 Llama 大语言模型

2025-08-09

与Meta的其他人工智能团队合作开展各种项目，包括即将发布的模型、模型推理能力的扩展和人工智能代理的开发。新的Llama项目由Jack Rae领导，他是从谷歌聘请到TBD实验室的。Meta现有的Llama团队成员和TBD实验室正在合作开发这

扎克伯克：Meta 明年投入更多工程和计算资源到 AI 领域

2023-10-28

众所周知的最大贡献者之一。仅今年它就向人工智能社区发布了大量人工智能模型和训练数据集。其中包括针对编程任务优化的 Code Llama 大语言模型；可实现数百种语言通用按需翻译的 SeamlessM4T 模型；用于创作音乐和声音的生

熱門推薦