Meta 计划 7 月发布 Llama 3


根据 The Information 的报道,Meta 计划在 7 月发布最新版本的大语言模型 —— Llama 3。

Meta 的一位员工透露,由于研究人员尚未开始对模型进行微调,因此公司尚未决定Llama 3是否是多模态的。Meta员工还说,Llama 3最高可能拥有超过1400亿个参数,相比之下,去年7月发布的Llama 2的参数最高为700亿。

参数数量越多,通常意味着模型能提供的结果越精确,不过较小的模型可能在处理速度上更有优势。Llama 3正在由Meta旗下的独立基础人工智能研究团队(FAIR)以外的生成人工智能团队开发。

理论上,Llama 3将拥有更强大的语义理解能力,能够准确辨别一个单词在不同上下文中的多重含义。例如,Llama 3可能会理解英文“kill a vehicle’s engine”(关闭机动车的发动机)中的“kill”是指“关闭”,而非“杀害”。

据悉,Meta计划在未来几周内为Llama 3分配专门负责语气和安全培训的内部人员,以提升模型的反应灵敏度和精确度。尽管计划在7月发布Llama 3,但发布时间表仍可能调整。作为一款开源大语言模型,Llama 3不仅将支持Meta旗下的人工智能助手,还将向外部开发者免费提供,以便他们开发自己的聊天机器人。

Llama作为Meta人工智能战略的核心,对公司具有重大意义。Meta希望通过人工智能技术提升其广告工具的效果,并增强社交媒体平台的吸引力。本月早些时候,Meta首席执行官马克·扎克伯格(Mark Zuckerberg)向投资者表示,今年的重点包括推出Llama 3和“扩展Meta人工智能助手的实用性”。


相關推薦

2024-04-10

根据 The Information 的报道,Meta 计划在下周推出两款小型的 Llama 3 模型,为即将在今年夏季发布的正式版 Llama 3 模型预热。 Meta 相信,这两款小模型的发布有助于激发人们对于Llama 3 模型的兴趣。Meta希望Llama 3能赶上OpenAI的GPT-4,

2023-06-09

害。 重要的是要更好地了解 Meta 如何评估此风险以及它计划在此事后做出哪些改变。 更多详情可查看此文件。 延伸阅读: 被泄露的大语言模型 LLaMA,助长了一系列 ChatGPT 开源替代品 被 “开源” 的 LLaMA 成最大赢家

2023-08-19

根据 The Informaiton 的报道,Meta 正计划推出一款帮助开发人员自动生成代码的软件,名为 Code Llama。 据称 Code Llama 最早或在下周推出,这是一款开源软件,构建在 Llama 2 的基础之上。如果消息属实,Code Llama 将会对 Op

2023-02-28

Hub 上找到,Meta 暂时还没有要公开发布完整模型和权重的计划。Meta 提供了一个登记页面,感兴趣的开发者可以申请登记,从而获得完整的代码和权重。

2023-08-26

ode Llama 完全免费,可用于研究和商业用途,并已在 GitHub 发布:https://github.com/facebookresearch/codellama。 Code Llama 基于 Llama 2 大语言模型打造,提供了三种模型: Code Llama - 基础代码模型 Code Llama - Python - 专门针对 Python 进行优

2023-10-28

众所周知的最大贡献者之一。仅今年它就向人工智能社区发布了大量人工智能模型和训练数据集。其中包括针对编程任务优化的 Code Llama 大语言模型; 可实现数百种语言通用按需翻译的 SeamlessM4T 模型; 用于创作音乐和声音的生

2023-07-14

根据英国《金融时报》的报道,Meta 准备发布其人工智能模型 LLaMA 的商用版本,允许初创公司和企业在该技术的基础上构建定制软件。 此举将使 Meta 与微软支持的 OpenAI 和谷歌展开竞争。今年早些时候,Meta 面向研究人员和学

2023-09-12

道,Meta 正在寻求在生成式 AI 领域与 OpenAI 展开竞争,将发布新的开源大模型,其性能或将与GPT-4 不相上下。 报道称,这款新模型比 Llama 2 强大数倍,将提供文本、图像生成以及分析等功能。目前该模型正处于开发之中,最终

2023-07-27

基于 Llama 2 的全新跨语言对话模型。 Llama 2 是 Meta 最新发布的模型基座,它的数据比前一代模型更为充分,且对月活7亿以下的商用予以支持。这意味着,更多的公司和团队可以使用这个模型进行商业开发,推动各类应用的普及

2023-09-13

Meta 前工程师,他此前将 GitHub 上火热的纯 C 语言实现的llama2.c项目移植到了 Python ——llama2.py。 上周 Mojo 编程语言正式开放下载,并且声称比 Python 快 68000 倍。 于是 Aydyn Tairov 马不停蹄地就开始将llama2.py移植到 Mojo——

2023-10-26

macOS 和 Linux 上本地运行 Llama 2、Code Llama 和其他模型,并计划支持 Windows。Ollama 目前支持近二十多个语言模型系列,每个模型系列都有许多可用的"tags"。Tags 是模型的变体,这些模型使用不同的微调方法以不同的规模进行训

2023-04-04

细节仍不清楚,阻碍了该领域的研究和开源创新。受 Meta LLaMA 和 Stanford Alpaca 项目的启发,来自加州大学伯克利分校、CMU、斯坦福大学和加州大学圣地亚哥分校的成员,共同推出了一个 Vicuna-13B 开源聊天机器人,由增强的数据集

2023-09-30

口为 4k 的情况下,速度提高了 2 倍。” 此外,该公司还计划在这项工作的基础上发布一个更大的模型,能够更好地推理并支持多种语言,预计将于 2024 年亮相。 更多详情可查看官方公告。

2023-08-24

模型,包括流行的开源大语言模型,比如 Meta Platforms 的 Llama 2。 据报道,Salesforce 这次领投表明它可能将 Hugging Face 视为潜在收购对象。今年 6 月,Salesforce 宣布推出一套人工智能产品 AI Cloud,让企业客户可以使用 Anthropic、OpenAI