Meta 推迟发布旗舰级 AI 模型 Behemoth


根据《华尔街日报》的独家报道,Meta 推迟了其旗舰级 AI 模型 Behemoth 的发布计划,因为担心它可能不足以超越之前的模型。

报道称,《Behemoth》预计将于秋季甚至更晚发布。它原定于上个月与 Meta 的 Llamacon 活动同时发布,后来被推迟到六月。该公司也有可能加快 Behemoth 的有限发布速度。

Meta 在其人工智能项目上投入了数百亿美元,直到最近,它才取得了快速进展,赶上了谷歌和 OpenAI 等竞争对手。Meta 的失望反映了人工智能行业内部更广泛的担忧,即依赖于扩大模型的进步可能会陷入停滞。

OpenAI在推出 GPT 4.0 之后的一体化下一代大型模型方面面临着诸多障碍。因此,这家 ChatGPT 开发者推出了一系列独立的模型,其中一些专注于推理,另一些专注于编码和技术工作。据报道,谷歌和 Anthropic在最近训练最大模型的努力中也遇到了挫折。


相關推薦

2025-07-16

大战略转变,放弃公司强大的下一代开源人工智能模型 Behemoth,转而开发一个封闭模型。 据悉,Meta 已完成 Behemoth 模型的训练,但因内部性能测试不佳而推迟发布,其测试工作在新实验室启动后也已暂停。若 Meta 最终选择放弃

2025-05-28

失外,Meta 还面临多重压力。内部方面,其最大 AI 模型 Behemoth 开发进度滞后,而最新发布的 Llama 4 模型在开发者社区反响平淡;外部方面,公司深陷法律纠纷,一场关于 Meta AI 版权的诉讼指控其 Llama 模型使用了盗版书籍数据集

2025-04-08

模型: Llama 4 Reasoning - 预计在下个月有更多消息 Llama 4 Behemoth - 扎克伯格描述为"巨大",超过2万亿参数,"我不知道有人在训练更大的模型",据称已经是"世界上性能最高的基础模型",而且"甚至还没有完成训练" 扎克伯格对Llama

2025-04-11

中,Llama-3.1-Nemotron-Ultra-253B-v1 优于 Meta 最新发布的 Llama 4 Behemoth 和 Llama 4 Maverick。

2024-07-26

继 Meta 昨天发布最强开源大模型 Llama 3.1 后,法国 AI 初创公司 Mistral AI 也加入了竞争,今天发布了全新的旗舰开源模型 Mistral Large 2。 该模型拥有 1230 亿个参数,可在单个 H100 节点上以高吞吐量运行,在代码生成、数学

2025-04-11

根据维深信息 Wellsenn XR 的独家报道,阿里已经确定了 AI 智能眼镜项目方案,目前正在积极招聘和扩充团队。 据了解,阿里 AI 智能眼镜主要由智能信息事业群旗下的天猫精灵团队负责,硬件规格将超越目前火爆的 Ray-Ban Meta 智

2023-03-02

,涉及数据、算法、算力及训练基础设施等。智源研究院发布的FlagOpen大模型技术开源体系,是智源及上下游生态合作机构联合开展技术攻关的成果展现,为大模型技术创新提供了“北京贡献”。同时,他对于大模型的发展提出

2025-05-10

tps://meta-llama.github.io/PurpleLlama/LlamaFirewall/ 随着大型语言模型(LLMs)嵌入 AI 智能体并被广泛应用于高权限场景,安全隐患随之增加。这些智能体可以读取邮件、生成代码、调用 API,一旦被恶意利用,后果不堪设想。 传统的安

2025-03-21

、OpenAI 和 Anthropic 等科技巨头已经在使用合成数据来训练旗舰人工智能模型,因为他们已经耗尽了真实世界的数据源。

2024-06-06

圳南山区举行。活动现场,大湾区首个专注大模型领域的旗舰孵化器——深圳“模力营”AI生态社区揭牌,首批11家人工智能企业签约入驻“模力营”。 深圳“模力营”AI生态社区是粤港澳大湾区首个垂直领域大模型生态系统,

2025-06-06

的原因。由于中美之间“日益加剧的政治不确定性”,CAC推迟了申请审批。 今年4月,特朗普大幅提高了对中国进口商品的关税,税率高达145%。苹果公司获得了部分关税豁免,关税随后暂停90天。但由于中美未能达成协议,贸易

2025-06-14

I 联合推出了最新的 Instinct MI400和 MI350系列 AI 芯片。这次发布会吸引了众多行业人士的关注,OpenAI 首席执行官 Sam Altman 也亲自出席,分享了与 AMD 在芯片研发过程中的合作经验。 强大的 AI 计算能力 AMD 新发布的 Instinct MI350系

2025-06-28

根据《The Information》的报道,DeepSeek 工程师在过去几个月一直致力于完善 R2 模型,但梁文锋对 R2 现在的性能还不满意,工程师团队仍在全力优化和打磨,发布时间待定。梁文峰要求模型达到更出色的结果才批准发布。 此外,

2023-10-28

众所周知的最大贡献者之一。仅今年它就向人工智能社区发布了大量人工智能模型和训练数据集。其中包括针对编程任务优化的 Code Llama 大语言模型; 可实现数百种语言通用按需翻译的 SeamlessM4T 模型; 用于创作音乐和声音的生