Meta 宣布全球首个 1GW+ 能耗超级计算机集群即将上线


Meta 首席执行官马克·扎克伯格通过社交媒体宣布,公司正加速推进人工智能基础设施建设,计划上线全球首个功耗超过1吉瓦(GW)的超级计算机集群“Prometheus”,预计于2026年投入使用。同时,Meta 正在规划另一个名为“Hyperion”的超大规模集群,未来几年内功耗将达到5GW,规模堪比曼哈顿。

Meta 的“Prometheus”超级计算机集群被定位为全球首个功耗超过1吉瓦的 AI 算力基础设施。这一集群将搭载约130万块 NVIDIA H100GPU,预计提供超过2艾克萨(exaflops)的混合精度算力,远超 Meta 此前于2022年推出的 AI Research SuperCluster(RSC,约5exaflops)。

Prometheus 专为训练下一代大语言模型(如 Llama4)及通用人工智能(AGI)设计,目标是支持多模态 AI 任务,包括实时语音翻译、增强现实(AR)应用及元宇宙相关技术。

与传统超级计算机不同,Prometheus 采用 NVIDIA Quantum2InfiniBand 网络架构和 Grand Teton 硬件平台(Meta 贡献给开放计算项目 OCP 的设计),优化了 GPU 间的通信效率和数据中心能效。社交媒体上,开发者对 Prometheus 的规模表示震撼,称其“重新定义了 AI 算力的上限”。

除了 Prometheus,Meta 还透露正在规划“Hyperion”集群,预计功耗高达5GW,规模堪比一座小型城市。这一集群将进一步扩展 Meta 的 AI 基础设施,目标是支持更复杂的模型训练和推理任务。

有分析指出,Hyperion 的能耗相当于 xAI 30 万张 GPU 集群的 20 倍。xAI 近期宣布其 Memphis 超级计算机集群(约30万块 GPU)功耗在200-300兆瓦,而微软与 OpenAI 合作的 Stargate 项目计划投资超5000亿美元建设 AI 数据中心。

Hyperion 的具体细节尚未完全公开,但 Meta 表示,该集群将采用液冷技术和高性能网络架构,以应对大规模 AI 训练的散热和通信需求。此外,Meta 计划在2025年投资600-650亿美元用于数据中心建设和 AI 团队扩张,以确保算力与人才储备的同步增长。

Meta 强调,Prometheus 和 Hyperion 将延续其在开放计算(Open Compute Project)和 PyTorch 等开源生态中的承诺。集群设计基于 Grand Teton 平台,支持 RoCE 和 InfiniBand 两种网络架构,展示了 Meta 在硬件灵活性和可扩展性上的探索。

此外,Meta 承诺在数据隐私方面采取严格措施,集群将与互联网隔离,数据传输全程加密,以保护用户数据安全。

开发者对 Meta 的开源策略表示欢迎,认为这将进一步降低 AI 开发门槛。然而,也有用户指出,如此大规模的算力部署可能需要更透明的能源使用和碳排放报告,以回应公众对可持续性的关注。


相關推薦

2025-03-22

大关,跻身全球前五大超级计算中心。 此外,Dojo 2 超级计算机即将问世,其将比第一代 Dojo 超级计算机强大 10 倍。目前,Dojo 超级计算机已在纽约超级工厂投入运行,承担了特斯拉 5% 至 10% 的智能辅助驾驶训练数据量。 马斯

2025-06-05

re 1.0的正式发布标志着边缘计算领域的重要突破——这是全球首个原生支持Rust编程语言并通过SESIP(物联网安全评估标准)认证的安全边缘计算平台。本文将深入解析该平台的技术架构、安全特性及其对物联网生态的变革性影响。

2025-06-05

种被NIST选为后量子加密标准的技术,能够有效抵抗量子计算机的暴力破解。传统RSA加密在量子计算面前仅需数分钟即可被攻破,而格基加密的数学复杂性使其破解时间预估超过1000年。在边缘计算场景中,系统采用混合加密模式

2025-03-25

转载自 https://weibo.com/1727858283/PjZwSjy2I 阅读更多 计算机科学家吴恩达对“AI 将取代程序员”的看法 Anthropic CEO:未来 3-6 个月内,90% 的代码将由 AI 编写 未来三年,软件工程师或将转型为“AI 代码审核员” GitHub CEO:AI

2024-08-07

面操作系统,deepin 以其美观易用、安全可靠的特点深受全球用户的喜爱。在即将发布的新版本中,deepin V23 更是在用户体验、智能化应用及系统维护方面实现了质的飞跃,为全球开源爱好者及普通用户带来了前所未有的惊喜。 U

2025-06-13

bsp; 现如今,黄仁勋称,未来几年或至少下一代超级计算机中,它们中的每一个都将拥有连接到GPU的QPU(量子处理器),QPU将进行量子计算,而GPU将用于预处理、控制、纠错、后处理。    

2023-06-09

覆盖”,“做”了大量数字化升级: 做深基础:引入全球多个开源社区优势特性 做厚安全:提供CentOS安全接管高质量服务 做强生态:持续扩充生态兼容 做好服务:提供免费使用授权模式,可永久免费使用 ...... 在

2023-07-08

测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型,通过AI推理的方式,研究者只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。 华

2025-05-14

验室与新加坡南洋理工大学在安徽芜湖签约,标志着奇瑞全球开源计划首个海外协同创新中心落地。 开阳实验室是奇瑞打造的“没有围墙的研究院”,其以“科学-技术-产业”三位一体模式构建开放创新生态。此次合作中,双

2022-11-04

场景测试与真实业务场景的稳定性打磨。 云栖大会上被宣布正式上线的OceanBase 社区版 4.0与企业版拥有同等性能。测试环境最小支持2C8G,生产环境最小支持4C16G,在性能上有大幅提升。经测试,OceanBase 社区版 4.0在同等硬件环境

2025-03-29

。 五、未来演进方向        智碳EMS团队宣布2025年技术路线图:       1. 集成AI算法实现负荷预测(预计Q2发布)       2. 扩展建筑能耗空调与空压机节能模块       3. 构建开发者

2023-04-04

功耗更低。 Cerebras-GPT 在 Cerebras 所拥有的 Andromeda AI 超级计算机的 CS-2 系统上进行了几周的训练。“训练这七个模型使我们能够推导出新的 scaling law。Scaling laws 根据训练计算预算预测模型准确性,并在指导 AI 研究方面产生了巨

2023-06-17

来更好地满足开发者的需求。 今天我们很高兴地向大家宣布,Postcat.com 正式上线 AI 生成 API 的功能,并且是国内首个结合 AI + API 的产品! 本次更新,我们首先上线了自然语言生成 API 的功能,只需要通过语言描述需求,Pos

2025-04-12

落实一项计划,建设13家AI超级工厂。超级工厂内设超级计算机和数据中心。欧盟委员会主席乌尔苏拉·冯德莱恩2月11日在法国首都巴黎举行的AI行动峰会上宣布“投资AI”倡议,旨在调动2000亿欧元投资,以推动AI发展。根据这一