AMD 与 OpenAI 联合发布 AI 芯片:推理性能提升 35 倍


在刚刚结束的2025全球 AI 发展大会上,AMD 与 OpenAI 联合推出了最新的 Instinct MI400和 MI350系列 AI 芯片。这次发布会吸引了众多行业人士的关注,OpenAI 首席执行官 Sam Altman 也亲自出席,分享了与 AMD 在芯片研发过程中的合作经验。

强大的 AI 计算能力

AMD 新发布的 Instinct MI350系列 GPU 基于 CDNA4架构,专为现代 AI 基础设施设计。其中,MI350X 和 MI355X 两款 GPU 显著提升了 AI 计算性能。MI350系列配备288GB HBM3E 内存,内存带宽高达8TB/s,相较于上一代产品,AI 计算能力提升了4倍,推理性能更是提升了35倍。

与竞争对手英伟达的芯片相比,MI355X 每美元能提供多达40% 的额外 tokens,表现出色。MI355X 的 FP4性能可达到161PFLOPS,而 MI350X 在 FP16性能上可达到36.8PFLOPS,确保了在 AI 应用中的高效运行。

灵活的冷却与部署方案

AMD 的 GPU 设计不仅关注性能,还提供多种灵活的冷却配置,支持大规模部署。例如,在风冷机架中最多可以支持64个 GPU,而在直接液体冷却环境中则可支持多达128个 GPU,极大地增强了其应用的灵活性。

开源 AI 加速平台 ROCm7

为进一步提升 GPU 性能,AMD 还推出了开源 AI 加速平台 ROCm7。经过一年的发展,ROCm 现已成熟,并与多个世界领先的 AI 平台深度整合,如 LLaMA 和 DeepSeek。即将发布的 ROCm7版本将提供超过3.5倍的推理性能提升,为 AI 开发者提供了强大的技术支持。

下一代旗舰 AI 芯片 MI400

Instinct MI400系列是 AMD 下一代旗舰 AI 芯片,预计将搭载高达432GB 的 HBM4高速显存,内存带宽可达300GB/s。MI400在 FP4精度下的计算性能可达到40petaflops,专为 AI 训练中的低精度计算进行优化。此外,MI400系列通过 UALink 技术实现72个 GPU 的无缝互联,使其成为一个统一的计算单元,打破传统架构的通信瓶颈。

 多家企业的合作前景

目前,Oracle、微软、Meta、xAI 等多家企业正在与 AMD 合作使用其 AI 芯片,Oracle 将在其云基础设施中首批采用 Instinct MI355X 驱动的解决方案。Oracle 云基础设施执行副总裁 Mahesh Thiagarajan 表示,与 AMD 的合作极大提升了其服务的可扩展性和可靠性,未来将继续深化合作。


相關推薦

2024-11-01

OpenAI 公司正在与博通(Broadcom)及台积电(TSMC)合作,设计并制造首款用于支持其人工智能系统的自研芯片,OpenAI 希望借此减少对单一芯片供应商的依赖,分散其芯片供应,并满足 AI 模型对高计算需求的支持。 OpenAI 的原计

2025-06-14

球 AI 发展大会,介绍最新 AI 芯片和云基础硬件设备。 OpenAI 联合创始人兼首席执行官 Sam Altman 作为特邀嘉宾出席了本次大会,并与 ADM 联合发布了 Instinct MI400、Instinct MI350 系列超强 AI 芯片。尤其是在研发的过程中,OpenAI 一直为

2022-10-09

在我们已经开放了 AIT 的源代码,我们欢迎任何有兴趣的芯片供应商能够为它做出贡献。” 与 PyTorch 中的 Eager 模式相比,Meta 使用 AIT 在 Nvidia A100 AI GPU 上实现了高达 12 倍的性能提升,在 AMD M1250 GPU 上实现了高达 4 倍的性能提升

2025-06-09

双方的技术优势和资源,英特尔平台和MiniCPM 4.0系列模型联合解决方案的广泛应用和落地部署已经奠定了坚实的基础,有望在智能生活、生产力提升等多个场景中发挥关键作用。 展望未来,英特尔将继续与面壁智能保持紧密合

2025-04-09

接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,让

2025-06-06

生成等细分任务中,DeepSeek等开源模型已能在性能上直逼OpenAI等闭源模型,形成“性能差距逐步收敛”的新趋势。“中国与开源的崛起将AI竞争推向多极对抗的新时代,不再是巨头一家独大的游戏。” 核心观点:AI 变革速度颠覆

2025-04-08

有双子座系列此前各模型所具有的全部功能。 同一天,OpenAI也正式推出了基于GPT-4o模型的原生图像生成功能,能够直接从文本提示生成图像,同时支持多轮迭代优化图像时保持角色形象一致。 作为AI领域的新兴竞争者,DeepSeek3

2025-05-16

理模型的进展最快可能在一年内放缓。 近几个月来,OpenAI 的 o3 等推理模型在人工智能基准测试中取得了大幅提升,尤其是在衡量数学和编程技能的基准测试中。这些模型可以对问题进行更多计算,从而提高性能,但缺点是它

2025-03-26

I 硬件领域的竞争中面临压力。该公司推出的 Gaudi 加速器芯片在性能上未能赶上英伟达的 Hopper 和 AMD 的 Instinct 产品。英特尔目前已将 Falcon Shores 人工智能平台搁置,转而专注于下一代项目 “Jaguar Shores”。 盖尔辛格还提到,计

2024-10-31

为其嵌入式系统不可或缺的一部分。该公司强调了其提升芯片性能的努力,并透露了三星代工厂如何帮助客户利用 RISC-V 技术突破界限。 Google的RISC-V人工智能创新 Google DeepMind 也成为焦点,分享了基于 RISC-V 的人工智能加速器的

2025-05-01

Bench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。 MiMo推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动,包

2025-04-09

李飞飞联合斯坦福大学人工智能研究所(Stanford HAI)发布了《2025人工智能指数报告》(Artificial Intelligence Index Report 2025)。 报告于2025年4月7日发布,由来自学术界和产业界的跨学科专家组成的AI指数指导委员会主导编制。 该报

2025-05-09

模型的基础推理能力。 CCI 4.0数据集由智源研究院牵头,联合包括阿里云、上海人工智能实验室、华为、出门问问、金山办公、昆仑万维、面壁智能、奇虎科技、美团、稀宇科技、月之暗面、紫东太初、中科闻歌、科大讯飞等多

2025-04-17

月9日起,美国政府已通知英伟达,公司“对华特供版”AI芯片产品H20 GPU(人工智能加速计算处理器)出口至中国及D:5国家(包括中国大陆及香港、澳门等特别行政区、俄罗斯、朝鲜、叙利亚、伊朗等面临美国最严格出口管制的