Meta 推出不限定 GPU 的 AI 框架


到目前为止,人工智能推理引擎在很大程度上被束缚在它们所设计的特定硬件上。这样的硬件锁定意味着开发人员将需要为不同的硬件构建特定的软件,并且很可能也会减缓行业整体创新的步伐。

Meta 日前开源了一套新的 Python 框架,名为 AITemplate(AIT)。它彻底改变了上述情况,使开发者可以在不牺牲速度和性能的前提下使用不同厂商的 GPU。

AITemplate 能够提供高速的推理服务,最初将同时支持 Nvidia TensorCore 和 AMD MatrixCore 推理硬件,并且以 Apache 2.0 许可协议开放了 AITemplate 的源代码。

Meta 工程总监 Ajit Mathews 表示:"当前版本的 AIT 主要是支持 Nvidia 和 AMD 的 GPU,但该平台是可扩展的,如果有需要的话,将来还可以支持 Intel 的 GPU。现在我们已经开放了 AIT 的源代码,我们欢迎任何有兴趣的芯片供应商能够为它做出贡献。”

与 PyTorch 中的 Eager 模式相比,Meta 使用 AIT 在 Nvidia A100 AI GPU 上实现了高达 12 倍的性能提升,在 AMD M1250 GPU 上实现了高达 4 倍的性能提升。

Meta 主导的 AIT 在概念与 SYCL 十分相似,后者是一个基于 C++ 异构平行编程框架,可以用来加速高性能计算、机器学习、内嵌计算,以及在相当宽泛的处理器构架之上的计算量超大的桌面应用。但 Meta 在实现的内容上有所不同。SYCL 更接近于 GPU 编程层,而 AITemplate 则专注于高性能的 TensorCore/MatrixCore AI 基元。

Meta 的工作负载在不断发展,为了满足这些不断变化的需求,Meta 需要开放和高性能的解决方案,并且他们也倾向于希望其技术栈的上层能够与特定硬件无关。如今 AIT 通过支持 AMD 和 Nvidia 的 GPU 做到了这一点。

Ajit Mathews 还表示:“我们目前和未来的许多推理工作负载都有机会从 AIT 中受益,我们认为 AIT 有潜力作为性能最强的统一推理引擎被各大厂商广泛采用。”

 


相關推薦

2023-02-28

ChatGPT 持续火热,大型科技公司争先恐后地涌入 AI 军备竞赛中,这也为 AI 领域又带来了一个新的模型与潜在竞争对手 —— LLaMA。 LLaMA 语言模型全称为 "Large Language Model Meta AI",是 Meta 近日公布的一个全新的大型语言模型(LLM

2023-10-21

为一家承载各类数据驱动型工作负载的数据平台公司,现推出全新的 Alluxio Enterprise AI 高性能数据平台, 旨在满足人工智能 (AI) 和机器学习 (ML) 负载对于企业数据基础设施不断增长的需求。 Alluxio Enterprise AI 平台可综合优化企业 AI

2024-10-31

在不断优化,还与AI技术深度融合,例如Meta基于RISC-V架构推出AI推理加速器,高通与谷歌合作推出基于RISC-V架构的智能穿戴芯片等。 多元化应用:RISC-V正在加速落地生根,包括苹果、英特尔、高通等在内的芯片巨头纷纷投身RISC-

2023-10-28

智能模型 AudioCraft;语音生成人工智能模型 Voicebox。它还推出了 I-JEPA(一种可以像人类一样学习的计算机视觉模型)和 FACET(一种基准数据集,旨在帮助研究人员审核计算机视觉模型的偏差)。 延伸阅读 Meta AI 多语言阅读

2023-08-26

26 日「源创会」北京站,聊聊 AI 大模型与底层技术 >>> Meta 刚刚开源了号称是编程领域“最先进的大语言模型”——Code Llama,可根据代码和自然语言提示生成代码和有关代码的自然语言,支持多种主流编程语言,包括 Python、C+

2024-06-25

谈判尚未最终敲定,仍存在失败的可能性。在本月初宣布推出 Apple Intelligence 时,苹果曾宣布与 OpenAI 达成合作,将 ChatGPT 引入新版 Siri。苹果表示,如果与 OpenAI 以外的合作伙伴达成协议,客户可以选择除了苹果内部系统之外他

2023-08-19

根据 The Informaiton 的报道,Meta 正计划推出一款帮助开发人员自动生成代码的软件,名为 Code Llama。 据称 Code Llama 最早或在下周推出,这是一款开源软件,构建在 Llama 2 的基础之上。如果消息属实,Code Llama 将会对 Op

2023-08-25

创会」北京站,聊聊 AI 大模型与底层技术 >>> Meta 宣布推出 SeamlessM4T,一种基础的多语言和多任务模型,可以无缝翻译和转录语音和文本。SeamlessM4T 支持: 自动语音识别近百种语言 近 100 种输入和输出语言的语音到文

2024-07-25

今天凌晨,Meta 正式发布新一代开源大模型 Llama 3.1 系列,提供 8B、70B 及 405B  参数版本。 Llama 3 使用了超过 1.6 万个 H100 GPU、以及超过 15T token 的公开数据进行训练。 架构方面,该模型选择标准的仅解码器 transformer 模型架

2023-08-23

,AI大模型的研发层出不穷,不同种类的AI大模型也相继推出,由于其庞大的训练任务需要大量算力,以 GPU 为核心的算力供给已成为大模型产业发展的关键基础设施。在实际使用场景中,用户对于 GPU 资源的使用存在资源利用率

2023-09-05

Meta AI 宣布推出一款涵盖 122 种语言变体的多语言阅读理解数据集,名为 Belebele。“我们希望这项工作能够引发围绕 LLM 多语言性的新讨论”。 BELEBELE 是首个跨语言并行数据集,可以直接比较所有语言的模型性能。该数据集涵

2023-04-17

必须在特定类型的 GPU 上运行。 因此,Web LLM 项目的推出,是“为生态系统带来更多多样性的一步”。具体来说,通过实现将 LLM 直接 bake 到客户端并直接在浏览器中运行,可以为客户个人 AI 模型提供支持,从而降低成本、

2023-06-18

本和已有的旋律转化为完整乐曲。该模型基于谷歌 2017 年推出的 Transformer 模型。 研发团队表示:“我们使用了 20000 小时的授权音乐来对训练该模型,并采用 Meta 的 EnCodec 编码器将音频数据分解为更小的单元进行并行处理,进

2023-03-23

接向 AMD CEO  Lisa Su 汇报。Raja 领导了 RTG 的架构转型,推出了 Polaris、Vega 和 Navi 架构。 2017 年,英特尔从其竞争对手 AMD 手上挖走了 Raja,任命为该公司新成立的核心与视觉计算事业部的首席架构师和高级副总裁,重点负责为