英特尔开源其 Python NPU 加速库


英特尔已将其 NPU 加速库 (intel-npu-acceleration-library) 在 Apache-2.0 协议下开源。这是一个 Python 库,旨在利用英特尔神经处理单元 (NPU) 的强大功能在兼容硬件上执行高速计算,从而提高应用程序的效率。

该库目前正处于积极开发状态。为了显着提高库的性能,项目团队正在努力实现一系列关键功能。其中已实现的包括支持 8 位量化、Float16 支持、torch.compile 支持和 Static shape inference。计划实现的有:

  • 4 位量化和 GPTQ
  • NPU-Native 混合精度推理
  • BFloat16 (Brain Floating Point Format)
  • LLM MLP horizontal fusion 实现
  • MHA NPU 推理
  • NPU/GPU 异构计算
  • Paper

仓库页面上的 Python 代码示例还展示了在 NPU 上进行单矩阵乘法运算、为 NPU 编译模型,甚至在 NPU 上运行 Tiny-Llama 模型。

from intel_npu_acceleration_library.backend import MatMul import numpy as np inC, outC, batch = ... # Define your own values # Create both inputs X1 = np.random.uniform(-1, 1, (batch, inC)).astype(np.float16) X2 = np.random.uniform(-1, 1, (outC, inC)).astype(np.float16) mm = MatMul(inC, outC, batch, profile=False) result = mm.run(X1, X2)

更多详情可查看此处。


相關推薦

2022-11-23

还有许多其他候选开源加速器驱动程序正在开发中,例如英特尔 Meteor Lake 多功能处理单元、东芝 DNN Visconti、NVIDIA NVDLA、三星 Trinity NPU、英特尔 GNA、高通 QAIC 等。

2022-06-08

el 添加了 Softmax 参数 添加了音频语音识别样本(C++) 英特尔推理引擎后端(OpenVINO): 增加了对 OpenVINO 2022.1 版本的初步支持 删除了对传统 API 的支持(自 2020.3 起放弃) 更多详情可查看:https://github.com/opencv/opencv/wik

2023-05-18

计算库版本。Intel的MKL数学计算库,只支持x86,源代码不开源,并优先支持Intel处理器,同时在x86生态,MKL库的使用也最为广泛,原因主要是发展早,以及Intel处理器在高性能计算领域的市场占有率极高有关。华为的KML数学计算库

2023-10-26

度和虚拟机的隔离性,是一种安全的容器运行时,使用了英特尔 Clear Containers 和 Hyper.sh runV。Kata Containers 可与 Kubernetes 和 Docker 协同工作,同时支持多种硬件架构,包括 x86_64、AMD64、Arm、IBM p 系列和 IBM z 系列。 获得了谷歌云、

2022-05-26

微软方面还表示,其正在与 Python、node、git 和 LLVM 等一些开源项目合作,以实现原生 ARM 目标。 此外,微软还构建了一个用于制作 AI 应用程序的新跨平台开发模式,称为 Hyvrid Loop。此模式可以动态决定是在本地客户端还是在 Azu

2023-05-25

gz 等,增加这一支持是因为 Windows 11 现在使用了 libarchive 开源项目。 libarchive 是一个开源的 C 库,旨在为各种不同的压缩格式提供读取和写入支持。它支持许多常见的压缩格式,并提供了许多高级功能,例如加密、数字签名、

2022-09-29

化与上游 CPython 的兼容性。 Pyston 最初是由 Dropbox 开发的开源 Python 实现,并与 Python 高度兼容。Dropbox 几年前就已停止支持开发 Pyston,不过其开发团队一直在进行维护,并于去年加入了 Anaconda——继续他们对高性能 Python 的

2023-04-17

ows 笔记本电脑应该也可以使用。“我配备 AMDGPU 的 2019 年英特尔 MacBook 也能正常工作。当然,还有 NVIDIA GPU!我们的模型是 int4 量化的,大小是 4G,所以也不需要 64GB 的内存。6G 左右的地方应该就足够了。” 不过,Web LLM 团队也

2023-05-05

行并编写你自己的 Mojo 代码(链接),Mojo 未来也将保持开源。

2023-01-19

nux 视频加速 API 首个对 Windows 提供初始支持工作的版本。英特尔正在努力在 Windows 上公开 VA-API,以便更好地与他们的 oneAPI 软件堆栈兼容,使 oneVPL 视频处理与 VA-API 更加跨平台 此外, Libva 2.17.0 还提供 “with-legacy”构建

2022-11-26

此前我们报道了英特尔将 CPU 内购功能 (SDSI) 合并到 Linux 5.18 中,软件定义芯片 (software-defined silicon / SDSI) 是一种制造后机制,允许通过购买许可证激活额外的 CPU 功能。 如今英特尔正式推出了名为 On Demand 的内购功能,该功

2022-09-21

元。 除了带来最新款显卡以外,NVIDIA 还公布了一个新的开源项目 —— CV-CUDA。CV-CUDA 是一个用于构建加速的端到端计算机视觉和图像处理管道的开源库,可以更快、更高效地大规模处理图像。 如今大多数互联网流量来自于视

2022-05-20

实验性 API。 改进 CPU 性能:默认启用 oneDNN TensorFlow 与英特尔合作,将 oneDNN 性能库与 TensorFlow 整合在一起,以便在英特尔 CPU 上实现更好的性能。自 TensorFlow 2.5 以来,TensorFlow 对 oneDNN 有实验性的支持,它可以提供高达 4 倍的

2023-08-09

接口。 与此同时,结构上可兼容树莓派3B,并支持基于开源鸿蒙的Orange Pi OS(OH)操作系统。 外观上,Orange Pi 3B比四年前的Orange Pi 3更为小巧,仅为85mm x 56mm x 17mm。搭载瑞芯微RK3566的Orange Pi 3B集成了ARM Mali G52 2EE图形处理器,