英特尔开源其 Python NPU 加速库


英特尔已将其 NPU 加速库 (intel-npu-acceleration-library) 在 Apache-2.0 协议下开源。这是一个 Python 库,旨在利用英特尔神经处理单元 (NPU) 的强大功能在兼容硬件上执行高速计算,从而提高应用程序的效率。

该库目前正处于积极开发状态。为了显着提高库的性能,项目团队正在努力实现一系列关键功能。其中已实现的包括支持 8 位量化、Float16 支持、torch.compile 支持和 Static shape inference。计划实现的有:

  • 4 位量化和 GPTQ
  • NPU-Native 混合精度推理
  • BFloat16 (Brain Floating Point Format)
  • LLM MLP horizontal fusion 实现
  • MHA NPU 推理
  • NPU/GPU 异构计算
  • Paper

仓库页面上的 Python 代码示例还展示了在 NPU 上进行单矩阵乘法运算、为 NPU 编译模型,甚至在 NPU 上运行 Tiny-Llama 模型。

from intel_npu_acceleration_library.backend import MatMul import numpy as np inC, outC, batch = ... # Define your own values # Create both inputs X1 = np.random.uniform(-1, 1, (batch, inC)).astype(np.float16) X2 = np.random.uniform(-1, 1, (outC, inC)).astype(np.float16) mm = MatMul(inC, outC, batch, profile=False) result = mm.run(X1, X2)

更多详情可查看此处。


相關推薦

2022-11-23

还有许多其他候选开源加速器驱动程序正在开发中,例如英特尔 Meteor Lake 多功能处理单元、东芝 DNN Visconti、NVIDIA NVDLA、三星 Trinity NPU、英特尔 GNA、高通 QAIC 等。

2022-06-08

el 添加了 Softmax 参数 添加了音频语音识别样本(C++) 英特尔推理引擎后端(OpenVINO): 增加了对 OpenVINO 2022.1 版本的初步支持 删除了对传统 API 的支持(自 2020.3 起放弃) 更多详情可查看:https://github.com/opencv/opencv/wik

2023-10-26

度和虚拟机的隔离性,是一种安全的容器运行时,使用了英特尔 Clear Containers 和 Hyper.sh runV。Kata Containers 可与 Kubernetes 和 Docker 协同工作,同时支持多种硬件架构,包括 x86_64、AMD64、Arm、IBM p 系列和 IBM z 系列。 获得了谷歌云、

2023-05-18

计算库版本。Intel的MKL数学计算库,只支持x86,源代码不开源,并优先支持Intel处理器,同时在x86生态,MKL库的使用也最为广泛,原因主要是发展早,以及Intel处理器在高性能计算领域的市场占有率极高有关。华为的KML数学计算库

2024-08-10

。 阿里巴巴达摩院科技有限公司高级技术专家王云龙 英特尔(中国)有限公司开源技术总监杨继国带来《AI时代PC操作系统新机遇》主题分享。他表示,AI为Linux桌面带来前所未有的新机遇。英特尔正积极投身于这一变革浪潮

2022-05-26

微软方面还表示,其正在与 Python、node、git 和 LLVM 等一些开源项目合作,以实现原生 ARM 目标。 此外,微软还构建了一个用于制作 AI 应用程序的新跨平台开发模式,称为 Hyvrid Loop。此模式可以动态决定是在本地客户端还是在 Azu

2023-05-25

gz 等,增加这一支持是因为 Windows 11 现在使用了 libarchive 开源项目。 libarchive 是一个开源的 C 库,旨在为各种不同的压缩格式提供读取和写入支持。它支持许多常见的压缩格式,并提供了许多高级功能,例如加密、数字签名、

2024-10-15

CodeGeeX 团队技术负责人郑勤锴、vLLM 核心贡献者游凯超、英特尔软件与先进技术事业部高级软件工程师 张怀龙Huailong Zhang 等 13 位技术专家与核心贡献者,以塑造人工智能未来为主题进行主题演讲。 作为AI技术领域的新星,openMi

2023-04-17

ows 笔记本电脑应该也可以使用。“我配备 AMDGPU 的 2019 年英特尔 MacBook 也能正常工作。当然,还有 NVIDIA GPU!我们的模型是 int4 量化的,大小是 4G,所以也不需要 64GB 的内存。6G 左右的地方应该就足够了。” 不过,Web LLM 团队也

2024-10-31

的有力替代品。 值得注意的是,早在2023年,包括谷歌、英特尔、英伟达、高通、阿里等在内的13家企业就发起了全球RISC-V软件生态计划——RISE,旨在加速RISC-V的软件生态建设和应用商业化进程。 英伟达加速出货RISC-V GPU 近

2022-09-29

化与上游 CPython 的兼容性。 Pyston 最初是由 Dropbox 开发的开源 Python 实现,并与 Python 高度兼容。Dropbox 几年前就已停止支持开发 Pyston,不过其开发团队一直在进行维护,并于去年加入了 Anaconda——继续他们对高性能 Python 的

2023-05-05

行并编写你自己的 Mojo 代码(链接),Mojo 未来也将保持开源。

2023-01-19

nux 视频加速 API 首个对 Windows 提供初始支持工作的版本。英特尔正在努力在 Windows 上公开 VA-API,以便更好地与他们的 oneAPI 软件堆栈兼容,使 oneVPL 视频处理与 VA-API 更加跨平台 此外, Libva 2.17.0 还提供 “with-legacy”构建

2022-11-26

此前我们报道了英特尔将 CPU 内购功能 (SDSI) 合并到 Linux 5.18 中,软件定义芯片 (software-defined silicon / SDSI) 是一种制造后机制,允许通过购买许可证激活额外的 CPU 功能。 如今英特尔正式推出了名为 On Demand 的内购功能,该功