英特尔开源其 Python NPU 加速库

2024-03-04 發表於开源资讯

英特尔已将其 NPU 加速库 (intel-npu-acceleration-library) 在 Apache-2.0 协议下开源。这是一个 Python 库，旨在利用英特尔神经处理单元 (NPU) 的强大功能在兼容硬件上执行高速计算，从而提高应用程序的效率。

该库目前正处于积极开发状态。为了显着提高库的性能，项目团队正在努力实现一系列关键功能。其中已实现的包括支持 8 位量化、Float16 支持、torch.compile 支持和 Static shape inference。计划实现的有：

4 位量化和 GPTQ
NPU-Native 混合精度推理
BFloat16 (Brain Floating Point Format)
LLM MLP horizontal fusion 实现
MHA NPU 推理
NPU/GPU 异构计算
Paper

仓库页面上的 Python 代码示例还展示了在 NPU 上进行单矩阵乘法运算、为 NPU 编译模型，甚至在 NPU 上运行 Tiny-Llama 模型。

from intel_npu_acceleration_library.backend import MatMul import numpy as np inC, outC, batch = ... # Define your own values # Create both inputs X1 = np.random.uniform(-1, 1, (batch, inC)).astype(np.float16) X2 = np.random.uniform(-1, 1, (outC, inC)).astype(np.float16) mm = MatMul(inC, outC, batch, profile=False) result = mm.run(X1, X2)

更多详情可查看此处。

相關推薦

Linux 6.2 已准备好引入计算加速器子系统

2022-11-23

还有许多其他候选开源加速器驱动程序正在开发中，例如英特尔 Meteor Lake 多功能处理单元、东芝 DNN Visconti、NVIDIA NVDLA、三星 Trinity NPU、英特尔 GNA、高通 QAIC 等。

AI PC 新突破端侧首次支持 128K 上下文窗口实现 2.2 倍推理优化

2025-06-09

，实现了端侧可落地的系统级软硬件稀疏化的高效创新。英特尔与面壁智能从模型开发阶段就紧密合作，实现了长短文本多重推理效率的提升，端侧AI PC在Day 0全面适配，128K长上下文窗口等多方面突破。双方开展了深度技术协

布局个人 AI 市场，AMD 考虑向 PC 用户推出独立 NPU 方案

2025-08-01

Rahul Tikoo向外媒 CRN透露，他们正在与客户洽谈一款专用的加速芯片的使用范例和潜在市场，这芯片不是GPU，而是NPU。实际上联想、戴尔和惠普等OEM厂商也正在开始探索独立的NPU核其他类似的加速芯片，作为PC中AI工作负载GPU的代

OpenCV 4.6 发布，Intel 开源的计算机视觉库

2022-06-08

el 添加了 Softmax 参数添加了音频语音识别样本（C++）英特尔推理引擎后端（OpenVINO）：增加了对 OpenVINO 2022.1 版本的初步支持删除了对传统 API 的支持（自 2020.3 起放弃）更多详情可查看：https://github.com/opencv/opencv/wik

InfoWorld 公布 2023 年最佳开源软件

2023-10-26

度和虚拟机的隔离性，是一种安全的容器运行时，使用了英特尔 Clear Containers 和 Hyper.sh runV。Kata Containers 可与 Kubernetes 和 Docker 协同工作，同时支持多种硬件架构，包括 x86_64、AMD64、Arm、IBM p 系列和 IBM z 系列。获得了谷歌云、

PerfMPL 国产高性能数学计算库的进展

2023-05-18

计算库版本。Intel的MKL数学计算库，只支持x86，源代码不开源，并优先支持Intel处理器，同时在x86生态，MKL库的使用也最为广泛，原因主要是发展早，以及Intel处理器在高性能计算领域的市场占有率极高有关。华为的KML数学计算库

2024 中国操作系统产业大会 — openKylin 开源创新论坛成功举办

2024-08-10

。阿里巴巴达摩院科技有限公司高级技术专家王云龙英特尔（中国）有限公司开源技术总监杨继国带来《AI时代PC操作系统新机遇》主题分享。他表示，AI为Linux桌面带来前所未有的新机遇。英特尔正积极投身于这一变革浪潮

微软将推出微型 Arm PC 和原生 Arm64 Visual Studio

2022-05-26

微软方面还表示，其正在与 Python、node、git 和 LLVM 等一些开源项目合作，以实现原生 ARM 目标。此外，微软还构建了一个用于制作 AI 应用程序的新跨平台开发模式，称为 Hyvrid Loop。此模式可以动态决定是在本地客户端还是在 Azu

Build 2023 亮点：Windows 原生支持 rar 格式、发布 Windows Copilot

2023-05-25

gz 等，增加这一支持是因为 Windows 11 现在使用了 libarchive 开源项目。 libarchive 是一个开源的 C 库，旨在为各种不同的压缩格式提供读取和写入支持。它支持许多常见的压缩格式，并提供了许多高级功能，例如加密、数字签名、

英伟达官宣：CUDA 工具链将全面原生支持 Python

2025-04-09

期的 GTC 2025 大会上，英伟达宣布其 CUDA 工具包将为 Python 提供原生支持并全面与之集成。 CUDA 架构师 Stephen Jones 在 GTC 技术演讲中对此表示，“我们一直在努力让加速计算与 Python 深度融合，使其成为 CUDA 技术栈中的‘一等

聚焦开源大模型前沿，openMind 将亮相 GOSIM CHINA 2024

2024-10-15

CodeGeeX 团队技术负责人郑勤锴、vLLM 核心贡献者游凯超、英特尔软件与先进技术事业部高级软件工程师张怀龙Huailong Zhang 等 13 位技术专家与核心贡献者，以塑造人工智能未来为主题进行主题演讲。作为AI技术领域的新星，openMi

Web LLM：将语言模型聊天直接带到 Web 浏览器中

2023-04-17

ows 笔记本电脑应该也可以使用。“我配备 AMDGPU 的 2019 年英特尔 MacBook 也能正常工作。当然，还有 NVIDIA GPU！我们的模型是 int4 量化的，大小是 4G，所以也不需要 64GB 的内存。6G 左右的地方应该就足够了。” 不过，Web LLM 团队也

英伟达、高通等芯片四巨头联手，以新 CPU 架构对抗英特尔、AMD

2024-10-31

的有力替代品。值得注意的是，早在2023年，包括谷歌、英特尔、英伟达、高通、阿里等在内的13家企业就发起了全球RISC-V软件生态计划——RISE，旨在加速RISC-V的软件生态建设和应用商业化进程。英伟达加速出货RISC-V GPU 近

Python 有史以来最强大的挑战者终于出现！

2025-06-06

张宏波团队打造的面向云计算、边缘计算及 AI 的高性能开源语言，聚焦 WebAssembly（WASM）和原生编译场景。其核心优势在于：通过优化的 WASM 后端实现比 Rust/Go 更快的运行速度和更小代码体积；原生后端直接编译为机器码（支

熱門推薦