英特尔开源基于 CPU 的 OpenCL 运行时


英特尔正式开源其专有的基于 CPU 的 OpenCL 运行时,首批开源代码共 718,996 行。现在这个巨大的合并请求正在等待进入 Intel 的 LLVM 存储库下游。

多年来,英特尔的 LLVM 仓库 中就一直有开发者请求开源 OpenCL CPU 运行时(#788、#624、#453)。而在 2020 年,英特尔工程师正面回复了该请求,表示他们也想将其开源,但当时开发资源有限,最重要的是保证 DPC++ 功能和稳定性。

如今该目标终于实现,英特尔现已正式开源 OpenCL CPU RT(Running Time) 代码,包括 OpenCL CPU RT、Transform passes 以支持 SYCL 和 OCL ,以及它们的 LIT 测试用例。

对于基于 CPU 的 OpenCL 实现,最著名的是作为“便携式计算语言”实现的 POCL ,以及在 Mesa 中运行在 LLVMpipe 之上的 Rusticl/Clover 之类的实现。

多年来,还有其他基于 OpenCL CPU 的执行工作,而英特尔的 OpenCL CPU 运行时可能是最具特色和性能的。


相關推薦

2022-09-17

内核执行命令的配置。 该扩展由 Codeplay、Qualcomm、Arm、英特尔、坦佩雷大学、NVIDIA 和 Google 的工程师开发,以克服 cl_khr_command_buffer 的限制:命令缓冲区中记录的命令在队列间不可变。 cl_khr_command_buffer 扩展通过提供一种记录

2023-02-15

,该功能支持 AMD 的 RX 5000 / 锐龙 4000 系列 ,英特尔 11 代以上 CPU 和  Iris® Xe / Arc®  显卡系列,以及英伟达的 GTX 10 / RTX 20  / Quadro RTX / NVIDIA RTX 工作站系列。 有关该功能具体的  VA 入

2023-04-17

RADV 初始 AMD GFX940 支 众多 Zink OpenGL-on-Vulkan 增强功能 英特尔 Meteor Lake 图形 ID 初始 LoongArch CPU 支持 英特尔 Vulkan 视频支持 基于英特尔计算的 DXT5 转码 Asahi Gallium3D 的着色器磁盘缓存 许多新的 Microsoft Dozen“Dzn”功能 &nb

2023-04-20

图形硬件处理标准 OpenCL 3.0.14 已发布,其中包含一些小的修复/更正,以及一个重要的新扩展:cl_khr_command_buffer_multi_device。 OpenCL 全称 Open Computing Language,是一个面向异构系统通用目的并行编程的开放式、免费标准,也是一个

2022-06-12

pocl) 是一个高效的 OpenCL 标准实现,提供易移植的开源实现。该项目另外一个目的就是通过编译器优化实现性能的提升,减少人工优化的步骤。 PoCL 3.0 发布了,该版本支持最小的 OpenCL 3.0 功能集,提供了最初的 OpenCL

2022-12-07

PoCL Vulkan 驱动程序依赖于 libvulkan 和 clspv,目前已经针对开源 Mesa Vulkan 驱动程序进行了测试。该驱动程序目前实现了大部分 Vulkan 1.2 API,但 OpenCL 图像支持、命令缓冲区无缓存和其他缺失元素尚未处理完毕。 完整的变更可查看

2022-09-17

英特尔酷睿 i9 12900K 和 AMD 锐龙9 5950X 是两家厂商目前性能最强的桌面端 CPU 型号,虽然英特尔 Raptor Lake 和 AMD Zen 4 的规格信息都陆续浮出水面,但毕竟还没有正式上市,那么不妨先在这个新老交替的时间点来看看目前市售最强桌

2023-04-17

ows 笔记本电脑应该也可以使用。“我配备 AMDGPU 的 2019 年英特尔 MacBook 也能正常工作。当然,还有 NVIDIA GPU!我们的模型是 int4 量化的,大小是 4G,所以也不需要 64GB 的内存。6G 左右的地方应该就足够了。” 不过,Web LLM 团队也

2022-05-20

实验性 API。 改进 CPU 性能:默认启用 oneDNN TensorFlow 与英特尔合作,将 oneDNN 性能库与 TensorFlow 整合在一起,以便在英特尔 CPU 上实现更好的性能。自 TensorFlow 2.5 以来,TensorFlow 对 oneDNN 有实验性的支持,它可以提供高达 4 倍的

2022-12-05

在从 Linux 移植最新的图形驱动程序代码,并更改其英特尔图形多路复用器设计后,他们现在通过 Genode OS 22.11 支持英特尔 Gen12 级图形。如果想在最新一代英特尔硬件上享受加速的图形效果,这对于 Genode 的 Sculpt OS 通用操

2022-06-15

,也可以使多插槽服务器的 Intel CPU 受益。测试显示,对英特尔至强可扩展“Ice Lake”服务器上的 Stream,其性能提高了 54~82%。 而且这个内核补丁只有几行代码: 目前该补丁已排入 sched/core 队列,如果没有其他突发情

2023-04-24

的基准测试,三台设备配置如下: 戴尔 XPS 9310,配备英特尔 Core i7 1165G7 Tiger Lake 处理器; 微星 Prestige 14(MSI MS-14C6),配备英特尔 Core i7 1280P Alder Lake 处理器; 联想 ThinkPad X13 Gen 3(21CM0001US),配备 AMD Ryzen 7 PRO 6850U Rembran

2022-12-10

的最低要求改成 SSE4.1 指令集,SSE4.1 指令集随 2007 年英特尔的 45 纳米“ Penryn ”处理器发布。 跳到更高级的指令集有两个好处,首先更现代的 CPU 肯定能在 Blender 的各种繁重的计算功能中提高性能,其次,Blender Cycles 目

2022-11-04

变量) 打包的一些注意事项: 使用光线追踪构建英特尔 Vulkan 驱动程序时(使用 -D intel-clc=enabled,默认禁用),需要 libclc 作为构建和运行时依赖项)。 Rusticl,OpenCL 实现(-D gallium-rustic=true,默认禁用),引入了一堆新