Khronos Group 已发布 OpenCL 3.0.12


Khronos Group 发布了 OpenCL 3.0.12,这是最新的跨异构平台计算标准,OpenCL 让显示芯片(GPL)也能为通用软件提供计算能力的标准,简单来说就是 GPU 可以帮忙干 CPU 的活儿。

OpenCL 全称 Open Computing Language,是第一个面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的编程环境,便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码,而且广泛适用于多核心处理器 (CPU)、图形处理器 (GPU)、Cell 类型架构以及数字信号处理器 (DSP) 等其他并行处理器,在游戏、娱乐、科研、医疗等各种领域都有广阔的发展前景。

OpenCL 3.0.12 中的更改为:

  • 添加了有效对象的定义和测试有效对象的要求。
  • 添加了内核支持的参数数量的最大限制。
  • 明确了对象句柄的可比性和唯一性要求。
  • 澄清了无效设备端入队“clk_event_t”句柄的行为。
  • 澄清了 `cl_khr_command_buffer` 与其他扩展的交互。
  • 指定命令缓冲区多次完成时的错误行为。

值得注意的是引入了一个新的扩展“cl_khr_command_buffer_mutable_dispatch”,用于使用命令缓冲区进行可变调度。这是 OpenCL 3.0.12 中的新功能,以临时形式引入。该扩展允许在命令缓冲区队列之间修改内核执行命令的配置。

该扩展由 Codeplay、Qualcomm、Arm、英特尔、坦佩雷大学、NVIDIA 和 Google 的工程师开发,以克服 cl_khr_command_buffer 的限制:命令缓冲区中记录的命令在队列间不可变。

cl_khr_command_buffer 扩展通过提供一种记录一组命令的机制将命令构造与入队分开,然后这些命令可以重复入队。但是,记录到命令缓冲区的命令在队列之间是不可变的。 cl_khr_command_buffer_mutable_dispatch 消除了这个限制,尤其是,这个扩展允许修改命令缓冲区中的内核执行命令的配置,称为 mutable-dispatch。这允许内核的输入和输出,以及工作项的大小和偏移量,而无需在新的命令缓冲区中重新记录整个命令序列。

更多 OpenCL 3.0.12 文档可查看更新公告。


相關推薦

2022-04-09

2008 年构建的现代处理器跨平台、并行计算编程标准,由 Khronos 工作组完成开发。尽管 OpenCL 越来越冷门(虽然好像也没火过),甚至惨遭老父亲苹果公司的弃用,但 Khronos 仍未放弃它。4 月 7 号,  Khronos 工作组宣布对 OpenCL 的

2023-04-20

可以由 OpenCL 运行时自动完成。 OpenCL 3.0.14 规范可通过 Khronos 官网获得。

2022-11-24

,主要更改如下: 普通改动 将 OpenGL 标头更新为 The Khronos Group Inc. 的最新 API。 添加了 SDL_GetWindowSizeInPixels() ,以获取以像素为单位的窗口大小 为软件渲染器添加了模拟 vsync 同步 将鼠标位置添加到 SDL_MouseWheelEvent 添加

2022-06-12

化实现性能的提升,减少人工优化的步骤。 PoCL 3.0 发布了,该版本支持最小的 OpenCL 3.0 功能集,提供了最初的 OpenCL 3.0 支持意味着 POCL 可通过 LLVM 在 CPU 或其他后端执行,例如针对 AMD HSA、NVIDIA GPU 和其他加速器。 除了解

2022-12-07

化实现性能的提升,减少人工优化的步骤。 目前 PoCL 3.1 发布了,此版本带来如下改动: 提供与 LLVM/Clang 15.0 版本的兼容性 所有通过 POCL_DEVICES 控制平台设置的设备名称都改为小写 自定义设备驱动程序(以前称为 Accel,现

2023-02-19

英特尔正式开源其专有的基于 CPU 的 OpenCL 运行时,首批开源代码共 718,996 行。现在这个巨大的合并请求正在等待进入 Intel 的 LLVM 存储库下游。 多年来,英特尔的 LLVM 仓库 中就一直有开发者请求开源 OpenCL CPU 运行

2022-07-04

过该软件查看和编辑照片。 目前 Darktable 4.0 版本已发布,以庆祝该项目自 1.0 版以来的 10 周年,该版本的重要更新内容如下: 主要功能 颜色和曝光映射 曝光和色彩校准模块中的一个新功能允许你为取色器定义并保存

2023-12-04

。 第一个新扩展是 VK_EXT_layer_settings,由 LunarG、Google、Khronos 等公司开发。VK_EXT_layer_settings 允许采用一种机制以编程方式配置 Vulkan API 层的行为。 另一个新扩展是来自 Arm 和 Mediatek 的 VK_ARM_render_pass_striped。VK_ARM_render_pass_striped

2022-09-02

细信息。 关于 Vulkan Mesh Shader 扩展的更多细节,可以在 Khronos 博客上细阅。

2023-06-08

成将作为技术预览(而非正式的新功能)在 Qt Creator 11 中发布,在编写 C++/Qt 代码时, GitHub Copilot 能够提供 AI 驱动的代码建议等内容。 但 GitHub Copilot 是一个商业的代码辅助工具,只有 30 天免费试用期,随后每月收费 10

2023-12-06

Django 5.0 已正式发布。 根据 JetBrains 公布的 2022 Python 开发者调查结果,Python Web 框架的三巨头依旧是 Flask、Django 和 FastAPI。Django 和 Flask 的使用率排名并列第一。 Django 5.0 支持最新的 Python 版本,包括 Python 3.10、3

2022-09-03

Diesel 2.0.0 已正式发布。据称此版本开发周期长达 3 年,包含了超过 1700 次 commit。 Diesel 是一个安全可扩展的 Rust ORM 框架和查询构建工具。Diesel 可避免运行时错误,提供最好的性能。 2.0 添加了许多新功能,并重写了大部

2022-12-14

Git 2.39 已正式发布。 新版本主要变化包括: 为git shortlog命令添加更灵活的--group选项 该选项支持按作者或提交者以外的字段对 commit 进行分组,例如 $ git shortlog -ns --group=author --group=trailer:co-authored-by 优化稀疏索引

2022-11-04

Mesa 22.3-rc1 已发布,正式的 Mesa 22.3 版本将在 11 月底或 12 月初发布。  22.3-rc1 新功能(排名不分先后): llvmpipe 上的 GL_ARB_shader_clock lavapipe 上的 VK_KHR_shader_clock Mesa-DB,新的单文件缓存类型 RADV、lavapipe 上的 VK_EXT_att