LLVM/Clang 编译器全面适配 AVX10.2,512 位支持成为强制要求


近期,英特尔发布了更新后的AVX10技术白皮书,其中一项重要决定是AVX10.2指令集将不再将512位浮点数和整数支持视为可选,而是强制要求。这一变化意味着未来的AVX10.2处理器将全面支持128位、256位和512位指令集,同时取消了256位嵌入式舍入支持,转而专注于512位支持。LLVM/Clang编译器此前基于英特尔最初的AVX10设计假设进行了开发,现在正进行调整以适应这些新变化。

AVX10是英特尔推出的新一代高级向量扩展指令集,旨在提升处理器在并行计算任务中的性能。AVX10.2作为其最新版本,强制要求512位支持,这不仅有助于提升性能,还简化了编程,特别是在x86_64微架构特性级别方面。LLVM/Clang作为开源编译器基础设施的重要组成部分,此前已经实现了对AVX10.2的支持。然而,随着英特尔的最新决定,LLVM/Clang需要进行以下调整:修正对256位/512位支持的假设,取消对AVX10.2无512位支持的保护措施,移除不再需要的256位嵌入式舍入支持。

这一变化对开发者来说是一个好消息。未来所有AVX10.2处理器都将支持512位指令集,这意味着开发者可以更轻松地编写高性能代码,而无需担心底层指令集的兼容性问题。特别是在需要处理大量数据的场景中,512位指令集将带来显著的性能提升。随着AVX10.2指令集的普及,预计将有更多的应用和库开始利用这一技术。LLVM/Clang的全面支持无疑将加速这一进程,推动高性能计算领域的进一步发展。


相關推薦

2022-10-22

GNU C 库“glibc”获得另一轮 AVX-512  优化工作,使用英特尔的 AVX-512 处理器或 AMD Zen 4 的用户可从中受益。 AVX-512 是一种 SIMD 指令,用于在执行特定任务时提高 CPU 的性能。英特尔工程师 Sunil K Pandey 为 Glibc 开发了增强型矢量扩

2023-10-08

今年早些时候,英特尔发布了一个利用了 AVX-512 的 x86-simd-sort 快速排序库;当 Numpy 将 x86-simd-sort 代码进行合并后发现,对于 16 位到 64 位的数据类型,排序速度提高了10~17倍。如今,英特尔软件工程师又发布了 x86-simd-sort 3.0,Open

2022-03-30

3月上旬我们报道了向上游 LLVM/Clang 编译器添加 DirectX + HLSL 支持 。而从本周开始,微软图形处理工作的早期代码开始登陆 LLVM 15.0。 微软的开源 DirectX 着色器编译器“DXC”基于旧的 LLVM/Clang 3.7 分支,现在正致力于开发一种现代 D

2023-03-07

去年我们报道了 Linux 内核拟放弃支持英特尔 ICC 编译器,如今该讨论终于有了结果。在 Linux 6.3 内核合并窗口打开的最后一天,Linus Torvalds 合并了“删除 Intel ICC 编译器支持” 补丁,从内核中移除了 Intel  ICC  编译器的支

2022-03-11

微软方面提出了一项提案,希望为上游 LLVM/Clang 编译器贡献 HLSL、DirectX 和 Vulkan 图形支持。 原因在于,其现有的 HLSL 编译器 DirectX Shader Compiler (DXC) 基于旧的 LLVM/Clang 3.7 分支。而微软计划将其编译器更新到最新的 LLVM,以便为

2022-03-14

微软方面提出了一项提案,希望为上游 LLVM/Clang 编译器贡献 HLSL、DirectX 和 Vulkan 图形支持。 原因在于,其现有的 HLSL 编译器 DirectX Shader Compiler (DXC) 基于旧的 LLVM/Clang 3.7 分支。而微软计划将其编译器更新到最新的 LLVM,以便为 HL

2023-06-07

1 的解释是: 针对 z1/z2/z3 工具的优化对 AVIF(AV1 图像支持)非常有用 ARM64 NEON 优化现已全部完成 AVX-512 代码已成为“相当先进”,并且表现比 AVX2 好得多。 然而,AVX-512 代码仍未被认为是完整的,预计未来将对 AVX-512

2022-04-04

nux 5.18 对 LLVM 环境变量的处理进行了改进,以处理版本化编译器二进制文件或 PATH 之外的编译器安装。 LLVM = 1 当前用于定义 LLVM/Clang 工具变量,以使用该非 GNU 工具链构建 Linux 内核。 但是目前,如果想在 PATH 之外使用 LLVM/Clan

2023-08-24

题。 目前,Xmake 主要用于 C/C++ 项目的构建,但是同时也支持其他 native 语言的构建,可以实现跟 C/C++ 进行混合编译,同时编译速度也是非常的快,可以跟 Ninja 持平。 Xmake = Build backend + Project Generator + Package Manager + [Remote|Dist

2022-09-03

Phoronix 对运行在 Linux 上的 Apple M2 芯片 的 GCC 和 LLVM Clang 编译器进行了性能测试和对比。 此次测试采用的设备是 Apple M2 MacBook Air ,运行基于 Arch 的 Asahi Linux 系统(这是目前唯一能够运行最新 Apple  M2 芯片的发行版),测试

2022-09-09

为 LLVM 默认的 C++ 和 ObjectiveC++ 版本。 Clang 的 C++17 支持非常稳定了,只有一些微小的细节需要修复。事实上,Apple 的 DriverKit 已经在上游 LLVM 中进行了更改(D121911 [Clang] 添加 DriverKit 支持 ),默认使用 GNU++17 而不是 GNU++14

2022-12-16

够运行各种客户操作系统。 QEMU 7.2 发布了,此版本新增支持 AVX / AVX2 / F16C / FMA3 / VAES 指令集,同时优化了 9pfs 文件系统的性能,主要更改如下: x86/x86_64 的 QEMU 现在支持 CORE_THREAD_COUNT MSR。 支持在使用“-kernel”参数引导时

2022-10-16

时,大家似乎忘记了,作为对长期以来占主导地位的 GCC 编译器目标的补充支持,英特尔的 ICC 编译器也能够用于构建 Linux 内核(尽管没有被广泛使用)。鉴于此,内核开发人员现在正在考虑删除对 ICC 编译器的支持。 Linux 开

2023-06-09

节、部分市场的“局部试点”,走向多环节、多行业的“全面覆盖”,“做”了大量数字化升级: 做深基础:引入全球多个开源社区优势特性 做厚安全:提供CentOS安全接管高质量服务 做强生态:持续扩充生态兼容 做好