只用几行代码,AMD 对 Linux 5.20 进行了出色的性能优化,性能直接爆炸


据外媒 Phoronix 报道 ,AMD 近日提交的一个补丁可以进一步调整 Linux 内核的调度程序围绕 NUMA 的不平衡状态,对于某些工作负载,该调度程序的调整补丁可显著改善基于 AMD Zen 的系统性能,甚至在 Intel Xeon 服务器上也可提供帮助。 补丁的内容主要为:当 find_idlest_group() 函数中允许 NUMA 不平衡时,公平调度程序的更改正在考虑 CPU 亲和性。AMD 工程师 K Prateek Nayak 解释说:
对于每个插槽包含多个 LLC 的系统,例如 AMD Zen 系统,用户希望将需要带宽的应用程序分布在多个 LLC 上。Stream 就是这样一种具有代表性的工作负载,其中通过限制每个 LLC 一个流线程来获得最佳性能。 为了确保这一点,已知用户将任务固定到指定的 CPU 子集,每个 LLC 由一个 CPU 组成,同时运行此类需要带宽的任务。 我们可以通过检查本地组中允许的 CPU 数量是否少于本地组中运行的任务数来检测并避免这种堆积,并使用此信息将任务分散到下一个套接字中(毕竟,此慢速路径的目标是在初始放置期间找到最空闲的组和最空闲的 CPU。)
Stream 内存基准测试用例结果显示:对当前的 Linux 内核来说,此补丁可使 Stream 受益 36~44%,性能提高约 40% : 有趣的是,AMD 主导的优化不仅能让基于 AMD Zen 的处理器受益,也可以使多插槽服务器的 Intel CPU 受益。测试显示,对英特尔至强可扩展“Ice Lake”服务器上的 Stream,其性能提高了 54~82%。 而且这个内核补丁只有几行代码: 目前该补丁已排入 sched/core 队列,如果没有其他突发情况,应该会在 Linux 5.20 中引入。 更多技术细节可在补丁邮件中阅读。 

相關推薦

2022-08-16

0 内核将在两个月内稳定下来。 Linux 6.0 带来了超百万行代码,这些代码主要来源于 AMD GPU 和英特尔 Habana Labs Gaudi2 支持代码。下面是该版本一些重要的变更: 合并大量 char/misc 代码,提供 Gaudi2 支持 引入 F2FS 低内存模式,

2022-06-15

两种内核:兼容 Red Hat Enterprise Linux 的内核(使用 RHEL 源代码编译)和 Oracle 自己的 Unbreakable Enterprise 内核。Oracle 表示 Unbreakable Enterprise 内核兼容 RHEL,Oracle 中间件和经过 RHEL 认证的第三方应用程序可以不经过修改地在 Unbreakable

2022-09-17

上的表现到底如何。 外媒 Phoronix 近日在 Linux 6.0 内核下进行了大量的 CPU 基准测试,除了上述两款 CPU 差异以外,此次测试的设备配置如下: 系统:Ubuntu 22.04 LTS 内核:Linux 6.0 桌面环境:GNOME Shell 42.2 编译器:GCC 12.0.1

2023-11-24

了HP Z6 G5 A工作站的96核AMD Ryzen Threadripper PRO 7995WX处理器上进行的。 测试结果显示,Linux在处理高核心数处理器时的性能优势比Windows更明显。这主要归功于Linux内核调度程序在处理大核心数处理器时的优秀表现。此外,Linux在处

2023-06-21

中,以启用  F2FS nowait 异步缓冲写入功能。 只需更改几行代码,即可在缓冲写入条件下使用 FIO 进行测试时产生一些非常好的加速。 I/O 深度为 1 时,性能提高了大约 47%,而 I/O 深度为 16 时,它扩展到当前性能的 2.54 倍。

2024-03-16

建议用于生产环境,欢迎大家下载试用。 禅道20版本对代码进行了大规模重构,从框架层到业务代码都进行了大幅改进。禅道作为开源软件,重构后二次开发更加友好且易于维护,也带来了更好的产品性能和更强的安全性。20版

2023-02-24

起的最新内核性能补丁改进了 Linux 内核的公平调度程序代码,这个补丁系列的重点是避免不必要的跨 CPU 唤醒,可增强搭载高核心数 CPU 的 Linux 系统性能。 该 Linux 内核调度补丁主要是将短任务放在当前 CPU 上,以避免跨 CPU 唤

2023-04-24

爽了。 5. Python: 创建deepin的前期写了很多Python代码,只用看一本书《Python核心编程》就可以实现入门到精通。Python告诉我世间所有数据都可以用string, bool, list, tuple来组合。它从来不像其他编程语言那样宣扬宗教理念和小技巧

2023-03-07

直接 I/O 优化、更多的 ASUS 主板的传感器监控,还有 Btrfs 性能优化、移除英特尔 ICC 编译器支持等。 驱动方面,这个版本合并了 AMD-Xilinx XDMA 驱动程序、一些 AMD Zen 4 性能优化, 8BitDo Pro 2 有线控制器支持。还合并英特尔 TPMI 驱

2022-09-29

为较新的 Intel 平台使用了基于 MWAIT 的 intel_idle 驱动程序代码路径来进行替代。 值得一提的是,Intel Linux 工程师 Dave Hansen 在 K Prateek Nayak 的补丁上进行进一步的简化。该补丁将不会应用这种“dummy wait”的解决方法,因此 AMD 系

2023-12-01

个痛点,deepin 团队特别成立专项计划,对于 deepin 的电源进行专项优化。 在对电源进行专项优化之前,首先对 deepin (深度)操作系统进行了深入调查和分析,以了解其在负载场景下的实际运行情况。 经过对 CPU 使用率和功耗

2022-05-12

,此 NVIDIA Open GPU 内核模块的第一个版本是 R515,除了源代码之外,还提供了驱动程序的完全构建和打包版本。 对于 NVIDIA Turing 和 NVIDIA Ampere 架构系列中的数据中心 GPU,这些代码可用于生产。 对于 GeForce 和工作站 GPU,这些

2022-10-12

于 perf  perf 是Linux 系统的一款性能分析工具,能够进行函数级和指令级的热点查找,可以用来分析程序中热点函数的CPU占用率,从而定位性能瓶颈。 Linux 内核的“perf”是一个基于内核的子系统,提供一个性能分析框架

2022-10-21

文中,AMD 表示将会开源 GI-1.0,但目前还没有公开相关的代码。 对 GI-1.0 所有技术细节感兴趣的开发者可以访问 GPUOpen.com,里面有一份包含 14 页详细介绍的的文档。