20 年前的芯片组解决方案一直在伤害现代 AMD Linux 系统


AMD 工程师 K Prateek Nayak 最近发现,Linux 内核中一个已有 20 年历史的芯片组变通方法仍应用于现代 AMD 系统中,而其在某些情况下会损害现代 Zen 硬件的性能。并提出了一个相关的补丁,旨在将这种变通方法限制在旧系统上,从而帮助提高现代系统的性能。

根据介绍,自从 2002 年将 ACPI 支持添加到 Linux 内核以来,就一直有一个“dummy wait op”来处理一些芯片组的 STPCLK# 没有被及时处理的问题。这个 dummy I/O read 会延迟进一步的指令处理,直到 CPU 完全停止。“至少在一些带有 VIA 芯片组的 AMD Athlon era systems 中,这是一个问题……但对于大约过去二十年的新芯片组来说,这不是问题”。

K Prateek Nayak 指出:

在 AMD Zen3 系统上使用 IBS 对某些工作负载进行采样表明,大量时间花费在 dummy op 中,这被错误地视为 C-State residency。较大的 C-State  residency 值可以使 cpuidle governor 在随后的空闲实例期间推荐一个 deeper C-State,从而开始恶性循环,导致在繁忙和空闲阶段之间快速切换的工作负载的性能下降。

其中一个工作负载是 tbench,在某些运行期间可以观察到大量的性能下降。

因此至少对于 Tbench 而言,Linux 内核中这种长期、无条件的变通方法一直在损害 AMD Ryzen / Threadripper / EPYC 在特定工作负载中的性能:

不过其并未影响现代 Intel 系统,因为较新的 Intel 平台使用了基于 MWAIT 的 intel_idle 驱动程序代码路径来进行替代。

值得一提的是,Intel Linux 工程师 Dave Hansen 在 K Prateek Nayak 的补丁上进行进一步的简化。该补丁将不会应用这种“dummy wait”的解决方法,因此 AMD 系统将放弃这个会降低现代系统性能的操作。目前,这一补丁已作为 x86/urgent 修复的一部分被合并到 Linux 6.0 中。


相關推薦

2023-01-21

i810- Intel i810 驱动程序适用于旧的 Intel i8xx/pre-i915 系列芯片组。 mga - 非常老的 Matrox 图形卡的驱动程序。 r128 - ATI Rage 128 显卡的内核驱动程序。 savage - 通过 SuperSavage 和 ProSavage 硬件支持各代 VIA / S3 Savage 图形芯

2023-06-13

英特尔工程师一直在为Linux内核开发新的集群调度代码,以更好地帮助其现代混合处理器的进程调度。这些补丁的更新版本现在已经发布,试图帮助提高Alder Lake CPU和更新版本的Linux性能。 英特尔工程师以前曾为Linux尝试过集群

2024-10-31

化进程。 英伟达加速出货RISC-V GPU 近十年来,英伟达一直悄悄将 RISC-V 集成到其 GPU 微控制器中。此次,该公司分享了该架构如何改变其产品设计的见解。在题为“一个架构、数十种应用、数十亿处理器”的演讲中,该公司强

2024-08-16

。 国民级办公应用WPS日前也公布了双方联合开发AI办公解决方案的进展,基于deepin V23的 WPS Office For Linux 个人版将于8月下旬上线deepin应用商店。用户不仅可在该版本中体验到融入AIGC的三款WPS拳头产品,更能感受到UOS AI与WPS AI在

2023-09-05

驱动程序。 “ar9xxx”和“ar7xxx”:Atheros/Qualcomm 无线芯片组。 “ath6k”:Atheros AR600x 系列无线 LAN 芯片组。 “atusb”:Atmel at76c50x/90x USB 无线网络适配器。 “cirrus”:Cirrus Logic 显卡。 “smsmdtv”:Siano Mobile Silicon

2023-04-03

TRIM。 ichwd(4) 驱动程序已更新,包括对 Lewisburg PCH (C620) 芯片组中的 TCO 看门狗定时器的支持。 更新了 amdsmn(4) 和 amdtemp(4) 驱动程序以支持 Ryzen™ 2 主机桥。 amdtemp(4) 驱动程序已更新以更正 AMD® 2990WX 的温度报告。 为 RTL8188EE

2024-07-24

为用户带来更好的使用体验和更高的工作效率。感谢大家一直以来的支持和反馈,我们将继续努力提供更优秀的产品和服务! 新增功能点 体验: 平滑更新机制 客户端缓存 禅道本次发布数据如下: 本期优化的全部

2024-08-07

为用户带来更好的使用体验和更高的工作效率。感谢大家一直以来的支持和反馈,我们将继续努力提供更优秀的产品和服务! 新增功能点 消息中心: 面板增加消息中心列表 消息通知需要展示通知人、时间、内容 消息

2022-08-16

没有任何内在的意义。 最近几周 Linux 内核邮件的讨论一直在交替使用 5.20 和 6.0 两个版本号,直到 Linus 最终决定采用 6.0 。

2024-03-16

o.net/book/zentaopms/460.html   持续优化,定期更新,禅道一直在路上。

2023-01-31

由于 coreboot 要初始化硬件,所以必须为所要支持的每个芯片组和主板移植。因此而言,coreboot 只适用于有限的硬件平台和主板型号。 近日,coreboot 4.19 正式发布了,此版本完成了将代码从遗留的 ASL 语法转换为完全使用 ASL 2.0

2023-10-20

减缓中国下一代前沿模型的开发,特别是因为它们可用于现代化军事用途。 美国政府官员表示,它们无意损害中国经济增长。 有报道称,中国将被禁止使用的 NVIDIA H800 和 A800,这些产品已经是英伟达此前为遵守美国贸易政策

2023-07-23

的优势,对我友善并与我分享他们的时间。” Dan 于七年前加入 Meta 公司,并作为 React 官方发言人长期活跃在开发一线,一直以来在 React 贡献排行榜排名第一。离开 Meta 也就意味着他要离开 React 团队,这对 React 来说

2023-06-18

n笔记本电脑,可以在屏幕内容不变时降低功耗。 目前,现代笔记本电脑已经有了像面板自刷新(PSR)这样的省电技术,可以在屏幕内容静止时减少功耗。但是FreeSync Panel Replay是一种新的技术,只有在Display Core Next 3.1.4+硬件上才