Linux 修复了持续多年的 CPU 平衡算法问题


Linux 6.3 收到了一个 Linux CPU 调度程序修复补丁,修复了自 2019 年底以来一直存在于主线内核中的“ CFS 调度器计算不平衡导致的整数溢出” 问题。

该问题最先在英特尔至强可扩展 Sapphire Rapids 服务器上发现,自 2019 年 10 月被报告以来,一直存在于主线内核。当时报告该 Bug 的具体表现为:

CFS 的重新平衡算法存在问题,kernel/sched/fair.c 中的 calculate_imbalance 函数可能由于整数溢出错误导致产生的结果不正确。

该算法旨在将一些任务从最繁忙的组拉到本地组。但是当两个组都或将变得过载时,算法不会将本地组推到调度域的平均负载之上。

而且,在某些情况下,该平衡算法的计算可能是错误的,导致无意义的任务迁移,甚至放大不平衡。

Linaro 的 Vincent Guittot 已发送了一组修复补丁来处理该不平衡溢出问题。 他解释说,“当本地组完全繁忙但其平均负载高于系统负载时,计算不平衡将溢出,本地组不是拉动此负载的最佳目标。”

该修复补丁已紧急进入 Linux 6.3-rc7 内核版本,具体解决方式是:如果本地组的负载超过平均系统负载,则不要尝试从本地组中拉出任何任务。

一旦被主线采用,该补丁应该会被反向移植到最近的稳定 Linux 内核版本。


相關推薦

2023-12-01

实:尽管在高负载场景下 CPU 的占用率不高,但其功耗却持续升高,最终导致设备发热并影响续航。也就是说,我们前期做的省电优化工作,不仅无效,还起了反作用。那么到底该如何解决这一问题呢? 在刚刚结束的DDUC 2023上

2023-06-13

并一直致力于改善P核与E核的负载平衡,并提供进一步的修复,以确保在x86混合CPU上的正确行为。 周四的混合CPU的集群调度的v2补丁解决了前一轮代码审查中提出的一些问题。 通过这些更新的补丁,他们看到性能的改善高达

2022-04-02

深度操作系统 20.5 现已发布,升级Stable内核至5.15.24,修复底层漏洞,进一步提升系统兼容性和安全性,功能层面上积极响应社区用户反馈的需求,开发并集成了大量实用功能。 人脸识别 新增人脸识别功能模块,对已适配的

2022-06-15

补丁可以进一步调整 Linux 内核的调度程序围绕 NUMA 的不平衡状态,对于某些工作负载,该调度程序的调整补丁可显著改善基于 AMD Zen 的系统性能,甚至在 Intel Xeon 服务器上也可提供帮助。 补丁的内容主要为:当 find_idlest_group()

2023-06-15

GLT 已经开源并且在PyG, GraphScope中都有示例,后面我们会持续开发优化,欢迎使用和贡献! [1] P3: Distributed Deep Graph Learning at Scale [2] Quiver: Supporting GPUs for Low-Latency, High-Throughput GNN Serving with Workload Awareness

2023-05-18

包的基础软件之一。 PerfMPL是以OpenBLAS为发展基础,经过多年发展逐步覆盖至FFT(快速傅立叶变换)、SPARSE(稀疏矩阵计算库)、MATH(基础数学库)、VML(Vector Math Library向量数学库)、DNN(Deep Neural Networks深度神经网络)、PerfIPP

2024-06-04

情,培养学生开发基础底层软件平台的能力。本文作者在多年教学中,面向人工智能时代的社会需求,将一门传统的程序设计课程“C/C++程序设计”,逐年优化和改进成为一门包含多项内容的“高级计算机程序设计”课程。该课

2023-10-31

,MeterSphere开源项目组坚持发布小版本,持续进行问题的修复更新,并针对部分功能进行优化。 本次发布的MeterSphere v2.10.8 LTS版本在性能测试模块对压测报告进行功能增强,同时测试执行机新增运行状态和CPU监控,欢迎广大社

2022-08-26

良好,而在某个故障的 CPU 内核上不断崩溃。 然而这么多年来,出问题的 CPU 的故障模式是非常具体的,你可能在 bash、python 或各种系统守护程序中找到分段错误,然而故障消息不会告诉你是哪个 CPU 出了问题。现在我们将 print

2024-08-14

传承。OpenSearch 的检索体系从 开源 ES 演变而来,是一个持续演进的技术体系,也是大家所熟悉的技术栈。云搜索团队选择基于 OpenSearch 去构建向量检索,也能更好的利用之前积累的内部经验。   随着 RAG 技术和大模型的

2021-12-10

此前,Ubuntu 将其 Initramfs 的压缩算法从 LZ4-9 (LZ4 压缩算法最高等级)改成了 Zstd -19 (Zstd 压缩算法最高等级)。然而 12月9日,Canonical 公司的 Julian Andres Klode 提出,Zstd -19 压缩等级导致 Initramfs 出现非常严重的解压时间和内

2023-07-18

能所有这些加起来都不如人类有趣。” 马斯克强调,他多年来一直在思考和担心 AI 安全问题,并声称自己向来是最积极呼吁对 AI 进行监管的声音之一。他表示,在他看来如果 AI 以及监管 AI 的人类能够最大限度地保持好奇心和

2024-07-19

担任 SustainOSS 和 CURIOSS 的组织者、Open Source Initiative 的可持续发展协调员、Open Source Collective 的社区发展经理,并为 Node.js 和 IPFS 等许多项目做出了开源贡献。 Holly 在卸任后则将重返校园攻读心理学博士学位。 相关阅读:

2024-09-26

214TB,实际内存使用从 300TB 降至 129TB,减少了 57%。作业持续时间保持相对稳定,从 2.1 小时变为 2.2 小时。磁盘溢出的触发机制从仅在内存达到满容量时触发,转变为一旦内存达到 1GB 阈值就定期触发。 Configuration Tuning Evalua