Meta 通过热补丁为数百万台 Linux 服务器更新内核


Meta(原 Facebook)工程师在本周举办的 Linux Plumbers 大会上分享了他们如何使用 Linux 内核的 kernel live-patching (KLP) 基础设施


据介绍,Meta 除了使用内核自带的 KLP,还选择了 Red Hat 的 Kpatch 方案。他们通过 Kpatch 为“数百万台 Linux 服务器”的内核进行热补丁更新。热补丁还可以在服务器运行期间对内核功能进行修复。

之所以选择 KLP,Meta 称主要是为了减少内核更新时的服务器停机时间——以应对永无止境的安全更新。毕竟完全重启服务器和冗长的 POST 时间会带来相当大的问题,而通过热补丁,当一切按计划进行时,服务器可以近乎无缝地迁移到新内核。


Meta 工程师在使用 Linux 内核的热补丁功能过程中,发现了一些需要克服的追踪问题,也遇到了性能问题。具体的性能问题是,在进行热补丁期间会有 1~2 秒出现问题,比如更高的 I/O 和 fsync 延迟,以及更高的 TCP 重传率。

Meta 工程师还提到,他们正在积极解决一些边界问题,以更好地处理通过 Clang 编译并使用 PGO 进行优化的内核构建等情况,以及其他提高稳健性的项目。

详细内容查看 PPT 或演讲视频。


相關推薦

2022-07-31

的问题。这种“自动化升级”意味着大多数谷歌员工无需通过重新安装机器,并重新创建所有配置来手动升级。不过为了实现这一点,谷歌需要对升级过程进行全面测试,并检查所有已更改的主要软件包是否继续运行(在 Ubuntu

2022-12-21

上周末才提交了 PR。就在今天,Linus Torvalds 合并了该补丁。该 PR 依旧是由来自 Facebook 的 Zstd 维护者 Nick Terrell 完成,他一直积极从上游为 Linux 内核使用的 Zstd 更新代码。 毫无疑问,使用新的 Zstd 实现能够为 Zstd 压缩的内核

2022-10-30

关补丁添加到 Linux 6.2 合并窗口的 Btrfs for-next 分支中, 通过“discard=async”挂载选项打开该功能(可以通过设置 “async=nodiscard” 挂载选项来强制关闭该功能),该补丁预计会在 12 月实装。 两年前 Fedora 就有相关提案,请

2024-07-02

而无需关机或重启。该项功能对需要动态调整内存容量的服务器和数据中心非常有用。 Linux 的内存热插支持允许在运行时增加/减少物理内存大小。如果要在运行中的 RISC-V 服务器上物理拔插内存 DIMM,这可能会很有用。但更常

2022-10-20

x)是微软内部使用的 Linux 发行版,它不是桌面 Linux 而是服务器端 Linux,它被用于微软的云基础设施以及边缘产品和服务。CBL-Mariner 旨在为这些设备和服务提供一致的平台,并增强微软在 Linux 更新方面与时俱进的能力。 CBL-Marin

2024-10-23

可以使用它完成十亿级用户量 APP 的 DAU 统计、十几万台服务器的运维监控、一线互联网大厂数据量级的日志统计、也可以用它来统计一天只有零星几次的接口调用量、耗时状况; 支持高并发查询统计结果; 支持自定义存储

2022-12-01

发起成立,在openKylin社区中负责为搭载飞腾系列处理器的服务器及桌面平台提供支持飞腾特性的内核补丁,包括但不限于双路特性支持补丁、Kdump功能修复补丁、中断堆积修复补丁、SMMU特性支持补丁以及系统驱动适配补丁等。 0

2024-06-26

可以使用它完成十亿级用户量 APP 的 DAU 统计、十几万台服务器的运维监控、一线互联网大厂数据量级的日志统计、也可以用它来统计一天只有零星几次的接口调用量、耗时状况; 支持高并发查询统计结果; 支持自定义存储

2023-02-24

ronix 介绍,这些补丁特别有利于 AMD EPYC 和英特尔至强服务器处理器,以及其他具有高内核数的 HEDT 系统,具体的性能改进程度则因工作负载和系统繁忙程度而异。 总体而言,在 Intel Xeon 2 x 56C 机器上测试时,该补丁在某

2022-11-23

安装包时都会默认使用 LTO,也有像 Clear Linux 这样的公司通过使用 AutoFDO(基于程序性能分析工具的反馈式编译优化)来进一步提升其发行版的性能。 2022 年年底,SUSE 工程师 Jiri Slaby 提交了 GCC LTO 支持补丁,同时作为“第一

2024-09-21

更多任务关键设备 (mission-critical devices) 和工业硬件上。 通过 ‘PREEMPT_RT’ 补丁,Linux 内核实现了完全可抢占 (fully preemptible) 特性,从而能够在微秒内响应事件。 这一能力对于需要精确时间控制的应用程序至关重要,如工业控

2023-11-23

能模式的 ThinkPad ACPI 驱动程序已在 ThinkPad T14 G4 AMD 型号上通过了测试。 不过补丁仍在 review 阶段。按照日程进度,它应该会在 v6.8 内核开发周期准备就绪。

2022-06-15

补丁可显著改善基于 AMD Zen 的系统性能,甚至在 Intel Xeon 服务器上也可提供帮助。 补丁的内容主要为:当 find_idlest_group() 函数中允许 NUMA 不平衡时,公平调度程序的更改正在考虑 CPU 亲和性。AMD 工程师 K Prateek Nayak 解释说: 对

2023-03-26

。 兆芯去年年底宣布了 KH-4000 系列采用“永丰”架构的服务器 x86_64 处理器,最高支持 32 个核心。“永丰”架构是“陆家嘴”微架构的继任者,仍然采用 16nm 工艺,支持最高 32 个核心,相比陆家嘴的 8 核是一大飞跃,频率最高