Meta 通过热补丁为数百万台 Linux 服务器更新内核


Meta(原 Facebook)工程师在本周举办的 Linux Plumbers 大会上分享了他们如何使用 Linux 内核的 kernel live-patching (KLP) 基础设施


据介绍,Meta 除了使用内核自带的 KLP,还选择了 Red Hat 的 Kpatch 方案。他们通过 Kpatch 为“数百万台 Linux 服务器”的内核进行热补丁更新。热补丁还可以在服务器运行期间对内核功能进行修复。

之所以选择 KLP,Meta 称主要是为了减少内核更新时的服务器停机时间——以应对永无止境的安全更新。毕竟完全重启服务器和冗长的 POST 时间会带来相当大的问题,而通过热补丁,当一切按计划进行时,服务器可以近乎无缝地迁移到新内核。


Meta 工程师在使用 Linux 内核的热补丁功能过程中,发现了一些需要克服的追踪问题,也遇到了性能问题。具体的性能问题是,在进行热补丁期间会有 1~2 秒出现问题,比如更高的 I/O 和 fsync 延迟,以及更高的 TCP 重传率。

Meta 工程师还提到,他们正在积极解决一些边界问题,以更好地处理通过 Clang 编译并使用 PGO 进行优化的内核构建等情况,以及其他提高稳健性的项目。

详细内容查看 PPT 或演讲视频。


相關推薦

2022-07-31

的问题。这种“自动化升级”意味着大多数谷歌员工无需通过重新安装机器,并重新创建所有配置来手动升级。不过为了实现这一点,谷歌需要对升级过程进行全面测试,并检查所有已更改的主要软件包是否继续运行(在 Ubuntu

2022-12-21

上周末才提交了 PR。就在今天,Linus Torvalds 合并了该补丁。该 PR 依旧是由来自 Facebook 的 Zstd 维护者 Nick Terrell 完成,他一直积极从上游为 Linux 内核使用的 Zstd 更新代码。 毫无疑问,使用新的 Zstd 实现能够为 Zstd 压缩的内核

2022-10-30

关补丁添加到 Linux 6.2 合并窗口的 Btrfs for-next 分支中, 通过“discard=async”挂载选项打开该功能(可以通过设置 “async=nodiscard” 挂载选项来强制关闭该功能),该补丁预计会在 12 月实装。 两年前 Fedora 就有相关提案,请

2022-10-20

x)是微软内部使用的 Linux 发行版,它不是桌面 Linux 而是服务器端 Linux,它被用于微软的云基础设施以及边缘产品和服务。CBL-Mariner 旨在为这些设备和服务提供一致的平台,并增强微软在 Linux 更新方面与时俱进的能力。 CBL-Marin

2022-12-01

发起成立,在openKylin社区中负责为搭载飞腾系列处理器的服务器及桌面平台提供支持飞腾特性的内核补丁,包括但不限于双路特性支持补丁、Kdump功能修复补丁、中断堆积修复补丁、SMMU特性支持补丁以及系统驱动适配补丁等。 0

2023-02-24

ronix 介绍,这些补丁特别有利于 AMD EPYC 和英特尔至强服务器处理器,以及其他具有高内核数的 HEDT 系统,具体的性能改进程度则因工作负载和系统繁忙程度而异。 总体而言,在 Intel Xeon 2 x 56C 机器上测试时,该补丁在某

2022-11-23

安装包时都会默认使用 LTO,也有像 Clear Linux 这样的公司通过使用 AutoFDO(基于程序性能分析工具的反馈式编译优化)来进一步提升其发行版的性能。 2022 年年底,SUSE 工程师 Jiri Slaby 提交了 GCC LTO 支持补丁,同时作为“第一

2023-02-04

门。 因此,这意味着需要通过 GDExtension 公开对所有渲染服务器结构的底层访问。这将允许在渲染步骤中创建自定义渲染器或插入自定义代码,这对于自定义渲染技术或后期处理非常有用。 场景作业系统 (Scene job system) 为 G

2023-11-23

能模式的 ThinkPad ACPI 驱动程序已在 ThinkPad T14 G4 AMD 型号上通过了测试。 不过补丁仍在 review 阶段。按照日程进度,它应该会在 v6.8 内核开发周期准备就绪。

2022-06-15

补丁可显著改善基于 AMD Zen 的系统性能,甚至在 Intel Xeon 服务器上也可提供帮助。 补丁的内容主要为:当 find_idlest_group() 函数中允许 NUMA 不平衡时,公平调度程序的更改正在考虑 CPU 亲和性。AMD 工程师 K Prateek Nayak 解释说: 对

2023-01-30

社区联合发起。 GOTC 2023,为期 2 天的开源行业盛会,将通过行业展览、主题发言、特别论坛、圆桌讨论、快闪演讲、大咖会客厅、HR 面对面、开源时空隧道等形式来诠释此次大会主题 ——“Open Source, Into the Future”。会议聚焦

2023-03-26

。 兆芯去年年底宣布了 KH-4000 系列采用“永丰”架构的服务器 x86_64 处理器,最高支持 32 个核心。“永丰”架构是“陆家嘴”微架构的继任者,仍然采用 16nm 工艺,支持最高 32 个核心,相比陆家嘴的 8 核是一大飞跃,频率最高

2022-10-20

用户专注于他们的工作负载,从硬件和应用层抽离出来。通过使用虚拟机和容器技术,ALP 可以让工作负载独立于代码流。 SUSE 已将其引入开源社区,并开始设计和构建一个以应用程序为中心、安全且灵活的新平台。 ALP 的首

2022-10-16

//gotc2023.oschina.net GOTC 2023,为期 2 天的开源行业盛会,将通过行业展览、主题发言、特别论坛、圆桌讨论、快闪演讲、大咖会客厅、HR 面对面、开源时空隧道等形式来诠释此次大会主题——“Open Source, Into the Future”。会议聚焦