GitHub 出现大规模全站服务故障


美国时间8月14日,GitHub 出现大规模宕机事故,核心服务几乎全部瘫痪(现已恢复)。当时用户反馈称,GitHub 主站无法访问,并显示“无可用服务器”的错误信息。

同时,包括 Pull Request、GitHub Pages、Copilot 和 GitHub API 在内的多个核心服务也受到严重影响。  

根据 GitHub 的 Status 状态页消息,本次影响范围为 GitHub 全站所有服务。

根据 GitHub Status 当时公布的情况,此次故障疑似因数据库基础设施变更导致,公司正在紧急回滚。

值得注意的是,此次故障发生迅速,从 GitHub 首次发布故障信息到多个服务瘫痪仅用了数分钟时间。据第三方监测平台 Downdetector 显示,有超过一万名用户报告了问题。

网络监测机构 NetBlocks 也确认了 GitHub 正在经历全球范围的宕机。

服务恢复后,GitHub 很快就发布了事故报告,称这是由于他们对数据库基础设施更改配置,从而引发流量路由受影响,结果导致关键服务意外失去数据库连接。在这一事件中,没有数据丢失或损坏。

详情查看:https://www.githubstatus.com/incidents/kz4khcgdsfdv

相关阅读

GitHub 多项服务出现故障

GitHub 今天凌晨短暂宕机

GitHub.com 跑了 1200 多台 MySQL 主机,如何无缝升级到 8.0?

GitHub 解释近期频繁宕机原因:MySQL 不堪重负


相關推薦

2023-06-09

20:00 更新: 截至 19:24 ,广东省内电信网络已经全面恢复。 15:40 更新: 中国电信客服表示,电信基站全省(广东电信)故障,暂时不能拨打电话,请耐心等待,现在紧急加急处理中,不便之处,敬请谅解。 ​​​ 对了,

2023-11-30

这是大公司系统故障最常见的原因。 因此对于滴滴此次大规模的长时间故障,有行业人士认为,降本增效可能也是原因之一。 该人士认为,互联网公司核心业务频繁宕机,且长时间宕机,是降本增效的附属品之一。系统投资

2023-08-06

布式 PostgreSQL 集群。 这个配置是中大型企业运行管理大规模数据库集群的参考样例,而您可以在单台物理服务器上用半个小时完整一键拉起。 更丝滑的构建流程 当你选择直接从互联网下载 Pigsty 所需的软件时,可能会遭遇

2023-11-13

日 17:44 起,阿里云监控发现云产品控制台访问及 API 调用出现异常,阿里云工程师正在紧急介入排查。非常抱歉给您的使用带来不便,若有任何问题,请随时联系我们。 今天下午 17:50 左右,大量网友表示阿里云盘出现访问

2024-08-22

馈「网易云音乐」App 无法正常使用,与此同时网页端也出现 502 Bad Gateway 报错信息。 随后“网易云音乐崩了”词条迅速登顶微博热搜。 对于如此大面积的故障,网上很快出现了各种猜测事故原因的传言,比如删库跑路、

2023-12-05

另一种虚构的软件是那些没有用户但具有可扩展性(大规模)的软件。这是无法解决问题或解决错误问题,可能没有人关心问题。这种软件源于采用一些炒作技术并将其应用于所有事物,直到出现模糊地符合某个用例需求。

2024-07-03

称,阿里云在 10:04 监控发现上海地域可用区 N 网络访问出现异常,正在紧急处理中。 10 点 35 分,阿里云工程师完成网络切流调度,上海可用区 N 网络访问开始恢复。 10 点 42 分,阿里云称经过处理受影响产品服务已恢复。

2023-12-05

今日晚间,大量网友反馈称腾讯视频陆续出现网络故障,具体表现包括不限于首页无法加载内容、VIP 用户看不了会员视频等等。 针对这一问题,腾讯视频回应称:目前腾讯视频出现了短暂技术问题,正在加紧修复,各项功能

2023-11-17

月 12 日 17:39 起,阿里云云产品控制台访问及管控 API调用出现异常、部分云产品服务访问异常,工程师排查故障原因与访问密钥服务 (AK)异常有关。工程师修订白名单版本后,采取分批重启 AK 服务的措施,于 18:35 开始陆续恢复

2023-11-16

新泽西运营中心检测到大范围的系统故障,网络显示屏上出现了大量红色警告。 尽管试图排除故障,但网络故障仍持续了 9 个小时,导致呼叫连接故障率达到 50%。 AT&T 因此损失了 6000 多万美元,6 万多名美国人的电话完全

2023-11-16

HTTP API 的支持,更加灵活多变。 高性能不减:专注于在大规模负载环境下的高性能 MQTT 协议。 模块化架构进一步优化:适应各种业务需求的分布式集群管理。 强力可扩展性:目标支持大规模多租户的 Serverless 云服务。 Bi

2023-11-17

支持,更加灵活多变。   🚀 高性能不减:专注于在大规模负载环境下的高性能 MQTT 协议。   🛠️ 模块化架构进一步优化:适应各种业务需求的分布式集群管理。   📊 强力可扩展性:目标支持大规模多租户的 Se

2023-11-18

更新主要增加了数据库集群批量上线和离线的功能,管理大规模的数据库集群更加方便,并优化了一下代码。 更新 增加数据库集群批量上线功能。 增加数据库集群批量离线功能,方便停机维护。 优化了代码,增加代

2023-03-09

马斯克接手推特后,2023 年才过去两个多月就出现了 6 次大规模崩溃: 1 月 23 日,Android 用户无法加载新推文或发布新推文 2 月 8 日,用户发现无法转发和发送推文,因为被系统提示“超过了每天发送的条数限制” 2 月 15