美国时间8月14日,GitHub 出现大规模宕机事故,核心服务几乎全部瘫痪(现已恢复)。当时用户反馈称,GitHub 主站无法访问,并显示“无可用服务器”的错误信息。
同时,包括 Pull Request、GitHub Pages、Copilot 和 GitHub API 在内的多个核心服务也受到严重影响。
根据 GitHub 的 Status 状态页消息,本次影响范围为 GitHub 全站所有服务。
根据 GitHub Status 当时公布的情况,此次故障疑似因数据库基础设施变更导致,公司正在紧急回滚。
值得注意的是,此次故障发生迅速,从 GitHub 首次发布故障信息到多个服务瘫痪仅用了数分钟时间。据第三方监测平台 Downdetector 显示,有超过一万名用户报告了问题。
网络监测机构 NetBlocks 也确认了 GitHub 正在经历全球范围的宕机。
服务恢复后,GitHub 很快就发布了事故报告,称这是由于他们对数据库基础设施更改配置,从而引发流量路由受影响,结果导致关键服务意外失去数据库连接。在这一事件中,没有数据丢失或损坏。
详情查看:https://www.githubstatus.com/incidents/kz4khcgdsfdv
相关阅读
GitHub 多项服务出现故障
GitHub 今天凌晨短暂宕机
GitHub.com 跑了 1200 多台 MySQL 主机,如何无缝升级到 8.0?
GitHub 解释近期频繁宕机原因:MySQL 不堪重负