关于facebook:Facebook-Instagram-and-WhatsApp宕机事件的原因线索20211004晚开始

4次阅读

共计 1915 个字符,预计需要花费 5 分钟才能阅读完成。

【宕机根本原因的线索】:这个问题与一个叫做 BGP 路由的货色无关,且极有可能与配置失误无关。
【影响工夫长的线索】:过后 facebook 的办公网无奈连贯外网,极有可能是影响时长达 6 小时的起因,因为无奈登录 BGP 路由做个批改。
【宕机时间段】:2021-10-04 23:39〜2021-10-05 06:45

周一,Facebook、INSTAGRAM、WhatsApp 和 Oculus 的中断使马克·扎克伯格帝国的每个角落都下线。这是一种社交媒体停电,最贴切的说法是“彻底”停电,而且仿佛特地难以被解决。

Facebook 自身尚未确认其宕机的根本原因,但互联网上流传很广。与 DNS 记录无法访问的工夫相吻合,该公司的所有应用程序在美国东部工夫上午 11 点 40 分开始从互联网上隐没了。DNS 通常被称为互联网的电话簿;它将您输出到 URL 的主机名(如 facebook.com)转换为 IP 地址,即这些站点所在的 IP 地址。

DNS 事变很常见,如果有疑难,它们就是特定站点宕机的起因。它们可能因为各种不稳固的技术起因而产生,通常与配置问题无关,并且能够绝对简略地解决。然而,这一次,仿佛产生了更重大的事件。

网络威逼情报公司 Bad Packets 的首席钻研官 Troy Mursch 说,“Facebook 的宕机仿佛是由 DNS 引起的;然而,这只是表象。”Mursch 说,基本问题是 (其余专家也批准) Facebook 曾经撤回了所谓的边界网关协定(BGP) 路由器,此路由器蕴含了 DNS 服务器的 IP 地址。如果 DNS 是互联网的电话簿,那么 BGP 就是它的导航系统;它决定数据在信息高速公路上行驶时采纳的路线。

“你能够把它设想成电话游戏,但不是人们在玩,而是较小的网络,让彼此晓得如何分割对方。他们向街坊发表这条路线,他们的街坊会将其流传给他们的街坊。”网络监控公司 Cisco ThousandEyes 的产品营销总监 Angelique Medina 说。

这里很多术语,但很容易说分明,Facebook 曾经从互联网地图上隐没了。如果您当初尝试 ping 这些,正如 Mursch 所说,“这些数据包最终进入了一个黑洞,”。

地图显示了因为 DNS 解析失败而无法访问 Facebook。由 CISCO THOUSAND EYES 提供
https://www.thousandeyes.com/…

不言而喻但仍未解决的问题是为什么这些 BGP 路由器 首先隐没了。这不是一种常见的问题,尤其是在这种规模或持续时间。在宕机期间,Facebook 除了一条推文外没有说别的,“正在致力尽快让事件恢复正常”。在周一下午晚些时候服务逐步复原后,Facebook 发了一份依然不足任何技术细节的申明。该公司示意,“对于明天受到咱们平台中断影响的每个人:咱们很道歉!咱们晓得全世界有数十亿人和企业依赖咱们的产品和服务来保持联系。咱们感谢您的急躁期待。”

与 WIRED 交谈的互联网基础设施专家都示意,最可能的答案是 Facebook 的配置谬误。互联网基础设施公司 Cloudflare 的首席技术官 John Graham-Cumming 示意:“看起来 Facebook 对他们的路由器做了一些事件,这些路由器将 Facebook 网络连接到互联网。”他强调说他不晓得细节产生了什么。毕竟,他说,互联网实质上是网络的网络,每个网络都向另一个网络宣传它的存在。这一次,Facebook 进行了广告。

这也意味着不仅仅是 Facebook 的内部服务受到影响。例如,您不能在第三方网站上应用 Facebook 登录。而且因为公司本人的外部网络无法访问内部互联网,据报道,其员工明天也无奈工作。(Instagram 首席执行官亚当·莫塞里(Adam Mosseri)甚至在推特上说“感觉就像下雪天。”)

这也解释了为什么须要这么长时间能力复原运行。2019 年,谷歌云宕机导致谷歌工程师无奈登录谷歌云来修复谷歌云宕机。Facebook 仿佛至多有可能陷入相似的 catch-22,无法访问互联网来修复 BGP 路由问题。

梅迪纳说,“好消息是,一旦 Facebook 可能复原任何配置,它应该很快就会复原业务。“当它失去纠正后,交通将真正开始流动,”

与此同时,互联网的其它利用也感触到了 Facebook 的宕机。或者,更具体地说,像 Cloudflare 这样的 DNS 解析器(将域名转换为 IP 地址的服务)监控到了平时流量的两倍之多,因为人们始终试图加载 Facebook、Instagram 和 WhatsApp。这些申请不足以压倒整个零碎,但激增的流量揭示人们互联网的确是相互依赖的,有时甚至是软弱的。

援用来自《Why Facebook, Instagram, and WhatsApp All Went Down Today》

正文完
 0