共计 1660 个字符,预计需要花费 5 分钟才能阅读完成。
简介: 美国工夫 7 月 17 日,美国出名的网络安全服务提供商 Cloudflare,呈现了突发网络服务故障。通过这个事件,和大家聊聊对于网络安全稳固的思考,以及稳固、平安的 DNS 服务的重要性。
7.17 事件
美国工夫 7 月 17 日下午,出名互联网服务商 Cloudflare 因为路由器产生谬误,引起全球性互联网拜访中断,中断继续了 27 分钟,整个网络上的流量降落了 50%,造成包含 Shopify、Politico、Discord 和 LOL(英雄联盟)等在内的网站及服务无法访问。随后,Cloudflare 从其寰球的十二个数据中心从新路由了流量,逐步复原了互联网拜访。
据悉,故障波及的范畴微小,包含达拉斯、西雅图、洛杉矶、芝加哥、华盛顿特区、亚特兰大、伦敦、阿姆斯特丹、法兰克福、巴黎、斯德哥尔摩、莫斯科、圣彼得堡、圣保罗等多地。
图片起源:Cloudflare
事件起因——“不是攻打的后果”
美国东部工夫下午 6:09,Cloudflare 在其官网上公布一条音讯:“今天下午,咱们看到了网络中某些局部的中断。这不是攻打的后果。咱们寰球骨干网中的路由器仿佛发表了谬误的路由,并导致网络的某些局部不可用。咱们置信咱们曾经解决了根本原因,并且当初正在监视系统的稳定性。”
随后,Cloudflare 博客中更新了此次中断的起因:在解决与纽瓦克到芝加哥的网络阻塞问题时,其网络工程团队更新了亚特兰大路由器上的配置。然而,此配置蕴含了一个谬误,该谬误间接导致逾越 Cloudflare 骨干网络的所有流量都发送到了亚特兰大。这很快使亚特兰大的路由器不堪重负,并导致连贯到主干网的 Cloudflare 网络地位呈现故障。
图片起源:Cloudflare
工夫线
具体的工夫线是这样的:
• 20:25 EWR 和 ORD 之间的骨干链路失落
• 20:25 ATL 和 IAD 之间的骨干网拥塞
• 21:12 至 21:39 ATL 吸引了来自整个骨干网的流量
• 21:39 至 21:47 ATL 从骨干链路中删除,服务已复原
• 21:47 至 22:10 外围拥塞导致某些日志降落,边缘持续运行
• 22:10 全面复原,包含日志和指标
下图是 Cloudflare 外部流量管理器工具产生的影响视图。
图片起源:Cloudflare
事件后续
预先,Cloudflare 公开发表声明:“咱们从未经验过骨干网中断的状况,咱们的团队迅速响应以复原受影响地位的服务,但这对于每个参加人员来说都是一个十分苦楚的期间。对于咱们的客户以及中断期间无法访问互联网的所有用户,咱们深表歉意。咱们曾经对骨干配置进行了更改,以确保此类情况不会再次发生”。
稳固、平安的 DNS 服务的重要性
在 2019 年 7 月 2 日,Cloudflare 就曾因 CPU 的大量激增导致主、次零碎解体,蒙受了约 30 分钟的停机。短短一年工夫,Cloudflare 又一次产生如此重大的事变,这让咱们意识到一个稳固、平安的 DNS 服务是如许重要。
随着物联网、5G、AI 等技术的倒退,互联网减速了诸如无人驾驶、近程办公、智能家居等多个新兴行业的诞生与倒退。能够试想一下,当无人驾驶汽车运送您返回目的地时、当 AI 机器人正在为您提供服务时、当您正在进行一个近程大型会议时……如果此时呈现断网、网络攻击等问题,将会造成怎么的严重后果。
因而,在这样的背景下,作为本着“用户至上”理念的网络 DNS 服务厂商,咱们更加不能漠视网络安全与稳固的问题。如何保障大量数据运行过程中服务器不宕机、网络不中断,如何反黑客、避免网络攻击,是咱们始终须要思考的问题。
阿里云 DNS 团队领有多年的 DNS 经营教训,始终把互联网基础设施重要组成部分作为咱们的指标,博得业界好评。咱们的产品深受用户青眼,向来是用户的首要抉择。阿里云公共 DNS 服务,面向所有互联网用户,提供寰球公共递归域名解析服务,旨在用优质的服务保障网站运营商的业务继续稳固、保障用户的晦涩上网体验。
不管您是一般的互联网用户,还是浏览器的厂商,亦或是智能终端设备的供应商,阿里云公共 DNS,都能为您提供平安、稳固、疾速的服务。
原文链接
本文为阿里云原创内容,未经容许不得转载。