近日,欧洲云计算巨头 OVH 位于法国斯特拉斯堡的机房产生重大火灾,该区域总共有 4 个数据中心,产生起火的 SBG2 数据中心被齐全烧毁,另有一个数据中心 SBG1 的建筑物局部受损,SBG3 因受到消防爱护暂未受影响,以及 SBG4 确认没有受到波及。侥幸的是,到目前(发文工夫)为止,还没有对于大火造成人员伤亡的报道。
(事件产生几小时后,OVH数据中心页面不再显示SBG2和SBG3)
当地报纸称 115 位消防员投入 6 个小时才将其点燃。通过长达 6 个小时的继续焚烧,SBG2 内的数据恐怕曾经彻底失落。
(火灾现场)
令人担忧的是,火灾曾经导致OVH 局部客户数据齐全失落且无奈复原,大量 OVH 客户的 Web 服务无法访问。受影响的客户包含网络威逼情报公司 Bad Packets、收费国际象棋服务器 http://Lichess.org 的提供者、游戏制造商 Rust等等。
Rust 旗下的游戏工作室 Facepunch Studios 也证实,他们的数据已在这场大火中全副失落,即便数据中心从新上线后,也无奈复原任何数据。
火灾产生后,CEO 创始人兼董事长 Oktave Klaba发推倡议客户启动容灾复原打算。他示意将在接下来的 1-2 周对服务器进行紧急修复,完全恢复工夫待定。
截至发文,并无申明发现火灾确切起因。12日Octave Klaba公布视频赔罪并解释可能是因为(不间断电源)UPS电源故障导致的OVH数据中心起火。
OVH是欧洲最大的托管服务提供商之一,除 AWS、微软 Azure 以及 Google Cloud 之外,OVH 堪称寰球体量最大的 Web 托管服务商之一,在寰球领有 27 个数据中心,其中 15 个位于欧洲。而这所有产生在 OVH 启动了首次公开募股 (IPO) 打算两天后。
通篇看下来,损失最惨重的莫过于 OVH 和那些损失了所有数据且没做任何灾备的企业,因为数据失落且无备份的状况下,即代表着业务中断,重大的甚至关门大吉。
当下数字化时代,数据对于企业及集体的重要水平显而易见。然而上述事件通知咱们,除了做好日常平安预警和解决机制以外,同样也得做好灾备,应答意外降临,哪怕是曾经上云。
同创DR专家解读:
云计算自诞生之日起,即具备了先天的劣势,诸如升高IT老本、疾速交付、弹性扩大等等,人们不再须要放心硬件性能和兼容性的问题,同时基于云计算的服务也顺应潮流被业界宽泛认可并迅速推广。
然而这场OVH数据中心产生的火灾也警醒了咱们,云服务与所有技术一样,无利也有弊,如果企业和云服务提供商没有充沛从劫难复原和业务连续性的角度去思考平安问题,一旦产生相似灾难性事件时,那么放在云上的数据和业务零碎都会受到牵连,甚至全副失落。
要做到防患未然,防微杜渐,欠缺灾备与业务连续性体系建设,同时装备正当监控伎俩,及时响应,做好应急处理。无论是否曾经上云,都应器重这个问题。
云服务商尽管能够利用规模效应及成熟的技术为企业提供业务运行的根底环境保障,然而对于存在行业监管,有合规压力的企业,云服务商这方面的能力上就略显有余,通过与业余的BCM和DR公司进行单干会是个不错的抉择。可能高效的帮忙企业实现业务梳理、灾备策略布局、合规建设、应急演练和培训等工作。
晋升环境监控的颗粒度和范畴对于及时精确的判断相似火灾这种重大事件十分要害。监控工具收集来自物理探针和软件探针的各类信息,通过手工或者人工智能技术对各类信息中的内容进行筛选剖析,最终以显形的形式展示进去。
总之,企业时刻须要具备防患意识,通过与业余的灾备公司单干满足行业合规要求,同时辅以业余的灾备平台软件帮忙企业简化业务连续性和灾备治理流程、升高整体老本、晋升用户处理应急事件的综合能力,帮忙企业在业务永续的路线上一路向前。
参考资料:
https://www.bleepingcomputer.com/news/security/ovh-data-center-fire-likely-caused-by-faulty-ups-power-supply/
https://securityaffairs.co/word