损失惨重!数据中心失火Rust 游戏25台服务器数据永久丢失

欧洲云计算巨头OVH位于法国斯特拉斯堡的机房近日发生严重火灾,该区域总共有4个数据中心(StrasbourgDataCenter),发生起火的SBG2数据中心被完全烧毁,另有一个数据中心SBG1的建筑物部分受损。出于安全起见,OVH位于斯特拉斯堡的全部数据中心暂时关闭了服务。

OVH公司目前在欧洲、北美及亚洲拥有27处数据中心,除AWS、微软Azure以及GoogleCloud之外,OVH堪称全球体量最大的Web托管服务商之一,甚至被不少人视为欧洲托管服务业的希望。毕竟与其把数据交给美国人,还不如由本地运营商打理。

火灾之前的数据中心大楼

这场大火彻底摧毁了五层高、占地500平方米的SBG2数据中心,并导致相邻SBG1服务器发生损坏。但消防人员及时赶到,保护SBG3与SBG4免遭冲击。OVH公司目前在欧洲运营有15处数据中心,其中有4处位于斯特拉斯堡园区。园区内另有1处新数据中心在建。

在消防员们成功平息火势之后,OVH立即介入并对斯特拉斯堡园区的数据中心设施进行盘点。该公司发现,SBG2的某一房间在当天00:47发生大火,主体建筑在04:09被完全摧毁。位于莱茵河毗杜港莱茵工业区的SBG1数据中心同样受到影响。目前,全部4处数据中心均已离线。

Klaba在最新发布的推文中提到,“SBG1已经遭到部分破坏。”他还建议客户立即启动灾难应对计划,并补充称“整个站点均已被隔离,并影响到SBG1至SBG4承载的所有服务。”

OVHcloud在服务状态页(截至本文发稿时)表达了深切歉意,并恳请客户不要“申请重置”。作为三大云巨头(AWS、微软Azure、GoogleCloud)之外欧洲最大的网络托管服务商,OVH公司董事长Klaba表示恢复计划将“为SBG3数据中心重建2万伏供电设备”;“为SBG1/SBG4重建240伏供电设备”;验证网络机房内的路由器/交换机;并在各处数据中心内兴建额外的冗余网络机房。他还在另一条推文中提到,“SBG1中的网络机房并未受到影响。”

引发火灾的原因尚不清楚,但当地报纸称115位消防员投入6个小时才将其扑灭。经过长达6个小时的持续燃烧,SBG2内的数据恐怕已经彻底丢失。

“不!我没有任何灾难恢复计划!”

这场大火对欧洲范围内的众多网站造成严重影响。据Netcraft称,目前跨464000个域的多达360万个网站皆已下线。

受到此次大火影响的客户包括欧洲航天局的数据与信息访问服务ONDA项目,此项目负责为用户托管地理空间数据并在云端构建应用程序。ONDA项目负责方为Serco意大利分部,OVH则参与提供云基础设施,将来自哥白尼地球观测项目的10PB非预结构化数据通过公有云交付至开发者手中。项目管理方表示,所有服务“在……今天上午斯特拉斯堡OVHCloud基础设施发生重大火灾之后,均被暂时禁用。”

Rust旗下的游戏工作室FacepunchStudios证实,有25台服务器被烧毁,他们的数据已在这场大火中全部丢失。即使数据中心重新上线后,也无法恢复任何数据。

其他客户还包括法国政府,其网站之前被迫下线,但目前已经恢复运行。另外还有加密货币交易所Deribit,以及负责跟踪DDoS僵尸网络与其他网络滥用问题的信息安全威胁情报厂商BadPackets。BadPackets公司首席研究官TroyMursch在之前的推文中提到,“可能会有部分数据丢失”,但其随后在采访中澄清称这里指的并不是该公司自己的数据。

无论如何,这场大火还是跟信息安全行业搭上了关系。卡巴斯基研究总监兼全球分析团队负责人CostinRaiu今天早上宣布,此次火灾还烧掉了不少防止发布恶意软件的服务器。“我们在OVH当中已经发现140台被APT及其他网络犯罪集团利用的已知C2服务器,其中约64%目前仍然在线。受到影响的36%服务器与多个APT团伙有关,包括:CharmingKitten、APT39、Bahamut以及OceanLotus。”

在一份采访声明中,Raiu解释道:“根据我们的跟踪数据,OVH在全部托管有恶意命令与控制基础设施的互联网服务供应商中排名第九。但总体而言,OVH托管的APT与网络犯罪集团C2设备在总量中的占比不到2%,远远低于CHOOPA等其他托管服务商。”

他还提到,“我认为这次意外事件对恶意团伙的影响很小;更重要的是,大部分复杂恶意软件都配置有多台C2,用以缓解入侵及其他风险。很高兴看到此次火灾没有造成人员伤亡,也希望OVH及其客户能够从灾难当中尽快恢复。”

受到火灾影响的其他OVH客户还包括欧洲人民大学、斯特拉斯堡机场、瑟堡市政府、标致-索绍工厂委员会、浏览啤酒厂、克莱蒙费朗橄榄球俱乐部、以及西班牙职业足球俱乐部维拉里尔。市场营销平台同样受到影响,并在用户通告中表示“我们服务供应商的数据中心出现重大问题,导致服务中断”,并决定“以承担部分后果的方式……支持这家托管服务商。”

专门销售苹果配件的供应商CoverStyle以及免费国际象棋平台网站也受到了影响,但后者明显灾备措施更到位,短短24小时之后即重新上线。此外,加密货币交易所Deribit、电信公司AFR-IX、加密货币实用程序VeraCrypt(包括其git与站点)都受到影响。为了解决问题,VeraCrypt决定将用户引导至SourceForge与GitHub,“在服务中断期间继续下载及访问源代码。”绘图板平台pr0gramm则立刻将火灾事件发布给访问用户,并承诺最后一轮备份已经于2小时前完成。

但也有人没那么走运:

“不!!!我靠!!!我就是个普通客户,没有任何灾难恢复计划……我的服务器在机架70C09上,它现在还好吗?”

不同寻常的火灾

这场火灾强烈地提醒着我们,云服务与所有技术一样,有利也有弊。

云服务最大的优势在于,让人们不必担心硬件问题,具有非常好的可扩展性和灵活性:它可以对需求变化快速地做出反应,并且用户可以按需付费,从任何地方进行访问。但是,即使在云中,用户的数据也始终位于某个地方。这个地方仍然需要安全性、数据保护、备份和灾难恢复。

让很多人疑惑的是,作为一家有名的云服务提供商,技术应该很成熟,也应该有软件对此类事件进行预警,并自动启动灭火系统。但这些系统都没有起到作用,消防员到来后根本就压制不住熊熊的火势。

“SBG2的电网建立在SBG1的电网之上,而非两处数据中心彼此独立。”在被问及此次升级的更多细节时,OVH方面表示计划“拆除部分货运集装箱(用于放置设备)”以及主体电气工程。

“这是我在职业生涯中亲眼见证的又一次数据中心燃烧事件,好在当时那处设施还没有全面运行。以模块化或者园区形式建设数据中心,就是会带来这样的风险。”

“在初步设计数据中心时,往往设想不到园区的总体电力与制冷能力需求。随着园区规模的发展,对电力及制冷能力的需求也会越来越大。我们已经在伦敦港区的HarbourExchange遇到过类似的情况。对于这类最初设计并非作为数据中心的建筑,总会留下各种各样的疑难杂症。”

在谈到客户面对此类事件该如何保护自己时,Haynes认为“最重要的是,企业必须在保证数据中心基础设施符合TIA942IterII标准的审计之外,还同时具备完善且明确记录在案的变更管理、事件响应以及风险管理方法。”

OVH公司创始人兼董事长OctaveKlaba也于昨天简要介绍了恢复计划,表示各处数据中心对应的电力基础设施同样受到影响,预计至少需要七天才能重新运转。Klaba提到,该公司拥有“随时可以交付给所有受影响客户的免费”新服务器、pcc与pci,同时计划“在未来三到四周之内增加10000台服务器。”

四天之前,OVH公司宣布有意竞购法国流媒体初创企业Shadow(也称Blade)。本周一,这家云服务商还谈到上市计划。一位发言人在采访中表示,OVH“已经开始在巴黎筹划上市工作。”

火灾发生后,竞争对手Equinix给予了出色的回应:

[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系我们会予以删除相关文章,保证您的权利。

上一篇 《危鸡之夜》手游评测:真正的“杀鸡”游戏
下一篇 “很快”登陆Cocos2016 “快玩”探索H5游戏新契机