当前位置:主页 > 国际 >

全球第三大互联网托管厂商的数据中心出现宕机(2)

2017-07-30 14:51 来源:网络整理
分享到:

这一流程此前虽然进行过基础测试,但却从未以高达5万个网站的规模进行实际操作。整个流程通过脚本实现,且直到次日凌晨3:00,虚拟机克隆工作才正式开始进行。

次日早9:00,已经有20%的实例得以恢复。时间继续推移,“次日晚23:40,最后一个实例的恢复工作终告完成,所有用户皆可正常访问其站点。惟一的问题在于,部分用户原本托管的MySQL 5.1实例被恢复成了MySQL 5.5版本。”

很明显,受影响阵列的灾难恢复流程并不顺利。而且尽管OVH公司的技术支持人员表现出色,但这种状况本可以得到避免。

VNX阵列被安装在了错误的机房当中,除此之外,其还缺少必要的故障转移规划。事实上,主动灾难恢复计划与测试并未能起到应有的作用。

与受影响用户间的沟通亦饱受诟病,OVH公司的表现相当消极。“作为事件的起源,水冷系统冷却液泄漏让我们彻底陷入了恐慌。”

我们该从中总结出哪些经验?

不要将存储阵列与液体同置一室。

面向全部关键性系统组件建立完善的灾难恢复计划与测试方案。

应定期进行审查以配合系统组件的更换。

除非对更新规程进行严格测试,否则不要轻易对关键性系统组件加以更新。

原文标题:OVH遭遇服务器冷却液泄漏事故 导致长达24小时服务中断因为冷却液泄露 




上一篇:巴勒斯坦国总统阿巴斯:巴方希望融入“一带一
下一篇:保加利亚国际民俗文化节开幕

随机文章

>