如何在发生灾难时确保数据中心正常运行时间和电气安全?
- 来源:企业网D1Net
- 2020/1/14 9:35:1139768
【安防展览网 企业关注】灾难来袭时,许多关键设施可能会面临灾难性的后果,但是数据中心尤其脆弱。无论是企业内部部署数据中心、托管数据中心还是边缘数据中心,其所拥有的大量关键业务信息都无法托管到其他设施。因此在断电的情况下,其他设施都会面临重大的业务后果。
为数据中心供电的电气设备也很独特。因此,虽然灾难造成的数据中心停机后果非常严重,但电气安全问题带来的潜在风险也是如此。
以下通过电力中断和电气安全两种视角来研究灾难对数据中心的影响:
与灾难有关的停机成本
随着美国近期发生一些重大灾难(从墨西哥湾的飓风到加州的森林火灾),现在是数据中心运营商了解此类灾难在导致中断时如何影响其运营的好时机。
Uptime Institute公司在2018年的评估调查报告中提供了有关电源管理趋势和当前挑战的见解,重点是数据中心。该调查报告发现了停电数量上升的令人担忧的趋势,基础设施停电和“严重服务质量下降”事件的数量比上一年增加了6%,31%的受访者表示在自己的数据中心经历了电力中断事件。
数据中心的电力中断可能会给企业带来巨大的收入损失。近一项IT智能咨询(ITIC)的研究发现,在47个垂直市场中,81%的企业估计,他们的平均每小时停机成本(不包括灾难性停机)超过30万美元。33%以上的企业表示,每小时的停机时间会使他们损失100万美元或更多。
虽然每个行业都面临着自己的一系列挑战,但数据中心的特殊之处在于,它们对100%正常运行时间的期望与访问关键业务数据的需求直接相关,任何访问的丢失都可能发生超出其他业务范围的后果。重大电力中断的威胁突出表明,需要电力备份解决方案来保护和大限度地减少停机的影响。
备用电源系统的关键组件
为了防止这些高成本并保持系统正常运行,数据中心需要一个集成的电源系统来进行电源管理和灾难预防。首先从一个或多个不间断电源系统(UPS)(通常与备用发电机和配电单元结合部署)开始,以确保电力中断期间提供可靠电源,保障关键IT资产继续运行。这些系统通过在电源事件期间提供网络和其他应用程序的可用性来帮助企业避免数据丢失和硬件损坏。
随着向混合云环境发展的趋势不断发展,监视软件现在已成为电源管理系统的重要组成部分。此外,一些企业已经实施了虚拟化基础设施,可以将其与电源监控软件结合使用,以在发生灾难或其他事件的可能性较小的情况下简化并大化其管理电源的能力。通过使电源管理解决方案与常见的虚拟化管理平台(如来自VMware、Cisco、NetApp、Dell EMC、HPE、Nutanix和Scale Computing的虚拟化管理平台)结合起来,企业及其IT团队可以扩展其服务的可用性。此功能允许团队从单个控制台远程管理物理和虚拟服务器以及电源管理设备。
归根结底,数据中心运营商需要知道其基础设施中采用了哪些电源管理技术,并了解这些解决方案是否能够在灾难发生时满足其可靠性需求。采用正确的电源系统可能意味着业务连续性或数千美元的收入损失之间的差异。
安全势在必行
在数据中心为灾难做好准备时,电气安全可能会被忽略。这其中有几个原因。企业通常依赖专业人员安装电气设备,甚至依赖电气设备制造商自己来确保其基础设施的安全。但现实是,每个组织都有自己的角色,尤其是数据中心运营商。
数据中心的电气系统通常是为功能性、美观性、易维护性、高效性和安全性而设计的,但由于存在许多相互竞争的优先级(更不用说数据中心运营商面临的许多其他职责),安全性并不总是能得到它所需要的关注。
第一步也是重要的一步是花时间了解给定位置可能面临的独特环境和挑战。这可能包括审核当前的配电资产,并审查关键负载分析、发电机连接性、可用性和燃料来源,从而确定发生风险的位置以及在发生灾难时如何解决这些风险。此外,必须具有设施配电系统的新单线图。为了确保安全是重中之重,考虑采用现代化或更新在灾难期间可能变得不安全的特定设备,并利用这些更改的机会的方法将很有帮助。
在此之后,数据中心可以在其设施内实施紧急情况连续性计划,以识别合格人员。然后,他们可以利用数据,通过隔离危险的设备或将危险的设备放在限制未经授权的员工访问的安全位置,使员工能够快速安全地减少危害。企业团队必须确保将连续性计划传达给适当的数据中心员工和服务人员,并进行灾难演习,以便员工可以有效地做出响应。
与备用电源计划一样,电气安全也需要对设施的运营采取整体方法。设施设计的结构、管道、HVAC和其他方面在安全中起着至关重要的作用,如果在整体灾难规划工作中未将其考虑在内,则会造成危害。
结论
灾难随时可能发生,并且会对企业业务运营造成许多不利影响。数据中心运营商需要一个全面的灾难备灾策略,其中既要包含用于预防中断的技术,又要包含负责确保电气安全的程序、协议和人员。有了正确的方法和计划,数据中心运营商可以让灾难对人员安全和业务整体健康的影响降至低。