数据中心可能遭遇的灾难是各种各样的。包括灾难性的自然事件,如洪灾、地震和龙卷风,以及网络攻击、设备故障等,都可以被归类为灾难。
公司和组织都应该通过制定灾难恢复计划,将遇到灾难时应有的行动和流程细化,以快速恢复关键业务功能,避免造成收入或业务方面的重大损失。
什么是灾难恢复?
在IT领域,灾难恢复聚焦于支持关键业务功能的IT系统。“业务连续性”通常与灾难恢复联系在一起,但这两个术语并不能完全互换。灾难恢复是业务连续性的一部分,它更侧重于在发生灾难时保持业务运行的各个方面。如今,IT系统对业务的成功至关重要,因此灾难恢复已成为业务连续性的一个主要支柱。
灾难损失
如果一个企业对灾难没有任何应对措施,那么灾难所造成的经济和运营上的损失会将其完全压垮。据IT灾难恢复计划(DRP,DisasterRecoveryPreparedness)理事会年的一份报告显示,一小时的停机时间,就可能会让小公司损失高达美元,中型企业高达美元,大型企业的损失高达70万美元。而且那还是在三年前,今天可能更高。
某灾难恢复服务提供商的另一项调查显示,超过一半的受访企业(54%)在过去5年里经历的停机时间长达8个多小时。这其中有三分之二的受访者表示,他们的企业因停机造成的损失超过了每天2万美元。
风险评估,识别漏洞
即便你的公司已经制定了某种灾难恢复计划,可能也仍需更新。如果你的公司没有相应的计划,或者正准备进行制定,最好先做一次风险评估,识别IT基础架构的漏洞,并找到可能出现问题的地方。当然,先决条件你必须清楚地了解公司的IT基础设施。
在《灾难恢复期刊》(theDisasterRecoveryJournal)最近的一篇博客文章中,作者汤姆?罗普克(TomRoepke)和史蒂文?戈德曼(StevenGoldman)建议,在保持业务连续性的计划中,将最坏的情况从其他重大威胁中特意分离出来的做法是非常危险的/p>
“大体上,大家都会去尝试找出或定义最坏的情况。这是一个致命的缺陷,因为它决定了之后整个计划的努力,即使是在潜意识层面。因为当我们插入一个特定的场景时——如瘟疫、地震、网络攻击等,我们就会自动开始思考和计划响应/恢复措施,以应对这一特定的、潜意识定义下的事件。当这种情况发生时,我们不仅会在规划中形成一种隧道式的局限视角,而且也可能面临着增加风险的危险。这是因为在我们将最糟糕的情况特意分离探讨的时候,只有一两个特定的领域会被过度