创建云灾难恢复需要了解服务等级协议(SLA)
如今,许多组织正在转向云计算的特定服务,应用程序和新的商业经济。人们看到更多的方案部署到云计算中,并且出现了围绕特定类型云服务的更多的成熟方案。
考虑这一点,根据思科公司的调查,全球云计算流量在2014年跨过了泽字节门槛,而2019年,在云计算中的总流量将超过所有的数据中心总流量的五分之四。云计算流量显著增长,2019年云计算流量为总数据中心流量的83%,这其中包括快速通过和迁移到云计算架构和云计算数据中心的能力,以处理更高的流量负载。云计算数据中心支持增强的虚拟化,标准化和自动化。这些因素导致更好的性能,以及更高的容量和吞吐量。
一个真正伟大的用例是使用云计算提高灾难恢复(DR),备份和弹性的能力。而且,这个主题最重要的事情之一,在开发时,通过第三方主机的服务等级协议(SLA)部署灾难恢复环境。这是一个组织可以定义的非常具体的条款,其中包括硬件更换,管理服务,响应时间等等。基于云计算的远程数据中心,可以像本地化数据中心一样进行监控和管理。当与第三方供应商时,需要主机托管或数据中心托管时,确定具体的界限,并尽可能清楚地理解管理者的意图。
利用供应商的灵活性。托管服务提供商有非常灵活的能力。他们可以设置一个合约,声明他们将只管理一个租用的机架的硬件组件。而在这种情况下,管理程序和以外的一切设备,将成为客户的责任。即使在这种情况下,知道是否已发生故障或者发现有故障的组件是非常重要的。基本上,用户的目标是保持与远程环境恒定的通信。管理员必须知道底层硬件上发生了什么,即使他们不直接负责。对物理灾难恢复资源的任何影响,都有可能会对在该硬件上运行的任何工作负载产生重大影响。
同样,还要有可以接管整个DRBC功能,甚至准备将故障转移网站所需要的新的云服务。请记住,为了满足关键工作负载和更高的正常运行时间的要求,需要有特殊的SLA条款和成本的考虑。
定义业务恢复要求。当开发一个云计算或托管数据中心的SLA时,重要的是明确定义的恢复时间目标,也就是部件正常运行时间有多长?一些组织要求他们的许多关键部件达到99.9%的正常运行时间。在在这种情况下,确保组件的适当的冗余是非常重要的。这些都可以建成一个SLA以及具有可视性灾难恢复环境的后端监控工具。以下举一个具体的例子,如果你利用微软公司的冷与热存储,这也要有一些正常运行时间的考虑。微软公司强调,你可以在冷热接入层之间选择存储基于其访问模式对象数据。然而,冷层提供了99%的可用性,而热层提供了99.9%的可用性。
所以,你绝对需要围绕自己的灾难恢复和连续性要求进行设计。如果一个组织有0到4个小时的恢复目标,这是可以接受停机一段时间,但这种类型的灾难恢复设置的时间不能太长。采用服务等级协议(SLA)仍然可以在被隔离的供应商和客户之间建立明确的职责。在紧急情况时有发生时,具有良好的沟通和明确的环保知名度的将节省大量的时间和精力。