灾备世界:深入其中才知水有多深

自云计算、大数据、物联网等技术的崛起,企业在从新技术中受益的同时,也面临着前不断出现的新问题,其中安全是最大的一个问题。每年我们都会听到几例云宕机、网站受的攻击、数据泄漏的事件。

灾备世界:深入其中才知水有多深

安全问题是必然事件

2015年5月,对于企业来说真的是“一片黑色”,各大企业组团发生安全事件,从陌陌网络故障无正常运行、到因骨干网络异常,网易旗下游戏、有道云笔记无法运行,再到因光缆被断,导致支付宝大面积瘫痪、最后再到携程由于员工失误删除数据,导致官方网站及应用近12小时无法使用,直接损失超过7,400多万元。2016年,一月中旬清华大学网站遭IS黑客攻击,服务器全部停机;7月6日,国内最大公有云提供商阿里云华北2区网络故障导致业务中断一小时。

这些案例让我们清楚地意识到,安全问题的产生是一件必然事件——无论是大公司还是小企业都无法避免;安全事件的发生也让人防不胜防,且花样百出——有自然的、有人为的,有内部的,也有外部的原因。针对所有这些安全事件,企业可以做的就是建立自己的灾备系统,即使事故发生,我们仍然有备用方案,仍然可以维持业务的正常运行。

然而,我想说的是,“灾备不是想做,想做就能做;要你明白,要你研究,放手才能做”。只有全面了解,深入研究,才能感知灾备的真谛,才能做出更好的灾难防护。

灾备的思考

灾备一词,有许多人都错误地理解它为灾难备份的缩略词;事实上灾备的真正意义包含两层意思:灾难前的备份与灾难后恢复。人们往往只注意到了备份,而忽略了恢复的重要性,导致灾难发生后系统、数据无法恢复如初。近日, 专注于容灾及业务高可用领域的科技企业英方股份发布了《2016 年中国灾备技术和行业白皮书》。书中明确定义的了灾备的含义,指出灾备五大主流技术:

五大灾备技术

数据复制技术:该技术是容灾方案设计中最基本、最核心的技术,主要分为基于数据库/应用的复制、基于主机的数据复制、基于存储网络的数据复制、基于存储的数据复制。

切换技术:切换是指在早前支行系统故障或异常终止后,能够自动切换到冗余或备用信息系统的能力。根据具体突发故障的不同,切换可以分为网络切换和应用切换。另外,灾备的切换是一系列操作的组合,不是单一技术动作,并且由于“容灾黑盒”的存在,其切换的决策难度难度非常大,不能根据单一的个人意愿,需要集体进行决策。

重复数据删除技术:在灾备存储中已经大量应用了基于磁盘的重复数据删除技术。该技术通过寻找不同数据块中的冗余数据,并通过删除这些重复数据来对数据进行压缩,不仅节省一数据中心的空间,还减少了传输备份数据所需要的带宽。重复数据删除技术主要分为基于软件的重复数据删除和基于硬件的重复数据删除两种方式。

数据加密与传输技术:数据级灾备往往依托于多部门、多单位,甚至跨系统的统合协作,因此数据在传输过程或存储介质上的安全性问题也格外引人注意。目前针对数据的加密方式主要有两大类,即源端加密和传输加密。

数据存储技术:从定义来看,存储和灾备并不属于同一领域,但灾备技术是基于存储技术而发展的,数据备份的过程也必须涉及到数据的存储过程。目前,常见的存储方式包含:DAS直播附加存储、SAN存储区域网络、NAS网络附加存储、OBS对象存储等。

云灾备

除了上面提到五项技术外,随着技术的不断发展,灾备技术也在不断地创新。虚拟化技术、开源技术,和超融合等新型技术,也推动着灾备行业的向前发展,同时也出现了新的灾备模式——云灾备。

云灾备是一种全新的灾备服务模式,主要包括传统物理主机、虚拟主机等IT系统,向私有云或公有云等云端化灾备的趋势,以及新业务形态下,灾备端云化,云与云之间的灾备等。它不仅包含传统的数据存储和定时复制,还包括了数据实时传输、迁移和应用切换,从而保证灾备端应急接管理业务应用等等范畴。

根据云计算的不同模式,云灾备也有几个不同的业务模式:SaaS层灾备、PaaS层灾备、IaaS层灾备和DRaaS(灾难恢复即服务)。利用云灾备,企业可获得五大优势:减少基础设施、按需付费降低IT成本、高度机动性和灵活性、快速恢复和安全备份,以及大量的支持服务。

英方首创了灾备全生态理念:以往单一的灾备技术已经发展成一个集信息存储、 信息传输、数据安全等多个方面于一体的综合性 IT 技 术 ,同时 ,不同的灾备技术也必须依赖更高维度的生 态系统管理予以有效整合。从灾备管理的便捷性 ,降低运维成本的角度出发 , 能够提供基于统一灾备平台 ,实现对各类业务数据进 行实时或定时数据灾备、兼容各类操作系统、同时能 够满足本地灾备或异地及云灾备的全生态灾备技术将 大受欢迎。

灾备建设三步曲

英方股份CTO周华说,“灾备的架构比较开放,不是某一个厂商或某几个厂商能支撑起来的领域。这是需要大家一起来建设的一个生态系统,包括所有厂商,以及知识体系共享建设的一个生态。”

因此,在了解了灾备的含义、灾备所需要的技术,以及新型云灾备后,企业就应该着手进行灾备建设了。在英方看来,灾备的建设有三个步骤,即业务连续性规划、灾备规划、灾备方案设计和实施。只有做到专业性实施,且服务体系全面,才能得到用户的认同。

首先,灾备建设的最终目的就是要保护业务的连续性运行,其具体要求需要通过进行业务连续性规划来确定。没有业务连续性规划,灾备建设就没有意义,充其量只能做到数据不丢失,而不能恢复业务运行,所以保障业务连接性运行是灾备建设的重中之中。

其次,灾备规划采用的方法与业务连续性规划的方法基本一致,主要区别在于前者针对的是支持业务运行的IT应用和系统,后者主要关注的业务流程。通过灾备规划,确定所有支持业务运行的IT系统的各项恢复指标,并制定IT系统的恢复策略,以及IT系统的恢复计划。

最后,根据灾备规划对支持业务运行的IT系统提出的恢复要求和恢复策略,来设计灾难恢复技术方案,例如同城灾备,异地灾备、两地三中心、双活,云灾备等。灾备方案的实施是确保所设计的灾备方案真正有效的重要环节,需要制定详细的工作计划,包括场地选址、产品先型、服务商选择、资源保障、项目管理、验收评审、演练测试等等内容。同时,还应该根据灾备计划,确保各个部门在灾难发生时能够统一协调地行动。

结语:

相关推荐