关于应对混合云存储若干技术挑战的思考

改用混合云存储模式有助于应对安全和合规方面的问题,但随之带来了诸如数据同步和广域网延迟之类的问题。

关于应对混合云存储若干技术挑战的思考

数据安全和合规问题帮助促使企业对混合云而不是纯公有云或纯私有云解决方案产生兴趣。在这种混合模式下,公司的一部分数据驻留在私有云上,一部分数据驻留在公有云上,而大部分数据驻留在私有云和公有云上。

然而,混合云存储方案也有其问题。虽然它确实有助于应对合规问题,但是无法消除合规问题。仍然面临合规问题,限制了哪些数据可以进入到公有云,或者驻留在公有云和私有云上。与此同时,暂时将数据拷贝到公有云花费太多的时间、耗用太多的带宽,因而处理负载激增的“云爆发”(cloud-bursting)这个概念遭遇这个现实:拷贝在云端创建新实例所需的数据所花的时间可能比负载激增持续时间还长。

另一个问题是数据同步。一旦主副本数据发生了变化,你如何防止公共实例因使用或创建非同步的信息而“践踏”私有数据?

来自初创企业和大牌厂商的众多产品试图解决这些问题。Nirvanix、StoreSimple、Nasuni和Twinstrata等公司提供缓存网关,但这些产品都受制于广域网在普通操作中的速度。这些网关看起来就像NAS文件管理器或云(分别是NFS协议或REST协议)。数据写入到本地缓存中,然后通常经过压缩后,重新写入到云端。本地磁盘或固态硬盘充当读取缓存,以加快最近文件的交付。

如果改用这样一种新的混合模式:数据仍然留在私有云,但可以由公有云中的新实例来访问,它会直接面临典型广域网连接的低速度和高延迟这个问题。延迟会长达数毫秒,相比之下私有云的延迟只有数微秒,这意味着公共实例将效率低下、速度缓慢。

有几个办法可以改善这种情形。最有用的一种办法就是,结合运用缓存和数据压缩,以减少广域网流量。压缩和缓存的好处取决于具体的使用场合,但通常而言压缩可以实现耗用带宽缩减约6倍(云端的存储数据也可以缩减约6倍),同时缓存通常可以将流量减少约4倍。这两种方法可以结合使用,但是面临性能挑战,如果与固态硬盘操作相比更是如此,因为压缩和缓存查询都是计算密集型操作。

提高广域网连接的速度是另一个办法。遗憾的是,在美国,电信公司觉得市场对光纤互联网链路的需求不大。这将广域网链路的速度限制在通常只有每秒50兆位(50 Mbps),甚至更低,而这跟不上如今单只硬盘的速度。

主机托管的私有存储可以在一定程度上缓解广域网带宽问题,存储池位于电信公司的设施,并由专用链路连接到公有云。但是通向私有云的连接仍然速度偏慢,所以光纤到电信公司的连接依然是个问题。

不过,已经有人提出了一个更发人深省的问题。云安全达到让用户相信它足够安全可靠的时候DD也许只要再过一两年,公有云解决方案的灵活性、成本效益和绝对规模会让混合云不切实际吗?

除了这个问题外,现在一些人还在向公有云中的SaaS混搭应用程序迁移。在某个时刻,纯公有云解决方案很吸引人。从技术的角度来看,最合适的主机托管就是放在公有云提供商的内部,而这有可能连接纯公有云解决方案。

相关推荐