云计算体验与成本双赢背后:需平衡集约、分布部署
云计算本质是一种基于互联网访问的IT服务能力,它具备按需随选的特点,具有良好的可视化体验,同时还具有经济性。按需分配以及弹性伸缩是云最为重要的特征,这种特点意味着云计算不仅可以及时满足各种需求,而且可以动态满足需求的变化。
弹性伸缩特性使网络成本降低
笔者先解释一下什么是云计算的按需分配以及弹性伸缩。以虚拟机为例,如这个时刻网络需要5个虚拟机,下一时刻增加到10个虚拟机,再下一时刻仅需要3个虚拟机,传统的IT模式很难满足这种动态伸缩需求,这种伸缩称为Scale Out/In,适合于原生云应用。而另一种伸缩体现在虚拟机本身资源能力的扩大和缩小,例如这一刻需要4vCPU/8G的虚拟机,下一刻扩大到8vCPU/16G,再下一刻回到4vCPU/8G,还可能包括虚拟机硬盘的伸缩,在这种伸缩的实际操作中,资源扩大比较容易,资源缩小则比较困难,通常不建议操作,这种伸缩称为Scale Up/Down,比较适用于传统IT平台,另外这种弹性伸缩一般是自动化的,不需要或很少需要人为干涉,由监控系统监控资源负载情况,基于预先定义的策略自动去调度资源、扩展和回收资源(对于Scale Up/Down这种伸缩在自动化伸缩情况下极其容易出现问题)。
弹性伸缩这种特性对于互联网/移动互联网类应用是至为重要的,而要实现弹性伸缩就要求资源池共享程度高。资源池具有较大的规模,能够实现较好的“错峰填谷”,否则可能造成资源浪费(为了实现扩展,资源冗余度过高)或弹性不足(冗余不足,难以实现按需扩展)。
除了弹性伸缩,云计算还具有经济性和低门槛的特点,成本优势是云计算之所以大获成功的关键之一,成本的降低促使中小企业和个人使用IT的门槛也随之降低(按需弹性也降低了用户使用云的门槛)。而云计算之所以有成本上的巨大优势,并非简单地引入虚拟化技术就能实现的(仅仅实现了单物理机的简单共享能力),而要涉及到全局资源调度能力、产品模型优化(成熟度高的云服务提供商会提供上百种产品规格,以满足各种用户需求,避免用户资源浪费,实际也是资金浪费)、规模化经济效应、服务器高度定制化、 软件定义技术、自动化部署与运维技术、DC机房选址以及制冷电力节能技术的引入等,但集约规模化是最主要的降低成本的手段,有效降低建设、部署、运维的成本。
另外,云计算的应用使得用户体验更优,而复杂度降低。传统IT的部署、应用复杂度都较高,需要专业人员操作,同时准备周期也长,而云计算用户能够像使用互联网应用一样使用云服务,例如可以自助服务、服务迭代优化、用户界面友好等,可以将大量的配置和运维工作交给后台的工程师。
云架构要在集约和分布间平衡
因此,云计算的基础设施需要尽量集约化和规模化,以保障最大化的共享、按需提供资源以及降低成本,但过于集约化和规模化可能无法保障最终用户的访问体验,所以需要在集约和分布两者间实现平衡,为了保证用户使用体验,同时还要保证规模化效应。
公有云服务商通常在数据中心的布局上费尽周章,例如AWS(亚马逊云计算公司)典型的数据中心架构(Region+Available Zone),既要保证有规模,还要离用户需求更近一些,同时更要保证HA,在这方面AWS为行业(公有云)树立了标杆,目前大部分公有云提供商都按照AWS的云数据中心架构进行全球布局。
同时,随着运营商网络功能虚拟化(NFV)的推进,运营商未来将需要构建面向NFV的规模庞大的云基础设施(即NFVI),虽然承载的绝大部分将是软件化的网络网元,但NFVI的部署同样面临着集约化与分布式部署的矛盾。
集约化部署的好处是建设、部署门槛较低,运营、运维成本更低,能够集中实现冗余和灾备,网络架构较为简单,管理统一较为容易,但是比较适合于承载计算存储型的网络VNF(网络虚拟化网元),例如vIMS以及网元转控分离后的控制功能等,不适合于实现接入型、流量型和高转发型的网元。而例如OLT、BRAS、EPC转发设备等(严格说OLT和BRAS如果实现控制分离,控制功能的NFV可以实现一定的集约),涉及到用户网络体验、网络架构调整和部署成本等问题。
分布式资源池体系挑战巨大
因此,运营商的NFVI,无法做到像IT、VAS资源池那样集约化,需要参考网元现有部署位置以及网元虚拟化特点进行分层部署,甚至实现转控分离后,转发功能还需要进一步下沉,以提升用户体验,包括满足未来VR、4K、物联网以及自动驾驶等对带宽和时延要求高的业务需求,例如在本地网的边缘和核心层面的数据中心上进行部署,这样必然导致运营商NFVI的资源池节点体系非常分散,分布式的资源池体系带来的挑战巨大。主要面对的挑战有以下4点。
第一,本地网目前并没有合适的可部署NFVI的机房,需要充分利用本地网CO机房进行DC化改造,这带来CO选址、改造的挑战(有些CO机房改造成本过高,而新建机房又没有资源条件)。
第二本地网NFV容量较小,资源池规模较小,这就带来了大量的分布式的资源池建设问题,资源池的分裂(以及网络条件限制)难以实现共享和调度,建设部署成本也较高(需要分别进行规划、设计、集成部署等),同时每个本地网的DC都需要有容灾的部署,增加了部署成本,另外在资源的维护上压力也较大,人工成本较高。
第三,各地部署节奏、需求和CO资源差异较大,这可能带来的问题是未来NFVI资源池五花八门,很难统一(例如软硬件厂商类型过多,架构封闭性,自成体系,形成一个个烟囱),如何实现资源池统一部署架构,包括与已有资源池的管理架构融合,将是一个巨大的挑战。