CloudOps:云和运维的融合创新
只是这一次,Wintel的美谈已成历史,微软也早不复当年之勇。且不论Windows 8、Windows Phone和Surface的评论与销售双双滑铁卢,Windows Azure挣扎这么多年,仍然无法成为市场主流。虽然亲生的Hyper-V虚拟技术对Windows系统的支持最好,但始终不温不火。只有深度依赖微软技术栈的客户,还保持对微软技术的不离不弃,倒也不负恩泽。
廉颇老矣,何论冯唐?百年IBM在给宣传SmartCloud时自豪地宣称专注虚拟化40年,一口气将自己的虚拟化寻根到上世纪70年代的System/360,俨然一副“蓝色巨人”的风范。只是2013年6月当NASA宣布放弃IBM而选择Amazon AWS的时候,不知道40岁的SmartCloud是否老泪纵横?
屋漏偏逢连阴雨,过去的一年中国内云计算界在淘宝的带领下也掀起了对“巨人的进击”—“去IOE”的声音越发响亮。在云计算的时代,IBM的小型机、Oracle的商业数据库、EMC的存储在X86的廉价集群前溃下阵来。淘宝在2005年以蚂蚁大军击败eBay大象,如今“蚂蚁缠斗大象”的一幕似乎将在IT基础设施的领域再一次上演。2013年5月17日,阿里最后一台IBM小型机在支付宝下线。那张照片是这次“去IOE”革命的最好注脚。
无怪乎RedHat、Canonical、VMware、Intel等厂商也纷纷追随RackSpace和NASA,进入以OpenStack为代表的开源云计算社区,或以产品、或以资助、或以资源等方式试图在廉价云计算市场占得先机。除了收购DynamicOps和Nicira,VMware组建了一支专门的开发团队向OpenStack代码库提交针对vsphere Hypervisor的代码。Intel从2012年起,就开始深度参与到OpenStack的开发中去,其上海的测试团队就一直对OpenStack的各个版本提供测试。在移动市场失掉先机之后,Intel在云计算、大数据和穿戴式设备领域终于找回了感觉。
“三十年河东,三十年河西”,在过去的一年中,开源社区和中小型厂商迎来了属于它们的机会。我们不仅看到了基于容器的虚拟化技术的兴起,也看到诸多新鲜血液加入到云计算的市场。
Joyent在收编了Solaris的一批开发骨干之后推出了SmartOS,不仅进一步完善了Solaris的Container/Zone以及ZFS,而且将Linux下的虚拟化Hypervisor KVM移植过来。于是,以NodeStack和Fengqi.Asia为代表的部分公有云厂商选择了SmartOS作为云平台底层虚拟化的核心组件。除了Unix,在Google的大力推动下,基于cgroups技术的LXC在2013年也是在Linux社区得到了极大的重视和发展。腾讯基于LXC推出游戏云,为QQ游戏提供更弹性的资源配给和资源隔离服务。与此同时,以Docker为例的工具在过去的一年内也夺取了很多眼球,甚至进入到商业市场。百度在它的BAE(Baidu App Engine)中就使用Docker来管理底层的资源。
除了上面的重量级厂商和公司,国内的中小、创业公司也是捷报传。先是2013年8月金山云宣布2000万美元的融资,接着上海的UCloud宣布获得1000万美元的A轮投资。最近,想做中国AWS的QingCloud又在2014年元旦之际宣布2000万美元的B轮融资。风投资本再一次投出了自己的一票,用赤裸裸的金钱证明了他们对于国内云计算市场的看好。
上述都是针对基础设施的厂商,他们结合底层的各种Hypervisor和Container将面向IT的服务固化到他们的云平台之中。与之对应的是,传统意义上位于运维上层、离一线运维人员更近的配置管理、任务编排、日志监控以及日常运维等领域也是英雄迭起、精彩纷呈。很多厂商将不同层次的技术结合起来,以期在IaaS上提供更多的增值服务。RightScale将IaaS和Chef结合,提供跨越不同云平台的虚拟机镜像服务,甚至支持企业内部的vSphere;Travis-CI将Vagrant和VirtualBox结合,向GitHub这类的代码托管厂商提供持续集成的服务;ScaleWorks将vSphere、OpenStack和Chef结合,向企业提供针对已有虚拟化技术的云化方案;Modern.IE则把眼光放在了Windows IE版本兼容性测试的领域,结合VirtualBox、VMware和Parallels提供标准的虚拟机镜像服务……更别说Chef背后的OpsCode、Puppet背后的PuppetLab和Ansible后面的AnsibleWorks了。大量的运维人员将自己的最佳实践转化为开源或商业产品,守得云开见月明。
实质上,云计算从来都不是目的,背后的CapEX、OpEX以及Productivity才是真正的诉求。而这,是永远不变的主题。云计算通过虚拟化和标准化,将精通运维的团队与个人的生产力池化而后量化、再服务化,使得大量的非运维人员可以以很低的价格享受优质而有SLA保障的运维服务。因此,云计算可以算得上是技术挑战商业的又一次成功案例。
Hypervisor和Container虚拟化技术都基本尘埃落定,云计算领域的大玩家也都已经基本进场,更多的中小玩家在纷纷自立山头。这只是云计算的起点,根本不是云计算的重点。更多的领域将等待着云计算团队们去突破,云计算更多的想象空间等待着整个市场去挖掘。笔者不才,妄自预测了2014年的云计算新趋势,可分为如下四个方面:
Cloud Native Application:运维从未有像今天一样这么深远地影响到软件的开发和设计。软件应用在架构上如何更好地弹性利用已有的云服务,这将成为未来一段时间的重要命题。传统的软件开发对于可扩展性和运维考虑的是各级模块的纵向扩展和HA,但Amazon AWS的CloudFront、EC2、EBS、S3、DynamoDB基本就涵盖了网站的CDN、计算、文件系统、存储和数据库,这些对于一个中大型的互联网网站已经绰绰有余,企业又有什么理由不去利用?再比如,传统的软件监控往往强调MTTF,Netflix开源的Chaos Monkey则对系统的MTTR提出了更严格的要求。
Cloudify OPs:传统的运维只是单机版1.0,未来的运维需要同时操作上千台机器;传统的运维只是被动地执行变更,未来的运维需要主动地提出变更。如何结合企业的运维流程和要求,从整个企业全局的角度提高运维的效率?如何即提供服务平台,同时又保障运维的合规?《Measureing IT》这本书里面提出了SPO(Servers Per Ops)指标——一个运维人员,能够支撑多少台服务器的运维、配置管理、应用部署、监控警告等。类似于互联网思维对于产品经理的思维改造一样,运维人员用云计算的思维、技术和工具对自己的日常工作进行改造。这一点对于国内的运维团队更为重要,否则,人力成本导致“人海战术”的难以为继只能阻碍运维团队为企业创造更多的价值。
I&PaaS:2011年,NIST定义了云计算的几种类型,但谁又规定了IaaS、PaaS和SaaS的边界不能被打破?IaaS、PaaS和SaaS都只是运维服务平台化的实现方式而已,只要有需求,就没有不能被打破的藩篱。Amazon AWS支持Beanstalk,Google除了GAE之外也推出了自己的Cloud。如今,OpenStack也加入了LXC的支持,业界涌现出来OpenStack加上CloudFoundry或OpenShift组合向外提供PaaS服务的案例。未来IaaS、PaaS两者的融合会越来越多、越来越快,也算是上文提及的IaaS厂商下沉IT服务的一类。
Cloud Security:随着企业的应用迁移到云计算服务厂商,视数据为生命的企业对云平台的安全性也提出更高的要求。Amazon和GMail在2012~2013的几次事故都给云平台的可用性和安全性提出了质疑。去年,随着个人云、穿戴设备的兴起以及小白用户对云平台SLA的不了解,都给数据和云的安全提出了更高的挑战。如何从云的整体技术栈着手,构建全面的安全服务,不出现任何的短板;如何从租户的隔离上下手,减少租户对底层系统的突破,减少租户之间的攻击;又如何在第一时间侦测到安全的问题并采取措施修复问题,这些都是云服务厂商需要考虑并强化的点。