如何通过虚拟化和云环境提升资源使用率
当Dammions Darden担任德克萨斯州嘉伦市高级系统管理员上任伊始,他很快就意识到其位于达拉斯市郊的托管着该市234000市民信息的50到60台物理主机并没有全部实现有效运转。一些主机的产能过剩,而另一些则处于超负荷运行状态。
传统上,如果应用程序运行缓慢,虚拟机需要更多的内存。但最简单的解决方案却并不是最好的:即增添更多的硬件。但Darden显然对于这一解决方案并不满足。当他在两年前参加VMworld大会时,他曾造访过VMTurbo公司的展台,VMTurbo公司专门致力于分析虚拟环境。
通过使用Vmturbo的服务,以洞察和了解虚拟网络中到底发生了什么状况,然后嘉伦市发现他们可以在某些物理机器上显著的增加虚拟负载,从每台主机托管20到25台虚拟机增加到在某些服务器上增加40到45台虚拟机。而通过整合所释放出来的主机容量可以用来支持其他工作任务。例如,他们正在考虑采用一个虚拟桌面环境,但又担心硬件成本,这样,Darden就有服务器来托管这些部署了。
只是简单的增加更多的硬件设备固然很轻松,但其实还有更好的方式,Darden表示。
IDC的企业网络集团总经理马特伊斯特伍德也表示同意。他估计,典型的运行10到12台虚拟机的企业服务器在今天大约只使用了30%至40%的容量能力。最佳的服务器利用率通常在60%至70%,这意味着很多服务器可以很容易地处理两倍于的那个钱的虚拟负载。随着虚拟机的爆炸式增长——IDC预测,虚拟机的数量在未来四年内将增加130%——一些IT企业将购买更多的硬件来增加容量。但专家表示,明智的企业领导会首先优化现有的环境。
这是一个关乎人的问题
“通常,造成服务器、系统管理和云管理效率低下等情况的一般都与手动操作,连接断开和分散的流程关系更大,而非硬件。”IDC管理软件专业分析师Mary Johnston Turner表示。“改善IT实际运作的方式是通过采用更加集成化,规范化和自动化的管理过程,包括生命周期服务产品。”
这样做并不容易。Johnsto说,从一个需要请求资源和特设提供的环境转到完全自动化和自助服务系统,而且在该系统中,用户可以请求和消费他们所需要的资源,是一种变革性转变。可能需要花很多时间和精力来设置,但其会带来更顺利的操作的回报。
自动化服务器的生命周期环境可以节省10%到15%的硬件和软件成本,其带来的是实际的资金和时间成本的节省,她说。提高服务器的利用率固然是相当棒的,但如果其需要业务部门花费几个礼拜的时间才能获得对某虚拟机资源的访问,那么,不管服务器能够多有效运行也没有多大意义。
提高IT操作,通过服务器的更自动化的管理,或使用软件工具来绑定您的硬件更划算——这应该是每一名虚拟机管理员的目标。问题是要找到时间去执行。“管理员们都知道他们需要做什么。”VMware用户组IT架构师兼董事会成员布赖恩·基尔希说。“但重点是保持一切的顺利运行。而今天的当务之急是让一切运转起来。”
您无法优化您看不到的东西
Johnston说,使用管理工具建立一个私有云或配置诸如Chef、Puppet 和Ansible这样的工具自动化配置虚拟机,以获得更多的时间集中在提升效率方面。但另一个关键点是获得对于其内部到底发生了什么有良好的把控。虚拟化实践容量管理咨询公司的分析师Bernd Harzog 表示:“效率低下最大的原因是缺乏关于做出更积极的决策的信息。”虚拟化管理人员一般并不具备足够的信息,并未充分了解其所管理的环境,因此他们往往害怕过度配置服务器,反而造成有损性能的状况。
试图解决该问题的一些全新细分的供应商们正在如雨后春笋般成立。Darden曾经在嘉伦市所采用过的VMTurbo便是其中的选择之一。Darden安装了该软件之后,在短短数小时内就获得了一些改进方面的建议。在最初安装的两年后,Darden仍然用其来进行日常监控操作,运行报告和自动修复等工作。
Cirba公司是另一家关注该问题的企业,但该公司采用了一些不同的方法,他们使用一个效率指标用以评估工作负载,并显示哪些方面可以进行改进。该公司的首席技术官兼共同创始人安得烈·希利尔表示,其系统的完美指数是1,而发现运行环境的指数达到0.5到0.7是较为常见的。
为什么呢?“工作负载组合在一起的方式通常看起来就像一个俄罗斯方块的游戏。”希利尔说。“VMware或其他的虚拟化工具都没有关注过工作负载时如何在一起运行工作的,也从未试图找出如何最有效地在工作负载中实现负载的平衡。”
然而,他指出,最佳利用率会根据工作负载的不同而有所不同。对于某些较为保守的工作负载而言,评级为1将意味着其利用率远远比您所要求的场合要低。
另一种需要优化的问题是虚拟机的蔓延,这会造成需要配置比实际需求更多的虚拟机。容量管理工具也可以帮助解决这一问题了。虚拟化实践公司的Harzog表示,对工具进行评估的一大关键在于其是否可以确保其能够根据环境的变化进行自动配置,而非仅仅就相关情况进行简单提示。VMTurbo和Cirba均可以做到这一点。
虽然许多提升服务器利用率的工具主要都是着眼于计算资源方面,初创企业CloudPhysics公司的创始人约翰·布卢门撒尔表示,放眼整个IT环境是相当重要的。其所在的公司的产品是一款基于云的SaaS服务产品,提供包括从从CPU到内存,网络和存储的分析服务。
某一服务的运行效率低将会对另一台服务器运行,乃至整个环境产生怎样的影响?为什么系统额响应时间会变慢?这种变化将如何影响到整个大环境? “这一问题的本质是相当严峻的。”他说。“无法看到某一执行行动的后果,也不能够评估某一行动执行得是否正确。”CloudPhysics说,很多客户在最初部署了工具之后,都会发现有高达3.5 TB的存储空间被释放出来了。
达到最高效率可能意味着蔓延的工作负载转移到了公共云资源,其正在由如Autotrader.com这样的公司替代。
迁移到云
Autotrader的某些200 ESX主机托管运行其开发区域在多达140台虚拟机;在生产主机上运行少得多。但是,像许多企业一样,Autotrader.com正在探索如何使用公共云资源来补充在企业内部托管主机。
该公司云基础架构团队的高级系统工程师Chris Nakagaki非常热衷于以最小的变化迁移工作负载到VMware的vCloud Air公共云的理念,如果需要的话,可以跨多个VMware公共云合作伙伴供应商。但迁移到公共云有其自身的一套需要应对的关于效率问题的挑战;公共云可以说是一个相当复杂的地方。
像亚马逊网络服务、微软Azure和谷歌云平台这样的供应商有着几十种类型的虚拟机可供选择,资源也可以动态更改,并且可以按分钟或小时进行支付。您可以实现显著的资源节约,例如,如果您不再需要某些资源时,可以删掉。
Gartner的分析师Lydia Leong说,一旦公共云的使用达到了某个阈值,开发相关的工具来管理云的使用和优化支出是值得探索的。并指出,这一门槛将根据企业规模大小的不同而有所不同。Cloudyn和Cloud Cruiser均有相关的工具可以帮助企业确定何时按需选择采购亚马逊网络服务云、合适的价格模型、以及合适的虚拟机工作负载的比例。Cloud Cruiser公司的一款工具能够监视混合环境,建议较之公共云,何时在私有云中运行工作负载。 Cloudyn公司表示,他们可以帮助那些花费了上万美元的AWS客户通过优化其使用情况,找回三分之一的公共云开销。