如何执行一套数据推动的云迁移方法
对于当前几乎所有行业的各种规模的企业组织机构而言,迁移到云计算早已经不再是一个新的趋势——而是一项势在必行的计划了。根据市场调研机构Gartner公司最近的研究显示,“预计在未来几年,企业云策略将达到没有采用云服务就像不能上网一样罕见的一个境地。”Gartner公司的研究副总裁杰弗里·曼恩表示说,“甚至是那些曾经主要取决于客户而定制设计的软件,也将逐步迁移到云中。”
对于这一在全球范围内的各行各业都在掀起的从企业内部部署的IT迁移到基于云服务的IT的趋势,实在没有什么神秘的。作为一款平台,云服务为那些依赖于信息技术来运行他们的企业业务,并在今天的全球市场竞争的企业组织们带来了诸多的好处。
这些关键性的好处包括:
- 降低了IT成本:包括购买服务器和软件许可授权的资本成本,及维护、管理、保持系统的可用性和更新的员工成本。
- 增加了灵活敏捷性:云服务供应商使得企业客户在规模化缩放计算能力;及快速方便地调配新的员工和地点,以响应不断变化的业务目标、市场条件、机会和事件方面的变得更容易。
- 可靠性和可用性得到了保证:通常,对于个别企业客户而言,想要以一种具有成本效益的方式实现云服务供应商们所担保的可靠性和可用性往往是非常困难的。主要供应商们(如AWS、谷歌、微软)均提供满足5个9标准——即99.999%的正常运行时间的服务水平协议(SLA)的方案。
- 安全性:现如今,在许多情况下,云服务供应商所提供的安全性通常被企业客户普遍认为与他们自己内部部署的系统和数据一样好,或者甚至远远优于后者的安全性。
- 移动性和协作支持的改进。
不过,尽管云计算提供了如此众多的好处,但其也是极其复杂的。仅仅以评估云供应商的选择这一单一的任务举例来说吧。如果您企业将主要云服务供应商的所有的实例类型、存储选项、可用区域和定价方案结合起来,您会发现,目前已经有超过2500万可用的云配置。鉴于如此让人震惊的现实,使得为您企业组织选择最佳的配置,来满足您企业的业务需求瞬间变得更具挑战性了。而更令人心悸的是:这些可用的配置(以及您企业在任何给定时间的业务需求)仍在不断的演变。更为不幸的是,这一系列的复杂性常常使得当前的企业组织难以体验到他们本应体验到的性能和成本优势。
当涉及到您企业的云服务时,精度等于性能。在企业现有的基础上做出正确的云决策,并以最低的成本持续地达到最佳的性能其实并非易事;甚至在缺乏高度精确的分析来对您企业进行指导的情况下是不可能的。而做出错误的决策则可能会带来灾难性的后果。
准确、成本有效的满足您的需求,以最合适的云配置帮助您企业实现云计算的全部优势潜力的唯一方法就是采用一种深度的分析——这一方法需要您仔细考虑150项具体的指标,以确保您企业所作出的选择能够充分满足您的业务需求,同时提供最高的投资回报率。
在本文中,我们将为广大读者诸君介绍:
- 一项持续的、战略性的云项目所要经历的主要阶段
- 每个阶段所要实现的主要目标及最亟待咨询的问题
- 在每一个阶段您企业均需要哪些分析,以便作出最佳的决策
- 从云服务中获得效益最大化并不是一次性的任务——这是一次持续的,战略性的旅程
为了确保企业组织能够以最成功、最具有成本效益的方式迁移到云服务,并保持其云部署的优化,企业组织需要了解并掌握关于他们的IT基础架构的详细信息,以及关于企业长期愿景和不断发展成长计划的更多信息。
当考虑您企业迁移到云服务的计划、以及您企业的短期、中期和长期的目标和期望时,您应该采用一个连续的,闭环的分析过程,以便广泛的收集最新的数据,并对这些数据进行分析。为了确保您企业迁移到云服务的项目及您所选择的云配置是成功的——且能够随着时间的推移及市场情况的变化而获得持续的成功,您企业最好选择采用一套通常被分为三个阶段的服务:
这种多步骤的流程是持续的,并通过这一流程定期运行,您可以最大限度地提高您企业云部署的效率和投资回报率,在支持企业的战略和目标的同时,获得对于几乎任何新的形势快速响应的能力。
分阶段步骤的流程
阶段一:评估
目标:
确定哪家云服务供应商和哪款云配置是最适合您企业的,及迁移到云服务的总拥有成本(TCO)。云配置包括实例类型、存储选项、可用性区域、定价方案和所需容量。最适合您企业的云配置将以最低的成本为您企业提供最佳性能。
要求:
为了得到一个准确的评估,您需要对于您企业现有的基础设施和应用程序有一个清晰的了解和掌握——包括您企业目前所拥有的、您所需的性能配置文件以及相关存储的属性和数量。当完整掌握了这些情况后,您还将需要对各种云服务供应商的产品及相关的定价模型进行一个一对一的比较。
基本数据:
综合性能分析:在评估阶段,综合性能指标和分析对于选择最佳的云服务供应商、实例、存储选项及定价方案,然后准确的预测云计算的成本和所需的容量能力绝对是必要的。这些措施包括:
库存分析:识别所有的节点(包括物理和虚拟机)和在您企业的基础设施上运行的应用程序。您需要了解并掌握您企业所拥有的一切,以运行一个准确的性能分析。
基础设施性能分析:对您企业的计算、存储和网络资源的性能指标进行不少于两周的评估。这些指标将有助于您了解最佳的定价方案,并了解您企业的每项工作负载,在云中最佳实例类型,最好的存储选项,所需的容量,网络成本和迁移成本。其中的关键指标包括:
- 峰值CPU利用率
- 分配和峰值内存使用情况
- 观测企业内部部署的存储(容量和目前使用情况)
- 磁盘IOPS和带宽
- 吞吐量
- 使用模式:确定计算和存储资源被使用、空闲和未使用的频率
贴士:观察所有性能指标的波峰和低谷,而不是平均值。如果您是基于平均值来规划您企业云环境的规模,那么,当您企业的需求达到高峰时,您企业的基础设施将遭遇严重的性能下降;同时又会在需求不那么旺盛时产生不必要的成本费用。
云选项分析:您需要知道您企业都有哪些备选项,并基于您企业的性能配置文件选择最佳的一个选项。这些措施包括:
可用的云配置:确实有数以百万计潜在的云配置可供选择,包括实例类型、存储选项、网络选项和PaaS服务。
可用的云成本模型:不同的云服务供应商所提供的定价方案选项有很大的不同。例如,AWS提供了一种按需定价方案和不同类型的预订计划。预留实例(RI)计划的范围包括了从1年期没有预付款到3年期全预付款预留实例,并可以提供从15%的节省一直到高达75%的节省的按需定价方案。微软的Azure提供现收现付订购模式,企业客户可以基于您企业的协议获得额外的折扣。同时,谷歌则提供了一个持续的使用模式。如果您知道了您企业的性能配置文件,您将能够确定最为匹配您企业的具体需求,并能够带来显著的成本削减的定价方案。
一旦您收集了您企业的性能分析和云选项,您会想要在云中找到匹配的基础设施设置,并测试他们是否满足您企业的性能目标。理想情况下,您会在每一个可用的云选项中测试您企业项目的工作负载特征,查看其是否与您企业的性能目标相匹配。最好的做法是在可用的云配置选项和定价方案中运行互动的场景假设,以确定该选项将能够交付您企业所正在寻求的性能和投资回报率。
常见的评估陷阱:
一个不准确的观点:如果您企业组织的CMDB(配置管理数据库)并不完全是最新的,您企业绝不是唯一案例。鉴于这一现实,大多数企业组织面临着一个漫长而繁琐的过程,而且其很少是准确的。对于基础设施分析的精度越低,您企业越有可能在云迁移过程中遭遇应用程序连接中断。这意味着痛苦的性能问题和安全威胁的增加。
工作负载不一致:未能准确地评估您企业基础设施的性能配置(即,忽视了高峰期间的使用需求),这意味着您企业可能会选择一款不合适的或不可行的云配置。这将带来成本效率低下和性能差的风险,甚至可能会带来关键业务系统的停止。
存储不一致:当在选择一个云配置时,磁盘IOPS和带宽也常常被忽视。每种类型的磁盘在这些措施方面都有限制局限性,而低估您的实际需求会对性能产生严重的影响。更糟糕的是,这种类型的瓶颈是很难找到的,因此也就很难快速修复。
在您企业通往云服务之旅的评估阶段过程中,所需解答的问题包括:
- 我们企业的总的IT基础设施是什么样子的?
- 哪家云服务供应商和封装产品配置是最适合我们企业组织的需求和业务目标的?
- 针对我们的每一项工作负载,是否有最佳实例?
- 我们是否有适量的存储,我们是否已经选择了满足企业的业务需求的最佳存储选项?
- 随着时间的推移,我们企业的CPU和RAM的使用情况是什么样的?特别是在高峰时段及间歇时段与平均使用情况的对比情况如何?
阶段二:迁移规划
目标:
创建一套清晰的计划来指导您企业的迁移过程,其中包括您企业决定迁移的应用程序、以及最佳的迁移顺序,而该顺序是基于两个因素来确定的:迁移的复杂性和云的适用性。
要求:
您将需要对于应用程序所依赖的详细细节信息进行深入的研究,并对于企业现有的基础设施和应用程序以及它们之间的关系具有一个完整的可视化映射。这将说明哪些应用程序将能够很容易的迁移,而哪些应用程序的迁移则将是最具挑战性的,其还将帮助您解释为什么有些应用程序是不太适合云计算的,因为他们在云环境中的性能表现不会良好。
基本数据:
迁移设计分析:收集以下信息来设计一个分阶段的方法,以迁移到符合您企业业务需求的云服务,并确保在迁移过程中不会发生中断事故。
应用程序依赖映射:对于所有的应用程序,需要确定正在与他们通信的其他应用程序和服务器,他们通信的频率如何,通信是否是双向的或是单向的,以及每个通信之间所允许的延迟情况如何。映射这些依赖关系,以了解您企业的每一款应用程序中的复杂性。这使得您企业在评估阶段所做的库存分析再次成为了关键。
可执行名称、应用程序名称和描述及供应商信息:确定哪些应用程序正在运行,谁构建了这些应用程序。例如,哪些应用程序是属于在企业内部专门构建的应用程序可能需要在云中进行重建;而您企业又对一款“现成销售的非定制”的应用程序做了多少定制化,将需要在您企业的迁移过程中进行复制,而不是简单地通过采购该应用程序的云版本来解决;或者哪些应用程序可能已经过时,其供应商不再提供支持了。
应用程序对于CPU的使用情况:确定您企业的应用程序所消耗的计算资源,使他们能够优先进行迁移。消耗资源最多的机器应该在开始阶段被迁移。
影子IT:在您企业的环境中,隐藏节点可以在项目范围之外通过识别对于IP地址的依赖来发现。在迁移开始之前,确定您企业的应用程序是否正在与这些隐藏的节点通信是必不可少的。
适用性:评估一款应用程序对于云计算的兼容性,及其迁移到云计算之后是否能够获得效率的增加。这方面需要考虑的事项包括:
- 自动缩放的能力:自动的规模化缩放也可以在需求高峰期间通过自动增加云实例的数量,来保持性能和减少容量,进而降低成本。确定每款应用程序的自动的规模化节点的数量和发生“突发”行为的倾向(规模化缩放与静态IOPS / CPU资源需求)。
- 同时还需要确定在云中是否为应用程序提供了合适的实例类型,并确定其是否是专用的或是现成销售软件的专用版本。
迁移执行分析:确保您掌握了对于您企业的云迁移项目的执行的至关重要的信息。这信息包括:
防火墙规则:了解每款应用程序的防火墙规则,以便在云中配置您的安全团队。防火墙规则让您能够知道哪些应用程序正在与哪些端口通信,而哪些端口需要为连接到工作的应用程序的入站/出站打开。您还需要详细了解TCP和UDP端口,这样,您可以为子网建立防火墙规则。
DNS:盘点您企业的DNS,因为当迁移到云服务时,其将需要进行配置。
云配置:利用您在评估阶段所收集到的洞察见解,将您企业的工作负载迁移到最佳实例和存储类型。
贴士:先易后难。无论是按照迁移的复杂性和对于云计算的适应程度,每款应用程序最终会被归类为简单、中等、或难。
虽然您可能曾经被训练需要先解决最困难的问题,但这种方法并不适合云迁移的情况。故而您应该先行迁移那些复杂性和要求不高的应用程序。
常见的规划缺陷:
糟糕的中断:如果您没有掌握关于您企业应用程序的每一个细节,那么在迁移阶段过程中,您将不可避免地出现一些错误。这将在云迁移过程中增加应用程序运行中断的次数,以及调试的次数。在最后将所有的应用程序迁移到云服务之前,通过避免大量的试验和错误,从而减少迁移时间。
影子IT:如果您企业的应用程序正在与隐藏节点通信,它们必须被纳入到您的迁移计划。通常情况下,企业组织有15%以上的影子IT,而如果没有对这些影子IT进行确定,您企业不仅可能会面临服务中断,而且还会面临安全问题。
还没学会走就开始跑了:及时通知的方法对于您企业选择和执行您的试点应用程序的价值是不能低估的。在一个主要的云迁移工作的第一阶段的故障有技术、心理和政治多方面的影响。
在您企业通往云服务之旅的迁移规划阶段过程中,所需解答的问题包括:
- 哪些应用程序应该迁移到云服务,并以怎样的顺序迁移?
- 我们如何确保应用程序(内部的和企业环境之外的)之间的所有关系保持不变,并能够继续在云中发挥相应的功能?
- 我们有哪些许可授权,每一项许可授权的状态如何?供应商对于这些许可授权的支持如何?
阶段三:优化和管理
目标:
在一个连续的基础上对于您的云环境实施监控和管理,以确保其规模大小总是合适的,这意味着您企业的每项工作负载都是采用了恰当的实例,而您企业的最佳配置都是通过基于您业务的实际需求而购买的
要求:
通过检查数据,您可以充分体验到进行云投资的承诺。并需要继续分析您的性能配置文件和使用模式,因为这些对于正确调整您的基础设施,以自动规模化缩放和规划预留实例将是相当关键的。
基本数据:
性能分析:如在评估阶段所做的一样,分析性能数据,以便为您企业的云基础设施配置恰当的规模。
使用模式:为每个节点确定闲置的计算资源和未使用的存储容量,这样您就可以关闭不使用的东西。对所有实例进行追踪:每个实例打开/关闭的次数;其被访问的频率如何;其在一天中被访问的次数最多/最少分别是在何时。您会看到,该实例是否在一天中的大多数时间是闲置状态或是被积极使用的状态。由此,您可以确定其是否能够在特定的时间被关闭或完全被拆除。
成本控制:积极关注您企业的云计算成本,看看您是如何花钱的。通过应用程序或应用程序组来收集成本信息。标记资源(即,X计算资源属于Y应用程序),这样您可以适当地确定应用程序和业务部门的消费支出水平。
配置清单:就像在您的云计算的评估阶段所做的那样,您需要监控所有可用的云配置。除了您企业的需求之外,这些也都是在不断变化的。事实上,云服务的架构通常是越来越便宜,这无疑给了您更多的节省成本的机会。
常见的优化陷阱:
设置完成之后就忘了:一旦您将应用程序迁移到了云服务,您必须积极地确保一切以最佳状态运行。如果您企业采用的是一种传统的心态(设置完成之后就忘了)在云中管理基础设施,那么,这个阶段可能会为您带来严重的问题。
糟糕的惊喜:在迁移过程中的不准确或不充分的计划会引发问题,然后进入管理阶段后,其会以预算超支的形式体现出来。
为您企业未使用的资源支付买单:服务的过渡配置会让您为您企业并未使用的容量买单付费,并会使得您企业的系统膨胀,超出了其实用性。故而您企业应该为每款应用程序的花费设置一个限制。
一旦您企业迁移到云服务,您必须积极地配置您所购买的容量能力。行业数据显示,在云中有超过三分之一的实例是过度配置的。
如果基础设施只是简单的完成了迁移,而没有经过所需规模的恰当规划,这意味着企业需要支付远超他们实际消费的账单。
在您企业通往云服务之旅的优化管理阶段过程中,所需解答的问题包括:
- 我们怎样才能找准我们的最佳云配置,以满足性能目标?
- 鉴于云配置也在不断变化。我们怎样才能确保我们跟上其步伐?
- 我们如何控制我们的云成本?我们在哪些方面可以省钱?
- 我们应该如何规划未来的发展,并确保企业的工作负载得到了准确的配置?除了您企业的要求之外,这些也都是在不断变化的。事实上,云计算通常是越来越便宜,这也就给您企业更多的机会,以节省成本。
结束语:一项成功的云迁移之旅取决于一套全面的、分析驱动的方法
在一个持续的基础上选择、迁移和管理云服务其实是一项相当复杂的工作。正如在本文中所描述的那样,您企业的云迁移旅程中的每一个阶段的决策都需要依据准确的、深入的数据分析,以充分实现云服务所带来的益处,同时最大限度地提高您的投资。精度越大,投资回报率越大。