循序渐进,通过云计算加速IT现代化的路线图
云是手段,而非目的。完整的标准化和自动化战略可促进这样的成果,即通过云来实现IT现代化。
云计算的采用一直在迅速增长,人们预计特定于云的支出将在整个2020年以一般IT支出的六倍以上的速度增长。虽然大型组织已成功实施了特定的SaaS解决方案或已经为新系统采用了云优先的战略,但仍有很多组织在努力将大量企业系统迁移到云端,以此将价值最大化。
这是因为公司往往会掉进这样的陷阱,即把IT系统迁移到云端与最大化利用云端所需的转型策略搞混淆了。将遗留应用程序迁移到云端(“直接迁移”)是不会自动产生云基础设施和系统所能带来的好处。实际上,在某些情况下,这种方法可能导致IT架构比以前更加复杂,繁琐且昂贵。
云的全部价值源自将这些选择视为实现数字化转型的整体战略的一部分,而不是一次性的战术决策。这种策略是可以实现的,其方法是通过开放的API模型将IT环境标准化和自动化,采用现代化的安全性,在自动化的敏捷操作模型中进行工作以及利用新功能来推动创新的业务解决方案。尽管云并不是所有这些功能的先决条件,但它确实起到了推波助澜的作用。以这种方式应用云功能的公司可以创建下一代IT,从而能够在快速发展的数字时代实现业务增长和创新。
直接迁移是不够的
Amazon Web Services(AWS),Microsoft Azure和Google Cloud之类的云服务之所以吸引了许多组织,是因为它们具有这些特点:按使用量付费,根据使用量进行伸缩的能力,高弹性,自助服务,与传统的IT产品相比,所有这些优点有望产生更低的IT成本,更快的上市时间和更好的服务质量。
但是,传统企业在迁移到云时会遇到两个主要问题:
- 现有业务应用程序是使用传统IT范式创建的。结果,这些应用程序通常是一体化的,并且在几个数据中心中具有固定/静态容量。仅仅将这些程序迁移到云端并不会神奇地赋予它们云所具备的所有动态功能。
- 企业的典型技术人员都精通传统IT框架中的业务应用程序开发。他们中的大多数人都需要重新熟悉和掌握云环境。
IT安全就是一个很好的例子。大多数传统的IT环境都采用基于边界的“城堡和护城河”方法来实现安全性,而云环境更像是现代酒店,其中房卡可以访问某些楼层和房间。如果这些为城堡和护城河式的安全模型开发和部署的遗留应用程序不是针对新的安全模型重新配置的,那么迁移到云端则可能会对网络安全产生不利影响。
企业能成功采用SaaS解决方案主要是因为它们以简单的方式解决了这些限制:它们替换了现有的业务应用程序而将新功能的开发工作交给了SaaS提供商。因此,SaaS解决方案在营销和销售、后台(HR)以及通信和协作等业务职能中变得非常流行。但是,大多数部门还没有成熟的SaaS解决方案可用于其核心业务职能,例如公用事业部门的计费以及金融服务的核心/在线银行业务。
结果,尽管云投资总体上增加了,但企业对云的采用却十分缓慢。许多企业仍然无法支持其效率低下的传统数据中心环境和没有充分规划的云实施,云实施也许并不像他们想象得那样易于管理或负担得起。尽管有些高瞻远瞩的公司已经采用了云计算,但一般企业的公共云或私有云的采用率却不到20%。
通过云实现IT流程自动化的好处
从历史上看,企业业务应用程序设计十分巧妙,可在自定义配置的IT系统中运行,每个应用程序都需要对计算机存储和网络资源进行严格的自定义配置。结果,IT部门需要大量的管理员来使系统处于最新的版本状态并持续运行,需求很高时就手动添加新容量,或者针对性能低下等问题进行快速修复。随着IT解决方案越来越多,测试、集成和维护所需的开销也随之增加。在典型的企业中,只有一小部分IT人员专注于设计和开发企业所关注的差异化市场的解决方案。其他IT人员但求维持现状。
这个比例是可以扭转的,只要将系统配置标准化并将IT的支持流程自动化就可以了。只要让企业更好地管理其基础设施,它们不仅可以节省成本,还可以缩短上市时间并提高服务水平。
采用云技术能在很大程度上促成必要的标准化和自动化。借助云,公司可以做到如下事情:
- 将IT开销成本降低30%至40%
- 有助于按需扩展IT流程,优化IT资产的使用
- 提高IT在满足业务需求(例如更频繁地发布业务功能)方面的整体灵活性;云提供商正在提供比基本计算和存储更丰富和强大的解决方案,例如大数据和机器学习服务
- 通过标准解决方案的“自我修复”特性来提高服务质量,例如,自动将更多的存储容量分配给数据库。我们发现有些企业将IT事件减少了70%,其方法是以云计算作为反思其IT运营的契机,
当业务应用程序系统配置高度定制化而IT流程大多为手动时,要想从云采用中获得这些好处仅凭迁移是远远不够的。它需要一定程度的补救,从而使IT系统更加面向云端。
网飞(Netflix)就是投入基于云的新一代基础设施的众所周知的一个例子。它耗时7年进行转型,采用云原生方法,重建了所有技术并重组了运营方式。它采用应用程序接口(API)来将一体化遗留应用程序简化为较小的组件,使其更加灵活,然后将其迁移到AWS。结果,服务的可用性提高了,接近公司规定的99.99%正常运行时间的目标。网飞发现,流媒体的IT成本已大幅下降,比使用自己的数据中心要便宜得多。
最近,许多老牌公司已采取了积极行动,采用了公共云解决方案。第一资本(Capital One)正在AWS上运行银行的移动应用程序;GE石油天然气集团正在将大部分计算和存储能力迁移到公共云。马士基正在迁移其遗留系统,从而降低成本和运营风险,同时启用高级分析以简化运营。
先进组织还积极想办法利用云端的新服务来打造创新的业务解决方案。前进保险(Progressive Insurance)在公共云中部署了名为Flo的聊天机器人;纳斯卡(NASCAR)正在利用云端的机器学习解决方案来分析实时和历史赛车数据,以提高性能并模拟各种场景。
即使是那些“生于数字化时代”的公司,虽然它们最初出于战略原因而选择创建自己的IT基础设施和系统,但如今它们也选择迁移到云端以利用其可伸缩性和更高阶的功能。Spotify就是一个很好的例子。
如何进行云转型
全面采用云技术的做法也许大有裨益,但动辄历时数年的转型过程还需要大量的前期投资。因此,从长远来看,全方位转型的方法需要积极的承诺以及首席执行官和董事会的明确授权。
具体而言,公司应解决四个关键主题,从而在大规模采用云方面取得成果:
1. 为采购做决策
对大多数公司来说,创建自己的云技术栈是很难的,维护就更难了。与公共云提供商合作创建和管理云栈是更典型的方法。在大多数情况下,比较务实的方法是从单个云服务提供商开始,同时采用必要的指导原则来避免被某个提供商绑定。在达到一定规模和成熟度之后(根据我们的经验,一个可取的方法是针对主要的云服务提供商规划3000万美元的年度运营成本),企业就可以探索第二或第三家服务提供商以进行扩展。
2. 创建公共云运营模型
公共云与传统的运营模式不同,它要求IT部门以代码形式管理基础设施。这要企业具备了解公共云的计算,存储和安全协议的软件工程师(而不是网络工程师或系统管理员)。对大多数企业而言,这意味着它们对基础设施的组织以及其所使用的运营模式进行大幅提升。这需要分配特定的团队来配置和管理生产环境。
3. 遗留应用程序的修复
现有应用程序将需要在基础设施和应用程序层进行重构,以符合公共云的安全性和容量要求。安全性也必须纳入这些应用程序中,并且它们必须以高度自动化的方式工作。这需要应用程序开发团队的大量关注,而要得到这种关注是很难的。
公司是可以解决这个困难的,其方法是为遗留应用程序的现代化创建清晰的业务案例,使迁移计划与主要应用程序的升级或替换相一致并采用基础的解决方案(例如API框架)来简化修复工作,从而使修复工作变得更容易。
4. 培养合适的技能
专业人士必须能够安全,快速地在云端(特别是在供应商的系统上)开发应用程序。为此,公司将需要聘请并培训云专家,然后将他们引进开发团队,对现有员工进行再培训或技能提升并根据需要创建以云开发为主的数字创新实验室。
这种激进的方法确实需要领导层的承诺,即资金承诺(有一家金融服务企业正在往云转型豪掷3亿美元)和时间(这些计划可能需要两到三年的时间才能实现)。这是因为在执行云转型时需要同时进行多项操作。例如,在许多情况下,一个核心的云工程师团队要为云迁移做准备,其方法是搭建云环境并对其进行强化,考察要迁移的应用程序并创建用于迁移的工具。同时,主要的IT团队正在接受以敏捷方式工作方面的培训。这种方法面临重大的管理难题,但强大的领导力是实现转型的最快途径。
但是,许多企业尚未准备好全面投入云计算,这可能是因为缺乏组织支持,或者是不愿意长期投资必要的资源,又或者在某些情况下是由于监管限制。在短期到中期的范围内,这些组织可以获得显著的收益,其方法是在传统IT中采用云的敏捷和自动化运营模型(尽管规模较小)。这种方法可创建重要的组织功能并在企业就绪时为云转型做好准备。
各大公司迫不及待地采用敏捷方法进行应用程序开发并积极追求自动化/开发运维(例如持续集成或持续交付),但是同样的方法可能会对IT运营和基础设施产生更大的影响。IT能够以提高生产率,质量和速度的方式对各种工作进行优先级排序,其方法是将基础设施功能组织为一组组小型的跨职能且自我指导的小分队,这些小分队的产品负责人负责对工作进行优先级排序,而敏捷专家(scrum master)则负责清除各种障碍。此外,随着时间的推移,持续的自动化程序可以进一步将类似于云的功能融入传统的IT中,例如用于开发人员与基础架构之间进行交互的API。
为了提高服务水平并降低成本,一家主要的人寿保险公司在其250人组成的IT运营团队中采用了敏捷方法。该公司首先评估其当前基础设施的状态(其核心流程、组织模型、指标和关键绩效评估以及历史需求)并就使用更为敏捷的方法可能实现的成果提出假设。它创建了适用于敏捷方法的领导力计划,采用了必要的工具并为利益相关者开展了为基础设施实现敏捷的新手训练营。
在六周的时间内,IT基础设施小组开始为正在开展的项目进行规划,为高管和基础设施团队开办了培训课程并为正在进行的运营设定了目标。该小组充分利用Scrum方法来开展有计划的工作(例如各种项目)并使用看板(Kanban)来管理强调连续交付的产品创建的方法,以处理意外事件和服务请求等非计划性工作。到第二个月末,该公司已经实现了预期的运营模型,并且渐渐能够设计服务管理流程并启动自动化计划。
该公司在半年内完成了最初的转型,将IT成本削减了35%以上并使生产力提高了一倍。该公司计划将多达80%的运营工作自动化,从而进一步降低成本并显著提高服务水平。如今,它处于十分有利的位置,可以在将来更加积极地迁移到云中。
云迁移的规则