提高混合环境中的IT可视性
很多调研机构认为混合云环境将在未来五年内主导企业的IT。Research and Markets公司估计,到2023年,混合云市场规模将从450亿美元增长到980亿美元。AWS公司和Microsoft Azure公司正在争夺公共云市场的主导权,将公共/私有的云计算和存储与内部部署的工作负载上的虚拟化相结合的混合环境将成为新的常态。
Research and Markets公司表示,基础设施即服务是一种驱动因素,因为它使企业能够将工作负载从内部部署迁移到云平台,以便在高峰需求期间更好地分配资源,并在公共或私有云环境中工作。
这种向混合环境的持续转变可以为数据中心所有者和运营商提供更大的数据存储、处理、分发的灵活性,但它确实在满足性能服务等级协议(SLA)以及监控这种日益分散的环境方面面临挑战。
混合世界:IT梦想还是噩梦?
随着向多计算环境的发展,现在大量的新数据和应用程序在数据中心中流动,数量惊人。这种数字基础设施的发展为现代IT带来了巨大的复杂性:多个移动部件都可能随时出现故障。这些不同的系统不会相互通信,而且经常会失败。管理这一问题的挑战因许多现代系统具有企业控制之外的组件而变得更加复杂:只需考虑典型的云计算设置即可。
这使得有效的监控对于发现问题的早期预警信号,保持系统正常运行以及让客户满意至关重要。如今的企业标准更加严格,部分原因在于严格的合规性法规,其中包括GDPR法规,以及导致停机的数据泄露和破坏性事件的惩罚性成本。IT专业人员现在在一个误差很小的世界里工作。
说到成本,如果企业试图利用遗留的IT基础设施或者没有足够的监控系统和流程,企业就会增加代价高昂的停机风险。调研机构Gartner公司估计企业的IT停机时间每小时耗资30万美元。美国西南航空公司的业务因路由器故障停机,导致2000多架航班取消,预计损失收入为5400万至8200万美元。而除了对资产负债表的影响外,企业还受到客户流失和利益相关者价值下降的损害。
以往的监测措施如今不起作用
早期数据中心的运营与当今的数据中心管理相差甚远。第三方提供商和服务提供商已将IT的一些“实际操作”方面从企业员工中剥离出来。这就是说,如果对潜在的破坏性威胁没有足够的反应,那么IT部门就会停滞不前。IT部门需要管理和监控的工作量也远远大于早期数据中心。
如今,确保工作流程生产力和降低风险必须超越即使是最有才华的IT员工也能做到的事情。人类根本无法充分监控现代混合环境——有太多的应用程序、多个云计算和提供者、可能的容器和大数据工作负载。波洛蒙研究所的调查报告指出,22%的系统故障事件和业务停机可以追溯到人为错误。
需要调用自动化来提供所需的一致性能级别。自动化的监控方法可以确保基础设施得到良好维护,降低成本,并且组织可以雇佣更多的技术人员来专注于业务的战略领域,包括推动客户满意度和业务增长。
停机可能会突然发生,而且没有警告。在这种情况下,快速检测故障并了解受影响的系统至关重要。一旦确定,组织应该有适当的流程来快速缓解问题——减少停机时间和收入损失。自动化这些过程对于在代价高昂的大范围停机之前遏制破坏性事件至关重要。
从复杂性走向整合
Enterprise Management Associates公司的分析师研究指出,很多组织拥有10多种不同的监控工具,组织可能需要三到六个小时才能找到影响IT性能问题的根源。在解决任何问题方面滞后的一个关键因素是“工具蔓延”,这有助于创建IT孤岛,各个团队通常依赖于不同的监控视图,无法找到共同点。与此相关,甚至可能更具破坏性的是,它通过创建太多数据点来延迟平均修复时间(MTTR)。其结果是没有满足服务等级协议(SLA),并且在企业联盟中,警报和应用程序都不应标记为“关键任务”。
目前使用的工具通常只设计用于监控过去的静态内部部署基础设施,而不是目前基于现代、动态、云计算和虚拟的数字系统。大多数企业都没有现成的监控工具来实时了解其系统和应用程序的当前状态。
无论数据存在于何处,其解决方案都是摆脱难以管理的复杂性,并从单一管理平台监控整个IT基础架设施。企业需要摆脱工具集合,并整合到一个旨在支持现代混合环境的监控解决方案中。
通过监控设备和系统的各个方面(硬件和软件、内部部署和云端),组织将始终全面了解系统的运行状况。此外,当应用程序跨越多个系统、硬件和云服务时,当组织可以在单个存储库中关联多个数据时,更容易隔离问题。这样,检测数据中的异常就变得容易多了。
可视性增加业务价值