当 DevOps 遇见 AI,智能运维黄金时代即将开启?

概述

“弱人工智能”(Narrow AI), 是在某些特定领域高效完成任务的专用人工智能, 比如识别图片中的内容或是通过搜索大量医学临床案例为医生提出治疗建议的专用人工智能。目前可实现的人工智能的本质是,人来提出目标,由机器分析大量数据人来高效找到答案。

人工智能应用的分类

很多情况下人工智能无法给出 100% 正确的回答(其实人类也是一样的),如何找到人工智能善于解决的问题就成了首要的任务。

人工智能应用可以分成三类:

  • 核心业务,失败不可接受。 医疗,银行,法律。
  • 核心业务,失败率可接受。 自动驾驶,自然语言理解。
  • 非核心业务,对失败不敏感。 用于改善用户体验。

从人工智能发展和应用的过程来看,通过对感知的模拟,帮助人类做决策,直到完全 代替人类处理大量重复的数据方面的工作

另一方面,由 巨大商业利益 推动的人工智能将很快成为现实,自动驾驶商业应用会带来客观的商业价值比如:

人为交通事事故减少,保险费降低,无人参与驾驶,用车成本减少到五分之一;按需用车,汽车保有数量会减少到三分之一,导致车商业模式变革;车辆流量变化,大量节省道路和停车场的面积,导致城市规划改变。

人工 + 智能才是最佳的组合方式

卡斯帕罗夫和李世石真的败给了机器吗?

(IBM 的深蓝和谷歌的 AlphaGo)在人类选手的对面,是人工智能汇集了所有人类智慧和经验的智能流算法,如果是这样的话人类必败无疑。

但反过来想如果人类也有一个人工智能辅助来比赛呢?那胜负就未尝可知了。

卡斯帕罗夫在被深蓝击败后,发起了自由式国际象棋比赛,可以使用人工 + 智能(半人马选手)方式参与比赛,由人工智能给出建议,人类来决定是否采纳建议。2014 自由式国际象棋对抗比赛人类赢得了 42 场半人马选手赢得 53 场,当前最优秀的国际象棋团队都是半人马选手由人类和人工智能组成。既然人工智能可以帮助人类成为最优秀的象棋选手,那么可以推测人工智能也能帮助人类成为最优秀的医生、飞行员、法官 和教师甚至是运维和开发人员。

人工智能的工作方式和解决的问题种类

当 DevOps 遇见 AI,智能运维黄金时代即将开启?

典型的机器学习流程

机器学习可以解决以数据为基础四类问题:典型的机器学习通过无监督学习和监督学习,抽取特征,再通过机器学习算法,实现基于通用特征分组,得出预测模型,通过预测模型为新数据数据打标签。逻辑推理预测、规划师、沟通者、体验与情感。

运维发展的历程与人工智能的作用

当 DevOps 遇见 AI,智能运维黄金时代即将开启?

运维行业经历了初始、专业化、工具化、平台化、云化和智能化过程。从手动运维阶段基本没有数据,到规模化结构化数据和智能化非结构化数据的趋势。

人工智能发展初期充当辅助人类的助手角色,以增加销售额,提升用户体验,优化生产过程和节省成本为目标。

手动阶运维阶段

运维工作量小运维人员主要工作就是看监控屏幕,随着对运维要求提高,工作分工此阶段产生,产生了稳定,便捷,可靠,快速的工作原则。

人工智能可以做的是:基于人的经验,对结构化销售数据进行商业智能分析(BI)找出数据中的知识,从而提升销售额。存在的问题主要是数据专家基于经验发现业务数据中的知识,对业务了解程度成为 BI 有效性的最大瓶颈。即缺乏即懂业务规则又懂数据发掘的人才阻碍商业智能的发展。

规模化阶段

随着 DevOps 概念的推出,工具大量涌现来协助运维工作运维能力大幅提升,带来问题是很少有一家公司可以生产覆盖所有 DevOps 生命周期的工具,而学习多种不同厂商的工具完成任务带来很高的技术门槛。随着一些创业型公司崛起,运维工作量爆发式增长,为了保证业务的连续性 SRE 也在此时期产生,主要目标是使用软件工程技术实现业务大幅增长而运维工作了保持平稳。

人工智能可以做的是:出现以结构化数据为主工业级解决方案,使用算法为主解决商业通用问题,以提高人员利用率加快创造价值为典型问题。同时也存应用了工业级智能解决方案有多大的效率提升很难估算和当数据知识变化后很难进行跟踪优化的问题。

生态化阶段

随着互联网规模的发展,少数大公司承担起基础设施的工作,通过高度集中提升数倍的运维效率(在亚马逊购买 1 美元的基础设施,可以带来与传统数据中心 7 美元投资相同的计算力),这种变革让云计算客户专注于业务的发展将基础设施运维交给云计算平台。市场规模继续增长一个公司无法使用一套解决方案覆盖所有细分市场的需求,生态化从而产生。因此大量的数据为人工智能实用化奠定基础。

人工智能可以做的是:出现以非机构化数据为主通用的技术框架,不同的公司负责一部分问题形成生态圈,协助业务人员完成工作,通过新感知能力半自动或自动化完成以前手工的工作。如何结合新的感知能力辅助人类在巨大数据量,变化的规律中做出决策成为新的问题。

为什么人工智能在 DevOps 中大有可为?

DevOps 可以获取几乎所有类型的数据

当 DevOps 遇见 AI,智能运维黄金时代即将开启?

指标体系框架来自《精益软件度量》我们了解到人工智能解决的问题都是以数据为基础的,那么有了价值、效率、质量和能力方面有指标和数据就可以在 DevOps 过程中通过人工智能解决问题了。

找到 DevOps 全生命周期中人工智能可以改善问题

当 DevOps 遇见 AI,智能运维黄金时代即将开启?

在 DevOps 生命周期中还有很多工具无法实现自动化的过程,这些过程往往会投入大量的人力和沟通成本,也有很多信息不足无法做出很好决定的场景,在这些场景中人工智能可以根据以往大量数据训练的模型,给出建议,从而给出研发和运维都能认同的工作方式,提升工作效率提高工作质量。

当人工智能牵手 DevOps

当 DevOps 遇见 AI,智能运维黄金时代即将开启?

我们现在有了 DevOps 生命周期中的数据,同时也了解到人工智能易于解决的四类问题。我们可以尝试使用全连接的方式找出 36(4×9)个在 DevOps 领域里适合使用人工智能解决的问题。

比如上图中的“精益需求管理”过程中:通过价值和效率数据使用逻辑推理和预测人工智能方法,得出需求的价值命中率和客户满意度的预测。通过这些人工智能得出的标签优化需求的优先级管理。这样从完全靠人工经验的过程变为人工智能辅助完成的高效过程。

到那时需求人员只需要调节想得到的转化率(运营指标),或是性能(运维指标),就可以通过人工智能方式自动提升改善这些指标的需求的优先级。。甚至是根据需求改变的特性,分析大量现有代码库中的通过测试的代码而自动为开发人员推荐代码。

“分层自动测”过程中:使用图片转文字,方式将必须人工完成的测试自动化弯道提高测试效率与准确率。

“持续运营反馈”过程中:通过自动化运维根因分析,提升定位系统问题的效率。

找到成功的第三条路,在吞吐量和稳定性中间建立平衡让两方面都能正常行事

当 DevOps 遇见 AI,智能运维黄金时代即将开启?

再说“最终二合为一”的矛盾论下半部分。通过人工智能给出的第三种方式让双方都能向自己的目标前进,从而为一个共同业务成功目标结合为一个整体。

比如,在“安全发布策略(灰度发布)“阶段,使用研发团队的能力数据、内在质量数据和历史中发布后的外部质量数据训练机器学习模型。通过这个模型在发布阶段给出软件发布后外部质量评估。在发布过程中对比前后两个版本的外部质量差距来决定是否进入灰度发布的下一个阶段。


今天主要分享的是AI和运维结合,觉得有用的话帮忙转发下哦~

后面会分享更多DBA和devops内容,感兴趣的朋友可以关注下

当 DevOps 遇见 AI,智能运维黄金时代即将开启?

相关推荐