Gartner:2019数据和分析技术十大趋势预测
【新智元导读】2月18日至19日,在澳大利亚悉尼举行的Gartner数据与分析峰会上,增强分析和人工智能成为人们关注的焦点。
增强分析、持续型智能和可解释型人工智能(AI)是未来三到五年内数据和分析技术中最具颠覆性潜力的趋势。
Gartner研究副总裁丽塔•萨拉姆(Rita Sallam)在悉尼举行的Gartner数据与分析峰会上表示,数据和分析领域的领导者必须研究这些趋势的潜在商业影响,并相应地调整商业模式和运营,否则就有可能失去竞争优势。她说:
深入了解数据和分析发展的技术趋势,并根据业务价值对其进行优先排序,这一点至关重要。Gartner副总裁、著名分析师唐纳德•范伯格(Donald Feinberg)表示,数字颠覆带来的挑战也创造了前所未有的机遇。海量的数据,加上云带来的日益强大的处理能力,意味着现在可以大规模地训练和执行必要的算法,以最终实现AI的全部潜力。他说:
数据的规模、复杂性、分布式本质、执行速度以及数字业务所需的持续智能,意味着僵化和集中的架构和工具将会崩溃。任何业务的持续生存都将依赖于一个敏捷的、以数据为中心的体系结构,该体系结构对不断变化的速度做出响应。Gartner建议数据和分析领导者与高级业务负责人讨论他们的关键业务优先级,并探索以下主要趋势如何实现这些优先级。
No.1 增强分析
增强分析(Augmented analytics)是数据和分析市场的下一波颠覆。它使用机器学习(ML)和人工智能技术来转换分析内容的开发、使用和共享方式。
到2020年,增强分析将成为分析和BI、数据科学和ML平台以及嵌入式分析的主要推动力。随着平台功能的成熟,数据和分析领导者应该计划采用增强分析。
No.2 增强数据管理
增强数据管理(Augmented data management)利用ML功能和AI引擎来制定企业信息管理类别,包括数据质量、元数据管理、主数据管理、数据集成以及数据库管理系统(DBMS)自我配置和自我调整。
它使许多手动任务自动化,并允许技术水平较低的用户使用数据更加自主。 它还允许高技能的技术资源专注于更高价值的任务。
增强数据管理将元数据从仅用于审计、沿袭和报告转换为支持动态系统。元数据正在从被动变为主动,并成为所有AI/ML的主要驱动。
到2022年底,通过添加ML和自动化服务级别管理,手动数据管理任务将减少45%。
No.3 持续型智能
到2022年,超过一半的主要新业务系统将集成使用实时上下文数据改进决策的持续型智能(continuous intelligence)。
持续型智能是一种设计模式,在这种模式中,实时分析集成在业务操作中,处理当前和历史数据,以指定响应事件的操作。它提供决策自动化或决策支持。持续型智能利用多种技术,如增强分析、事件流处理、优化、业务规则管理和ML。
萨拉姆女士说:“持续型智能代表着数据和分析团队的工作发生了重大变化,对于分析和商业智能团队来说,2019年帮助企业做出更智能的实时决策是一个巨大的挑战,也是一个巨大的机遇。它可以被看作是运营商业智能的终极目标。”
No.4 可解释型AI
人工智能模型越来越多地被用于帮助和取代人类决策。然而,在某些情况下,企业必须证明这些模型是如何得出决策的。为了与用户和涉众建立信任,应用程序领导者必须使这些模型更具有解释性。
不幸的是,大多数这些高级人工智能模型都是复杂的黑匣子,无法解释它们为什么会得出特定的建议或决定。例如,在数据科学和ML平台中,人工智能可以用自然语言自动生成模型的准确性、属性、模型统计信息和特征的解释。
No.5 图
图(graph)分析是一组分析技术,它允许探索感兴趣的实体(如组织、人员和事务)之间的关系。
到2022年,图形处理和图形DBMS的应用将以每年100%的速度增长,从而不断加快数据准备工作,使数据科学变得更加复杂和具有适应性。
根据Gartner的说法,图数据存储可以有效地建模、探索和查询具有复杂数据竖井相互关系的数据,但是对专门技能的需求限制了它们的应用。
由于需要在复杂数据中提出复杂问题,图分析在未来几年将会增长,这在使用SQL查询时并不总是切实可行的。
No.6 数据结构
数据结构支持在分布式数据环境中的访问和共享数据。它支持单一且一致的数据管理框架,允许通过其他孤立存储的设计进行无缝数据访问和处理。
到2022年,定制的数据结构设计将主要作为静态基础设施部署,迫使组织进入新的成本浪潮,为更动态的数据网格方法完全重新设计。
No.7 NLP/会话分析
到2020年,50%的分析查询将通过搜索,自然语言处理(NLP)或语音生成,或者将自动生成。 分析复杂的数据组合并使组织中的每个人都可以访问分析的需求将推动其更广泛的应用,使分析工具像搜索界面或与虚拟助手的对话一样简单。
No.8 商业化AI和ML
Gartner预测,到2022年,75%利用AI和ML技术的新终端用户解决方案将使用商业化解决方案而不是开源平台构建。
商业供应商现在已经在开源生态系统中构建了连接器,它们提供了扩展AI和ML所需的企业功能,例如项目和模型管理、重用、透明度、数据沿袭以及开源技术缺乏的平台凝聚力和集成。
No.9 区块链
区块链和分布式账本技术的核心价值主张是在不受信任的参与者网络中提供分散的信任。分析用例的潜在影响是显著的,特别是那些利用参与者关系和交互的用例。
然而,四五种主要的区块链技术要成为主流还需要几年的时间。
在此之前,技术最终用户将被迫集成由其主要客户或网络决定的区块链技术和标准。这包括与现有数据和分析基础设施的集成。整合的成本可能会超过任何潜在的优势。区块链是一种数据源,而不是数据库,不会取代现有的数据管理技术。
No.10 持久型内存服务
新的持久型内存(Persistent Memory)技术将有助于降低采用支持内存计算(IMC)的体系结构的成本和复杂性。
持久型内存是DRAM和NAND闪存之间的一种新的内存层,可以为高性能工作负载提供高性价比的大容量内存。
它有潜力提高应用程序的性能、可用性、启动时间、集群方法和安全实践,同时控制成本。它还将通过减少对数据复制的需求,帮助组织降低应用程序和数据架构的复杂性。
范伯格说:“数据量正在迅速增长,将数据实时转化为价值的紧迫性也在以同样快的速度增长,新的服务器工作负载不仅要求更快的CPU性能,还要求更大的内存和更快的存储空间。”
关于如何使用数据和分析来获得竞争优势的更多信息,可以在Gartner data & analytics Insight Hub上找到,链接地址如下:
http://www.gartner.com/en/information-technology/insights/data-analytics