增强型分析(Augmented Analytics)、持续型智能(Continuous Intelligence)与可解释型人工智能(Explainable AI)在数据与分析(Data and Analytics)技术领域内的主要趋势中非常重要,并有可能在未来三到五年带来重大颠覆。
Gartner研究副总裁Rita Sallam表示,数据与分析领导者必须考察这些趋势对业务带来的潜在影响,并相应调整业务模式与运营状态,否则将失去与他人竞争的优势。
她指出:“从支持内部决策到持续型智能、信息产品以及任命首席数据官,数据和分析领域始终在不断演化。深入了解推动这一演化的技术趋势并根据业务价值对其加以优先排序,至关重要。”
Gartner副总裁兼分析师Donald Feinberg认为,数字化颠覆给企业带来的主要挑战是数据量的激增,而这同样也创造了前所未有的机遇。由云驱动的海量数据将实现更强大的处理能力,意味着现在可以大规模训练与执行算法,最终发挥出人工智能的全部潜力。
Donald Feinberg表示:“数据的规模、复杂性与分散性,以及数字化业务所需要的行动速度与持续型智能,意味着僵化且集中的架构与工具将会分崩离析。任何企业的长久生存都将取决于能够响应各种变化且以数据为中心的灵活架构。”
Gartner建议,数据及分析领导者与高级业务领导一同讨论至关重要的业务优先事项,并探索如何利用以下主要趋势获得竞争优势。
趋势一:增强型分析
增强型分析是数据与分析市场的下一波颠覆性技术。它利用机器学习(ML)与人工智能改变分析内容的开发、消费与共享方式。
到2020年,增强型分析将成为分析与商业智能(Analytics and BI)、数据科学与机器学习平台(DataScience and ML Platforms)以及嵌入式分析新增购买的主要驱动力。数据与分析领导者应在平台功能逐渐成熟时采用增强型分析。
趋势二:增强型数据管理
增强型数据管理利用机器学习功能和人工智能引擎来生成企业信息管理类别,其中包括数据质量、元数据管理、主数据管理、数据集成以及数据库管理系统(DBMS)自我配置、自我调整。它可以自动执行许多手动任务,帮助不太精通技术的用户能够更加自主地使用数据,同时也让高技能的技术人员专注于价值更高的任务。
增强型数据管理将以往仅用于审计、沿袭及报告的元数据用于支持动态系统,使得元数据应用从被动走向主动,并且正在成为所有人工智能/机器学习的主要驱动因素。
到2022年底,通过加入机器学习与自动化的服务级管理,数据管理手动任务将减少45%。
趋势三:持续型智能
到2022年,超过一半的重要新业务系统将嵌入持续型的智能化功能,利用实时情景数据帮助用户改善决策。
持续型智能是一种设计模式,将实时分析与业务运营相结合,处理当前与历史数据,以便为事件响应行动提供建议。它能够实现自动化决策或为决策提供支持。持续型智能采用多种技术,如增强型分析、事件流处理、优化、业务规则管理以及机器学习。
Pdta Sallam表示:“持续型智能让数据与分析团队的工作发生重大变化。这既是一个巨大的挑战,也是极大的机遇,因为分析与商业智能团队可以帮助企业做出更明智的实时决策。持续型智能可以被视作一种终极的运营型商业智能。”
趋势四:可解释型人工智能
人工智能模型越来越多地被用于增强与代替人类决策。但在某些情况下,企业必须充分了解这些模型是如何做出决策的。为了与用户及权益方建立信任,此类应用的领导者必须让这些模型变得更易解读与理解。
不幸的是,大多数先进的人工智能模型都是复杂的黑盒子,无法解释为何提出了某条具体建议或决策。而数据科学和机器学习平台中的可解释型人工智能将运用自然语言从准确性、属性、模型统计及特性等方面自动生成模型,提供解释说明。
趋势五:图形分析
图形分析(Graph Analytics)是一系列可用于探索企业机构、人员与交易等相关实体问关系的分析技术。
在2022年前,图形处理和图形数据库管理系统的应用将以每年100%的速度陕速增长,从而持续加快数据的准备工作,并支持更加复杂且合理的数据科学。
图形数据存储可以跨越数据筒仓(Data Silos)高效地建模,探索与查询具有相互复杂关系的数据,但Garmer认为,特殊的技能需求限制了该技术目前的应用。
为了满足对于复杂数据的综合查询需求,图形分析将在未来几年内得到发展。利用SQL查询完成大规模的复杂查询并不总是切实可行的,有时甚至无法完成。
趋势六:数据结构
数据结构(Data Fabric)支持分布式数据环境内的无摩擦数据访问与共享。其支持单一、一致的数据管理框架,通过避免孤立存储的独特设计,实现无缝的数据访问与处理。
到2022年,定制式数据结构设计将主要用作静态基础架构,促使各企业机构为全新的设计投入资金,进而实现更加灵活的动态数据网格(DataMesh)。
趋势七:自然语言处理/会话式分析
到2020年,50%的分析查询将采用搜索、自然语言处理(NLP)或语音生成技术,亦可能实现自动生成数据。分析复杂数据组合以及让企业机构中的每个人都可以访问分析的需求,将推动此项技术更广泛的应用,从而让分析工具的应用变得如同使用搜索界面或与虚拟助理进行对话一样简单。
趋势八:商业人工智能与机器学习
到2022年,75%利用人工智能与机器学习技术的新终端用户解决方案,将采用商业解决方案而非开源平台构建。
大多数商业解决方案供应商已经在开源生态系统中创建了连接器,为企业提供扩展与推广人工智能及机器学习所需要的功能特性,例如,项目与模型管理(Project&ModelManagement)、复用(Reuse)、透明度(Transparency)、数据沿袭(Data Lineage)、平台凝聚力(Platform Cohesiveness)以及开源技术所缺乏的集成。
趋势九:区块链
区块链与分布式分类帐(Distributed Ledger)技术的核心价值是在非置信的参與者网络中提供去中心化的信任模式。这种模式对分析使用案例结果的潜在影响非常大,尤其是那些利用参与者关系进行交互的案例。
然而,在今天的市场中,区块链技术并不成熟,至少需要再等几年的时间才会有4~5项主要区块链技术占据主导地位。在此之前,技术终端用户将被迫与主导客户,或网络所指定的区块链技术及标准相集成,这其中就包括与现有的数据及分析基础架构进行集成。集成成本可能会超过任何潜在收益。区块链是数据源,而非数据库,不会取代现有的数据管理技术。
趋势十:持久内存服务器
在采用内存中计算(IMC)所支持的架构方面,新型持久内存(Persistent Memory)技术将有助于降低成本与复杂度。持久内存代表着DRAM与NAND闪存之间的新内存层,可为商性能工作负载提供经济高效的大容量内存。它将有望改进应用性能、可用性、启动时间、集群方法与安全实践,同时保持成本可控;通过减少数据复制需求,还将有助于企业机构降低其应用与数据架构的复杂度。
Donald Feinberg表示:“数据量正在快速增多,实时将数据转化成价值的紧迫性也在快速增加。新的服务器工作负载不仅需要更快的CPU性能,而且还需要大容量内存及更快的存储。”