处于数据和分析位置的领导人必须审视这些趋势对业务带来的潜在影响,并相应调整业务模式和运营,否则就有可能失去竞争优势。
增强型数据分析、增强型数据管理、持续型智能、可解释的AI、数据结构、NLP/对话式分析、商业AI和ML、区块链和持久性内存服务器共同构成了Gartner2019年十大数据和分析技术趋势。
近日,在悉尼举行的Gartner数据与分析峰会上,增强型数据分析和可解释的人工智能成为焦点。Gartner称,增强型数据分析、持续型智能和可解释的人工智能(AI)是数据和分析技术的主要趋势之一,并在未来三到五年内具有显著的颠覆性潜力。Gartner副总裁兼杰出分析师Donald Feinberg认为,数字化颠覆带来的挑战——数据太多也创造了前所未有的机遇。大量数据和由云实现的日益强大的处理能力意味着现在可以大规模地训练和执行必要的算法,以最终兑现出AI的全部潜力。Donald表示:“任何企业的持续生存都将取决于灵活的,以数据为中心的架构,以响应不断变化的速度。数字化业务需要大量复杂且分布式的数据、迅速行动以及持续型智能,这意味着僵化且集中式的架构和工具分崩离析。”
Gartner研究副总裁Rita Sallam则认为,数据和分析领导者必须审视这些趋势对业务带来的潜在影响,并相应调整业务模式和运营,否则就有可能失去竞争优势。
“数据和分析的形势不断发展,从支持内部决策到持续型智能,信息产品和任命首席数据官,”Rita说道,“深入了解它们对于推动这种不断变化的技术趋势,并根据业务价值对它们进行优先排序至关重要。”
Gartner建议数据和分析领导者与高级业务负责人讨论他们的关键业务优先级,并探索以下主要趋势如何实现这些优先级。
趋势1 增强型数据分析(AugmentedAnalytics)
作为数据分析的高级增强阶段,增强分析能为分析计划带来更多自动化动能以及创新洞察力。因为在正式进入数据分析之前,都需要对数据进行抽取、清洗、融合等准备工作,以提高数据分析的效率和准确性,更利于决策。而增强分析则能够帮助普通用户在没有数据科学专家或IT人员协助的情况下,访问有效数据,并对理论和假设情况展开测试与验证。
增强型数据分析侧重于增强智能的特定领域,利用机器学习(machinelearning)转变分析内容的开发、使用与共享方式。目前国内正在加强这一技术突破,包括几大数据计算厂商,如阿里云、百度云、华为云等,通过对百万数据的计算与汇聚,实现对现实算力的优化,以在未来如智慧大脑领域实现更多突破。
Gartner预测,到2020年,增强分析将成为分析和商业智能解决方案的主要卖点,相关业务负责人应该在平台功能趋于成熟时率先采用增强型分析。机器学习和人工智能、增强型分析将为数据和分析市场带来颠覆,因为它将彻底改变开发、消费和共享分析内容的方式,可使数据准备、洞察力获取和洞察力可视化这个过程实现自动化,在许多情况下无需专业的数据科学家。
趋势2 增强型数据管理(AugmenteddataManagement)
增强型数据管理利用机器学习功能和AI引擎来制作数据管理类别,包括数据质量、元数据管理、主数据管理、数据集成以及数据库管理系统(DBMS)的自我配置和自我调整。
增强型数据管理将元数据由仅用于审计、沿袭和报告变成支持动态系统。元数据正在从被动变为主动,并且正在成为所有AI/ML的主要驱动因素。它可以自动执行许多手动任务,为技术水平较低的用户提供使用数据的机会。它还有助于高技能的技术资源专注于更多的增值任务。
趋势3 持续型智能(ContinuousIntelligence)
持续性数据不仅仅是一种实时数据的新方式;相反,它是一种设计模式,其中实时分析与业务运营相结合,处理当前和历史数据以规定响应事件的行动。它提供决策自动化或决策支持。持续型智能利用多种技术,比如增强型分析、事件流处理、优化、业务规則管理和机器学习。
“持续型智能代表了数据和分析团队工作的重大变化,”Gartner研究副总裁丽Sallam认为,“分析和BI(商业智能)团队在2019年帮助企业做出更明智的实时决策,这是一个巨大的挑战,也是一个巨大的机会。它可以被看做是运营商业智能的终极目标。”到2022年,超过一半的重要新业务系统将采用持续性智能,使用实时上下文数据来改善决策。
趋势4 可解释的AI(ExplainableAI)
人工智能模型越来越多地用于增强和取代人类决策。但AI解决方案如何解释为什么他们得出某些结论?
大多数这些先进的AI模型都是复杂的黑盒子,无法解释他们为何达到特定的推荐或决定。这是可解释的人工智能的用武之地。比如说,数据科学和机器学习平台中的可解释型AI可自动生成模型的解释,用自然语言从准确性、属性、模型统计和特征等方面解释模型。
趋势5 图形分析(Graph)
图形分析是一组分析技术,可帮助企业探索交易、流程和员工等实体之间的关系。到2022年,图形处理和图形数据库管理系统的应用将以每年100%的速度增长。
根据Gartner的说法,图形数据存储可以跨数据孤岛有效地建模、探索和查询数据,但是对专业技能的需求限制了它们的采用。由于需要在复杂数据中提出复杂问题,图形分析将在未来几年内增长,这在使用SQL查询时并不总是切实可行。
趋势6 数据结构(DataFabric)
数据结构都是关于单一且一致的数据管理框架。它着眼于在分布式数据环境中实现无摩擦访问和数据共享,而不是孤立存储。
到2022年,定制数据结构配置将主要用作静态基础架构,迫使组织进入新一波的成本控制浪潮,以完全重新设计更动态的数据网格方法。
趋势7 NLP/会话分析(NLP/ConversationalAnalytics)
到2020年,50%的分析查询将通过搜索、自然语言处理(NLP)或语音生成,或者将自动生成。
分析复杂的数据组合并使组织中的每个人都可以访问分析的需求将推动更广泛的采用,使分析工具将如同搜索界面或与虚拟助手的对话一样简单。根据另一项单独研究,NLP用例非常庞大,预计到2020年NLP市场价值将达到134亿美元。
趋势8 商用的人工智能和机器学习(CommercialAIandML)
到2022年,利用ML和AI技术的75%的新终端用户解决方案将采用商业解决方案,而非开源平台的方式构建。商业供应商已经在开源生态系统中创建了连接器,它们为组织提供了扩展AI和所需的功能,例如项目和模型管理、透明度、复用、数据沿袭、平台凝聚力以及开源技术所缺乏的集成。
趋势9 区块链(Blockchain)
企业可以使用区块链来解决数据管理问题吗?数据管理对CTO来说是一个持续不断的挑战,但Bluzelle首席执行官Pavel Bains认为区块链技术可以提供解决方案。
区块链和分布式账本技术的核心价值主张是在不受信任的参与者网络中提供去中心化的信任。区块链对于数据分析的潜在影响很大,尤其是对利用参与者关系和交互的那些企业的影响。然而,在四到五个主要区块链技术成为主导之前,还需要几年时间。但是,区块链是数据源,而不是数据库,不会取代现有的数据管理技术。
趋势10 持久性内存服务器(PersistentMemoryServers)
持久存储器技术旨在降低采用内存计算(IMC)架构的成本和复杂性。持久性内存代表DRAM和NAND闪存之间的新内存层,可为高性能工作负载提供经济高效的大容量内存。“数据量正在激增,实时将数据转化为价值的紧迫性正以同样快的速度增长,”Donald表示,“新的服务器工作负载不仅要求更快的CPU性能,还要求大容量内存和更快的存储系统。”