认知智能加速来临,传统行业AI落地有了新范式

2021-09-26 12:35石菲
中国信息化 2021年9期
关键词:图谱范式人工智能

石菲

人类的智慧是如何产生的?人类通过感知得到各种各样的信息,经过认知使信息和数据成为知识,并教授给其他人,这个过程就是智慧的产生过程。

近年来,随着技术的飞速发展,人工智能的应用越来越普及。但这一现象很大程度上是由于互联网产生的海量数据以及大规模运算能力的提升,在从感知智能通往认知智能的道路上,依然存在重重障碍。

随着人工智能逐步从消费互联网进入产业互联网,人们发现传统行业与互联网行业相比,数据量少基础差,需求复杂,人工智能在传统行业的深度应用迫切需要一种新的方法。

比如快消行业,新品发布后企业迫切想得知消费者的反馈。但这数据从何而来?即便在微博、小红书、抖音等平台上发现用户对新品的评价,如何将视频与文本中的观点评价提炼出来,形成对企业有价值的反馈?

作为深耕数据智能领域多年的企业,北京百分点科技集团有限公司始终坚持在感知、认知、决策、行动的人工智能应用闭环中不断探索,在此过程中,百分点科技找到了一种认知智能在行业里落地、决策的新范式。

符号主义引导下的认知智能行业落地新范式

百分点科技CTO刘译璟说:“这个范式我自己称之为符号主义引导下的多方法融合技术,它不是纯粹采用深度学习,而是首先构建出该领域业务的本体框架,然后再结合深度学习和样例数据细化知识图谱的本体和事实数据,并根据知识图谱应用中的反馈信息不断调整和优化。经过在不同行业的试用,我们认为这是一条传统行业人工智能深度应用落地的可行方法。”

刘译璟补充说,这套框架是融合符号主义、连接主义和行为主义三种方法的,基于符号主义引导,围绕应用需求定义出行业知识框架;再融合连接主义和行为主义,在应用中不断丰富和完善行业知识。由于一开始就是以应用为目的,可行性较高。

“该框架经过在应急领域的尝试,被证明是适用的。我们有信心把它从一个行业再跨越到另外一个行业里面,产生价值。比如对应急预案的定量判断、提供数据支撑方面都取得了不错的效果。例如暴雨会导致滑坡,以前更多是靠经验进行判断,到底导致滑坡的概率有多大?不同地形滑坡的概率是否不同?这些情况以前大多依靠人工判断,没有数据支撑。百分点基于历史数据,把暴雨、滑坡、房屋倒塌等灾害及事件全部搜集出来,构建了一个大数据库,之后计算发生次生灾害的概率,这样在制定预案的时候会有定量的数据进行支撑。”他说。

传统行业领域受制于以前的感知能力不强,实际积累下来的数据比较少。因此需要先定义框架,才可以根据有限的数据进行分析。

比如上面提到的快消行业,百分点科技首席算法科学家苏海波举例说,在新品发布后百分点科技可以先根据产品的品牌、型号、类型等维度,对在不同网络平台的帖子进行海量结构化的抽取、分析,就能够知道消费者对产品的反馈,甚至可以了解不同竞品之间具体数字上的差异。

用融合创新弥补数据量不足

数据量不足不仅仅是传统行业面临的难题,互联网领域也同样存在这个问题,此外,数据治理成本过高也是人工智能应用难的一个重要原因。近日,由百分点科技和机器之心联合举办的数据智能技术实践论坛成功举行。百度视觉技术部主任架构师刘经拓在论坛上表示,大规模有监督数据的技术红利逐渐减弱,AI新基建需要更低的研发与部署成本。因此,百度在技术和产业两个维度上都进行了融合创新,提出了计算机视觉领域从预训练、定制化到小型化,以及平台化的一体化研发方案。具体来说,首先通过用超大规模非结构性的数据做预训练,能够在同样少量数据的情况下取得更好的效果;定制化是指结合特定场景进行自适应迁移学习,根据场景数据进行有监督定制化调优;小型化主要是基于模型剪枝、蒸馏、量化等技术,对模型进行裁剪。

对此,百分点科技数据开发部负责人马伟凯表示,数据治理中的技术挑战除了数据孤岛、数据质量等问题,还存在多模态下如何解决数据不可用、不能用及不好用等挑战。百分点科技沉淀了一套数据治理“PAI”实施方法论,即流程化(processoriented)、自动化(automation)、智能化(intelligence)。通过引入机器学习算法、NLP等数据智能技术,可以更好地开展数据治理工作,建立全域数据标准、提升数据质量、盘活数据资产,从而支撑数据融通,最终释放数据价值指导业务创新。

知识图谱解决认知难题

从感知到认知的跨越过程中,构建大规模高质量知识图谱是一个重要环节。但目前知识图谱的成本与效用问题突出,如何低成本地从文本及各种资源抽取出有效的知识是一个非常大的制约因素。对此,复旦大学肖仰华教授也深有感触,他表示,作为大数据知识工程的典型代表,知识图谱技术近年来取得了长足进步,并在一系列实际应用中取得了显著效果。但随着应用的深化,知识图谱的落地过程单靠其所代表的知识智能本身这套技术体系和范式已经难以解决很多问题:一是数据获取和治理困难;二是在知识层面,小样本、低资源情况下知识的表示和获取代价仍然非常大;此外,获取知识之后,在应用、服务能力方面也存在很多挑战。

因此,未来破题的关键在于要突破以知识图谱为代表的知识智能的边界,向认知智能这样的智能新形态发展。他认为,认知智能作为数据智能、知识智能融合创新产物,将是知识图谱等知识工程技术发展的必然归宿。

百分点科技首席算法科学家苏海波则认为,未来知识图谱一定会深入到各行各业,只有掌握通用的人工智能技术,并将技术和业务需求对应起来,才能真正发挥出知识图谱的价值,解决行业问题。

此外,人才问题依然是困扰人工智能深度应用的重要因素。刘译 表示,影响人工智能应用最重要的是人。人工智能應用需要跨学科、跨领域,需要人工智能专家和业务人员一起努力,把现实的问题转化成AI能理解的数学或者计算机语言,不断迭代或优化后才能落地。只有构建好这样的融合探索环境,之后才能孵化出合适的工具,扩大人工智能应用范围。

我们已经进入到一个从数据到知识的“智变”时代,随着人工智能与大数据的进一步融合,从感知智能到认知智能的通路搭建会越来越快,人工智能赋能各行各业的时代即将到来。

猜你喜欢
图谱范式人工智能
基于CiteSpace的我国文化“走出去”研究的知识图谱分析(2001-2020)
基于SCP范式的贵州省食用菌产业分析
谨言慎行
从教师视角谈“读思达”课堂范式——以“百分数的认识”为例
2019:人工智能
工商银行与第四范式正式签约共建银行AI核心系统
人工智能与就业
图表
数读人工智能
最精确人类大脑图谱出炉