李启可 张克亮
摘要:问答系统的历史可以追溯到20世纪50年代,主要是受到了图灵测试的影响,图灵测试主要是通过测试者与被测试者之间的问答来进行测试。图灵测试可以说是问答最初的表现形式。而在当时,伴随着计算机的发展,问答系统也在之后问世,只不过当时的问答较现在来说,系统复杂程度不高,功能较少。经过几十年的发展,问答系统已经具有了蓬勃的发展,种类繁多,其中所使用的方法以及模型也多不胜数。近年来,由谷歌所提出的知识图谱技术在工业界得到了广泛的应用,并且知识图谱给带来的收益是不可小觑的,知识图谱结合了多种学科,并利用图的形式,为研究者提供具有切实的,有价值的参考。本文将着重介绍与知识图谱,知识推理相关的问答系统的发展状况,在此将做一个整体性的论述。
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2019)09-0155-02
1 基本概念
1.1 什么是推理
我們在生活中常常谈到推理,每当我们要对某些未知的事情进行猜测或是分析时,我们就会用到推理。推理,在《现代汉语词典第6版》第1323页是这样定义的:逻辑学指思维的基本形式之一,是由一个或几个已知的判断(前提)推出新判断(结论)的过程[1]。
推理是思维的基本形式之一,思维是人类的基本的特征,推理能够帮助人类认识世界,能够有效地表达人类的思维,并与外界产生交流,从而实现信息的交换。从古至今,人类的知识产量一直在不断增长,尤其最近几十年,人类知识呈现爆炸式的增加,从人类思维的角度来说,这就是推理所带给人类的巨大益处,人类通过已知的知识去推理未知的知识,从而产生新的知识,这样的过程就是一个推理的过程,而这个过程是从已知到未知,从无到有的过程。
1.2 什么是知识推理
知识推理的定义比较多,以下是MBA智库百科的定义:知识推理是指在计算机或智能系统中,模拟人类的智能推理方式,依据推理控制策略,利用形式化的知识进行机器思维和求解问题的过程。推理是按照某种策略从已知判断推出另一种判断的思维过程。推理的过程就是解决问题的过程,使问题从初始状态转移到目标状态的方法和途径。Kompridis[2]在他的论文中谈到,推理为一系列能力的总称,包括有意识地理解事物的能力建立和验证事实的能力运用逻辑的能力以及基于新的或存在的知识改变或验证现有体系的能力。
推理是人类思维最基本的特征,作为一个正常的人类,或者说只要是正常的人类,都会推理,这是必须承认的事实。其实推理就是思考,而对于机器来说,机器并不会思考,机器不想人类那样智能,人类能够分辨猫咪和狗,能够分辨下雨和天晴,但机器不能,机器在没人类指导的情况下是做不到的;人类能够通过学习去推断出新的知识,人类能够通过学习来推断未知的事物。但机器同样不能,机器在没有人类指导的情况下是无法做出推理的。
那么从人工智能的角度来说,机器想要进行推理,那么必须由人来指导,由人来指定规则,算法,模型等等一系列有利于计算机理解的法则,而计算机通过对这些法则进行编码解码,来按照人们的意愿,或是模仿人类的推理的行为做出一些简单的推理。我们必须把现实世界里的语言,知识,或是规则转换成计算机能够识别的语言,这样能够使计算机更加方便去进行推理,而计算机将通过计算机能识别的语言按照人们的思路去进行推理,从而实现让计算机来进行推理的过程。
2 历史发展
知识推理是与知识图谱密切相关,知识图谱的诞生直接导致了知识推理的诞生,而知识推理离不开知识图谱,知识推理中很多技术都是基于知识图谱来实现的,这就体现了这两种技术的相互的依赖性。关于知识图谱和知识推理的发展大概可以分为本体网络时代,语义网时代,和知识图谱时代[3]。
2.1 本体时期
知识图谱的最初形式是本体网络。这可以看作是知识图谱的雏形,后期的知识图谱在很大程度上是受本体网络的启发,从而发展出来的。本体(ontology)是一个哲学里的概念,在知识图谱的发展过程中,本体主要是指由一些抽象概念,物体属性以及关系类型所构成一个世界。本体主要关注的是物体之间的相互关系,或是物体的特征之间的一些相互关系。本体网络我们可以看作是一种特殊的语义网络(Semantic Network),这在早期人们也对其做了深入研究,并由此催生了很多与之技术。
在知识图谱发展初期,除了本体网络的雏形之外,还有一种形式值得我们研究——专家系统。专家系统中存储了大量的与某一类专业相关的知识,每当我们需要解决某一类专业问题的时候,我们可以不再去查阅大量的资料来解决我们遇到的问题,我们可以直接使用这样一个存储了大量专业知识的专家系统,通过这个专家系统来解决我们的问题。这样的专家系统同样为后来的一些人工智能系统提供了灵感。这也是早期人们通过计算机程序系统来解决问题的一个实例。
2.2 语义网
语义网(Semantic Web)与语义网络(Semantic Network)是两个不同的概念,语义网络主要研究事物之间的相互关系,或是事物特征之间的相互关系,而语义网则是与互联网类似的一种网,它具有十分强大的智能,能够有效地与人类交流,从而实现人类与机器的交互。语义网主要通过对用户输入的语义进行工作。对于当前大量的信息,人们将会面临困难是如何对大量信息进行检索,以及挖掘有用信息,而语义网的出现正是对这种困难的一种解决方案。
2.3 知识图谱
2012年,谷歌提出知识图谱。这是由谷歌搜索引擎专家Amit Singhal在他的论文《Introducing the Knowledge Graph: things, not strings》中提出的,搜索引擎在知识图谱的帮助下其性能将会有一个很大的提升。在知识图谱的帮助下,搜索引擎将能够理解用户的输入中语义,从而有一个更加精确的搜索,对用户的友好度将会更高。同时,知识图谱会为用户推荐与用户搜索相关的一些信息,或者说知识图谱通过用户的输入,来判断用户的喜好、兴趣,并根据这些喜好和兴趣来为用户推荐相关的东西。这与个性化推荐比较相似。
3 主流技术
当前在问答系统中有很多技术,这里主要介绍问答系统中一些相对来说比较主流的技术。主要分为两种,一种是基于规则的推理方法,一种是基于统计的推理方法。
3.1 基于规则的推理方法
基于规则的推理方法[4],这个方法的主要思想是借助RDF来实现的,资源描述框架RDF是Resource Description Framework的缩写,RDF允许人们可以定义自己的词汇表,这就意味着在知识表示的方面,人们能够根据自己的实际情况来定义知识,然后再根据自己的词汇表或者是自己定义的知识来进行知识推理。但仅仅是这样还无法完成知识推理,所以在这当中加入了图,与三元组相似,用图来表示实体之间的关系,但在这当中变得十分灵活,通过自己定义知识表示结构,从而让系统从这样的结构中去学习推理,并通过这些知识去推理出新的知识。
其次,在基于规则的推理方法中,还使用了OWL,OWL是Ontology Web Lanugage的缩写,通过借助这种语言来对事物之间的关系进行表示,之后再通过这些关系去进行推理。
3.2 基于统计的推理方法
基于统计的推理方法,这种主要是对大量数据进行处理,也就是堆数据进行挖掘,从中挖掘出实体之间的关系,之后再抽象成相应的规则,从而在这之后能够实现知识推理。我们都知道知识图谱主要是从数据抽取出三元组,通过三元组来表示实体之间的关系,这里基于统计的推理方法同样是如此,但这里的方法更进一步,它把抽取出来的三元组放进一个集合,同时有把这当中涉及的实体放入另一个集合,通过这样方法对未知的三元组进行推理,推断出一些可能的,未出现过的三元组,从而实现知识的推理。
4 總结
本文从知识推理的概念,历史发展,以及在问答系统中一些主流的知识推理技术等多个方面对知识推理做了介绍,从中我们可以了解到有关知识推理的一部分内容,同时,我们也能从这些内容中获取一些相关知识,从而能指导我们之后的学习,有关知识推理的内容以及知识推理的应用在工业界还有很多,例如基于知识库的问答系统[5]。在这里只是选取一些主流技术来介绍,对于知识推理我们仍然还有很长的路要走,因此我们应该秉持虚心求教的态度,才能把握好之后的机遇。
参考文献:
[1] 官赛萍,靳小龙,贾岩涛,等.面向知识图谱的知识推理研究进展[J].软件学报,2018,29(10):2-3.
[2] Kompridis N. So we need something else for reason to mean. International Journal of Philosophical Studies,2000,8(3):271-95.
[3] 毛先领,李晓明.问答系统研究综述[J].Journal of Frontiers of Computer Science and Technology,2012,6(3):195-196.
[4] 曾帅,王帅,袁勇,等.面向知识自动化的自动问答研究进展[J].自动化学报,2017,43(7):5?6.
[5] 王树西.问答系统:核心技术、发展趋势[J].计算机工程与应用,2005.18:2-3.
【通联编辑:李雅琪】