胡小敏,李冠宇
(大连海事大学 信息科学技术学院,辽宁 大连116026)
近年来,本体[1]已成为专家系统和多智能体系统的一个有机组成部分,同时也是语义网 (semantic web)的核心元素,在知识表示和知识推理方面发挥着重要作用。1993年 T.Gruber给出了本体的定义:An ontology is an explicit specification of a conceptualization[2]。本 体 (ontology)表达了某一领域的概念和概念间关系,提供了与其它模型和处理过程之间的互操作关系。
就本质而言,经典本体是一种外延和内涵都确定的、明晰的清晰本体。而目前的研究结果普遍认为经典本体并不适合处理现实世界领域中固有的、不精确的和模糊的知识。因此,引入模糊集和粗糙集理论帮助处理这类信息,形成模糊本体 (fuzzy ontology)和粗糙本体 (rough ontology)。
借助本体推理 (ontology reasoning),不仅能够发现本体中概念的矛盾性,也能发现本体中隐含信息。语义网的深入发展伴随着大量不确定的信息出现,如何针对这些不确定信息进行表达和推理,就需要一种能够处理模糊粗糙信息的本体推理机。
本文提出了一种新型推理机——支持模糊粗糙本体的推理机,不仅能够提高推理效率,而且能够增加知识表达的完备性。下面将从支持模糊粗糙本体的推理机的功能,推理机总体结构及推理机组成模块的功能作用等方面进行阐述。最后,将本文研究的推理机与其它推理机进行了比较分析。
人类认识世界的过程与方法往往是以不确定性为本质的,而大部分的不确定信息是不精确的。就目前的认知水平而言,学术界普遍认为,不确定性[3](或称不精确性)是由模糊性、粗糙性和随机性3种基本情况及其复合情况所构成的。随机性是内涵及外延都确定而发生规律具有不确定性,模糊性则是内涵的不确定性,粗糙性则是外延的不确定性。在本体的研究中,本体被认为是概念和概念间关系的集合,一般都具有稳定性特征,因此本文将随机性的研究暂时放置一边,主要研究不精确性中的模糊性和粗糙性。
模糊本体是将模糊集理论引入到本体研究之中,用来解决不精确的问题,虽然对于模糊本体的定义,学者们采用的或者是四元组形式,或者是六元组形式,但其本质是不变的,定义表示的都是概念之间的模糊关系,只是细化程度不同而已。
以四元组为例,对模糊本体的定义为[4]:O= (C,R,E,I),其中:C为概念的集合,R为概念间关系的集合,E为演化机制 (规则),I为推理机制 (应用或解释规则)。R中的成员为一个四元组 (r,c1,c2,f),其中r为c1与c2之间的关系名,c1,c2为直接相关的两个概念,f为关系程度,f∈ [0,1]。
根据文献 [5],粗糙本体是将粗糙集理论[6]引入到精确本体模型之中,将其扩展为粗糙本体,用来表示不确定知识,在该文献中,将粗糙本体知识模型 (rough ontology knowledge model,ROKM)(实际上就是粗糙本体)定义为七元组:ROKM= {U,P,C,I,Dom,Range,rel}。
其中:U为概念,表示个体的有限集合;P为属性,表示属性的有限集合;C为U的子集;I是领域内概念实例的集合;Dom表示定义域;Range是值域;rel表示函数或关系。
由于现实世界的知识不是单一的模糊的或粗糙的,而更多的知识既是模糊的又是粗糙的,粗糙逻辑 (rough logic)与模糊逻辑 (fuzzy logic)是呈互补形式的,很自然地将二者进行结合,从而形成模糊粗糙本体 (fuzzy rough ontology),以便处理结构更复杂的不确定信息。
模糊粗糙集理论利用模糊集与粗糙集处理不完善、不确定知识中的优势,丰富地处理和描述了信息系统中的知识。一些学者从知识描述的角度出发,将描述粗糙集的一对上下近似推广到模糊环境下,提出了模糊粗糙集 (fuzzy rough sets)的概念。
本文将模糊粗糙集理论引入到本体模型中,扩展为模糊粗糙本体,不仅可以丰富知识的表达,还提高了智能信息处理的效率,方便了知识的推理。本文将模糊粗糙本体模型的形式化定义如下所示:
定义1 不可分辨 (indiscernibility)关系[7]:给定信息系统IS=<U,A,V,f>,(其中,U是对象的非空有限集合;A是属性的非空有限集合;对任意a∈A,Va表示属性的值域,即V=∪Va;f为信息函数,即a∈A,x∈U,有f (x,a)∈Va),BA,定义B在U上的不可分辨关系:
定义2 将模糊粗糙本体模型 (fuzzy rough ontology model,FROM)定义为六元组:FROM = {C,R,P,I,U,V}。其中:
C:表示概念的集合,对于子集XC,定义2个C的子集,X的上近似集珚P(x)可定义为:珚P(x)={x(C|[x]IND(B)∩X≠ Φ};X 的 下 近 似 集可 以 定 义 为(x)= {x∈C| [x]IND(B)X},且(x)≠(x),因为X为C的粗糙集当且仅当(x)≠(x)。
R:概念之间的模糊关系集合,R (C×C,R的具体类型包括:is-a,part-of,kind-of,instance of。
P:概念属性集合,是一个三元组,P= {CP,PP,VP},CP是本体的概念集,PP是模糊属性值,VP是隶属度函数,VP(x)∈ [0,1]。
I:表示概念实例集合。
U:表示定义域。
V:表示值域。
综合确定性本体、模糊本体、粗糙本体和模糊粗糙本体的组成结构和演化关系,模糊粗糙本体这类不精确本体的产生形式和途径如图1所示。
图1 不精确本体的产生形式
在图1中,有两条可以通向模糊粗糙本体的演化途径:①先将经典的确定性本体模糊化,得到模糊本体,然后再将其粗糙化,进而得到模糊粗糙本体;②先将经典的确定性本体粗糙化,得到粗糙本体,然后再将其模糊化,进而得到模糊粗糙本体 (事实上是粗糙模糊本体)。
就实质而言,演化途径②可视为一种辅助的途径,而演化途径①则是主要途径。其重要原因在于,粗糙本体是可以通过建立粗糙描述逻辑转换函数从而可约简 (去粗糙化)为一组经典的确定性本体,再进行模糊化,事实上,就转化为对一组确定性本体的模糊化的经典问题了。也就是说,粗糙模糊本体可以通过约简转化为模糊本体进行处理了。因此,模糊粗糙本体是不精确处理的主要复杂对象。
推理机[8]是实现推理过程的程序。推理机通常应用于专家系统中,用来对知识进行解释,并且依据知识的语义信息,按照一定的规则找到知识并进行解释执行。
现阶段已有的推理机的推理对象都不是以模糊粗糙本体为研究对象的。为解决此问题,本文提出支持模糊粗糙本体的推 理 机 (fuzzy rough ontology driven reasoner,FRODR),为了使得推理功能更加全面,FRODR推理机既是基于描述逻辑[9,10]的推理,同时也是基于规则[11]的推理。
本体推理机最重要的功能是检查本体的一致性和得到隐含的知识。除此之外,FRODR推理机的功能还应包括模糊概念可满足性、模糊蕴含推理、模糊概念的包容性。
(1)本体的一致性检查:检查本体的一致性保证了推理正确性,检测实例是否与类、个体和属性之间产生冲突,如果有冲突则是不一致的,否则是一致的。
(2)隐含的知识:它是推理的结果,推理机的推理知识越全面,得到的隐含知识越多,获得的信息越全面。
(3)模糊概念可满足性:a是一个新的个体,并且并未在模糊知识库中出现,如果概念C是α可满足的当且仅当存在解释使得a属于概念C的隶属度大于α (α是根据需要自己定义的)。
(4)模糊蕴涵推理:用于判断一个模糊概念断言a对于当前的知识库是否是成立。
(5)模糊概念的包容性:D包容C,用 (C¤D表示),当且仅当新的个体a既属于概念C又属于概念D,且C的所有个体都能在D中找到。
本文的推理机FRODR的系统结构由用户模块、解释接口模块、解析模块、约简模块、推理引擎模块、模糊知识库和规则库七部分组成,FRODR的系统结构如图2所示。
图2 模糊粗糙本体推理机的系统结构
2.2.1 用户模块
用户模块是用户根据自己需要提出要推理的内容,提出推理需求。
2.2.2 解释接口模块
解释接口也称人—机交互界面,用于对用户输入的问题进行描述并转化成规范化的表示形式,然后交给推理模块进行推理。同时,将推理机的推理结果通过解释接口给予用户以相应的解释,得出结果。解释接口承担着系统输入输出的功能。
2.2.3 解析模块
解析器读取输入的模糊粗糙本体,并把它转换成模糊知识库内部表示。对模糊粗糙本体依次进行结构分析、资源整合和语法转换,解析后的结果被存入模糊知识库。复杂情况下,在推理机中有多个不同的解析模块,其中,每个解析模块,都要负责对一种特定的模糊粗糙本体表示语言进行翻译。通常,一个解析模块就够了。在解析中,重要的是将模糊粗糙本体进行翻译解释处理,通过处理模糊粗糙本体中的上下近似集,将其解析成模糊本体,并转换成模糊知识库的内部表示。
2.2.4 约简模块
约简模块的功能,就是将模糊粗糙本体约简成相对不模糊的本体,消除冗余的部分。在该模块中,优化过程起到了重要的作用。因此,在约简时,最好要全面的考虑优化问题,具体的约简方法包括:①最少化概念和公理数量;②忽略多余的元素;③优化通用的用例;④约简推理任务。
2.2.5 推理引擎模块
推理模块是推理机的核心部分,在推理模块中包含有两种推理机,即Pellet Reasoner和FuzzyDL Reasoner,分别用于完成不同类型的推理任务。系统可根据具体推理对象自行选择对应的推理机。在推理过程中,调用的推理规则之间可能会产生冲突[12]。因此,规则冲突的消解策略就显得极为重要。
在推理过程中,系统要不断的运用规则库中的规则和模糊知识库中的事实进行推理,推理过程中的事实或目标将与规则库 (模糊知识库)中的规则 (事实)进行匹配,在匹配过程中会发生以下几种情况:
(1)已知事实或目标不能与规则库或模糊知识库中的任何知识成功匹配;
(2)已知事实或目标能与规则库或模糊知识库中的任何知识成功匹配;
(3)已知事实或目标恰好与规则库或模糊知识库中的一条知识匹配成功;
(4)已知事实或目标与规则库模糊知识库中的多条知识匹配成功,但是能匹配的规则有多条或者能匹配的事实既有模糊事实又有精确事实。
对于情况 (1),其结果很明显,该推理条件在推理机中的推理是不成立的,即不存在任意一条的事实或者规则使得该事实或者目标在该推理机中能够推理成功;情况(2)则需要用户具体语境的参与,否则推理进行不下去;情况 (3)则是唯一匹配成功的规则或事实,可以直接带入进行推理;而对于情况 (4)则比较难以处理,由于有多条可选择的规则或事实,因此,需要一定的方法和策略解决冲突问题。推理规则或事实选择的不同,实现的推理结果就会不同,所以不能忽视规则或者事实的选择与处理,这就需要冲突消解的策略。
传统的冲突消解策略都是针对精确匹配的,而本文的处理对象则是不精确的。为了解决不精确处理对象的冲突消解问题,本文采用一种新的办法,用以处理冲突规则的选择问题——最大相似度原则。
由于每一条知识K的所有属性与规则库的规则或模糊知识库中的事实R能够匹配的知识都有一个最大的相似度Sim(K,R),所以采取最大相似度原则进行规则选择是可行的。
2.2.6 规则库
最早的推理规则是由美国数学家波斯特提出来的,这些规则是专家多年实践经验的总结和概括,具有容易表示、推理简捷、搜索效率高的优点,因而被广泛应用于实际中,对人工智能的发展应用起到了积极的推动作用。
推理机在推理过程中,推理规则起着重要作用。主要的推理规则种类包括SWRL规则和自定义规则。语义网规则描述语言 (semantic web rule language,SWRL)是OWL规则语言的扩展,采用抽象语法表达了OWL本体中的知识信息,丰富了OWL表达能力,提高推理效率;自定义规则是SWRL规则的补充,是为了满足用户的实际需求而定义的规则。其内部组成结构及规则构建和应用过程见图3所示。
图3 规则库的内部结构及构建过程
图3中,对于规则的建立,大部分都是自动生成的,但是也存在一些规则是自动无法生成的,因此需要人工的参与,通过Jena推理机自定义一些规则,当自定义规则与自动生成的SWRL规则无法协同衔接或产生矛盾的时候,则需要领域专家的参与进行协调。
2.2.7 模糊知识库
图2中,模糊知识库是由模糊断言知识库F-ABox、模糊术语知识库F-TBox和模糊关系知识库F-Rbox这3个部分的组合所构成的整体。
定义3 模糊断言知识库F-ABox:是关于个体的模糊断言 (公理)的有限集合。它有如下几种形式:
(1)模糊概念断言:<a:C⊕α>;
(2)模糊属性断言:< (a,b):R⊕α>;
(3)模糊属性断言:< (a,b): R⊕α>;
在推理机FRODR中,运用模糊知识库中的F-ABox和
(4)不相等断言:<a≠b>;
(5)相等断言:<a=b>。
定义4 模糊术语知识库F-TBox:是含有公理的模糊概念的有限集合,C,D是模糊概念。F-TBox包含的公理形式有:
(2)C≡D,表示等价关系。
定义5 模糊关系知识库F-RBox:是由模糊关系传递关系公理 (Tran(R))和模糊关系包含公理组成的有限集合。其中,传递关系是指一个关系R为传递关系时,可表示为Tran(R);模糊关系包含公理的形式为<b≥n>,<b≤n>,<b>n>和<b<n>,b为包含公理,且n∈ [0,1]。
对于图2中的模糊知识库,其内部结构以及输入和输出关系,可以用图4的形式表示。F-TBox公理进行描述逻辑推理,并实现一致性检测以及推理机的其它功能。
图4 模糊知识库的内部结构
最终将基于描述逻辑的推理与基于规则的推理二者进行有机结合。先根据最大相似度原则进行事实匹配,再依据事实匹配的结果,然后对推理机进行动态地选择。若匹配结果是知识库中的事实,则进行模糊描述逻辑推理;否则,就进行基于规则的推理。从而形成FRODR推理机的主要特色——既是基于描述逻辑的推理又是基于规则的推理,进而能够使得推理结构更加完善,推理结果能够更加充分,同时可以提高推理整体效率。
表1列出了实现FRODR推理机功能的Java程序代码,该代码中实现7个主要功能,它们分别是:知识库的创建,隶属度选择的实现,模糊知识库的更新,规则库中推理规则的定义,推理任务的构建,属性的约简和推理任务的实现。
表1 FRODR推理功能的Java程序代码
目前推理机的种类繁多且数量庞大,大多数的推理机都是对经典推理机的更新和改进,具有很好的可靠性。但是,这些推理机却都既不能支持模糊粗糙本体的表示,也无法支持模糊粗糙本体驱动的推理。
表2列出了一些推理机的功能,并与本文提出的推理机FRODR进行了相互比较。通过表2中各种推理机的比较,不难发现,除本文提出的推理机FRODR外,其它的典型推理机都不能支持模糊粗糙本体的推理。然而,在智能信息处理系统中,模糊粗糙本体驱动的推理是非常必要而且不可缺省的重要功能。
表2 FRODR与典型推理机的比较
目前的研究普遍认为,经典本体不能处理现实世界中不精确的信息。在本质上,信息的模糊性和粗糙性并非是不相容的、完全对立的两种关系,而是从两个不同方面对知识进行描述,两者之间呈现一种相容的互补关系。因此,将两者结合起来,研究现实世界中的一类不确定信息—模糊粗糙本体—从理论上和技术上都是可行的,据此,本文提出了一种模糊粗糙本体的模型。
针对不确定性推理问题,设计一种支持模糊粗糙本体的推理机FRODR,最大特点是处理的对象是模糊粗糙本体,解决了不确定信息的推理问题。
本文着重阐述了推理机FRODR的总体结构和功能及推理机各模块的作用,通过本文方法对模糊粗糙本体进行处理,最终可将模糊粗糙本体的推理任务转化为更为成熟且可靠的经典推理机处理推理任务。
[1]YUAN Fang,WANG Tao.The research of reasoner based on ontology[J].Computer Engineering and Applications,2006,42 (9):158-160 (in Chinese).[袁方,王涛.基于本体的推理机研究 [J].计算机工程与应用,2006,42 (9):158-160.]
[2]LUO Zhenghai.Semantic Web services oriented ontology merging research [D].Dalian:Dalian Maritime University,2009(in Chinese).[罗正海.面向语义 Web服务的本体合并研究[D].大连:大连海事大学,2009.]
[3]LI Zhaohai.Fuzzy concept lattice gluing based fuzzy ontology merging approach research [D].Dalian:Dalian Maritime University,2012(in Chinese).[李兆海.基于模糊概念格胶合的模糊本体合并研究 [D].大连:大连海事大学,2012.]
[4]LUO Junmin,WU Yuyun,WU Bin.Research on the fuzzy ontology and it’s evolution [J].Microelectronics & Computer,2011,28 (5):140-143 (in Chinese). [罗钧旻,武钰云,吴彬.模糊本体及其演化研究 [J].微电子学与计算机,2011,28 (5):140-143.]
[5]LI Haiyan,LI Guanyu,HAN Guoshuan.Rough ontology aided knowledge reasoning framework [J/OL].Computer Engineering and Applications,2012,49 (10):40-44. [2012-06-15].http://www.cnki.net/kcms/detail/11.2127.TP.20120615.1725.016.html(in Chinese).[李海燕,李冠宇,韩国栓.粗糙本体支持的知识推理框架 [J/OL].计算机工程与应用,2012,49(10):40-44.[2012-06-15]http://www.cnki.net/kcms/detail/11.2127.TP.20120615.1725.016.html.]
[6]LI Ze,ZHENG Yelu,SU Qian,et al.Knowledge reasoning model based on ontology and rough set theory [J].Journal of the China Society for Scientific and Technical Information,2010,29 (4):707-717 (in Chinese).[李泽,郑业鲁,苏倩,等.基于本体和Rough Set理论的知识推理模 [J].情报学报,2010,29 (4):709-717.]
[7]GUAN Yanyong,HU Haiqing,WANG Hongkai.Indiscernible relation inα-rough sets model [J].Journal of Shandong University(Engineering Science),2006,36 (1):75-80 (in Chinese).[管延勇,胡海清,王洪凯.α-粗糙集模型中的不可分辨关系 [J].山东大学学报,2006,36 (1):75-80.]
[8]PAN Chao,GU Hui.Ontology reasoner and its application[J].Computer Systems & Applications,2010,19 (9):163-167(in Chinese).[潘超,古辉.本体推理机及应用 [J].计算机系统应用,2010,19 (9):163-167.]
[9]WANG Hailong,MA Zongmin,YIN Junfu,et al.FREGS:A kind of fuzzy description logic reasoner [J].Journal of Computer Research and Development,2008,46 (9):1488-1497 (in Chinese).[王海龙,马宗民,殷俊夫,等.FRESG:一种模糊描述逻辑推理机 [J].计算机研究与发展,2008,46 (9):1488-1497.]
[10]Klinov P.Pronto:A non-monotonic probabilistic description logic reasoner [C]//Proceedings of 5th European Semantic Web Conference,2008:822-826.
[11]WANG Youli,HOU Zhongbin.Cutting tools materials intelligent selection system based on rule-based-reasoning [J].Tool Engineering,2008,42 (2):27-30 (in Chinese). [王友利,侯忠滨.基于规则推理的刀具材料智能选择系统 [J].工具技术,2008,42 (2):27-30.]
[12]Haase P,Volker J.Ontology learning and reasoning-dealing with uncertainty and inconsistency [J].Computer Science,2008,5327 (5):366-384.