张凯+杨靖
摘 要:粗糙集理论是一种新的分析和处理不精确、不一致、不完整信息与知识的数学工具,为智能信息处理提供了有效的处理技术,近年来,被广泛应用于专家系统、图像处理、模式识别、决策分析等领域。文中介绍了关于粗糙集的基本理论,并对其在各领域的应用情况进行了综述。
关键词:粗糙集理论;不确定性;知识约简;粗糙模糊集
中图分类号:TP18 文献标识码:A 文章编号:2095-1302(2017)06-00-02
0 引 言
粗糙集理论由波兰华沙理工大学Z.Pawlak教授于1982年首先提出,通过结合逻辑学和哲学中对不精确、模糊的定义,针对知识和知识系统提出了知识简约、知识依赖、知识表达系统等概念,并在此基础上形成了完整的理论体系——粗糙集理论。粗糙集理论把知识看作关于论域的划分,认为知识是有粒度的,而知识的不精確性是由知识的粒度过大引起的。从1992年至今,每年都要以粗糙集为主题召开国际会议,近两年,召开的关于粗糙集的会议有2015年国际粗糙集联合会议(IJCRS2015)和2016年第十六届中国粗糙集与软计算联合学术会议(CRSSC2016)。粗糙集越来越受到各行业专家和科研人员的重视,随着对粗糙集理论研究的不断加深,越来越多的领域开始运用粗糙集解决问题。
1 粗糙集理论
1.1 知识与知识系统
将研究对象构成的集合记为U,这是一个非空有限集,称为论域U,任何子集,称其为U中的一个概念或范畴。把U中任何概念族都称为关于U的抽象知识,简称知识。一个划分定义为:X={X1,X2,…,Xn},,Xi≠φ,Xi∩Xj=φ,且i≠j,i,j=1,2,…,n;∪niXi=U。U上的一簇划分称为关于U的一个知识系统。
R是U上的一个等价关系,由它产生的等价类可记为[x]R={y|xRy,y∈U},这些等价类构成的集合U/R={[x]R|x∈U}是关于U的一个划分。若PR,且P≠φ,则∩P也是一种等价关系,称为P上不可分辨关系,记为ind(P):。
1.2 粗糙集与不精确范畴
给定知识库K=(U,Q),对于每个子集和一个等价关系R∈ind (Q),定义在知识系统U/R下集合X的下近似为:
上近似表示属于X的对象组成的最小集合,即X的正域,记为POSR(X),而肯定不属于X的对象组成的集合称为X的负域,记为NEGR(X)。
在知识系统U/R下集合X的上近似为:
上近似是可能属于X的对象组成的最小集合。集合X的边界区域为:
边界区域BNR(X)是根据知识R,U中既不能肯定包含于集合X,又不能肯定包含于集合的元素构成的集合。
1.3 知识简约与知识依赖
知识简约,是在保持知识库分类能力不变的条件下,删除其中不相关或不重要的知识。令R为一簇等价关系,r∈C,若ind(R)=ind(R-r),则称r为R中不必要的,若对于每一个r∈C都为R中必要的,则称R为独立的,否则称R为依赖的。P中所有必要关系组成的集合称为核,记为core (P)。
定义知识R对知识Q的依赖程度为:
显然,0≤ξQ(R)≤1。当ξQ(R)=1时,知识R完全依赖于知识Q;当ξQ(R)→1时,说明定义知识R对知识Q的依赖程度高。ξQ(R)的大小从总体上反应了知识R对知识Q的依赖程度。
1.4 知识表达系统
在粗糙集理论中,一个知识表达系统可表示为S=(U,R,V,f),为其中U为论域,R为属性集合,V为属性值集合,f为一个信息函数,其对象的每个属性赋予一个信息值。即。
决策表是一类特殊而重要的知识表达系统。设S=(U, R, V,f)为一个知识表达系统,R=C∪D,C∩D=φ,称C为条件属性集,称D为决策属性集。具有条件属性集和决策属性集的知识系统称为决策表。
2 粗糙集理论的应用
粗糙集理论具有很强的实用性,目前在各领域已有诸多应用。
2.1 故障诊断
文献[1]中提出了一种基于粗糙集与证据理论的航空装备故障诊断方法,利用粗糙集框架实现对故障诊断模型的构造并对冗余信息进行简约,通过边界粗糙熵来衡量每个条件对决策的重要程度;文献[2]利用变精度粗糙集和信息论中互信息增量的特性,针对倾转旋翼机在过度转换时的故障进行诊断,利用OMELM对变精度粗糙集属性简约进行故障分类。
2.2 图像处理
粗糙集理论对不精确问题能够提供较好的解决方法,文献[3]将粗糙集理论与模糊聚类算法相结合用以解决图像分割问题。文献[4]依靠粗糙集对边界区域近似有较好的解决能力,将粗糙集近似集与粒子群算法相结合来解决图像分割问题,利用粗糙集理论得到图像的最优粒度,再通过粒度划分得到图像的近似集,从而利用近似集得到便捷的精准刻画。
2.3 专家系统
粗糙集理论对规则的抽取有较好的应用,因此能够为专家系统的构造提供理论基础。文献[5]利用粗糙集理论获取知识,建立决策表,并利用可辨识矩阵对决策表进行条件属性简约,能够获得需要诊断的故障树。
2.4 模式识别
文献[6]中关于矿井突水问题,可利用粗糙集对非正态、非线性和高维数据的处理能力,对存在大量不明确对应关系的特征进行简约,剔除与决策无关的属性,得到简约样本。
2.5 信息安全
在信息安全问题中,由于数据量大、信息种类繁多,无法形成统一阈值特性,所以很难针对不同种类的数据进行准确判断。文献[7]中提出了基于粗糙集合信息熵融合算法的入侵检测方法,利用粗糙集分析复杂信息的能力,对多样的入侵数据特征进行表达,构建入侵特征集合,根据决策表求出必要的特征集合,以有效解决多样数据检测困难的问题,提高效率。
2.6 预测研究
文献[8]将粗糙集与不同预测模型相结合,能够更加准确的预测行业与个股新闻对股票价格的影响。文献[9]将粗糙集与数据挖掘技术相结合来对滑坡变形阶段进行预测,通过与多种方法对比,发现利用该方法计算的结果与专业人员现场勘查结果极度吻合。文献[10]将模糊粗糙集理论与聚类算法相结合,对影响风速的多种因素进行知识简约,实验证明该方法能够有效提高风速预测模型的精度。
2.7 决策分析
粗糙集理论在金融投资预测方面也起到了很大的作用,文献[11]基于优势粗糙集建立了证券投资分析模型,能够有效分析出股票的投资价值。文献[12]运用多粒度粗糙集为决策问题提供了新的思路,将多粒度粗糙集运用到专家的综合决策中并证明了研究的有效性。
2.8 风险评估
每种风险灾害都是由多种不确定因素引起的,并且各因素耦合度较高,均不利于对风险的判断。文献[13]利用粗糙集对引起滑坡灾害风险的多种因素进行表达,并建立决策表,证明了将粗糙集与GIS组合的方式能够有效评估滑坡地质灾害的风险。文献[14]利用直觉模糊粗糙集对自然灾害造成电网灾害的各种不确定因素进行评估,并成功应用于辽宁雪灾,取得了较好的效果。
3 结 语
在粗糙集理论发展的三十多年间,已取得了许多突破性研究成果,并成功运用到生活的各个方面。粗糙集能够处理不完整、不精确的大量数據,在实际应用中,将粗糙集与各种不同分类方法相结合,能够更快、更准确的提取出有用信息是未来研究的热点之一。
参考文献
[1]孙伟超,李文海,李文峰.融合粗糙集与D-S证据理论的航空装备故障诊断[J].北京航空航天大学学报,2015,41(10):1902-1909.
[2]陈晓,王新民,黄誉,等.倾转旋翼机飞控系统的变精度粗糙集-OMELM故障诊断方法[J].控制与决策,2015,35(3):433-440.
[3]马文萍,黄媛媛,李豪,等.基于粗糙集与差分免疫模糊聚类算法的图像分割[J].软件学报,2014,25(11) : 2675-2689.
[4]姚龙洋,张清华,胡帅鹏,等.基于近似集与粒子群的粗糙熵图像分割方法[J].计算机科学与探索,2016,10(5):699-708.
[5]李英顺,姜双双,佟维妍,等.基于RST及FTA的综合传动装置故障诊断专家系统的应用研究[J].组合机床与自动化加工技术,2014 (4):60-63.
[6]王江荣,黄建华,罗资琴,等.基于粗糙集的Logistic回归模型在矿井突水模式识别中的应用[J].煤田地质与勘探,2015,43(6):70-74.
[7]何伟娜,褚龙现,姜建国.混合型数据库中入侵检测技术仿真[J].计算机仿真,2015,32(11):425-428.
[8]徐伟,李韵喆.行业与个股新闻对股票价格影响的定量分析[J].经济界,2015(20):31-32.
[9]韩舸,龚威,吴婷,等.利用粗糙集的滑坡分阶段位移预测方法——以白家包滑坡为例[J].吉林大学学报(地球科学版), 2014,44(3): 925 -931.
[10]刘兴杰,岑添云,郑文书,等.基于模糊粗糙集与改进聚类的神经网络风速预测[J].中国电机工程学报,2014,34(19):3162-3169.
[11]杨博翔.基于优势粗糙集的证券投资决策研究及应用[J].山东农业大学学报(自然科学版),2016,47(5):785-788.
[12]郭庆,吴磊.多粒度背景下直觉模糊信息系统的粗糙集及其决策[J].系统工程与电子技术,2016,38(2):347-351.
[13]刘彦花,叶国华. 基于粗糙集与GIS的滑坡地质灾害风险评估[J].灾害学,2015,30(2):108-114.
[14]刘鑫蕊,付倩,孙秋野,等.直觉模糊粗糙集理论在电网灾害评估中的应用[J].中国电机工程学报,2015,35(22):5692-5702.