马建敏, 景 嫄
(长安大学 理学院 数学与信息科学系 陕西 西安 710064)
Pawlak提出的粗糙集理论[1-2]是一种分析和处理不精确和不确定性问题的数学工具.目前,粗糙集理论已在数据挖掘、知识发现、图像处理、模式识别[3-6]等领域得到广泛应用.
Pawlak粗糙集在等价关系对论域产生的划分(单粒空间)上给出了目标概念的近似描述.此后,许多学者将等价关系推广到容差、相似或优势关系等[7-11],或将目标概念推广到模糊集等[12]研究粗糙近似.Lin提出了粒计算的概念[13-14],讨论了二元关系下的模糊集和粗糙集方法,并将粒计算方法引入到数据挖掘和机器学习中.钱宇华等从粒计算角度建立了等价关系族下的多粒空间,提出了多粒度粗糙集模型[15-17],证明了经典的粗糙集是多粒度粗糙集的特殊情况.
在实际应用中,有些概念往往不能精确定义,概念的外延也不能由实体集精确表达.现实世界中表示不确定、不精确、含糊或者部分已知概念的方法有:不确定边界概念、部分已知概念、不可定义概念和近似以及系统转换与概念近似.Yao引入了区间集[18]来表示部分已知概念.胡宝清提出了区间集粗糙集,研究了区间集三支决策[19].本文基于区间集粗糙集和多粒度粗糙集的思想,提出了乐观多粒度区间集粗糙集的概念,研究了其性质.建立了一族属性子集不同运算下的单粒空间和多粒空间,讨论了单粒空间下区间集粗糙集和多粒空间下乐观多粒度区间集粗糙集之间的关系.
本节给出有关粗糙集和乐观多粒度粗糙集的基本概念和性质,相关内容请参考文献[1,15-17].
(1)
从粒计算角度看,划分U/RA是由等价关系RA导出的单粒空间.Pawlak粗糙集是在单粒空间中对目标概念进行近似刻画.由于粒度世界存在不同形式、不同数量的粒空间,钱宇华等提出了多粒度粗糙集[15],在一族等价关系诱导的多粒空间下构建了乐观多粒度粗糙集对目标概念进行近似描述.
设信息系统S=(U,AT),A1,…,Am是AT的m个属性子集.对任意X⊆U,X关于属性集A1,…,Am的乐观多粒度粗糙下、上近似[15]分别定义为:
⊆X∨…∨[x]Am⊆X};
(2)
性质1[15-17]设S=(U,AT)为信息系统,A1,…,Am是AT的m个属性子集.对任意X,Y⊆U:
Yao利用一对集合作为下界和上界对概念进行描述,从而引入了区间集[18].胡宝清提出了区间集粗糙集[19].本节研究乐观多粒度区间集粗糙集.
设U是论域,2U为其幂集.区间集X定义[18]为
X=[Xl,Xu]={X∈2U:Xl⊆X⊆Xu},Xl⊆Xu⊆U.
所有区间集的集合用I(2U)来表示I(2U)={X=[Xl,Xu]:Xl⊆Xu⊆U},称为U的区间集幂集.区间集上的运算[18,20-23]定义为:对任意区间集X=[Xl,Xu], Y=[Yl,Yu]∈I(2U),
(3)
(4)
设S=(U,AT)为信息系统,A⊆AT.区间集X=[Xl,Xu]的区间集粗糙下、上近似定义[21]为:
(5)
定义1设信息系统S=(U,AT),A1,…,Am⊆AT.对任意区间集X=[Xl,Xu],X的乐观多粒度区间集下、上近似分别定义为:
(6)
性质2设信息系统S=(U,AT),A1,…,Am⊆AT.对任意区间集X,Y∈I(2U),有下列性质:
证明设区间集X=[Xl,Xu],Y=[Yl,Yu],下证多粒度区间集下近似的性质,上近似类似可证.
① 由定义1、性质1②及区间集补运算的性质知
② 由性质1①及定义1易证结论成立.
③ 由性质1③及定义1知,
④ 由公式(4)、定义1和性质1⑤可得
⑤ 由公式(3)、定义1可得
⑥ 类似⑤的证明可证结论成立.
⑦ 由性质1④和公式(3)可得
由性质2可知,对任意区间集X∈I(2U),
(7)
性质3设信息系统S=(U,AT),A1,…,Am⊆AT.对任意区间集Xj∈I(2U),j=1,2,…,n,都有
证明设Xj=[Xlj,Xuj]∈I(2U),j=1,2,…,n.由区间集的运算及性质2⑦知
由性质2⑥和性质2⑦知
由性质2④,⑤,⑥和⑦类似,可证性质3②与3③成立.
由等价关系的定义知,A1,…,Am⊆AT,X∈2U,
(8)
性质4设S=(U,AT)为信息系统,A1,…,Am⊆AT. 对任意区间集X∈I(2U),
证明由公式(8)知,X的边界Xl、Xu满足
于是由区间集粗糙下、上近似的定义知,
推论1设信息系统S=(U,AT),A1,…,Am是AT的属性子集. 对任意区间集X∈I(2U),
考虑风险投资公司的风险投资问题[24].公司给出了20个投资方案xi(i=1,2,…,20),投资方案的风险水平由5个专家给出,风险水平值1、2、3分别表示风险低、中和高.风险水平值越大,投资计划的风险越高,收益也就越高,反之亦然.表1是5个专家给出的投资方案的风险水平评估表.
记U={x1,…,x20}是投资方案集合,AT={a1,…,a5}是专家集合.根据经验,3个以上专家打分超过2的投资方案的获益较高,风险也高,而3个以上专家打分低于2的投资方案风险较低,但获益也低.故投资风险一定高的方案集合X={x1,x6,x8,x9,x19},而投资风险一定低,同时收益也较低的方案集合Y={x3,x4,x11,x13,x14,x15,x18,x20},Yc是风险不低的投资方案.记Xl=X,Xu=Yc,则X=[Xl,Xu]给出了风险一定高和风险可能高作为下界和上界的方案集合,即X中的集合是投资风险相对高而获益也相对高的方案集合.
表1 风险投资评估表Tab.1 Venture investment evaluation form
在专家组A1={a1,a2}诱导的单粒空间U/RA1上, 区间集X=[Xl,Xu]的边界Xl,Xu的近似刻画为:
在专家组A2={a3}诱导的单粒空间U/RA2上,区间集X=[Xl,Xu]的边界Xl,Xu的近似刻画为:
在专家组A3={a4,a5}诱导的单粒空间U/RA3上,区间集X=[Xl,Xu]的边界Xl,Xu的近似刻画为:
3个专家组A1,A2,A3诱导的多粒空间{U/RAi:i=1,2,3}上边界Xl,Xu的近似刻画为:
Pawlak粗糙集利用一个等价关系对论域的划分(单粒空间)给出了目标概念的近似刻画. 由于对实际问题的研究存在不同的观点、不同的粒度,一族等价关系对论域的划分产生了多粒空间,从而产生了对目标概念的乐观多粒度粗糙近似描述. 由于解决问题时存在的不精确、不确定性等原因产生了区间集,进而产生了区间集粗糙集. 基于区间集粗糙集和乐观多粒度粗糙集的思想,本文提出了乐观多粒度区间集粗糙集,讨论了它们的性质,并给出了不同属性产生的单个和多个粒空间下几种区间集粗糙集和乐观多粒度区间集粗糙集之间的关系,最后将乐观多粒度区间集粗糙集应用于风险投资分析中,分析了乐观多粒度区间集粗糙集的逼近效果优于区间集粗糙集.
下一步将研究多粒度空间上的悲观多粒度区间集粗糙集,以及乐观、悲观多粒度区间集粗糙集与不同粒度空间上的区间集粗糙集之间的关系.