考虑偏差度的犹豫模糊集距离及其在模式识别中的应用

2018-10-30 03:43薛慧玲陈春芳
统计与决策 2018年19期
关键词:模糊集模式识别正则

薛慧玲,陈春芳

(南昌大学 理学院,南昌 330031)

0 引言

犹豫模糊集[1,2]作为模糊集[3]的一种拓展形式,生动地显示出了决策者在决策过程中的犹豫性,它允许一个元素属于一个集合的隶属度可以是几个可能值的集合。犹豫模糊集已成为解决不确定性问题很好的工具,得到了广泛的研究和应用。例如,文献[4,5]对犹豫模糊集的相关系数及区间值犹豫模糊集进行了研究,文献[6]研究了犹豫模糊集及其在决策中的应用等问题。

距离度和相似度作为模糊集相关理论中两个非常重要的数值指标,在决策、模式识别、机器学习、市场预测[7,8]等领域得到了广泛应用。由于在模糊集中距离度和相似度的重要性,许多学者将它们的概念拓展到犹豫模糊集中。例如,文献[9,10]研究了犹豫模糊集距离度、相似度和相关度,文献[11]提出了广义犹豫模糊集权重距离度及其在多属性决策中的应用问题,文献[12]中作者提出了含犹豫度的距离度和相似度公式及其在模式识别中的应用。文献[12]中给出的距离度相似度相比文献[9,10]中的距离度相似度具有很大的优势,但它仍然没有考虑到犹豫模糊集间的偏差度。由于犹豫模糊集的不确定性和犹豫性,犹豫模糊元中的隶属值会存在一定的偏差,而这一偏差对结果判断会产生较大的影响。针对这种情况,本文提出了具有偏差度的新的距离度公式并研究其在模式识别中的应用问题。

1 犹豫模糊集及其相关概念

定义 1[13]:设 X={x1, x2, …, xn} 是一非空集合,则 X上的模糊集合A定义为:

其中 μA(x )称为隶属函数,它满足 μA:X→M ,这里,M称为隶属空间。最常见的隶属空间为区间( 0 , 1 )。

定义 2[14]:设 X={x1, x2, …, xn} 为一非空集合,则从 X到[0 ,1] 的一个子集的函数,称为犹豫模糊集,记作A={ x, hA(x) |x∈X } ,其中,hA(x )是[0 ,1] 中几个可能的数的集合,它表示x∈X属于集合A的可能程度,称hA(x )为犹豫模糊集A的犹豫模糊元。

定义3[9,10]:设A、B是非空集合 X={x1, x2, …, xn} 上的两个犹豫模糊集,则A、B的距离度d(A ,B )满足:

(d1)0≤d(A ,B )≤1;

(d2)d(A ,B)=0当且仅当A=B;

(d3)d(A ,B)=d(B ,A)

定义4[9,10]:设A、B是非空集合 X={x1, x2, …, xn} 上的两个犹豫模糊集,则A、B的相似度s(A ,B )满足:

(s1)0≤s(A ,B )≤1;

(s2)s(A ,B)=1当且仅当A=B;

(s3)s(A ,B)=s(B ,A)

犹豫模糊集的最小距离度和最大相似度原则[9,10]:两个犹豫模糊集距离度越小则它们越相近,或相似度越大它们越相近。

距离度和相似度的相关性质如下[9,10]:

性质1:如果d(A ,B )是犹豫模糊集设A、B的距离度,则 s(A ,B)=1-d(A ,B )是犹豫模糊集 A、B的相似度,称为由距离度导出的相似度。

性质2:如果s(A ,B )是犹豫模糊集A、B的相似度,则d(A ,B)=1-s(A ,B )是犹豫模糊集A、B的距离度,称为由相似度导出的距离度。

注意到,在不同的犹豫模糊元中元素的个数可能不相同。本文用l(h (x ) )表示犹豫模糊元h (x )中的元素个数。在实际中,为了运算的便利,文献[10,13]给出了如下的规则:将元素数较少的一个犹豫模糊元添加元素中最小值、最大值或者任意值,使得它与较长的那个犹豫模糊元具有相同的元素个数。这些值的选择主要根据决策者的个人喜好来添加,乐观主义者一般会选择添加该犹豫模糊元中最大的那个值,使得它们的元素个数相同;而悲观主义者则一般会选择添加该犹豫模糊元中最小的那个值,使得它们有相同的个数。

例如,设h1(x)={0.7, 0.5, 0.4, 0.1},h2(x)={0.6, 0.3}为X={x1,x2, …, xn} 上的两个犹豫模糊元,易知 l (h1(x))≠l (h2(x ) ),故在运算中需要将h2(x )拓展到与h1(x )具有相同的长度。乐观主义者会将h2(x)拓展为h2(x)={0.6,0.6, 0.6, 0.3},而悲观主义者会将其拓展为h2(x)={0.6, 0.3,0.3,0.3}。这种任意添加不同值的方法可能会产生不同的结果,这也是合理的,因为决策者的偏好会对最终的结果产生直接影响。本文假设决策者在决策过程中都采用乐观的处理方式,且为了计算的方便,本文将所有犹豫模糊元中的值都按降序进行重新排列。

文献[9,10]提出犹豫模糊元h1(x )、h2(x )的距离度d (h1(x ) , h2(x ) )还应满足:

(d4)对X={x1, x2, …, xn} 上有相同长度 l的三个犹豫模糊元h1(x )、h2(x )和h3(x ),如果它们满足(x )≤(x )≤(x ) ,i=1 ,2 , … , l ,则:

其中,hi

m(x )为犹豫模糊元的第i大的值,m=1,2 ,3。

对非空集合X={x1,x2, …, xn} 上的两个犹豫模糊集A、B,文献[9,10]给出了犹豫正则汉明距离、欧几里得距离和广义犹豫正则距离分别如下:

注意到,上文给出的犹豫模糊集A、B的距离实际上反应的是犹豫模糊元之间的不同。易知A、B的距离度与犹豫模糊元隶属值的不同及犹豫模糊元中元素个数的不同均有关。由犹豫模糊集的最小距离度和最大相似度原则可知,若:

d(A ,C)=min{d (A , C) , d(B , C) , d(D , C) , …}

s(A , C)=max{s (A , C) , s(B , C) , s(D , C) , …}

则在模式判断中C应属于A。但是,文献[12]指出(1)式至(3)式还存在不足之处,即当它们的距离度相同时,无法判断C属于哪个模式。为了克服这一缺陷,文献[12]给出了考虑犹豫模糊元犹豫度的新的犹豫模糊集的距离度公式。

定义5[12]:设A是非空集合 X={x1,x2, …, xn} 上的一个犹豫模糊集,对任意xi∈X,定义犹豫模糊元hA(xi)的犹豫度为:

其中,l (hA(xi) )是hA(xi)的长度,对任何犹豫模糊元hA(xi),μ (hA(xi) )反映的是决策者在决策过程中对hA(xi)隶属程度的犹豫度。如果l (hA(xi) )=1(即 μ (hA(xi))=0),说明决策者对所做决定是非常确定的;如果l (hA(xi) )是趋于无限的,则 μ (hA(xi) )=1,说明决策者是非常犹豫的,不能给出确定的隶属值。犹豫值的大小反映的是决策者在决策过程中的犹豫程度。文献[12]提出了含犹豫度μ (hA(xi) )的犹豫模糊集的距离度公式如下:

定义6[12]:设A、B是非空集合X={x1,x2, …, xn} 上的两个犹豫模糊集,则犹豫模糊集A、B间含犹豫度的正则汉明距离定义如下:

含犹豫度的正则欧几里得距离:

含犹豫度的正则广义距离:

注意到(5)式比文献[9,10]中的只考虑隶属值的距离度公式更精确地给出了两个犹豫模糊集之间的距离度。然而,通过下面的例子可以看到,该距离公式仍存在一定的缺陷。

例1:设 X={x } ,存在两个模式表示为犹豫模糊集:A={ 0 .7, 0.5, 0.4 } ,B={ 0 .6, 0.5, 0.3 } ,待识别的犹豫模糊集为C={ 0 .6, 0.5, 0.4 } ,易知 lx=3 ,由(4)式可知hA,hB的犹豫度都为,从而根据(5)式可知d ( A ,C)h=dh( B ,C )。

因此,根据(5)式并不能判别C属于A还是B。考虑到任意两个不同的犹豫模糊集之间存在着一定的偏差,因此,距离度也应考虑两个犹豫模糊集的偏差距离。本文给出了犹豫模糊集的偏差距离,并提出了具有偏差距离的犹豫模糊集的新的距离度公式。

2 具有偏差距离的犹豫模糊集的距离度

首先,本文给出犹豫模糊集的标准差的定义如下:

定义7:设 A为 X={x1, x2, …, xn} 上的犹豫模糊集,则A的标准差定义如下:

定义8:设 A、B为 X={x1,x2, …, xn} 上的两个犹豫模糊集,则A、B的偏差距离如下:

为了给出该偏差距离计算方法,给出如下例子予以说明:

例2:设 X={x } ,A={0.7,0.6,0.5},B={0.8,0.6} 为X上的两个犹豫模糊集。根据运算规则先将hB扩展为hB={0.8,0.8,0.6},由(6)式得 S(A)=0.0819,S(B)=0.0872,从而由(7)式可得A、B的偏差度为ds(A ,B)=0.0053。

定义9:设A、B是非空集合X={x1, x2, …, xn} 上的两个犹豫模糊集,则犹豫模糊集A、B间含偏差距离的正则汉明距离定义如下:

含偏差距离的正则欧几里得距离:

含偏差距离的正则广义距离:

根据决策者对隶属值、犹豫度和偏差距离的不同偏好,可以得到含参数偏好值的距离度公式如下:

其中0≤α, β≤1,且α+β=1,λ>0。

通常,还应考虑元素xi∈X的权重,因此,本文给出犹豫模糊集的权重距离度如下:

设xi∈X的权重为 ωi( i =1, 2, …, n ),其中 0≤ωi≤,则有下面的权重距离:

如果不仅考虑任意xi∈X的权重,而且对犹豫模糊集的犹豫度、隶属值和偏差距离考虑它们的偏好,则含偏好参数的权重距离如下:

3 数值例子

下面举例说明本文给出的距离公式的有效性。

例3:设 X={x } ,存在两个模式表示为犹豫模糊集为A={0.85, 0.6, 0.45},B={ 0 .6 } ,待识别模式 C={0.7,0.6,0.5 } ,要求对C进行模式识别。

根据(5)式可知C属于A,为了说明本文提出的距离公式的有效性,将上述数据代入(8)式可得:

dhs(A ,C)=0.0441,dhs(B ,C)=0.1747,

易知:

dhs(A ,C ) ≤dhs(B ,C)

从而可以判断C属于A,说明本文提出的距离公式在模式识别过程中是有效的。

例4:设 X={ x1, x2} 上的三个模式分别表示为如下的犹豫模糊集:

待识别模式为:

D=( x1,{0 .5, 0.4, 0.35}x2,{0 .5, 0.45, 0.38, 0.3} )。

根据(8)式有:dhs(A ,D)=0.1126,dhs(B ,D)=0.1002,dhs(C ,D)=0.0681。由距离度和相似度的性质s(A ,B)=1-d(A ,B)可得对应相似度分别如下:

shs(A ,D)=0.8874,shs(B ,D)=0.8998,shs(C ,D)=0.9319。

由此,容易得到shs(C ,D )≥shs(B ,D )≥shs(A ,D ),根据相似度最大原则可知D应属于C,与(5)式所得结果相同,进一步说明了本文提出的距离公式的有效性。

下面通过对例1的识别来说明本文提出的距离公式的优越性。因为例1中出现dh(A ,C)=dh(B ,C )的情况,故不能根据(5)式来判断待识别的模式C属于A还是B。但可根据本文提出的含犹豫模糊集偏差距离的距离公式来对待识别的模式进行判别。由(8)式得:

易知:

故根据犹豫模糊集距离度和相似度的性质,可知距离度对应的相似度分别为:

容易得到:

由此,根据最小距离度原则或最大相似度原则,可以判断模式C应属于模式A。

4 结束语

本文考虑了含犹豫模糊集偏差距离的距离度公式,并将它与文献[12]给出的距离度公式做了对比,说明了本文提出的距离度的有效性和优越性。

猜你喜欢
模糊集模式识别正则
J-正则模与J-正则环
π-正则半群的全π-正则子半群格
Virtually正则模
基于四种截集的粗糙模糊集表现定理的新表示
基于上下截集的粗糙模糊集的运算性质
复图片模糊集及其在信号处理中的应用
犹豫模糊熵生成算法及在后勤补给基地选址评估中的应用
任意半环上正则元的广义逆
紫地榆HPLC指纹图谱建立及模式识别
第四届亚洲模式识别会议