李 雪,李 芳
(上海理工大学 管理学院,上海 220000009933)
随着互联网领域的不断发展,电子商务、P2P、网格计算、云计算等应用越来越广泛。互联网环境下其交易具有虚拟性,存在欺诈、支付安全等问题。解决这一问题的关键在于信任,传统的信任机制是一种客观信任关系,建立在对双方身份认证的基础上,比如PKI证书、访问控制中的ACL等。使用传统的信任机制已不能解决现有的问题,因此另一种主观信任机制相应而生。它是基于人的一种认知现象,能对主体的特定行为特征做出评价,具有主观性、模糊性和随机性。国内外学者对信任评估进行了大量研究,Beth将信任分为直接信任和间接信任,用概率测量实体信任度[1],但是忽略了信任的模糊性;Josang提出了基于主观逻辑的信任模型,引入证据空间和观念空间的概念来描述和度量信任关系[2-3],随机性和模糊性没能区分出来,因此也没反应出信任的模糊性特点;唐文等人使用模糊集理论中的隶属度概念,对信任管理问题进行了建模,给出可信类型定义机制和信任评价机制[4],隶属度函数如何构造才能反映信任的内涵,另外将模糊数给定精确的数值后,它已经不再具有模糊数的特性。李德毅院士提出的云模型是基于模糊数学和概率统计的定性定量互换模型,能够反映事物或人类认知的模糊性和随机性[5]。基于云模型的可信研究能够弥补以上研究中的不足,实现语言值表述的定性概念与其定量数值描述间的不确定性转换。
20世纪90年代初李德毅院士提出了云模型,它是基于模糊数学和概率统计的定性定量互换模型,能够反映事物或人类认知的模糊性和随机性,实现语言值表述的定性概念与其定量数值描述间的不确定性转换[5-6]。
定义1:云和云滴,设U是一个用数值表示的定量论域,C是U上的定性概念,若定量值x∈U是定性概念C的一次随机实现,x对C的确定度μ(x)∈[0,1]是有稳定倾向的随机数μ:U→[0,1], ∀x∈Ux→μ(x)则x在论域U上的分布称为云,记为云C(x),每一个x称为一个云滴。
定义2[7]:设U 是一个精确数值表示的定量论域,C(Ex,En,He )是U 上的定性概念。若定量值x∈U,且x 是定性概念C的一次随机实现,x服从以Ex为期望、En'2方差的正态分布,即x~N(Ex ,En'2),其中En'又服从以En为期望、He2为方差的正态分布,即En'~N(En,He2);定量值x对定性概念C的确定度为y=e,则x在论域U上的分布称为正态云。
期望Ex,熵En和超熵He用来表示云的三个数字特征,它们反映了定性概念在整体上的定量特征。期望Ex在论域空间中最能够代表这个定性概念的点。熵En是定性概念的不确定性度量,由概念的随机性和模糊性共同决定,反应了云滴的离散程度。超熵He是熵的不确定性的度量,它反映代表定性概念值的样本出现的随机性,揭示了模糊性和随机性的关联。
学者采用了不同方法进行了基于云模型的可信研究,主要集中在云逆向生成算法的改进和相似度算法的改进以及评估方式的改进,本节将对所涉及的各方法进行介绍,并对各方法进行对比与评述。
云模型三个数字特征期望Ex,熵En和超熵He,它对信任度的评价会产生至关重要的影响,采用怎么的逆向云生成算法也是众多学者研究的热点。逆向云生成算法主要是通过参数估计的方式从数据样本中得到数字特征的估计值,包括有确定度的逆向云生成算法和无确定度的逆向云生成算法。
有确定度的逆向云算法先后由李德毅、吕辉军[8-9]提出,有确定度的逆向云算法存在明显的不足:(1)计算熵En和超熵He时需要使用确定度值,而在实际应用中确定度没有或者难以获得,利用确定度的逆向生成算法缺乏实用性;(2)将确定度大于0.999的点删除,没有对云滴完全利用,在某一程度上来说其算法缺乏准确性。
无确定度的逆向云算法首先由刘常昱等人提出,此算法充分利用了云滴,并且不需要确定度也能计算云的数字特征,算法简单,且容易推广到高维云模型。具体算法如下:
输入:N个云滴Xi;
输出:这N个云滴表示的定性概念的期望值Ex,熵En和熵He。
算法1[10]:
理论上已经证明S2=En2+He2,但在实际运算中可能会出现S2-En2<0的情况。陈昊[11]等人通过增大样本方差在此算法上进行了改进。许昌林[12-14]等人提出了多步式逆向云生成算法来解决此问题,该方法采用随机抽样,有些数据进行了多次抽样计算,并且推到高维云模型时,复杂性增加。吴涛[15]等人提出的基于四阶绝对中心矩和样本方差的逆向云生成法,但也不能保证每次生成的超熵He为实数。
信任具有主观性、模糊性及随机性,为了将信任更加直观的表达,通常采用信任等级对主体信任描述。可信云模型评价方法采取了信任等级划分方式,通过相似度计算确定各主体所属的信任等级。相似度算法是判断主体所属信任等级的关键步骤,学者们分别从期望、距离、面积、余弦值、重心偏离、改进逆向云生成算法等角度出发,给出了不同的相似度算法。
(1)基于期望的相似度算法。王守信[16]等人引入时效模型,选择期望Ex较大且超熵He较小的主体进行交易;陈建钧[17]等人计算出综合期望Ex,与给定等级云的期望进行差值比较,从而确定该主体所属的信任等级。廖良才[18]等人也采取加权法计算出主体的综合期望Ex,熵En和超熵He,通过计算相对分散度确定主体的信任等级。
上述算法只采用单一的期望进行比较,或者三个数字特征中的两个,没有充分地利用云的三个数字特征,没能充分反映信任的主观性、模糊性和随机性的特点。
(2)基于距离的相似度算法。一种是计算云滴的距离,一种是采用欧式距离来度量。张勇、蔡绍滨、肖子涵等人[19-21]认为云之间的相似性可以通过其数字特征产生特定数量的云滴,通过计算云滴之间的距离来计算其相似性。此算法存在以下不足:①只考虑了云滴的横坐标,没有考虑云滴的纵坐标;②生多少个云滴数,才是一个合适的数;③云滴是一个随机数,需要重复多次实验取平均值才能减小误差,增加了算法的复杂度。廖列法[22]、张景安[23]等人将云的三个数字特征组成特征向量C(Ex ,En,He),映射到三维空间,计算两点之间的欧式距离,通过判断距离的大小来确定主体的信任等级。此方法较为简单,充分利用了云的三个数字特征。
(3)基于余弦值的相似度算法。将云的三个数字特征看成是一个向量,通过夹角余弦值计算相似度。该方法简单,计算较为容易,但容易出现期望Ex远大于熵En和超熵He时,其计算忽略了熵En和超熵He的作用,并且余弦值的差异性也不明显,无法对主体信任度进行准确的判断。出ECM算法,其思想是将云模型看成是满足x~N(Ex ,En2)正态分布的曲线,通过面积之比计算相似度。龚艳冰[25]等人将云模型看成模糊数,通过模糊数的面积来计算相似度。
通过面积计算相似度较为复杂,因为计算两个云相交面积时要考虑其交点的位置,不同相交方式对应不同的面积算法,增加了算法的复杂度。
(5)基于重心偏离的相似度算法。所谓重心偏离度算法即通过样本点计算得到的云重心与等级云的云重心进行比较,衡量云重心的变换来确定该主体所属的信任等级。谢立军、刘延华等人[26]通过计算加权偏离度通确定主体的信任等级。该方法没有考虑到超熵He对相似度的影响,忽略了云的模糊性。
(6)基于改进正向云生成算法的相似度算法。黄海生、张仕斌、范涛等人[27-28]通过对正向云生成算法的改进,将原先算法中的期望值Ex,熵En分别换成某一等级信任云中的期望Exj和满足Enj~N(Enj,He2j)正态分布的Enj(其中T( Ex,En,He)为属性评价云,TCj(Exj,Enj,Hej)为某一等级信任云),得到不同信任等级云的相似度,最大相似度所对应的信任等级云则为该主体的信任等级。该算法目前运用较多,得到大多数学者的认可。
在主体信任研究中,主体拥有多个属性,因此需要建立信任评价指标体系来收集样本数据。每个属性对主体的影响能力不同,需要给每个属性赋予权重进行计算。信任评价中有不实评价,为了保证信任评价的真实性,张仕斌[28]等人引入了信任惩罚机制。另外信任具有时效性,随着时间的增加,以前的信任评价结果对现在的信任结果影响越来越小,因此张仕斌等人[28]在研究主体信任时加入了时间衰减函数。总的来说目前计算主体信任云有两步,首先计算主体的信任属性评价云,再将主体各属性云合成主体综合信任云。其中计算属性评价云时加入时间衰减函数,再给每一个属性评价云赋予权重,生成加权属性综合云。
基于云模型的可信研究,能够很好地体现出信任的主观性、模糊性和随机性特点。通过对逆向云生成算法的改进和相似度算法的改进,同时加入时间衰减函数和信任惩罚函数,使得基于云模型的可信研究具有更高的时效性和可信性。但从以上的分析可知,可信云模型的研究还存在明显的不足,仍处于初级研究阶段,基于此,本文对未来可信云模型的研究提出以下几点设想。
可信云模型方法多样性研究。现有研究主要集中在构建主体信任评价体系,设立信任等级,通过相似度计算判断主体的信任度。建立怎样的评价体系才能科学、全面地反映主体的信任特征;设立怎样的信任等级才具有客观性、合理性;如何体现信任的时效性和可信性;相似度算法的局限性与不足,这些问题都限制了可信云模型的深入研究。
基于多维度的可信云模型研究。现有的主体信任研究中,将主体的各个属性看成是一维云模型,通过数学运算将其合并成综合属性云。从某一程度上来说,这种计算方式缺乏理论意义。每个主体是由不同的属性组成,每个属性反映了主体的不同特征,所以在研究主体信任度时,应将模型推广到多维云模型上。
不同应用领域的可信云模型方法研究。可信云模型主要应用于复杂网络环境下主体信任的评估,存在同一种评价方法对不同信任主体的信任评估效果不同,或者同一主体采用不同评价方法其信任存在明显差异。解决这一问题的关键在于,找到不同应用领域中最适合的可信云模型方法。主体可以是实体(如电子商务中交易双方)也可以是虚体(如系统、软件),针对不同的主体应有相应的方法。
云模型能够实现语言值表述的定性概念与其定量数值描述间的不确定性转换,从其提出到现在已经逐渐形成一个成熟的理论,其应用领域也越来越广泛。本文通过分析比较逆向云生成算法、可信云模型评价方法和可信云模型评估方式的改进方法,总结出现有可信云模型研究主要集中于通过相似度算法判断主体的信任等级,研究方法单一,提出了以后可信云模型发展方向。总而言之,可信云模型研究处于初级阶段,需要大量深入的研究。