梁玉英,向志华
广东理工学院 信息技术学院,广东 肇庆 526100
推荐系统可以认为是一种程序,它试图通过基于项目、用户以及项目与用户之间交互的相关信息来预测用户对项目的兴趣,从而向特定用户(个人或企业)推荐最合适的项目(产品或服务)[1]。以推荐系统为代表的电子服务个性化技术在过去的20年中得到了广泛的关注,但是这些推荐方法都存在不足,如CF具有稀疏性、可伸缩性和冷启动问题,而CB具有过度专业化的推荐[2-3]。于是,研究人员设计了新的推荐方法,如基于社会网络的推荐系统、模糊推荐系统等。事实上,推荐系统管理本质上还要归结于推荐系统的评估问题[4-5]。
由于人类社会活动的复杂性和自然环境的不确定性,如何处理不确定性信息成为解决多属性决策问题的关键。Zadeh[6]提出模糊集来刻画不确定信息。Atanassov[7]定义了直觉模糊集,之后学者们给出了不同类型的模糊集拓展形式[8-10]。此外,学者们引入了语言术语集来刻画定性评价数据。文献[11]提出以犹豫模糊语言元为基本元素的犹豫模糊语言术语集(hesitant fuzzy linguistic term set,HFLTS)。
为了对多个评价数据信息单元进行有效融合,文献[12]提出正态随机犹豫模糊语言Hamy平均算子。文献[13]将有序加权距离算子推广到HFLTS。文献[14]设计了犹豫模糊语言阿基米德信息集成算子。文献[15]提出了犹豫模糊语言混合平均(hesitant fuzzy linguistic hybrid average,HFLHA)算子和犹豫模糊语言加权平均(hesitant fuzzy linguistic weighted average,HFLWA)算子。文献[16]提出犹豫模糊语言Heronian均值算子,可以考虑聚合参数之间的相互关系。文献[17]构建了基于范数的犹豫模糊爱因斯坦信息集成算子。文献[18]建立了犹豫模糊语言Maclaurin对称平均算子。文献[19]构建了基于广义犹豫正态模糊有序加权平均算子的多属性群决策模型。文献[20]研究了用HFLTS表示输入数据的情况,并引入一些准调和平均算子。
虽然现有研究成果中已经提出了一些信息集成方法,但是面向定性评价信息且服从现实生活正态规律的信息表达均未考虑。因此,为了研究适用范围更广且符合决策者评价偏好的语言表达模型,本文首先给出了犹豫正态语言元(hesitant normal linguistic element,HNLE)的概念,然后给出了HNLE之间的运算法则和大小比较方法,进而设计了犹豫正态语言有序加权平均(hesitant normal linguistic ordered weighted average,HNLOWA)算子用于信息集成,最后构建了基于HNLOWA算子的决策模型,并通过推荐系统产品评估进行验证分析。
语义术语集[21]可以表示为S={s0,s1,…,s2τ},其中的元素个数为奇数,si表示语义变量,τ是正整数,并且满足:(1)若α≥β,则sα≥sβ;(2)对偶运算neg(sα)=s2τ-α。
为了拓展语言评价信息,文献[21]给出了连续型语言术语集~={sα|s0≤sα≤s2ρ,α∈[0,2ρ]},ρ表示充分大实数。为了方便计算,引入下标函数~→[0,1],有I(si)=i/2τ,同时I(·)的逆函数表示为I-1(·):[0,1]→~,使得I-1(α)=s2τα。
定义1[10]假设A是一个模糊数,非空集合为X,若其隶属函数表示为,则称A为正态 模 糊 数(normal fuzzy value,NFV),简 记 为A=(a,σ)。所有NFV组成的集合记为Ω。
定义2假设(a,σ)∈Ω,非空集合为X,那么犹豫正态语言元(HNLE)表示为~=(a,σ);hA~,这里hA~={γA~|γA~∈hA~}是犹豫语言元,其隶属函数为:
由定义2可知,HNLE将NFV和语言术语集进行了巧妙的结合,使得HNLE不仅能够运用语言变量来描述决策信息,还能传递出语言决策信息的分布情况。为了便于后续计算,所有HNFV组成的集合记为~。
显然,上述定义的HNFV之间的运算满足交换律、结合律以及数乘运算等性质。接下来,将介绍HNFV之间大小比较的方法。
这里,#h表示h中语言变量个数。
则称HNLOWA为犹豫正态语言有序加权平均算子,简记为HNLOWA算子,这里的表示为第j大的HNLE,其对应的权重向量为w=(w1,w2,…,wn)T,且=1,wj∈[0,1],j=1,2,…,n。
并且使用HNLOWA算子融合得到的结果也是HNLE。
当n=2时,因为
于是有
那么根据定义的基本运算可得
令n=k时,展开式(5)成立,即
那么当n=k+1时,根据定义的基本运算可得
这就表明当n=k+1时,展开式(5)仍然成立。于是,证明了对于所有的正整数n,式(5)均成立。
然后根据定义的基本运算,可以得到
(2)证明使用HNLOWA算子融合得到的结果(即式(4))也是HNLE,其主要需验证对于所有的γ1∈h1,…,γn∈hn,可以得到还是语言变量,即证明包含在[0,1]区间内。
根据HNLE的定义可知,γ1,γ2,…,γn∈S,那么对于所有的j=1,2,…,n,可得到0≤I(γ(j))≤1。于是当λ>0时,有0≤(I(γ(j)))λ≤1。同 时,权重wj∈[0,1],j=1,2,…,n,因此
从而有
于是,借助于逆函数表示为I-1(·):[0,1]→可知是一个包含于连续语言术语集~中的语言变量。从而验证了定理1成立。
(2)单调性:如果A~j≤B~j,j=1,2,…,n,那么
证明 置换不变性可由定义6直接得到,故省略。
又 因 为 γj≤γ′j,所 以(I(γ(j)))λ≤(I(γ′(j)))λ,因 此(1 -(I(γ(j)))λ)wj≥(1 -(I(γ′(j)))λ)wj,从而
于是有
所以
结合定义4和定义5易得:
(3)结合幂等性和单调性,易得有界性。
HNLOWA算子的一些常用特殊形式可以通过对其中的w=(w1,w2,…,wn)T和参数λ分别给定固定的数值而得到。
常见算子1如果w=(1/n,1/n,…,1/n)T,此时的HNLOWA算子会转化为犹豫正态语言算术平均算子,具体表达式如下:
常见算子2当λ=1时,可以得到犹豫正态语言有序加权算术平均(HNLOWAA)算子:
常见算子3当参数λ无线逼近于0时,即λ→0,此时可以得到犹豫正态语言有序加权几何平均(HNLOWGA)算子:
引理1[15]假设xj>0,λj≥0,j=1,2,…,n,并且=1,则有。当且仅当x1=x2=…=xn时,等号成立。
定理3假设A~j=(aj,σj);hj(j=1,2,…,n)∈,其对应的权重向量为w=(w1,w2,…,wn)T,且=1,wj∈[0,1],j=1,2,…,n,那么
证明首先假设如下:
于是
由文献[15]可知,对于任意的非负实数xj,λj,j=1,2,…,n,有如下不等式成立:
另一方面,
因此
定理3得证。
本文首先在犹豫正态语言信息环境下,运用构建的HNLOWA算子设计新的多属性决策方法,然后利用新的决策方法来帮助企业筛选推荐系统。
考虑犹豫正态模糊多属性群决策问题,假设有m个备选方案组成了一个方案集Φ={φ1,φ2,…,φm},对每个方案进行评价时需要n个指标Ψ={ψ1,ψ2,…,ψn}作为评价标准,其权重向量为w=(w1,w2,…,wn)T,=1,wj≥0(j=1,2,…,n)。考虑到客观世界大多存在正态分布的特征规律,因此决策者在评价备选方案的过程中,将运用犹豫正态语言元=(aij,σij);hij来表示备选方案φi在属性ψj下的评价信息。于是,将决策者给出的方案集Φ={φ1,φ2,…,φm}在指标集合Ψ={ψ1,ψ2,…,ψn}下的评价信息收集在一起,可以得到一个犹豫正态语言决策矩阵
下面将给出运用提出的HNLOWA集成算子处理犹豫正态语言多属性决策问题的详细步骤。
步骤1量纲归一化。
(1)若ψj属于效益型,则令,其中
(2)若ψj属于成本型,则令,其中
于是,根据以上的两个量纲统一化处理方法,能够得到标准化犹豫正态语言决策矩阵B=(Bij)m×n。
步骤2运用HNLOWA集成算子融合评价信息。
以转化得到的标准化犹豫正态语言决策矩阵B=(Bij)m×n为信息基础,运用HNLOWA算子将备选方案φi(i=1,2,…,m)在所有属性指标下的HNLE融合为一个综合的HNLE Bi(i=1,2,…,m):
步骤3确定综合HNLE的期望得分值和标准差得分值。
运用定义4分别计算出所有综合HNLE Bi(i=1,2,…,m)对应的期望得分值E(Bi)(i=1,2,…,m)和标准差得分值Δ(Bi)(i=1,2,…,m),具体计算方法如下:
步骤4选择综合性能最佳的备选方案。
基于计算出的期望得分值E(Bi)(i=1,2,…,m)和标准差得分值Δ(Bi)(i=1,2,…,m),根据定义5的HNLE优劣排序准则对综合HNLE Bi(i=1,2,…,m)进行大小排序,并获得备选方案的优劣排序,进而得到综合性能最佳的备选方案。
众所周知,在网上找到用户所需的适当信息并不是一项简单的任务,并随着互联网使用的日益普遍,这个问题更加突出。例如,订阅上市公司列表的企业用户会浪费大量时间阅读、查看或删除不相关的电子邮件和广告。为了提高公司企业的信息访问能力,其需要借助相关的工具来过滤网上的大量可用信息。推荐系统可以通过将信息传递给需要的企业或个人来提供信息服务,通过信息的连续检索提供个性化的帮助,为区分相关信息和无关信息提供便利。
某网络购物小程序运营企业为了提升用户的购物体验和商品的精确推荐,准备采购一套商品推荐系统嵌入到网络购物小程序中。该企业的采购部门通过前期调研和筛选,在市场中初步遴选出4套推荐系统产品{φ1,φ2,φ3,φ4}以供选择购买。随后,该企业管理部门聘请相关领域的专家工程师在3个评价标准下对上述4套推荐系统进行评估,即推荐系统的准确度ψ1、推荐系统的多样性和覆盖率ψ2、推荐系统的售后服务ψ3,这3个评价指标的权重向量为w=(0.25,0.40,0.35)T。鉴于推荐系统评价过程的复杂性,在专家对备选推荐系统进行评估时将运用犹豫正态语言元=(aij,σij);hij来表示推荐系统φi在属性ψj下的评价信息,hij是由S={s0,s1,s2,s3,s4}中的若干语言术语组成的集合,从而构造出犹豫正态语言决策矩阵。接下来将运用上一小节建立的基于HNLOWA集成算子的多属性决策方法筛选出综合性能最佳的推荐系统产品。
步骤1量纲归一化处理。
备选的4套推荐系统产品分别是在推荐系统的准确度ψ1、推荐系统的多样性和覆盖率ψ2、推荐系统的售后服务ψ3这3个效益型指标下进行评估,因此运用归一化方法(1)将犹豫正态语言决策矩阵转化为标准化犹豫正态语言决策矩阵B=(Bij)4×3。
步骤2推荐系统产品综合评价信息的融合。
以标准化犹豫正态语言决策矩阵B=(Bij)4×3和权重向量w=(0.25,0.40,0.35)T为基础,分别运用HNLOWAA算子和HNLOWGA算子将备选推荐系统产品φi在3个属性指标下的评价信息进行综合集成,得到每套推荐系统产品的综合HNLE,结果如表1所示。
表1四套推荐系统产品的综合HNLETable 1 Comprehensive HNLEs of four recommender system products
步骤3利用式(18)计算出4套推荐系统产品{φ1,φ2,φ3,φ4}对应的综合HNLE的期望得分值E(Bi)(i=1,2,3,4),结果如表2所示。由表2中的期望得分值结果发现,运用HNLOWAA算子进行融合得到的综合HNLE不低于运用HNLOWGA算子进行融合得到的综合HNLE,这与定理3的结论相匹配。
表2运用两种算子得到的期望得分值Table 2 Expected score values with two operators
步骤4按照表2中的期望得分值的大小对4套推荐系统产品{φ1,φ2,φ3,φ4}进行综合性能的优劣排序,结果如表3所示。
表3运用两种算子得到的推荐系统产品综合排序Table 3 Ranking order among recommender system products with two operators
根据表3的决策结果发现,运用本文HNLOWA集成算子中的两类特殊集成方法得到的综合评价结果相同,即综合性能最佳的推荐系统产品都是φ4,因此建议该企业采购推荐系统φ4。这也表明本文建立的基于HNLOWA集成算子的多属性决策方法在处理决策问题过程中具有内在一致性,具有较好的决策稳定性。
为了验证本文决策方法的有效性,下面将运用文献[20]构建的犹豫模糊语言决策模型处理上述问题,其在决策模型构建过程中提出了一种犹豫模糊语言信息集成算子来对评价信息进行综合集成。
首先,将原始犹豫正态语言决策矩阵转化为如下的犹豫模糊语言决策矩阵K=(κij)4×3:
然后,由于评价过程中的3个评价指标均为效益型指标,犹豫模糊语言决策矩阵K=(κij)4×3不需要进行规范化处理。
进一步,运用文献[20]中的犹豫模糊语言广义加权平均算子(即文献[20]中的定义5)将矩阵K=(κij)4×3中的每一行进行融合,从而得到4套推荐系统产品的综合犹豫模糊语言元结果如下:
最后,运用文献[20]中的定义2计算出每个犹豫模糊语言元的得分函数值:
于是4套推荐系统产品的综合性能优劣排序为φ4≻φ3≻φ1≻φ2,因此建议该企业采购推荐系统φ4。
将上述决策结果与本文方法得到的决策结果进行对比,发现综合性能最佳的推荐系统产品均为φ4,这也说明本文的决策方法是有效的。然而,4套推荐系统产品综合性能排序稍有区别,主要不同点在于推荐系统产品φ1和φ2的排序不同。事实上,由于文献[20]中的决策方法在进行决策者评价信息的综合集成过程中,没有运用现实复杂社会通常存在的正态分布现象,而仅仅是考虑犹豫模糊语言信息来表达复杂评价信息,这可能会造成复杂评价信息表达得不全面、不精确。同时,根据计算出的标准化犹豫正态语言决策矩阵B=(Bij)4×3中的数据信息,能够发现推荐系统产品φ1对应的HNLE基本上不高于推荐系统产品φ2对应的HNLE,因此有φ2≻φ1,这与本文决策方法的决策结果相一致,其体现了本文决策方法的可靠性。
本文针对实际问题的复杂性和决策者的决策倾向偏好,提出了犹豫正态语言元的概念来对决策者的评价信息进行刻画,以提升决策信息的概括能力;然后,根据犹豫正态语言元的特征,设计了HNLOWA算子以实现多个HNLE的综合集成,并分析了两类特殊算子之间的关系;最后,建立了基于HNLOWA算子的多属性决策方法,并将其应用于推荐系统产品的评估过程中,同时进行了对比分析实验来说明本文模型的有效性。本文建立的多属性决策方法虽然能够对犹豫正态语言信息进行有效集成,但是没有深入探究参数λ的变化对最终决策结果的影响。因此,在今后的研究中,将进一步探究参数λ对HNLOWA算子的影响机制,并对参数λ进行鲁棒性分析;同时,将基于专家提供的犹豫正态语言元,设计信息熵计算模型来计算评价指标的客观权重,从而进一步提升多属性决策方法的可靠性。