李春梅,陈秀明,刘文文,周永芹
(安徽新华学院信息工程学院,安徽合肥 230088)
基于熵权的区间犹豫模糊集用户聚类方法研究
李春梅,陈秀明,刘文文,周永芹
(安徽新华学院信息工程学院,安徽合肥 230088)
本文针对群体中用户采用区间犹豫模糊信息表达兴趣偏好的情况,在推荐过程中对于区间犹豫模糊集用户聚类的方法进行研究。考虑到属性权重未知的情况,提出熵权模型来确定属性权重;基于相关性和最小距离思想,利用传递闭包算法和凝集型层次聚类算法对用户聚类,在此基础上研究群推荐方法,建立科学合理的群推荐模型。
区间犹豫模糊集;相关系数;熵测度;属性权重;用户聚类
在现实世界中,数据用于聚类可能是不确定的和模糊的,处理各种类型的模糊数据,大量的聚类算法对应不同的模糊环境.作为模糊集的扩展,区间犹豫模糊集能够表达决策者在决策过程中区间性、犹豫性的模糊问题.通过距离和相似性计算,进行用户聚类,能够为用户合理地推荐.在以往的聚类问题中,用户评价信息多为语言评价信息和语言算子;对于用户聚类的研究,主要从用户访问行为和访问内容两个方面对访问数据进行研究;但是,对于区间犹豫模糊集用户聚类方法的研究还比较少.本文着重研究了区间犹豫模糊集用户聚类问题,在文献[1]的基础上,考虑了属性权重已知和完全未知的情况,并在文献[2]的基础上,提出了熵权重模型用以确定属性权重,最后利用传递闭包算法和凝集型层次聚类算法对用户进行聚类.
1.1 相关概念
基于区间犹豫模糊集的性质和运算,给出区间犹豫模糊集的算术加权平均算子和几何加权平均算子.
(1)区间犹豫模糊集的加权算术算子.
(2)区间犹豫模糊集的几何加权平均算子.
1.2 区间犹豫模糊集的相关系数
在区间模糊集相关系数的基础上,给出区间犹豫模糊集的相关系数定义[1,3-4].
当考虑到该元素xi∈X的权重时,进一步得到:
1.3 一种区间犹豫模糊熵公式的构造
在具体的决策中,不同的决策者的重要程度通常是有区别的,所以在处理区间犹豫模糊熵时,要依据决策者的重要性赋予决策者的信息不同的权重ωj(ωj>0).为此,在犹豫模糊集的熵和对偶犹豫模糊集的熵的基础上,给出区间犹豫模糊集的熵的公式[5-6,8-9].
证明 由于
聚类是指一个过程,使一组对象(可选方案、人、事件等)进入有数据特点和对象的集群,比不同的集群具有更高的相似性集群.在模糊聚类分析中,聚类的方法有很多,目前典型的聚类算法有传递闭包算法、K-Means、迭代自组织数据分析方法等.本文采用传递闭包算法和凝集型层次聚类算法进行用户聚类.
2.1 Algorithm-IVHFSC算法
基于直觉模糊聚类算法[10],本文提出一种新的区间犹豫模糊凝聚型层次聚类算法,通过最小距离对用户进行聚类。
定理4 设C是一个相关矩阵.那么对于任意非负整数m1和m2,衍生矩阵Cm1+m2来源于Cm1+m2=Cm1∘Cm2仍然是一个相关矩阵.
定理5 设C=(ρij)m×m是相关矩阵,然后组成的有限次数C→C2→C4→…→C2k→…,必然存在一个正整数k,使得C2k=22k+1,C2k也是一个等价的相关矩阵.
定义9 设C=(ρij)m×m是等价的相关矩阵,称Cλ=(λρij)m×m为C的切割矩阵,其中,
2.2 属性权重未知的用户聚类
在决策过程中,属性权重有时是已知的,有时是全部未知或者部分未知的,在区间犹豫模糊多属性决策条件下,如何依据决策矩阵以及属性权重信息获取属性权重已成为现阶段研究的热点问题之一.下面着重解决属性权重已知和权重完全未知的区间犹豫模环境下的用户聚类问题.
属性权重完全未知的多属性决策问题是专家权重和属性权重完全未知,根据区间犹豫模糊熵和熵权重模型[8]求解属性权重,并基于备选方案与理想方案间的相关系数,提出一种用户聚类的算法.
基于区间犹豫模糊相关系数和传递闭包技术对用户进行聚类:
步骤1 依据用户提供的区间犹豫模糊信息构建决策矩阵M=(αij)m×n;
步骤2 依据区间犹豫模糊熵的权重模型,计算属性的权重ω=(ω1,ω2,…,ωn)T;
步骤3 基于区间犹豫模糊集的相关系数计算,构造相关矩阵;
步骤4 利用传递闭包技术进行用户聚类.
步骤1 依据用户提供的区间犹豫模糊信息构建决策矩阵M=(αij)m×n;
步骤2 依据区间犹豫模糊熵的权重模型,计算出属性的权重ω=(0.2026,0.3856,0.0980,0.3137)T;
步骤3 基于区间犹豫模糊集的相关系数计算公式,得到相关系数矩阵(表1).
表1 用户对六种渠道的区间犹豫模糊集综合决策矩阵M=(αij)6×4
显然,C8=C4,这表明C4是一个等价的相关矩阵.
表2 聚类结果
本文以用户聚类分析问题为研究重点,在不同区间犹豫模糊集的信息环境下,结合相关系数、熵测度模型和距离相似性公式,构造了区间犹豫模糊熵模型和权重确定模型,讨论了属性权重完全已知和完全未知的情况,并进行用户聚类.
针对区间犹豫模糊环境下用户聚类方法的研究,可以运用到群决策、群推荐系统中,对电子商务、投资决策和人才选拔等都有一定的帮助.但是,针对聚类方法中的凝聚型层次聚类算法和传递闭包技术聚类算法,每次只合并两个类,具有迭代次数高、时间复杂度高的缺陷,有待进一步的研究.
[1]Chen N,Xu Z,Xia M.Interval-valued hesitant preference relations and their applications to group decision making[J].Knowledge-Based Systems,2013,37(2):528-540.
[2]Zhang Z M,Wang C,Tian D,et al.Induced generalized hesitant fuzzy operators and their application to multiple attribute group decision making[J].Computers & Industrial Engineering,2014,67(1):116-138.
[3]W L Huang,A note on entropy of intuition fuzzy sets[J].Internation Journal of Uncertainty,Fuzziness and Knowledge-Based Systems,2003,11(5):627-633.
[4]吴婉莹.犹豫模糊信息的相关系数和熵测度及其在群决策中的应用[D].合肥:安徽大学,2014.
[5]王培,魏翠萍.一种区间直觉模糊熵的构造方法[J].计算机工程与应用,2011(2):43-45.
[6]李香英.区间犹豫模糊熵和区间犹豫模糊相似度[J].计算机工程与应用,2014(19):227-231.
[7]魏翠萍,高志海,郭婷婷.一个基于三角函数的直觉模糊熵公式[J].控制与决策,2012(4):571-574.
[8]金飞飞,裴利丹,陈华友,等.区间犹豫模糊三角相似度及其多属性群决策[J].计算机工程与应用,2015(4):41-45.
[9]王毅,雷英杰.一种直觉模糊熵的构造方法[J].控制与决策,2007(12):1390-1394.
[10]Z S Xu,J Chen,J J Wu.Clustering algorithm for intuitionistic fuzzy sets[J].Inform. Sci.,2008,178(19): 3775-3790.
Clustering Analysis of Interval-valued Hesitant Fuzzy Sets Based on Entropy Weights
LI Chun-mei,CHEN Xiu-ming,LIU Wen-wen,ZHOU Yong-qin
(School of Information Engineering, Anhui Xinhua University, Hefei Anhui 230088, China)
Methods of clustering analysis of interval-valued hesitant fuzzy sets have been proposed, considering the weight of the properties is unknown, we use the entropy measures to calculate the attribute weights. Based on the minimum distance, we use the transitive closure algorithms and hierarchical clustering algorithm. The example verifies the effectiveness of the proposed method.
interval-valued hesitant fuzzy sets; correlation coefficient; entropy measures; attribute weights; clustering analysis
2017-04-12
安徽省教育厅自然科学基金重点项目“犹豫模糊语言环境下的群推荐方法研究”(KJ2015A300);安徽省教育厅自然科学基金重点项目“指纹IRLRD特征加密技术在手机支付中的研究与应用”(KJ2015A309);安徽省教育厅自然科学基金重点项目“基于链路预测的关系推荐研究”(KJ2016A304);国家级大学生创新性训练计划项目“基于社团发现的个性化推荐系统研究”(201212216035);国家级大学生创新性训练计划项目“群推荐中偏好信息集结方法研究”(201312216006);国家级大学生创新性训练计划项目“基于模糊语言的群兴趣偏好集结方法研究”(201412216026);国家级大学生创新性训练计划项目“犹豫模糊语言集在大学生素质评价中的应用”(201512216009)。
李春梅(1978- ),女,讲师,硕士,从事数据挖掘研究。
陈秀明(1972- ),男,副教授,博士,从事智能决策研究。
C934
A
2095-7602(2017)08-0040-07