融合多维信息的协同过滤算法研究

2017-03-07 10:21彭慧洁
电子科技 2017年2期
关键词:社交协同情境

彭慧洁

(上海工程技术大学 管理学院,上海 201620)

融合多维信息的协同过滤算法研究

彭慧洁

(上海工程技术大学 管理学院,上海 201620)

针对信息时代背景下出现“信息过载”现象,而用户难以获取所需要信息的问题。在传统基于用户的协同过滤算法基础上,文中考虑了用户社交关系和用户情境信息,分析并构建了基于用户的SC-UI用户兴趣模型。以期在改进算法基础上,解决数据稀疏性问题,同时提高推荐精度。实验结果证明,文中提出的改进协同过滤算法,高于传统的基于用户的协同过滤算法。

协同过滤算法;信息推荐;移动情境;SC-UI模型;推荐精度

随着信息技术和移动智能设备的普及应用,“信息过载”现象日益突出,用户很难随时随地实时得到自己需要的信息,因此具有实时感知用户兴趣能力的推荐系统至关重要。推荐系统由用户兴趣模块、项目模块和推荐算法模块形成的统一整体,其中用户兴趣模块是确保推荐系统准确度的核心模块。

关于移动信息环境下的个性化信息推荐研究,王茜等人[1]将用户对项目属性的偏好代替了用户对项目的评分,借助用户偏好数学期望预测模型,提出了以用户对项目属性为评分标准的协同过滤推荐算法。李映等人[2]通过改进了皮尔逊相关系数的用户相似度计算方法,融入到混合协同过滤推荐算法中,取得了较好的推荐效果。张莉等人[3]为更准确刻画用户间相似性改进了用户相似度计算,提出了改进的预测用户评分方法。吴毅涛等人[4]借助梯形模糊评分模型计算用户间相似度,在传统的协同过滤算法的基础上扩展了对评分中模糊域的研究。高榕等人[5]对LBSN中兴趣点个性化信息推荐进行了研究,融入兴趣点有关的非结构化评论信息,提出了兴趣点推荐GeoSoRev模型。于是,针对当前推荐系统中缺少融入用户情境信息和社交关系对用户兴趣进行深入全面的理解,本文以缓解用户冷启动问题为出发点,利用LBSN中用户社交关系信息、情境信息和用户属性信息构建SC-UI用户兴趣模型,并设计相关算法产生信息推荐。防止推荐出现过拟合问题,以期提高推荐效果和准确度。

1 用户兴趣建模

随着用户所处环境的不同,用户兴趣的表达不断地发生着变化。因此实时获取用户的状态才能更好地了解用户的需求,为目标用户推荐其喜欢的项目信息。本文从信息的广度和深度对用户所处的信息环境进行了分析,并构建了基于用户的SC-UI用户兴趣模型。

1.1 基于“用户-项目”兴趣矩阵信息

用户-项目评分矩阵的数据来源是用户在消费后对项目按照一定的结构标准的针对性评价,对某一用户来说,评分分数的高低表现为用户的喜好程度的高低。该类信息结构性明显,通常情况下,是按照用户的整体体验偏好程度对项目进行的打分,只通过简单的分数就可以直观地反映出用户的喜好,通过该类信息简单明了,但是由于用户和项目巨大的数量,该类数据的稀疏性程度越来越严重,越来越多的项目评分信息空白,造成了难以把握用户的兴趣偏好,该类问题的存在也是本文融合多维信息进行刻画用户兴趣的原因。用户-项目评分矩阵信息表示如表1所示。

表1 用户-项目评分矩阵示例

其中,“?”表示评分缺失值。根据用户和项目数量形成m×n评分矩阵,每一行代表某一用户对所有项目的评分,每一列代表每一项目中所有用户的评分;rnm表示m第n个项目在所用用户m中的评分均值;rnm表示第m个用对所有项目n的评分均值。

1.2 基于信息结构的异构化特点

信息数据内容信息日益丰富的同时,其结构正在向异构化方向发展。随着移动设备及相关技术的发展,相比传统环境用户发布的信息更为复杂,主要体现在信息内容的复杂化和信息结构的复杂化。各式各样的信息类型,使得用户在选择自己喜欢的信息内容的同时,开始逐渐关心信息的载体,有结构化数据、半结构化数据、非结构化数据。通过判断用户对不同结构信息的偏好,为其推送不仅符合其内容偏好的信息,而且为其推送符合阅读习惯的信息形式。根据用户隐式浏览信息的历史记录,得到不同用户对信息结构的偏好,通过分析异构化信息对用户和信息推荐的影响,可以提高异构信息资源利用率,提高信息的推荐精度。非结构化信息、半结构化信息和结构化信息之间存在一定的联系,不同信息类型是关于同一主题内容,只是以不同的形式展现。针对用户 对异构化信息形式的喜好种类以数学模型进行建模如下

(1)

其中,Pu为用户u对不同结构信息的偏好;i为用户浏览的信息。

1.3 基于人口统计特征用户属性信息

基于用户人口统计特征信息是具有明显结构化的描述性信息,该类信息资料详细,通常情况下,在用户初始注册账号时会按照提示信息填写个人信息,该部分含有大量的隐含信息,如用户所在的地理位置,年龄大小以及学历信息等,这些统计信息可以在一定程度上将用户划分为不同的类别,如对于硕士学历的用户的消费观念和关注的信息内容,不同于学历为小学或初中的用户,同时具有类似统计信息的用户很可能具有类似的信息偏好。于是,用户的描述性的个人信息对信息的个性化推荐起到很好的指引和过滤的作用。本文将该类信息统一形式表示为(userID,year-of-birth,gender,post,education,tags)。

1.4 基于用户情境信息的兴趣分析

基于移动设备和定位技术的发展,来源于用户的信息具有移动性、即时性和多样性。如何在推荐过程中有效地融入用户情境信息,提高推荐精度。该部分对用户情境进行建模分析,以期降低数据稀疏性问题的同时,满足用户在移动环境下的个性化信息需求,如用户在查询消费地点位置时,更倾向于选择距离自己近的位置;用户急于处理事务,需要在短时间内到达某一地点,更倾向于选择最为快捷时间最短的交通方式;若是用户为了游玩,则更倾向于选择沿途风景优美的交通方式。因此,同一用户会在不同的情景状态下产生不同的信息需求,了解并把握用户所在的状态,在用户固定兴趣的基础上融入基于情境的动态因素,可以更精确地推荐信息。由于用户情境信息复杂,包含着多维度情境,不同维度的情境可能对用户在信息选择时有效,有的可能并没有作用[6]。将包含用户多维情境信息集合C(Context)表示如下

C=

(2)

其中,cn代表用户不同维度的情境。如某一用户的情境信息示例如下C=,分别代表用户位置、时间、网络状况和移动环境。那么 可以表示为 。基于用户特定情境条件下,用户信息服务应结合用户具体环境和状态提供用户所需的信息服务,基于情境感知的信息推荐服务,将用户兴趣经常变化的因素融入到兴趣模型中,在既能够处理用户当前兴趣的同时,又能避免用户兴趣的过拟合问题。

1.5 融合社交关系的用户兴趣分析

基于社交关系网络信息的兴趣分析主要用于发现邻居用户。源于“人以群分,物以类聚”的特点,存在好友关系的用户之间必定有类似的兴趣偏好,本文通过Foursquare服务平台中的追随者(Followers)关系,用户通过添加附近通讯录、Facebook和Twitter等社交平台的好友关系,将基于社交网络关系的好友关系融入到基于位置服务的服务平台中。通过添加好友可以查看追随者的建议、评分和用户个人饮食偏好,然后该用户可以根据追随者的建议和历史消费评价,选择消费地点及相关的信息。此外,Foursquare服务平台还可以添加喜欢的口味(Tastes),然后该系统就会将与该口味相关的的信息推送到用户的界面。由于项目共同特征词形成的相关关系网络,如口味相同的菜品之间的关系。若将所有菜品以口味划分,则所有菜品可以表示为:T=(Taste1,Taste2,…,TasteN),每一口味(Taste)代表具有该特征的一系列菜品。在稀疏的数据中,根据用户信息中的 标签筛选一系列相关的菜品直接进行推荐。但是,在通过标签筛选菜品时,如口味是辣,系统是不可能把所有的含辣的菜品推荐给用户,而是需要通过从父类别到子类别上下递推。

2 基于SC-UI用户兴趣模型的推荐算法

鉴于以上对用户信息环境的分析,通过融合用户相关的不同信息,将融合后的多维信息设计推荐算法,根据不同的用户信息资源,比较用户之间的相似度,找到目标用户的相邻用户,根据相邻用户的兴趣判断目标用户的兴趣偏好的信息推荐模式[7]。

图1 基于用户协同过滤模式预测用户评分示例

本文改进的用户协同过滤模式在历史评分数据的基础上,通过线性融合用户社交关系信息相似度sims(u,v),用户情境相似度simC(u,v),用户属性相似度simU(u,v),项目属性相似度户情境simI(u,v)

sim(u,v)=αsims+βsimC+φsimU+εsimI

(3)

其中,α,β,φ,ε分别根据各分支相似度的权重赋予大小不同的数值,α,β,φ,ε∈(0,1),α+β+φ+ε=1。根据前面用户兴趣建模分析,得到用户间属性相似度、社交关系紧密度和用户情境相似度,根据在计算过程中各信息的在所有信息的所占比重,确定权重值。从而得到用户间的相似度。构造有效的邻居集合是推荐质量的关键,本文就一用户生成的信息环境确定基于不同信息标准构建相邻用户集合,确定未知的“用户-项目”评分。以Foursquare中用户所在的信息环境为例设计改进算法为:

算法 改进的用户协同过滤算法简化。

输入 用户需要预测评分的LBSN用户信息。

输出 用户对项目评分的缺失值。

(1)确定该用户是否存在Followers,若存在,信息抽取其相邻用户的对项目的评分的均值作为该用户的评分,算法结束。否则,进入下一步;

(2)判断用户类别,若为初始用户,对用户属性信息进行数据预处理,并系统识别或者信息抽取该用户的情境信息,将用户属性与情境信息相结合,得到目标项目信息;

(3)该用户若为模式用户,通过该用户的历史评分数据与该系统中所有其他用户的评分数据比较,得到TOP-K相似用户(相邻用户),将相邻用户项目的评分情况综合分析作为该用户对项目的预测评分;

(4)根据预测评分高低生成推荐主题和用户对信息结构化信息偏好类型Pu,生成推荐列表。

考虑社交关系和情境信息的预测模型,是将各种信息整合在一起的启发式计算,即Rating=R(Social,Context,User,Item),其其对预测评分的影响作用在用户相似度计算中 。由该算法得出,主要有三部流程构成。其中,通过不同方式寻找到目标用户的相邻用户集后,得到目标用户的相邻用户,然后根据近邻用户的已知评分预测目标用户的项目评分,基于用户的评分预测计算公式[8]

(4)

3 推荐效果评估

本文采用情境信息丰富的LBSN典型代表Foursquare信息环境,数据集中的用户信息、评论信息、地位位置、社交关系可以有效地验证该算法的准确度。借助均方根误差(RMSE)计算并比较推荐精度,计算公式[9]为

(5)

传统基于用户的协同过滤算法与本文改进的SC-UI协同过滤算法实证比较,结果如表2所示。

表2 传统算法与改进算法结果对比

RMSE值越小,推荐精度越高。通过表2数据可得,改进后的推荐算法由于传统的推荐算法。

4 结束语

本文提出了基于用户的改进协同过滤算法,考虑了多维度信息对用户兴趣的影响,并基于不同信息特点构建兴趣模型,改进的算法很好地解决了协同过滤算法中用户冷启动问题,但是未对项目属性特征深入了解,对于项目冷启动问题尚需进一步研究与讨论。在个性化推荐领域中,移动情境信息对用户偏好的影响研究刚刚起步,并在不断的探索中。

[1] 王茜,杨莉云,杨德礼.面向用户偏好的属性值评分分布协同过滤算法[J].系统工程学报,2010,25(4):561-568.

[2] 李映,李玉龙,王阳萍.一种改进的混合协同过滤推荐算法[J].电子科技,2016,29(4):45-48.

[3] 张莉,秦桃,滕丕强.一种改进的基于用户聚类的协同过滤算法[J].情报科学,2014,32(10):24-27,32.

[4] 吴毅涛,张兴明,王兴茂,等.基于用户模糊相似度的协同过滤算法[J].通信学报,2016,37(1):198-206.

[5] 高榕,李晶,杜博,等.一种融合情景和评论信息的位置社交网络兴趣点推荐模型[J].计算机研究与发展,2016,53(4):752-763.

[6] 乔磊.基于多维情境的移动信息服务个性化推荐算法研究[D].北京:北京交通大学,2016.

[7] 王明佳,韩景倜,韩松乔.基于模糊聚类的协同过滤算法[J].计算机工程,2012,38(24):50-52.

[8] 曾子明,李鑫.移动环境下基于情境感知的个性化信息推荐[J].情报杂志,2012,31(8):166-170.

[9] 李贵,陈盛红,韩子阳,等.基于协同过滤的位置感知推荐[J].计算机科学,2014,41(11A):340-346.

The Research on Collaborative Filtering Algorithm of Multi-dimensional Information

PENG Huijie

(School of Management,Shanghai University of Engineering Science, Shanghai 201620,China)

This paper is under the background of information age appear "information overload" phenomenon and solves the problem that the user is difficult to get needed information. Based on the traditional collaborative filtering algorithm, this paper analyes and builds the SC-UI model based on the users’ interest considering the users’ social relationship and situation .This paper is to solve the data sparseness and improve the recommendation accuracy on the basis of improved model. The experimental results show that the proposed improved collaborative filtering algorithm get higher scores than the traditional collaborative filtering algorithm.

collaborative filtering algorithms; information recommendation; mobile situation; SC-UI model; recommend precision

2016- 10- 05

彭慧洁(1989-),女,硕士研究生。研究方向:数据挖掘,信息推荐。

10.16180/j.cnki.issn1007-7820.2017.02.011

TP391

A

1007-7820(2017)02-042-04

猜你喜欢
社交协同情境
不同情境中的水
社交牛人症该怎么治
家校社协同育人 共赢美好未来
聪明人 往往很少社交
借助具体情境学习位置与方向
蜀道难:车与路的协同进化
创设情境 以说促写
社交距离
“四化”协同才有出路
你回避社交,真不是因为内向