关于协同过滤推荐算法的研究文献综述

2016-10-29 15:22吴佳炜
2016年29期
关键词:协同过滤推荐系统

吴佳炜

摘要:协同过滤推荐算法从庞大的数据资源中为用户推荐其感兴趣的内容,在推荐系统中该算法得到广泛应用。但是随着用户数目和项目资源的不断增加,传统的协同过滤算法暴露出数据稀疏和冷启动等问题,大大降低了用户相似度和项目相似度计算的准确度。本篇文章介绍了协同过滤算法的基本概念,指出该算法的局限性以及在此基础上研究人员所做的一系列优化改进。

关键词:协同过滤;推荐系统;用户相似性;项目相似性

一、引言

现今互联网的快速发展,大数据时代应运而生,数据资源的增长速度以几何数量级呈现,个性化推荐技术[1]的出现解决了庞大的用户群体对数据的需求问题,更是广泛应用于数字图书馆[2]、电子商务[3]、新闻网站[4]等系统中。协同过滤(collaborative filtering)[5]在推荐系统中最为常用,它的根本思想是根据相似的用户群体或者项目群体来向目标用户推荐其可能感兴趣的项目资源。

基于用户的协同过滤推荐算法[6]和基于项目的协同过滤推荐算法[7,8]是构成传统的协同过滤算法的两大主体。在基于用户的协同过滤推荐算法中,算法依据目标用户的类似用户对项目的评分来预测目标用户对该项目是否感兴趣,然而鉴于部分用户与之相关联的信息量有限,所以对相关项目的评分并不完全,导致用户-项目评分矩阵稀疏度高而不能完全体现其相对关系,从而加大了相似用户群的选择程度,降低了推荐系统的效率。若通过基于项目的协同过滤推荐算法,依靠未评分目标项目的相似项目的评分来预测目标用户对未评分项目的评分,但是当用户对项目的评分较少时,易导致忽略项目自身属性的问题,降低了推荐效率。

二、协同过滤推荐算法

(一)核心内容

1、计算相似度

为了计算用户或项目之间的相似度,协同过滤推荐算法主要利用皮尔逊相关度系数[9](Pearson Correlation Coefficient,PCC)来实现,其中PCC的取值范围是[-1,1]。在基于用户的协同过滤算法中,PCC可以用来计算用户之间的相似度,公式如下:

(二)局限性及解决方案

传统的协同过滤推荐算法只偏重于用户相似度或者项目相似度的计算。基于用户的协同过滤算法由于用户接触信息量有限,用户-项目评分矩阵严重稀疏从而导致数据的冷启动。基于项目的协同过滤算法因为用户对项目的评分过少或者不够全面,从而在推荐过程中容易忽略项目的自身属性。

针对传统的协同过滤算法在大数据时代背景下暴露出的问题,相关研究人员对其进行了改进。针对数据稀疏性多带来的问题,计算的项目相似度准确度不高,文献[10]提出了一种结合类别偏好信息的item-based协同过滤算法,引出了类别偏好相似,根据类别偏好相似找出一组与目标项目类别偏好相似的候选邻居集合,再在其中搜寻最近邻,删减了与目标项目共同评分较少的项目,使得最近邻搜寻的准确性得以提高。因为传统的协同过滤推荐算法不能及时捕捉用户兴趣变化,文献[11]提出了一种适应用户兴趣变化的协同过滤推荐算法,该算法提出了分别基于时间和基于资源相似度的数据权重,并将它们结合在一起,然后引入基于项目的协同过滤算法的生成推荐中。文献[12]和文献[13]都提出了一种基于用户-项目的混合协同过滤算法来解决数据稀疏和冷启动的问题,通过改进相似度的计算来提高预测精度,同时在预测未评分值时,加入平衡参数对两种预测评分进行加权综合,产生推荐。

三、总结

综上所述,协同过滤推荐算法越来越被优化,所以在现今的推荐系统中,协同过滤推荐算法仍被广泛使用。但随着大数据时代的到来,传统的协同过滤算法也逐渐暴露出冷启动和数据稀疏等一系列问题,导致推荐质量大大下降。因此,研究人员对传统的协同过滤算法做了大大的改进,在计算用户相似度时引入时间权重因子来捕捉用户兴趣随时间变化的特点,在计算项目相似度是又引入了类别偏好因素,使得最近邻项目更为相似,同时还将基于用户的和基于项目的协同过滤算法相结合,引入平衡因子等等,从而使得预测精度大大提高。

但是随着数据量几何级的增长,研究人员也需要不断改进算法来满足推荐系统的需求,对传统的协同过滤算法的研究也会更为深入,挖掘更多影响因素,从而提高推荐质量。(作者单位:南京师范大学)

参考文献:

[1] 许海玲,吴潇,李晓东,等.互联网推荐系统比较研究[J].软件学报,2009,20(2).

[2] Jayawardana C,Hewagamage K P,Hirakawa M.A Personalized Information Environment for Digital Libraries[J].Information Technology & Libraries,2001,20(4).

[3] Schafer J B,Konstan J,Riedl J.Recommender systems in e-commerce[C].USA:ACM,1999.

[4] Konstan J A,Miller B N,Maltz D.GroupLens:applying collaborative filtering to Usenet news[J].Communications of the Acm,2000,40(3).

[5] Al-Shamri M Y H.Power coefficient as a similarity measure for memory-based collaborative recommender systems[J].Expert Systems with Applications,2014,41(13).

[6] Zhao Z D,Shang M S.User-Based Collaborative-Filtering Recommendation Algorithms on Hadoop[C].New York:IEEE Computer Society,2010.

[7] 邓爱林,朱扬勇,施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报,2003,14(9).

[8] 罗奇,余英,赵呈领等.自适应推荐算法在电子超市个性化服务系统中的应用研究[J].通信学报,2006,(11).

[9] 朱锐,王怀民,冯大为.基于偏好推荐的可信服务选择[J].软件学报,2011,22(5):852-864.

[10] 冷亚军,陆青,张俊岭.结合类别偏好信息的item-based协同过滤算法[J].计算机应用研究,2016,33(3):669-672.

[11] 邢春晓,高凤荣,战思南,等.适应用户兴趣变化的协同过滤推荐算法[J].计算机研究与发展,2007,44(2):296-301.

[12] 陈彦萍,王赛.基于用户-项目的混合协同过滤算法[J].计算机技术与发展,2014(12):88-91.

[13] Xiong W,Li B,Cui X,et al.A Learning Approach to the Prediction of Reliability Ranking for Web Services[C].The,International Conference on Web Services.2015:169-176.

猜你喜欢
协同过滤推荐系统
基于用户偏好的信任网络随机游走推荐模型
改进的协同过滤推荐算法