杨莉
摘要:在电子商务发展的今天,协同过滤推荐能够推荐给用户可能感兴趣的物品,这可以提高我们在海量物品中搜索自己感兴趣物品的速度。首先,论文介绍了协同过滤(CF)推荐的关键技术。然后,重点分析了基于时间的协同过滤研究。最后,提出了协同过滤的可能面临的问题,包括冷启动、稀疏性等。
关键词:协同过滤;用户偏好;时间权重;相似性;推荐系统
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2019)09-0170-03
Abstract:Today, with the development of e-commerce, collaborative filtering algorithm can recommend items that may be of interest to users, which can improve the speed of searching for items of interest among mass items. Firstly, the key technologies of collaborative filtering (CF) recommendation are introduced. Then, the research of collaborative filtering based on time is emphatically analyzed. Finally, the possible problems of collaborative filtering, including cold start, sparsity and so on, are put forward.
Key words:collaborative filtering; user preference; time weight;similarity;recommender system
引 言
随着网络技术的蓬勃发展以及网民数量的快速上涨,针对海量的信息,用户很难从这样庞大的信息中抉择出感兴趣的、对其有价值的商品。对于这样的“信息过载[1]”问题,推荐系统可以根据用户相关信息来预测用户喜欢的商品并推荐给用户。
推荐系统分为:(1)协同过滤(Collaborative Filtering)[1]推荐:经过用户的注册数据、历史行为信息(包含历史纪录、点击模式等)获取数据,按照用户间的相似性把其余相似用户爱好的项目推送给该用户。(2)基于内容的(Content-based)推荐[3],是参考用户曾经选择的商品,再把相似的商品推给用户。(3)基于关联规则的推荐(APBR)[4],依据用户历史行为获取相关数据、收集项目集合,提取规则,再由此推荐给用户产品。经典的有“尿布,啤酒”事件。(4)混合推荐[5],由于单个推荐算法只能解决其中一两个突出问题,有一定的局限性,有时候为了解决其他问题,会综合两个及以上的混合推荐算法。
1 协同过滤推荐算法
这种算法[6]在推荐系统中应用很多。其关键在于对未打分项目进行评分预测并给予推荐。包含了内存[7]( Memory- based)的CF与模型(Model-based)的CF推荐算法。
1.1基于内存(Memory-Based)的协同过滤推荐算法
1.1.1基于用户的协同过滤算法
4 协同过滤算法存在的问题
该算法被广泛应用于各种个性化推荐算法,而且取得的效果也可佳,但由于现在互联网的日益发展,物品的不断增加和用户数量的剧增,协同推荐在推荐中也存在着一些问题。
(1)冷启动[22]问题:用户冷启动与项目冷启动。即在计算时无可参考的数据。针对新注册的用户没有任何参考依据,未有任何打分项,称作为用户冷启动;对于没有被任何用户评分的项目叫作项目冷启动。尤其在协同过滤推荐算法中。
(2)稀疏性[23]问题:由于互联网的发展,用户和物品的增长导致数据的规模非常巨大,在系统中,不同用户对大部分产品不相关,对很小一部分产品进行了评分(通常用户浏览和购买的商品并且评价的商品不会超过10%),而只有评分过的产品才能在相似性度量中进行计算。由于数据的局限,促使获得的邻居集合不够准确,影响最后效果。
(3)鲁棒性[24]:在推荐时遭到恶意破坏后,推荐质量还能够保持。
(4)时效性[25]问题:用户的兴趣偏好会随时间的变化而不同,能夠根据用户兴趣的变化来推荐产品,是一个非常值得考虑的问题。
5 总 结
论文介绍了协同过滤的概念及过程,由于用户兴趣的变化,思考到时间因素对算法的影响。最后还说明了推荐算法在推荐中存在的挑战。在协同过滤中最大的两个不足是数据的稀疏性和冷启动。在基于时间的推荐算法研究中,用户随时间的变化因素比较多,例如长期与短期兴趣,季节性兴趣等,这都是以后研究的重点。
参考文献:
[1]施海鹰.基于关联规则挖掘的分类随机游走算法[J].计算机技术与发展,2017,27(9):7-11.
[2]孙光福,吴乐,刘淇,等.基于时序行为的协同过滤推荐算法[J].软件学报,2013(11):2721-2733.
[3]何波,潘力.融合内容和改进协同过滤的个性化推荐算法[J].控制工程,2018(8).
[4]文拯.关联规则算法的研究[D].中南大学,2009.
[5]杨丹.基于多模信息融合的个性化推荐系统的研究[J].电脑知识与技术,2013(27):6067-6068.
[6]宋文君,郭强,刘建国.一种改进的混合推荐算法[J].上海理工大学学报,2015(4):327-331.