基于商品流行度和用户活跃度的推荐算法研究

2014-12-16 03:48张献忠
电脑知识与技术 2014年32期
关键词:相似度协同过滤

张献忠

摘要:用户活跃度和商品流行度对个性化推荐系统性能影响越来越大。而以前的推荐算法很少考虑这两个因素的作用。该文根据商品流行度对计算用户相似度的影响,提出了一种改进的计算用户相似度的方法。同时,又根据用户活跃度对目标用户预测评分的影响,提出了一种改进目标用户计算预测评分的方法。经实验验证,改进后的推荐算法在准确率、召回率和覆盖率等性能指标都优于传统的推荐算法。因此,改进后的算法在提高推荐系统的性能上具有较好的理论研究和应用价值。

关键词:商品流行度;用户活跃度;协同过滤;相似度;推荐

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)32-7641-03

目前,常用的个性化推荐算法是基于协同过滤的推荐算法。它又分为两种:基于用户的协同过滤算法和基于项目的协同过滤算法。而基于用户的协同过滤算法使用更为普遍。基于用户的协同过滤算法原理是如果用户对一些项目的评分比较相似,则他们对其它项目的评分也比较相似。其实现过程是根据用户以往对一些项目的评价,以及其他与该用户具有类似兴趣的用户给一些项目的评价,将一些新的项目推荐给用户,或者预测对用户有价值的项目[1]。基于用户的协同过滤推荐的过程分为三个步骤:评分表示、邻居形成和推荐生成。

1 基于用户的协同过滤算法存在的问题

实践发现,该算法在用于个性化推荐过程中会存在以下一些问题[2]:

1) 随着用户和商品数量的不断增加,参与评分的数据规模也越来越大。如果把所有的用户评分记录数据都参与计算,会大大增加计算两个用户间相似度的时间,必然会导致系统推荐性能的降低,因而也就无法完成及时推荐。

2) 越是热门的商品越容易得到推荐,而使得冷门的商品无法被推荐。如果推荐的商品是热门商品,那么推荐系统的意义也不大。同时喜欢某个冷门商品的用户的相似度可能会更高一点。

3) 算法中没有考虑到用户活跃度和推荐结果间的关系。而事实上,人们更加倾向于有丰富购物经验的VIP用户的推荐。但该算法中没有体现VIP用户的推荐权值。

2 算法改进思路

2.1 用户活跃度和商品流行度对推荐结果的影响

用户行为对于商务网站来说是很重要的,如购买或未购买,购买后的反馈信息是正面的还是负面的,等等。推荐系统的目的是要找出用户可能感兴趣的商品,而不是对这个商品会评多少分的问题。因为只有知道用户有没有购买的意向,才会有用户给这个商品打多少分[3]。因此,在选择相似用户过程中,应该尽可能选择都对某类或某几类商品有正面反馈的用户。正是基于这样的考虑,可以对传统的基于用户的协同过滤算法进行修改。修改的思路是从两方面考虑,一是用户相似度的计算方法,二是计算用户兴趣度时适当考虑VIP用户的权值。

用户活跃度是用来反映用户参与电子商务系统的积极程度。可以把购买记录相对较多的用户设定为VIP用户,而把新用户称为不活跃的用户。不同用户喜欢的商品流行度也是不同的。新用户喜欢浏览热门商品,而老用户会更倾向于浏览冷门的商品[4]。

2.2 推荐公式的改进

推荐算法中推荐公式的改进分两个方面,一个是计算相似度的改进,另一个是计算用户对商品的兴趣度的改进。

1) 计算相似度的改进。为提高推荐算法的性能,必须要考虑长尾分布的影响。也就是说,要尽可能降低两个用户喜欢的商品中包含有热门商品的作用。比如说,两个同时购买了《新华字典》的用户并不能说明他们的兴趣相同。因为《新华字典》是一本经常使用的工具书,绝大多数国内用户都会购买并使用过。但如果这两个用户都同时购买了《ASP.NET程序设计》这本书时,那可以认为他们的兴趣比较相近,因为只有学计算机软件或应用专业的才会去买这本书。为此,可以在计算相似度时消除双方都购买了热门商品的影响[5]。对于给定用户u和用户v,计算相似度的公式可以改进如下:

4 总结

综上所述,商品流行度和用户活跃度对个性化推荐系统的性能产生一定的影响。在设计推荐算法时必须很好的考虑这两个因素。尽可能减少热门商品对用户产生的影响,同时要加强VIP用户对推荐系统的作用。

参考文献:

[1] 章晋波.推荐系统中协同过滤算法的研究与实现[D].北京:北京邮电大学,2009.

[2] 杨芳.一种改进的协同过滤推荐算法[J].河北工业大学学报,2010(3).

[3] Meadow C T Bert R. Boyce B R.Kraft D H. Text Information Retrieval Systems Third Edition[M].Emerald Group Publishing Limited.,2007.

[4] Manning C D Raghavan P. Schutze H.Introduction to Information Retrieva [M].England:Cambridge University Press,2008

[5] 曹一鸣.协同过滤推荐瓶颈问题综述[J].软件,2012,33(12).

摘要:用户活跃度和商品流行度对个性化推荐系统性能影响越来越大。而以前的推荐算法很少考虑这两个因素的作用。该文根据商品流行度对计算用户相似度的影响,提出了一种改进的计算用户相似度的方法。同时,又根据用户活跃度对目标用户预测评分的影响,提出了一种改进目标用户计算预测评分的方法。经实验验证,改进后的推荐算法在准确率、召回率和覆盖率等性能指标都优于传统的推荐算法。因此,改进后的算法在提高推荐系统的性能上具有较好的理论研究和应用价值。

关键词:商品流行度;用户活跃度;协同过滤;相似度;推荐

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)32-7641-03

目前,常用的个性化推荐算法是基于协同过滤的推荐算法。它又分为两种:基于用户的协同过滤算法和基于项目的协同过滤算法。而基于用户的协同过滤算法使用更为普遍。基于用户的协同过滤算法原理是如果用户对一些项目的评分比较相似,则他们对其它项目的评分也比较相似。其实现过程是根据用户以往对一些项目的评价,以及其他与该用户具有类似兴趣的用户给一些项目的评价,将一些新的项目推荐给用户,或者预测对用户有价值的项目[1]。基于用户的协同过滤推荐的过程分为三个步骤:评分表示、邻居形成和推荐生成。

1 基于用户的协同过滤算法存在的问题

实践发现,该算法在用于个性化推荐过程中会存在以下一些问题[2]:

1) 随着用户和商品数量的不断增加,参与评分的数据规模也越来越大。如果把所有的用户评分记录数据都参与计算,会大大增加计算两个用户间相似度的时间,必然会导致系统推荐性能的降低,因而也就无法完成及时推荐。

2) 越是热门的商品越容易得到推荐,而使得冷门的商品无法被推荐。如果推荐的商品是热门商品,那么推荐系统的意义也不大。同时喜欢某个冷门商品的用户的相似度可能会更高一点。

3) 算法中没有考虑到用户活跃度和推荐结果间的关系。而事实上,人们更加倾向于有丰富购物经验的VIP用户的推荐。但该算法中没有体现VIP用户的推荐权值。

2 算法改进思路

2.1 用户活跃度和商品流行度对推荐结果的影响

用户行为对于商务网站来说是很重要的,如购买或未购买,购买后的反馈信息是正面的还是负面的,等等。推荐系统的目的是要找出用户可能感兴趣的商品,而不是对这个商品会评多少分的问题。因为只有知道用户有没有购买的意向,才会有用户给这个商品打多少分[3]。因此,在选择相似用户过程中,应该尽可能选择都对某类或某几类商品有正面反馈的用户。正是基于这样的考虑,可以对传统的基于用户的协同过滤算法进行修改。修改的思路是从两方面考虑,一是用户相似度的计算方法,二是计算用户兴趣度时适当考虑VIP用户的权值。

用户活跃度是用来反映用户参与电子商务系统的积极程度。可以把购买记录相对较多的用户设定为VIP用户,而把新用户称为不活跃的用户。不同用户喜欢的商品流行度也是不同的。新用户喜欢浏览热门商品,而老用户会更倾向于浏览冷门的商品[4]。

2.2 推荐公式的改进

推荐算法中推荐公式的改进分两个方面,一个是计算相似度的改进,另一个是计算用户对商品的兴趣度的改进。

1) 计算相似度的改进。为提高推荐算法的性能,必须要考虑长尾分布的影响。也就是说,要尽可能降低两个用户喜欢的商品中包含有热门商品的作用。比如说,两个同时购买了《新华字典》的用户并不能说明他们的兴趣相同。因为《新华字典》是一本经常使用的工具书,绝大多数国内用户都会购买并使用过。但如果这两个用户都同时购买了《ASP.NET程序设计》这本书时,那可以认为他们的兴趣比较相近,因为只有学计算机软件或应用专业的才会去买这本书。为此,可以在计算相似度时消除双方都购买了热门商品的影响[5]。对于给定用户u和用户v,计算相似度的公式可以改进如下:

4 总结

综上所述,商品流行度和用户活跃度对个性化推荐系统的性能产生一定的影响。在设计推荐算法时必须很好的考虑这两个因素。尽可能减少热门商品对用户产生的影响,同时要加强VIP用户对推荐系统的作用。

参考文献:

[1] 章晋波.推荐系统中协同过滤算法的研究与实现[D].北京:北京邮电大学,2009.

[2] 杨芳.一种改进的协同过滤推荐算法[J].河北工业大学学报,2010(3).

[3] Meadow C T Bert R. Boyce B R.Kraft D H. Text Information Retrieval Systems Third Edition[M].Emerald Group Publishing Limited.,2007.

[4] Manning C D Raghavan P. Schutze H.Introduction to Information Retrieva [M].England:Cambridge University Press,2008

[5] 曹一鸣.协同过滤推荐瓶颈问题综述[J].软件,2012,33(12).

摘要:用户活跃度和商品流行度对个性化推荐系统性能影响越来越大。而以前的推荐算法很少考虑这两个因素的作用。该文根据商品流行度对计算用户相似度的影响,提出了一种改进的计算用户相似度的方法。同时,又根据用户活跃度对目标用户预测评分的影响,提出了一种改进目标用户计算预测评分的方法。经实验验证,改进后的推荐算法在准确率、召回率和覆盖率等性能指标都优于传统的推荐算法。因此,改进后的算法在提高推荐系统的性能上具有较好的理论研究和应用价值。

关键词:商品流行度;用户活跃度;协同过滤;相似度;推荐

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)32-7641-03

目前,常用的个性化推荐算法是基于协同过滤的推荐算法。它又分为两种:基于用户的协同过滤算法和基于项目的协同过滤算法。而基于用户的协同过滤算法使用更为普遍。基于用户的协同过滤算法原理是如果用户对一些项目的评分比较相似,则他们对其它项目的评分也比较相似。其实现过程是根据用户以往对一些项目的评价,以及其他与该用户具有类似兴趣的用户给一些项目的评价,将一些新的项目推荐给用户,或者预测对用户有价值的项目[1]。基于用户的协同过滤推荐的过程分为三个步骤:评分表示、邻居形成和推荐生成。

1 基于用户的协同过滤算法存在的问题

实践发现,该算法在用于个性化推荐过程中会存在以下一些问题[2]:

1) 随着用户和商品数量的不断增加,参与评分的数据规模也越来越大。如果把所有的用户评分记录数据都参与计算,会大大增加计算两个用户间相似度的时间,必然会导致系统推荐性能的降低,因而也就无法完成及时推荐。

2) 越是热门的商品越容易得到推荐,而使得冷门的商品无法被推荐。如果推荐的商品是热门商品,那么推荐系统的意义也不大。同时喜欢某个冷门商品的用户的相似度可能会更高一点。

3) 算法中没有考虑到用户活跃度和推荐结果间的关系。而事实上,人们更加倾向于有丰富购物经验的VIP用户的推荐。但该算法中没有体现VIP用户的推荐权值。

2 算法改进思路

2.1 用户活跃度和商品流行度对推荐结果的影响

用户行为对于商务网站来说是很重要的,如购买或未购买,购买后的反馈信息是正面的还是负面的,等等。推荐系统的目的是要找出用户可能感兴趣的商品,而不是对这个商品会评多少分的问题。因为只有知道用户有没有购买的意向,才会有用户给这个商品打多少分[3]。因此,在选择相似用户过程中,应该尽可能选择都对某类或某几类商品有正面反馈的用户。正是基于这样的考虑,可以对传统的基于用户的协同过滤算法进行修改。修改的思路是从两方面考虑,一是用户相似度的计算方法,二是计算用户兴趣度时适当考虑VIP用户的权值。

用户活跃度是用来反映用户参与电子商务系统的积极程度。可以把购买记录相对较多的用户设定为VIP用户,而把新用户称为不活跃的用户。不同用户喜欢的商品流行度也是不同的。新用户喜欢浏览热门商品,而老用户会更倾向于浏览冷门的商品[4]。

2.2 推荐公式的改进

推荐算法中推荐公式的改进分两个方面,一个是计算相似度的改进,另一个是计算用户对商品的兴趣度的改进。

1) 计算相似度的改进。为提高推荐算法的性能,必须要考虑长尾分布的影响。也就是说,要尽可能降低两个用户喜欢的商品中包含有热门商品的作用。比如说,两个同时购买了《新华字典》的用户并不能说明他们的兴趣相同。因为《新华字典》是一本经常使用的工具书,绝大多数国内用户都会购买并使用过。但如果这两个用户都同时购买了《ASP.NET程序设计》这本书时,那可以认为他们的兴趣比较相近,因为只有学计算机软件或应用专业的才会去买这本书。为此,可以在计算相似度时消除双方都购买了热门商品的影响[5]。对于给定用户u和用户v,计算相似度的公式可以改进如下:

4 总结

综上所述,商品流行度和用户活跃度对个性化推荐系统的性能产生一定的影响。在设计推荐算法时必须很好的考虑这两个因素。尽可能减少热门商品对用户产生的影响,同时要加强VIP用户对推荐系统的作用。

参考文献:

[1] 章晋波.推荐系统中协同过滤算法的研究与实现[D].北京:北京邮电大学,2009.

[2] 杨芳.一种改进的协同过滤推荐算法[J].河北工业大学学报,2010(3).

[3] Meadow C T Bert R. Boyce B R.Kraft D H. Text Information Retrieval Systems Third Edition[M].Emerald Group Publishing Limited.,2007.

[4] Manning C D Raghavan P. Schutze H.Introduction to Information Retrieva [M].England:Cambridge University Press,2008

[5] 曹一鸣.协同过滤推荐瓶颈问题综述[J].软件,2012,33(12).

猜你喜欢
相似度协同过滤
图书推荐算法综述
改进的协同过滤推荐算法
模糊Petri网在油田开发设计领域的应用研究
基于链式存储结构的协同过滤推荐算法设计与实现
基于相似传播和情景聚类的网络协同过滤推荐算法研究
基于协同过滤算法的个性化图书推荐系统研究
混合推荐算法在电影推荐中的研究与评述
相似度算法在源程序比较中的应用
基于灰度的图像边缘检测与匹配算法的研究
影响母线负荷预测的因素及改进措施