南京工业职业技术学院 陈 敏
一种改进的基于标签推荐方法
南京工业职业技术学院 陈 敏
大众分类网络已允许用户根据自身喜好自由的加入标签,因此结合标签的推荐算法能增加推荐的个性化和准确度,文章将用户打分分数转移到标签上,同时结合用户兴趣易发生转移的特点,提供更精确的用户偏好模型,提出一种基于标签和项目评分的混合推荐算法。实验结果证明,该算法在命中率、平均排序分和推荐多样性等方面都获得更好的表现。
推荐系统;标签;时间加权
Web2.0的发展让社会标签系统得到广泛应用,用户在标签系统中可以随意添加关键词标注,这使得用户的个性偏好更加具体化,因此通过标签进行个性资源推荐将大大提高推荐的精度。基于标签的推荐系统的关键点在于如何利用标签集为目标用户建立偏好模型。通常,标签的使用频率、词义特点等作为建立偏好模型的着手点。文献[1]建立用户-项目-标签三维网络,提出个性化的协同标签算法。文献[2]提出了重要性传递论,加强了标签系统中网络结构的三维关系。文献[3]利用标签的关联规则进行标签预测。本文提出一种改进的衡量标签重要性的方法。将基于标签和项目评分及评分时间进行加权,使得待推荐项目获得更好的偏好度。
协同过滤算法将用户对项目的评分都视为平等,没有先后的区别,并且忽略时间的影响,不利于准确分析用户偏好。如某用户在大学时可能喜欢小说,而有了孩子以后更喜欢育儿方面的书。所以很久之前选择的资源对当前的预测贡献度不大。用户对项目的评分和添加过的标签及时间三者都影响着推荐的准确度,因此,如何有效的利用这三者关系是本文的研究重点。文中所需的数据集有:
1.1 基于标签和打分偏好度的用户偏好模型建立
本文将用户对项目的打分转移到标签上,即用户使用过的标签都具获得了一定的偏好度,其值定义为:
1.2 时间加权因子
一个高效的推荐系统需要考虑到时间对推荐结果的影响,本文引入时间衰减因子,改善用户对项目的偏好度的预测。定义为:
1.3 基于标签和打分偏好度的用户偏好模型建立
本文将用户对项目的评分转移到项目标签上,将用户-项目-标签的三维结构转变成用户-项目的二维结构,同时综合考虑用户评分的时间进行加权处理,可以得到改进后的待测项目推荐能力公式:
2.1 数据集
本文算法测试流行的MovieLens数据集。数据集采取5分评分制,并具备添加标签功能。先对数据集进行精简,然后分割实验数据,测试集和训练集按不同比例划分,共划分成9组,进行多次取样实验分析结果。
实验中,将本文提出的改进的基于标签的推荐算法(AIR),与协同过滤算法(CF)和基于网络结构的推荐算法(NBI)[4]进行比较分析。
2.2 实验结果
本文从命中率、平均排序分和多样性[5]三个指标来分析算法性能。实验测试推荐列表长度分别取为20、60和100。
(1)命中率
命中率的定义是命中次数与推荐列表长度的比值。结果如表2所示。
表2 典型推荐列表长度下的命中率
由表2中数据对比可以得到,在推荐列表长L=60时,AIHR推荐算法命中率相比CF和NBI推荐算法分别提高了28.57%和35.81%。
(2)平均排序分
用于衡量推荐算法的排序准确度的推荐指标,值越小说明推荐算法的排序准确度越高。平均排序分的测试结果如图2所示,本文提出的AIR推荐方法在精确度上明显好于其他几个方法。
图2 几种算法对应的平均排序分比较
(3)多样性
推荐列表的多样性可以利用平均海明距离来衡量海明距离的定义为:
由表3不同推荐算法在不同列表长度下的多样性结果可以看出,在列表长度为20时,AIHR算法的多样性比CF和NBI两种算法分别提高了73.52%和14.80%。
表3 不同推荐列表长度下的多样性
本文的算法目的是将用户打分及打分时间和添加标签的行为结合起来,为用户构建更精确的资源偏好模型。因此,将用户对项目的评分转移到项目标签上,将用户-项目-标签的三维结构转变成用户-项目的二维结构,同时综合考虑用户评分的时间进行加权处理,提出一种改进的基于标签的推荐方法。实验结果表明,在准确度、命中率和多样性方面等评价指标上都有更好的表现,提高推荐算法的精度,改善了用户兴趣改变带来的推荐准确率的问题。
[1]Zhou T,Ren J,Medo M.,et al.Bipartite network projection and personal recommendation[J].Phys Rev E,2007,76:046-115.
[2]CLAYPOOL M,GOKHALE A,et al.Combining contentbased and collaborative filters in an online newspaper[C].Proceeding of ACM SIGIR Workshop on Recommender Systems,1999.
[3]Cattuto C,Loreto V,Pietronero L.Semiotic dynamics and collaborative tagging[J].PNAS,2007,104(5):1461-1464
[4]Zhang Z K,Liu C,Zhang Y C,Zhou T.Solving the cold-start problem in recommender systems with social tags[J].EPL,2010,92(2):28002.
[5]刘建国,周涛,汪秉宏.个性化推荐系统研究进展[J].自然科学进展,2009,19(1):1-15.