结合情感信息的个性化推荐算法

2014-08-08 01:00:38辛贤龙

微型电脑应用 2014年4期

辛贤龙

结合情感信息的个性化推荐算法

辛贤龙

随着互联网的快速发展，在面临“信息过载”情况下推荐系统扮演者越来越重要的角色。而在很多场景下人类决策的过程中，情感同样发挥非常重要的作用，因此，情感信息在推荐系统中不容忽视。而实际用户决策过程中，情感对于不同用户的重要程度也是不一样的。针对情感对于用户的重要程度研究，提出用熵来度量不同情感对于用户的重要性，并结合传统的协同过滤算法，提出一种结合情感信息的个性化推荐算法，最后，通过实验跟传统的协同过滤算法进行对比发现准确度有所提高。

个性化推荐协同过滤情感信息熵

0 引言

随着大数据时代的到来，“信息过载[1]”问题日益突出。面临着大量的信息，用户必须花费大量的时间寻找所需的信息，传统的信息查找方式越来越难以满足用户的需求。个性化推荐系统在20世纪90年代作为一个独立的概念被提出来，在其中发挥了重大的作用。个性化推荐是根据用户和项目的特征以及用户的历史行为来预测他对未知事物的喜好程度，然后向用户推荐用户可能感兴趣的。推荐算法通常被分为以下几类：协同过滤推荐算法[2]、基于内容的推荐算法[3]、混合推荐算法[4]。

其中协同过滤推荐算法是目前应用最广的推荐算法，而其又可以分为两类:基于用户的协同过滤算法[5]和基于项目的协同过滤算法[6]。基于用户的协同过滤算法通过研究用户的历史行为来计算用户之间的相似性，最后利用用户之间的相似性来做推荐，这个方法的思想是相似兴趣的用户购买行为也比较相似。基于商品的协同过滤算法则是通过商品的被购买记录来计算商品之间的相似性，以之来推推荐，其思想是用户往往会购买比较相关的商品。

近年来随着自然语言技术的快速发展，从文本中提取情感信息作为一个热点被越来越多的人所关注。推荐系统本质上也只是辅助用户决策的工具，如何在推荐系统中结合人类的情感分析逐渐受到关注。

1 相关工作

2010年, ACM Recsys’10（ACM Recommender Systems 2010）主办了一个面向“上下文感知的电影推荐”的专题研讨会，提出了3个方向的上下文感知推荐任务，基于情绪的推荐就是其中之一。Yue Shi[7]等提出基于特别情感的电影相似性计算方法，提高了预测精度。YasharMoshfeghi[8]等提出了一种从电影用户评论中抽取情感信息，然后结合电影的一些特征来计算各个特征影响用户偏好的概率的基于模型的协同过滤算法。

王立才[9]等提出结合情绪信息的改进的协同过滤算法，它运用“用户-情感”矩阵计算用户情感相似性，结合传统的相似性计算方法来做用户相似度计算，并作出推荐。

情感作为人类特有的心理特征，在用户决策中扮演着很重要的角色。在结合到推荐算法过程中，情感与随着web2.0到来而兴起的标签有着类似的一面，有学者通过标签将原来的用户-项目二部图转换为用户-项目-标签三部图来生成推荐，提高了算法性能，并一定程度上缓解了冷启动问题。在结合情感信息进行推荐时也可以利用转化为三部图的思想，但由于情感

与标签的差异性，计算的时候会有很大的区别。

本文通过“用户-情感”矩阵和“情感-情感”关联矩阵计算情感权重，通过“用户-项目”打分矩阵计算用户情感打分，通过信息熵[10]计算情感对于用户的重要性，得到用户对项目的情感评分预测，再结合传统的协同过滤算法得到最终的预测。

2 结合情感分析的个性化推荐算法

2.1 数据定义

2.2 算法描述

结合情感信息的个性化推荐算法核心算法如下:

(1) 基于“项目-情感”矩阵 M计算“情感-情感”关联矩阵S

(2) 根据“项目-情感矩阵”M和“情感-情感”S关联矩阵计算“情感权重-项目”矩阵W

(3) 根据“用户-项目”打分矩阵以及情感权重矩阵计算“用户-情感”打分矩阵

(4) 通过信息熵计算情感对于用户的重要性

(5) 综合以上的通过公式计算得到用户对项目的预测评分

(6) 将预测分值最高的N个推荐给用户

2.3 项目的情感权重计算

每一个项目都有相对应的一组情感特征，但每个情感特征对于项目的贡献确实不同的，为了体现不同情感对项目的权重差异，需要对项目情感进行建模。

项目情感矩阵M(包含n个项目和k个情感特征)，如果

用余弦相似度公式计算i情感和k情感的相似性如公式（1）：

根据项目情感矩阵 M 以及情感-情感关联矩阵 S 计算情感i在项目j中的权重为公式（2）：

2.4 用户情感评分

由于用户个体背景、性格等各方面的差异，每个用户对不同情感都有不同的偏好程度。由于每个项目包含各种情感，因此可以通过“用户-项目”打分矩阵来计算用户对应各个不同情感的评分。有一种简单的方法，通过用户对项目的打分间接得到对情感的打分，然后直接把用户对项目的打分作为用户对情感的打分，把用户对包含某情感的商品的评分的平均分数作为用户对该情感的打分。但此方法在应用的时候会发现一个问题。假设，用户U对一个包含情感i的项目j评分为90（该项目中情感权重为80％），用户U对另一个包含情感i的项目k评分也为90（该项目中情感权重为10％，按以上方法计算，这用户-项目打分对用户-情感打分的影响是一样的，直观上，此方法用在这里显然有点问题。需要加上一个权重因子度量用户对项目的打分对用户情感打分的影响度，公式(2)计算得到的W是一个很理想的因子，显然权重Wij越大，用户对项目j的打分对情感打分影响越大，反之越小，如公式（3）：表示用户U对项目j的打分，表示用户U打分的项目中包含情感e的集合，表示用户对情感i的打分。

2.5 基于情感信息的用户评分预测

根据以上的情感对项目的权重以及用户对情感的评分公式（4）：是根据(3)计算得到的用户u对情感i的评分，是根据(2)计算得到的情感i对于项目j的权重。

2.6 情感的信息熵由于每个项目都有一组情感特征，那么用户对项目的打分就可以映射到情感上去。同一个情感特征可能会在很多项目中出现，由上面的计算我们知道，不同的情感的项目的权重有差异，用户对情感的偏好也有差异。我们可以直接利用这些预测用户项目评分。但考虑到一个问题，以上用户对于情感的偏好是利用”用户-项目”计算而得的。如果用户对某个情感毫无偏好，那么该情感在该用于对项目评分的时候完全不发挥作用，观察公式(3)，会发现趋向于用户的平均评分值，导致(4)计算得到的预测值趋向于平均值，不能体现出用户对此情感的不在意性。相反的，如果某个情感对用户非常重要，对出现该情感的项目的评分都很高，而公式(4)也体现不出此重要性。由于个人的背景、性格、认知等方面的不同，不同的情感对于不同的个人重要程度是不一致的，在计算的时候，需要刻画出这种不一致性。

从信息论的角度看，熵代表系统的混乱程度，可以体现情感对于不同用户的重要性差异。基于以上的考虑公式（5）：

其中是用户u对包含情感e的项目打分为x的比例，Pui反应了打分的分布状况，越大，表明打分越混乱，那么情感的重要性就比较低，越小就表明打分一致性越高，那么相应情感的重要性就比较高。

2.7 改进的基于情感信息的用户评分预测

2.8 结合情感信息与传统协同过滤算法的用户评分预测

3 实验

本文的实验平台是PC(cpu 2.6GHz,内存2GB),windows 7操作系统(X86)。

3.1 数据集

本文采用公开的 Moviepilot数据集,是 2010年CAMRa2010提供的，包含105137个用户对25058部电影的4544409条评分，评分分数为0到100之间的整数。数据集中的项目都对应一组情感特征值，共有6712个情感标记，分布在16个维度上。最终经过数据清洗以及去噪后，筛选出共12562个用户对2315部电影的338607个打分数据作为实验的数据集。为了检验实验效果，本文跟传统的基于项目的协同过滤算法进行了对比。

3.2 评价指标

本文采用MAE（Mean Absolute Error）[11]作为评价指标，MAE表示预测值与实际评价值的偏差，MAE越小，评价越准确。设预测的评分集合表示为，对应的实际评分集合表示为，则为公式（7）：

3.3 实验结果分析

为了检验本文提出的结合情感信息的个性化推荐算法，本实验和传统基于项目的协同过滤算法进行了对比，其中计算项目之间的相关性时用的是Pearson相关系数，而邻居数目也调整到了最佳值。实验分为两部分，第一部分通过调节值，比较不同值得情况下本文提出的算法与传统的协同过滤算法 MAE方面的表现。第二部门，调整到最优值，通过调节训练集/测试集的比例，来测试两者在不同稀疏度情况下MAE的情况，如图1所示：

图1 左右的比重。

图2

可以发现随着训练集/测试集的比例的降低，即训练数据越来越少，结合情感信息的个性化推荐算法的效果相对比较稳定，而传统的协同过滤算法随着训练集的稀疏，到了一定的临界点后，效果急剧下降。这可能是因为，随着训练集数据的稀疏，经典的协同过滤算法在计算邻居时产生的偏差越来越大，从而导致推荐效果的下降。而本文提出的方法中，由于结合了情感信息，数据稀疏性带来的影响相对少很多。

4 总结

本文提出的结合情感信息的个性化推荐算法，通过“项目-情感”矩阵以及“情感-情感”关联矩阵计算项目中情感的权重，通过“用户-项目”打分矩阵计算“用户-情感”打分，然后再根据情感对于用户的信息熵来衡量情感对于不同用户的重要性，最后结合传统的协同过滤算法得到最条件。在Moviepilot数据集熵的实验结果表明，利用本文算法预测的评分效果优于传统的协同过滤算法。

[1] 蔺丰奇,刘益．网络化信息环境信息过载问题研究综述[J]．情报科学，2007:36-48.

[2] 马宏伟,张光卫，李鹏.协同过滤推荐算法综述[J]. 小型微型计算机系统2009,30(7):1282-1288.

[3] 刘建国,周涛,汪秉宏.个性化推荐系统的研究进展[J].自然科学进展,2009,19(1):1-15

[4] GediminasAdomavicius, Alexander Tuzhilin. Toward the nextgeneration of recommender systems: A survey ofthestate-of-the-art and possible extensions[J]. IEEE Transactions on Knowledge and Data Engineering,2005,17(6): 734-749.

[5] Wang J,DeVries A P, Reinders M J T.Unifying user-based and item-based collaborative filtering approaches by similarity fusion[C].//Proceeding of the 29th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval .New York:ACM,2006:501-508:

[6] Sarwar B,KarypisG,KonstanJ,et al. Item based collaborative filtering recommendation algorithms[C].//Proceeding of the 10th International Conference on World Wide Web.New York:ACM,2001:285-295.

[7] Yue Shi, Martha Larson, Alan Hanjalic. Mining mood-specific movie similarity with matrix factorization forcontext-aware recommendation[C].//Proceedings of the Workshop on Context-Aware Movie Recommendation at the 4th ACM Conference on Recommender Systems, New York, USA, 2010: 34-40.

[8] YasharMoshfeghi, Benjamin Piwowarski, Joemon M.Jose. Handling data sparsity in collaborative filteringusing emotion and semantic based features[C].//In Proceedings of the 34thinternational ACM SIGIR conferenceon Research and development in Information,Beijing, China, 2011: 625-634.

[9] Wang LC, Meng XW, Zhang. YJ, Shi YC. New approaches to mood-based hybrid collaborative filtering[C].//In Proceeding of the RecSys2010 Workshop on CAMRa 2010. New York: ACM Press, 2010.

[10] 王卫平,杨磊.结合最大熵模型和tag特征的混合推荐系统[J].计算机系统应用，2011,20(7):65-68.

[11] 刘建国, 周涛, 郭强, 等. 个性化推荐系统评价方法综述[J]. 复杂系统与复杂性科学, 2009, 6(3): 1-10.

A Personalized Recommendation Algorithm Based on Emotion Information

Xin Xianlong
(School of Computer Science, Fudan University, Shanghai 200120, China)

As the develop of the Internet, recommendation play a more and more important role in the face of “Information Overload”. In the course of human decision-making in many scenes, emotions play a very important role. So in recommender systems,emotion information can’t be ignored. Actually in the process of human decision-making, the importance of emotion for different users is very different. This paper focuses on the importance of emotion for different users, and presents a method that use tentrop to measure the importance of the emotion, then proposes a personalized recommendation Algorithm based on Mood Information. Experiments show the accuracy of this algorithm is higher than the traditional collaborative filter ingal gorithm.

Personalized Recommendation; Collaborative Filtering; Mood Information; Entropy

TP311

：A

1007-757X(2014)04-0038-03

2014.03.28)

辛贤龙，复旦大学计算机科学技术学院，硕士，研究方向：数据挖掘、推荐系统，上海，200120