李 霞 李守伟
1(滨州医学院网络信息中心 山东 滨州 256603)2(江苏大学管理学院 江苏 镇江 212013)
一种基于社交网络舆论影响的推荐算法
李 霞1李守伟2
1(滨州医学院网络信息中心 山东 滨州 256603)2(江苏大学管理学院 江苏 镇江 212013)
社交网络中的朋友间信任度是影响用户决策的重要因素之一。基于社交网络的拓扑结构和相邻节点间的信任度,构建推荐模型,给出推荐算法,并进行理论分析和仿真模拟。研究结果显示,社交网络结构和信任度在社会交往的作用下会对用户的产品预期产生较大的影响。社交网络中单个产品的推荐者数量随时间呈S型曲线变化。推荐系统中产品推荐等级序列呈尾部截断的幂律分布。该研究不但分析了用户对产品预期的形成机理,而且推荐算法在一定程度上提高了推荐的效率。
社交网络 网络舆论 信任度 推荐算法
随着互联网和信息技术的发展,信息收集、网上购物和网络社交等活动已成为人们日常生活的重要组成部分。因此,人们在网络上的活动和互动不但为研究人员提供了研究的数据基础,而且也提出了新的技术需求。传统的“软科学”研究,如社会学、经济学等,依靠这些大量的新提供的数据集,在最近几年中有了快速的增长[1-2]。在过去的十年中,基于长期的经验与数据驱动的研究,物理学家在金融学[3]、网络理论[4]以及社会动力学[5]等方面展开了深入的研究。其中,推荐系统和信息过滤的研究已经引起众多学者的关注,初步取得了较为丰富的研究成果[6]。
在线交易和电子商务的成功很大程度上取决于产品推荐机制的有效设计。在众多电子商务系统中,用户面对数以百万计的可选产品。在如此巨大的产品空间中,搜索到用户满意产品的过程不但耗时,而且是不可控的,因此个性化推荐的技术需求应运而生[7]。随着社交网络技术和平台的蓬勃发展,大多数电子商务企业都建立了自己的社交网络,构建了社交化电子商务系统。在社交网络与电子商务系统的不断耦合发展过程中,社交网络在偏好相似性、推荐信任和社会关系的基础上不断演化成推荐者系统[22],可以为用户提供更加精准的个性化推荐。例如,亚马逊、Netflix、YouTube等网站的成功在很大程度上依赖其推荐者系统。
社交网络不但包含用户个体偏好、活跃度等信息,而且包含用户之间的链接以及链接上的互动行为。社交网络的无标度和小世界特征分别影响网络链接的异质性分布和信息扩散的路径与距离。同时,个体行为以及用户之间的互动,又使社交网络涌现出复杂的群体行为。社交网络的这些特征从用户个体、关系互动以及系统动力学等三个层次上为社交化电子商务系统的推荐算法设计提供了新的思路。
推荐系统的主要任务是依据用户喜好的历史数据,预测未来用户可能出现的喜好。通常,推荐系统是由用户、项目(产品或者服务)以及用户对于项目的评分等三个部分构成。每个用户对某些项目进行评分,以表明该项目的实用价值。由于每个用户只是体验了小部分的项目空间,推荐系统的目标是要为未体验用户推荐一组项目,使其在不久的将来可能购买它们,并且是满意的[8]。基于此框架下,各种推荐算法已被提出,主要有基于相关性的算法(如基于用户和基于项目的协同过滤[9-10])、频谱分析技术[11]和概率模型(如潜在语义模型[12],贝叶斯网络和Markov链模型[13]等)。
但是,在推荐系统的研究领域仍然有许多挑战性的研究工作[14]。其中,一个关键的问题就是如何理解用户对项目的评价机制。显然,这个评价机制受到多方面因素的影响,其中同侪压力是影响因素之一。社会互动与同龄人的决策在一定程度上给予个体相关建议,从而有利于个体的决策[15]。因此,身边人的看法是影响用户对项目评价的因素之一。本文提出一个基于社交网络舆论影响的用户对项目的预期模型,并在社交网络上构建推荐系统。
在日常生活中,人们的决策往往受到各种信息扩散渠道的影响,比如电视广告、社会交往等。假设市场上刚刚推出的一个新产品。在上市前后各种广告、营销措施等活动不断开展,以吸引顾客。这些活动影响着顾客对该产品的购买意向(或预期)。显然,这个购买预期可能是由多个方面组成的,包括产品的内在质量,也包括身边朋友圈的建议。Li等人研究发现,个人交流和非正式的信息交换不但影响着消费行为的决策,而且还塑造了用户对产品或服务的预期[22]。
社会个体成员及其社会联系构成了信息交换的社交网络,这个网络是社会关系网络的局域子网。对于各种不同的信息主题(如食品或电影),每个局域子网的相关特性(如聚集密度、连接强度、拓扑结构等)具有很大的不同。本文所研究的社交网络是对一般意义的网络进行建模,不局限于特定的网络结构,可以适用于随机网络、无标度网络和小世界网络。
初始预期是由除社会交往影响外的多个来源所形成的,如媒体广告、产品质量说明书或用户自身体验等,是用户对产品的一种看法或意见。在形成初始预期之后,用户才能与其邻接用户就评价对象展开讨论并交换意见,即意见交换的社会交往。
目标预期是在初始预期的基础上,受到社交网络舆论的影响而形成的。在社交网络的局部,一个用户与多个直接联系的邻接点发生社会交往,如果一部分邻接点已经体验了产品和服务,或者对产品有了明确的评价,那么这些社会交往将可能会改变这个用户对特定对象(产品或服务)的预期。进而,这个目标预期将影响用户对产品的决策(消费等)。
另外,在推荐技术与方法的研究中,朋友间的信任度也备受关注[16]。Sinha等(2001)的研究结果显示,与家庭成员相比,朋友会对人的行为和发展产生更深远的影响[17]。McKnight等(1996)研究发现,朋友间的信任关系对提高推荐系统的性能有非常重要的作用[18]。因此,在本文的推荐模型中,引入了邻接点之间的信任度γ。
对于用户j和产品i,aij表示用户j对产品i的初始预期值,则在一次社会交往后,用户j对产品i的预期值的变化满足公式:
(1)
从式(1)可以看出,信任水平γ与用户邻接点正负意见密切相关,影响着用户对产品的预期偏移。如果用户强烈地信任邻接点(γ→1),那么只需要少量的正负意见的差值(ρ→0),就能使用户对产品的预期有较大的偏移;反过来,如果社交网络中的信任水平较低(γ→0),那么需要较大的正负意见的差值(ρ→1),才能使用户对产品的预期有较大的偏移。γ与ρ之间的关系可以用图1中的等高线来表示。
图1 信任水平γ与网络舆论ρ对于用户预期偏移的影响
图1中等高线上的数字为用户在社会交往后的预期偏移大小,同一曲线上的不同点表明在ρ和γ的不同组合情况下得到相同的用户预期偏移。
2.1 推荐算法的构成
根据前面的分析,用户对产品的预期是在两个阶段上形成的:(1) 基于各种外部信息和自身体验,每个用户产生自己的初始预期;(2) 基于社交网络上的社会交往,在舆论的影响下,用户的目标预期在初始预期的基础上形成。
通常,推荐系统由用户建模模块、推荐对象建模模块以及推荐算法模块等三个部分构成。本文结合用户社交网络的特点,重点研究推荐算法。因此,基于社交网络的推荐算法包括四个部分:一是用户群体基于各种社交联系所形成的社交网络G=(N,E),其中N表示网络结点(即用户)的集合、E表示网络结点之间边(即联系)的集合。在社交网络上,还存在着结点之间的信任度,即朋友间的信任。二是产品集合。这些产品被用户购买,或者向用户推荐。三是用户对于产品的预期(即,评分)。在社交网络中部分用户体验过产品或者对产品有明确的评价,将对其他用户产生积极或消极的影响;用户的产品预期在其最近邻结点舆论的影响下发生偏移,将会形成目标预期。每种产品的预期值服从相同方差、不同均值的正态分布。四是临界阈值。临界阈值表示用户对产品推荐与否的分界线。阈值越小,说明产品的吸引力越高,也说明用户对产品的认同度越强。反之,阈值越大,说明产品的吸引力越小,也说明用户对产品的购买欲望越弱。虽然理论上每种产品的临界阈值时不同的,但是为了研究的方便,本文在推荐系统中采取同一个阈值。对于给定的阈值,如果用户的预期不小于阈值,则其认可该产品,意味着其对该产品的推荐。这个用户的状态就用A表示;如果用户的预期小于阈值,则其不认可该产品,意味着其对拒绝推荐该产品。这个用户的状态就用D表示。除A和D两类状态外,用户还有可能处于观望状态,无论其预期值是否大于或小于阈值,这类用户用S表示。在推荐系统中,用户的状态一旦变成A或者D,其状态在以后的社会交往中将不会发生改变。
在推荐算法中,用户与产品之间形成了多对多的对应关系,即一个用户可以同时推荐多个产品,一个产品也可以同时被多个用户所推荐。对于特定产品而言,依据临界阈值与用户对于产品预期评分的大小关系,系统决定用户的身份状态。对于特定用户来说,其对产品的预期评分由自身评价与邻接用户评价之和所决定。这个邻接用户的评价与社交网络的拓扑结构密切相关。同时,邻接用户评价的影响程度受到用户间的信任度制约。基于上面的分析,本文给出如下基于社交网络的推荐算法。
2.2 推荐算法的描述
假定社交网络拓扑变化的时间范围比舆论在网络上传播的时间范围更长,因此在本文中假设社交网络G=(N,E)具有固定的拓扑结构,网络中共有n个结点,每个结点对应一个单独的个体。取推荐对象集合为O,其中有m个产品;假定推荐系统的临界阈值为Δ。
算法1给出了这个社交网络舆论影响的系统动力学过程。其中概率λ和概率β分别表示用户在满足临界阈值的条件下自愿更新为状态A和D的可能性,它们模拟了真实推荐系统中用户心理因素的影响。产品的初始评价得分ai服从正态分布,模拟了客观世界中的真实情况。
算法1 (基于社交网络的推荐算法)
1: 给出网络参数:社交网络G=(N,E)(含有n个结点)、产品集O(含有m个对象)、阈值Δ、信任度γ、概率λ和概率β
2: For产品集O中的产品i
3: 生成分布ai∈N(μi,σ)
4:for用户j∈N
5: 生成产品评价aij∈ai
6:jstatus←S
7:ifaij≥Δthen以概率λ新状态:jstate←A
8: ifaij<Δthen以概率β更新状态:jstate←D
9: end for
10: repeat
11: for 具有状态S且kj>0的用户j
16:endfor
17:until|{j|jstate=Sandkj>0}|=0
18:Endfor
3.1 社交网络中推荐者状态演化的理论分析
下面对推荐者在社交网络中的分布情况进行逻辑推理。
根据结点状态的转换规则,由平均场理论[19],可以得到a(t)、d(t)和s(t)随时间变化的微分方程组:
(2)
因此对于初值a(0)=a0,有s0=1-a0,d0=0,从而由微分方程组(2)可以得到a(t)的解析解:
(3)
3.2 社交网络中推荐者演化的仿真实验
基于人际交往形成的社交网络是典型的小世界网络。小世界网络最早是由Watts和Strogatz于1998年提出的,他们将具有高集聚系数和低平均路径长度等特征的网络称为小世界网络。他们在环形规则网络的基础上,通过以一定的概率断开网络连接并随机连接到网络中的其他结点上的方法构造了小世界网络模型,一般就称作WS小世界网络模型[21]。小世界网络生成的方法有多种,其中WS模型是最典型的小世界网络。因此,本文采用Watts和Strogatz的小世界网络生成算法,构建小世界网络,用于个性化推荐算法的仿真。由Matlab和Ucinet软件可以得到小世界网络(如图2所示),其中网络结点数为N=1000,网络平均度为degree=6,断开重连概率为p=0.07。
图2 小世界网络图
与相同规模的环形规则网络(p=0)和随机网络(p=1)相比,从表1中可以看出WS小世界网络具有较高的集聚系数和较低的平均路径长度。
表1 规则网络、小世界网络与随机网络的对比
基于上述小世界网络,假设推荐系统的评价阈值为0.6,社交网络上朋友间的信任度为0.5,在S状态下转换成状态A的概率为λ=0.5,在S状态下转换成状态D的概率为μ=0.5。应用Matlab对推荐系统对单个产品的推荐进行仿真模拟,得到社交网络中推荐者数量的变化曲线,如图3所示,图中的横坐标表示遍历所有网络结点的步数,纵坐标为推荐者占全部网络结点的比例(即密度),图中曲线是S型曲线的拟合结果。从图3中可以看出,社交网络中推荐者数量的变化近似服从S型曲线,从而验证了理论分析部分的结果。
图3 推荐系统中推荐者密度的变化
3.3 推荐系统中产品等级的变化
在上述参数不变的情况下,假设推荐系统中产品的数量为300个。在推荐系统的演化过程中,各个产品被不同数量的推荐者所推荐,形成了不同推荐等级的产品排名(ProductRank)。ProductRank是由推荐者和产品之间的推荐关系所确定的产品等级,一个产品的推荐等级越高,说明对其进行推荐的用户也就越多。在双对数坐标的设置下,图4给出推荐系统中产品推荐等级排序情况,图中横坐标表示产品的推荐等级,纵坐标表示该推荐等级所对应的产品数量。
图4 产品推荐等级与产品规模关系图
从图4中可以看出,产品推荐等级近似服从尾部截断的幂律分布,表明大部分产品的推荐等级比较小,而少部分产品的推荐等级比较大。对于截断的尾部而言,这些产品不但数量少,而且还具有近似相同的推荐等级,就是推荐系统向用户所推荐的产品集合。
近年来,随着社交网络的迅猛发展,用户不再是单纯的内容接受者,而是能够主动地建立用户之间的关系。电子商务系统中的用户关系可以在一定程度上解决产品推荐系统所面临的数据稀疏性问题和冷启动问题。因此,本文可以作为推荐系统。
本文的研究是基于如下的观点:推荐系统中用户对产品的评价决策,不但受到产品自身和用户自身等因素的影响,而且受到来自朋友舆论的影响。研究发现,朋友对产品的积极或消极评价,将有助于提高或降低用户对产品的预期。
通过将用户对产品的预期分成两个部分,并引入朋友信任度和积极与消极意见的对比,本文构建了用户的产品预期模型。研究发现,在相同的预期偏移的情况下,信任度和正反意见对比呈相反方向的变化。但较大的信任度和正反意见对比,都将提高用户对产品的预期偏移。
基于推荐算法的理论和实验分析,本文发现,推荐系统中单个产品的推荐者数量随时间变化近似满足S型曲线。产品推荐等级近似服从尾部截断的幂律分布,这表明大部分产品的推荐等级比较小,而小部分产品的推荐等级较高。
本文的不足之处在于没有考虑用户对产品评价的权重,这将是下一步的研究工作之一。
[1] Watts D J. A twenty-first century science[J]. Nature, 2007, 445(7127): 489.
[2] Vespignani A. Predicting the Behavior of Techno-Social Systems[J]. Science, 2009, 325(5939): 425-428.
[3] Bouchaud J P, Potters M. Theory of Financial Risk and Derivative Pricing: From Statistical Physics to Risk Management[M]. Cambridge: Cambridge University Press, 2009.
[4] Newman M, Barabási A L, Watts D J. The Structure and Dynamics of Networks[M]. Princeton: Princeton University Press, 2006.
[5] Castellano C, Fortunato S, Loreto V. Statistical physics of social dynamics[J]. Reviews of Modern Physics, 2009, 81(2): 591-646.
[6] Ricci F, Rokach L, Shapira B, et al. Recommender Systems Handbook: A Complete Guide for Scientists and Practitioners[M]. New York: Springer-Verlag, 2011.
[7] 谭学清, 何珊. 音乐个性化推荐系统研究综述[J]. 现代图书情报技术, 2014(9):22-32.
[8] 曹高辉, 毛进. 基于协同标注的B2C电子商务个性化推荐系统研究[J]. 图书情报工作, 2008, 52(12): 126-128,38.
[9] Konstan J A, Miller B N, Maltz D, et al. GroupLens: Applying collaborative filtering to usenet news[J]. Communications of the ACM, 1997, 40(3):77-87.
[10] Sarwar B, Karypis G, Konstan J, et al. Item-Based collaborative filtering recommendation algorithms[C]//Proceedings of the 10th International Conference on World Wide Web. New York: ACM Press, 2001: 285-295.
[11] Maslov S, Zhang Y. Extracting hidden information from knowledge networks[J]. Physical Review Letters, 2001, 87(24): 248701.
[12] Hofmann T. Latent Semantic Models for Collaborative Filtering[J]. ACM Transactions on Information Systems, 2004, 22(1): 89-115.
[13] Shani G, Heckerman D, Brafman R I. An MDP-based recommender system[J]. The Journal of Machine Learning Research, 2005, 6: 1265-1295.
[14] Adomavicius G, Tuzhilin A. Toward the next generation of recommender systems: a survey of the state-of-the-art and possible extensions[J]. IEEE Transactions on Knowledge and Data Engineering, 2005, 17(6): 734-749.
[15] Kim Y A, Srivastava J. Impact of Social Influence in E-Commerce Decision Making[C]//Proceedings of the ninth International Conference on Electronic Commerce, 2007: 293-301.
[16] 谭学清,黄翠翠,罗琳. 社会化网络中信任推荐研究综述[J]. 现代图书情报技术, 2014(11): 10-16.
[17] Sinha R R, Swearingen K. Comparing Recommendations Made by Online Systems and Friends[C]//Proceedings of the Second DELOS Network of Excellence Workshop on Personalization and Recommender Systems in Digital Libraries, Dublin, 2001.
[18] McKnight D H, Chervany N L. The Meaning of Trust[R]. Technical Report MISRC 96-04, Management Information Systems Research Center, University of Minnesota, USA, 1996.
[19] Boudec J Y L, McDonald D, Mundinger J. A generic mean field convergence result for systems of interacting objects[C]//Proceedings of the 4th International Conference on Quantitative Evaluation of Systems (QEST’ 07), 2007: 3-18.
[20] Newman M E J. Spread of epidemic disease on networks[J]. Physical Review E, 2002, 66(1): 016128.
[21] Watts D J, Strogatz S H. Collective dynamics of ‘small-world’ networks[J]. Nature, 1998, 393 (6684): 440-442.
[22] Li Y M, Wu C T, Lai C Y. A social recommender mechanism for e-commerce: Combining similarity, trust, and relationship[J]. Decision Support Systems, 2013, 55(3): 740-752.
A RECOMMENDATION ALGORITHM BASED ON THE INFLUENCE OF SOCIAL NETWORK OPINIONS
Li Xia1Li Shouwei2
1(NetworkCenter,BinzhouMedicalUniversity,Binzhou256603,Shandong,China)2(SchoolofManagement,JiangsuUniversity,Zhenjiang212013,Jiangsu,China)
The trust among friends is an important factor that affects users making decision in social network.Based on the topology of social network and trust degree of neighbor node,the recommendation system is constructed in this paper,and the recommendation algorithm is also presented.Then,some theoretical analysis and simulations have also been made out.The results show that the topology and trust degree in social network will have a great impact on user’s anticipation for product during the process of social communication.The mount of recommender for single product in social network varies with time by following S-curve and the rank of recommended products obeys the power-law distribution with cut-off tail.This research not only analyzes the forming mechanism of user’s anticipate,but also to some extent enhances the efficiency of recommendation by using the recommendation algorithm.
Social network Network opinion Trust degree Recommendation algorithm
2015-10-09。山东省科技发展计划项目(2013YD08 003)。李霞,实验师,主研领域:复杂网络与推荐系统。李守伟,教授。
TP391.3
A
10.3969/j.issn.1000-386x.2017.01.050