张继东 段小萌
[摘要]随着现代网络的发展,登录移动社交平台已经成为大多数人每天的日常,和亲人朋友在社交平台上的交流远远多于面对面的交谈,学习工作上的事情也大多可以用社交软件完成,在这样的大前提下,移动社交平台用户之间的信任关系必然要成为关注的重点。用户信任度可以用来详细检查用户之间所有可能的社交网络关系,本文以新浪微博为例提供了一种计算用户之间信任的方法,通过对用户之间的信任进行分析完成相应的推荐和其他服务。
[关键词]移动社交网络;社交平台;用户信任度;推荐系统
1研究背景
CNNIC(中国互联网络信息中心)2016年研究报告数据显示,2016年6月,网民中即时通信用户规模达到36.42亿,相比于2015年底增长1769万,占网民总体的90.4%;其中使用移动社交app来进行即时通信的用户有6.03亿,相比于2015年底增长4627万,占手机网民的91.9%。移动社交app成为移动网民上网的主要习惯之一。
最初,社交网络基于互联网,许多人将它作为和他们的家人,朋友和同事沟通的工具。后来,由于手机的广泛使用,更加成熟的移动社交平台的出现和发展,社交网络从基于网络的应用程序扩展到更广泛的移动社交平台。随着移动无线网络的逐步便捷,我们的生活中慢慢离不开移动网络,同时将更多的时间用在移动社交上,我们每个人都是移动社交网络的组成部分。我们通过移动社交网络来与朋友交谈,通讯,在维持正常的社交关系的同时发展新的社交关系。最初的推荐系统多用于确定用户需要哪方面的产品或服务从而进行个性化的推送,应用于社交网络中的则是一种特殊类型的推荐系统。
大数据时代,数据在网络中以高速动态变化,移动社交网络更是充满了复杂性和不确定性,我们需要建立有效的方式来控制用户的行为和选择交互策略,以使移动社交网络保持在稳定和可信任的状态。现在的大趋势是移动社交平台的多元化,它不仅仅作为一个单纯的社交平台,更可以是小型浏览器,甚至和电子商务相结合作为支付工具存在,除了支付宝以外很多手机网民同时使用微信支付,QQ钱包及百度钱包等在线支付工具。当一个软件拥有如此繁杂的功能和大量用户信息的时候,用户之间的信任和用户的隐私安全便显得尤为重要。
2基于移动社交平台和用户信任度的相关工作
2.1移动社交网络的实质
移动社交网络的本质是以移动终端设备为基础给用户提供一个在人群中分享兴趣、爱好、状态和活动等信息的在线平台,它包括传统社交网络、图片社交、私密社交,基于位置社交以及存在与社交网络中的商业模式。移动社交网络是社交网络的组成部分,社交网络是通过各种移动终端和固定终端的用户组成的,随着智能手机、平板电脑等移动终端设备的更加普及,移动社交网络的发展速度将大步提升。与固定终端相比,移动终端具有更好的便携性,可以随时随地和朋友共享状态和心情,移动社交网络可以更好地满足人们对社交关系的需求,但这并不代表固定终端社交网络会因此没落,两者依旧是相辅相成的,固定终端具有很多移动终端无法完成的功能。
移动社交网络的现状大多是以现实人际关系为基础进行扩展的社交关系网,20世纪60年代,美国哈佛大学心理学教授米尔格兰姆(stanley Milgram)通过实验提出了六度空间理论,他认为世界上任意两个人之间建立联系,最多只需要六个人。这是一个小世界现象,任何两个素不相识的人,通过一定的方式必然存在着某种联系。这也是我们社交网络的实质,通过合适的算法和推荐机制,移动社交平台可以智能的为用户找到与其志趣相符的人,用户可能感兴趣的商品、话题等。
2.2国内移动社交平台的现状和分析
CNNIC将国内移动社交软件主要分为6大类:即时通信工具、综合社交应用、图片,视频社交应用、社区社交应用、婚恋,交友社区应用和职场社交应用。其中即时通信工具的使用率最大,占手机网民的90.7%。超高的市场占有率也说明了即时通信工具在我们生活中的必要性,而即时通信工具中市场占有率最高的两个软件分别是QQ和微信,他们除了即时通讯的功能以外都具有向好友展示状态、图片或视频的平台,QQ的QQ空间和微信的朋友圈,这都占据了很大一部分流量。在QQ空间和朋友圈中,用户可以进行点赞评论或者转发分享等互动,这是一个不能被忽视的平台。
在综合类移动社交软件中,新浪微博占据了很大一片市场。网民使用移动社交软件的主要目的有与朋友互动、了解热点新闻、关注感兴趣的内容、获取帮助和分享知识,调查表明73.9%的用户通过新浪微博关注熱点新闻和话题,因为微博内容编辑的简单性和网络传播的高效性,这样的数据并不使人意外,很多热点新闻在媒体报道之前微博上就已经有了详细的经过,这意味着新浪微博已经成为一个大众舆论平台,是人们当下了解时事热点的主要渠道之一。
大多数社交平台的切入点都是熟人和商务交流,这样的社交方式可以称为强社交,是高强度和高黏性的代表,随着用户的积累和移动网络的普及,移动社交平台的发展趋势是要从强社交到大社交的逐步转换,大社交包括用户社交的多元化,仅仅通讯已经无法满足用户的需求,语音和视频通话,微视频交流甚至是直播的方式也越来越多地出现在我们的生活中,这也将慢慢成为一种互动的方式,社交方式的多样化也会成为移动社交平台的发展趋势。
2.3社交网络中用户之间的信任
网络可以定义为一组节点通过各种链路互相链接,网络的建成目的之一都是交换,它们具有不同的拓扑结构。社交网络可以定义为一组用户通过不同的关系相互联系,用户之间可能的关系有相识、熟悉、信赖甚至厌恶等。信任,只是一种关系,然而却有极大的价值,也可以说它是一种资产。人际信任的经验是由个人价值观、态度、心情及情绪、个人魅力交互作用的结果,是一组心理活动的产物。网络信任一词在20世纪被提出,对于它有很多不同的定义。鲁兴虎教授将网络信任归纳总结后分为以下三种:基于电子商务活动中网站和用户之间的信赖关系,技术上的“信任体系”和网络人际交流过程中的信任关系,即为本文研究的移动社交平台用户之间的网络信任。endprint
在本文中,我们将信任定义为用户能够依靠他的朋友在社交网络中的推荐。在研究社交网络中的信任时,我们面对两个最重要的问题,一是如何在社交网络中识别出谁是用户可以信任的朋友;二是如何计算没有直接连接的社交网络用户之间的信任。本文将主要关注前一个问题——如何衡量用户和他朋友之间的信任以及如何计算用户之间的信任关系。
2.4在社交网络中对用户的隐私保护
隐私权指自然人的私人信息秘密依法受到保护,不被他人非法侵扰、知悉、收集、利用和公开的一种人格权,而且权利主体对他人在何种程度上可以介入自己的私生活,对自己是否向他人公开隐私以及公开的范围和程度等具有决定权。
互联网的便捷使得我们的很多信息在网站和软件的数据库里都有存档,比如搜索和消费信息,大多数我们常用的软件都包含很多的个人信息。在线社交网络的普及增加了用户的可视性配置文件和用户与其他用户之间的交互,作为拥有大量用户和大量用户信息的在线社交网络,一定要确保用户隐私的安全性,用户需要可以自主的选择是否在社交网络内分享个人信息。移动社交网络中的隐私保护涉及收集个人数据,使用用户身份连接数据,使用数据,存储数据,转发数据和知晓用户所在位置的权利。
在本文中,我们需要根据用户和用户的朋友之间的联系来计算他们之间的信任度,在计算的过程中涉及很多用户隐私的方面,在后台计算的同时,要注意不能泄露用户的资料,保证用户的网络隐私权。
3社交网络中的通用信任模型
当我们尝试在一个基于移动网络的主流SNS(社交网络服务)平台上建立一套社交推荐系统时,我们需要关注如何定义具有变化离散值的社交网络成员,如在移动社交网络中的两个用户是否为可信任的朋友以及他们之间连接价值的权值。这种分析转化可以基于以下两点:①目标用户与其他用户之间的相似性,可以根据过往的浏览记录,购买记录甚至地理位置分析计算得到相应数据,②在社交活动中,目标用户与其他用户之间的社交活跃度,可以通过用户之间的聊天次数频率、共同参与的群聊和在公共平台(如朋友圈,QQ空间等)上的互动情况分析得来。
如图1所示,用户A、用户B、用户c等代表的是社交网络中的一个独立用户,而目标用户则是我们的研究对象。他们之间的连接线抽象的表示用户在社交网络中发生的社交行为,如聊天、留言和点赞等,但是在图l的模型中,每个连线的宽度和所表示的意义都是相同的,在实际交往中,每个关系的社交程度不尽相同,所以我们需要用某种方式表现出用户之间社交的差异性。如图2所示。
图1和图2在基本模型上区别不大,但是用户和用户之间存在着宽度不同的社交连接线。因为在社交网络中,用户间社交的次数和程度都不一样,我们通过对用户之间的社交进行分析和转换,用连接线的宽度来近似地表示用户之间社交的差异性,如用户D和目标用户之间的社交强度明显大于用户B和目标用户之间的社交强度。这样的模型可以适用于大多数的社交网络,它不仅可以表示拥有直接社交关系的两个用户之间的关系,还可以表示用户之间的间接社交,如用户A和用户c并不存在直接的社交行为,但是他们通过用户B和目标用户存在着间接的社交关系,所以它可以在实际应用中作为一个社交通用模型使用。
在图2中用户之间关联的权重以连线的宽度抽象表示。Podobnik,V和Lovrek,I提出了一个分析客户档案和过去行为进行客户匹配的机制,同时创建客户社交网络以促进组织客户关系管理,他们所创建的机制就是基于第一种方法,即用户之间的相似性,模拟创建隐式社交网络,以相似性来定义用户之间的连接级别。在本文中我们将着重于第二种方法,并展示出如何利用用户在社交活动中的行为计算社交网络中两个朋友之间的信任级别。
笔者將社交活动定义为在移动社交网络中两个直接连接的用户之间的社交交互行为,例如在同一张照片上有两个朋友的共同标记。现在我们将P(User x)定义为在某一段时间内与用户x在相同照片上有标记的朋友的列表,P(User x)中元素是两个对应的数据(User y,A),A是指用户x与用户y标记在相同照片上的次数,也就是此时的互动次数。例如,一个列表P(User x)可以定义为:
P(User x)={(User a,3),(uscr b,5),(uset c,2)}(1)
公式(1)表示用户x与用户a共同标记了3张合影,与用户b共同标记了5张合影,与用户c共同标记了2张合影。我们定义P(User x,User y)为用户x和用户y在社交网络中的合影标签,如公式(1)中P(User x,User a)=3,用户x和用户a的合影标签为3。
移动社交平台除了发布照片以外还支持多种不同类型的社交活动,为了计算社交网络中两个直连的用户之间完成的信任度,必须全面考虑在社交网络中用户可以参与的所有社交活动。因此,把用户x的各种社交活动的描述归纳为一个社交活动集,它是列表的集合,其中每个列表描述不同的社交活动,所有列表都被定义为类似P(User x)的形式。
3.1以微博为例计算用户信任度
作者以微博为例,详细说明通过信息的采集再用一系列算法计算出用户之间的信任级别,最后将用户之间的新人级别应用到实际社交之中的过程。在数据采集的过程中包括用户个人行为和用户朋友的行为数据,这些数据包括在一定时间内:
1)用户的呢称和账号登录信息
2)用户的好友列表(此时只考虑互相关注的情况)
3)相互评论微博情况
4)相互回复评论情况
5)相互点赞情况
6)相互@提醒查看情况
7)私信聊天情况
8)相互转发微博情况
9)所发微博含有同样合影的情况
10)在同一位置发微博
以上的信息基本概括了在微博里两个用户之间所有可能的社交行为,通过对以上信息的分析,我们可以比较全面的计算出两个用户之间的社交活跃度。但是以上信息在计算中所占的比重是不一样的,例如评论要比点赞更重要,对每项互动所占的权重考虑很重要。每个用户在对微博的使用上都有很大的差异,一些用户把微博作为一个记录生活的平台,乐于发照片和状态,一些用户虽然很少发微博但是经常浏览评论朋友的微博并通过私信与他们交流,这都是计算社交活跃度中很重要的部分。endprint