韩新明(西南科技大学新闻系,四川 绵阳 621010)
微信自2011年1月21日推出后,以其接入便捷、即时性、草根性的特点迅速成为人们生活交流中的重要媒介[1-2]。截止到2017年9月底,微信使用用户达到9.02亿,日发消息380亿次,成为人们自我表达和获取信息的重要通道之一。微信用户在朋友圈的阅读和转发行为是微信平台信息传播的重要途径,用户已从传统意义上的信息接受者转化为信息的参与者,甚至可以说是信息生产者,微信平台上信息传播具有速度快、范围广的特点,传播效果明显超越了传统媒体[3-4]。因此研究微信朋友圈的信息传播十分必要。
近年来微信朋友圈的信息传播问题已成为学者关注的热点,主要集中在以下5个方面:
第一,微信信息传播基本理论研究。武冲对微信信息传播模式进行了研究,指出微信朋友圈信息传播具有高隐蔽性、传播链条易断以及娱乐性强的特点,它的应用实现了用户的自我表达和信息分享[5]。薛杨等基于沉浸理论的视角探究了用户关注行为和分享行为产生的动机,构建了微信营销环境下用户信息行为的理论模型[6]。王小立以复杂网络理论为基础建立Agent模型,提出信息本身价值、Agent节点之间制约作用以及意志气候制约等演化规则影响微信信息传播机制[7]。柯赟认为舆论信息传播具有小世界和无标度特性,以微信平台为基础进行实证分析,指出移动互联社交网的无标度特性使得信息传播存在蝴蝶效应,拥有众多关注度的微信号或公众平台上转发的信息更容易引起用户的广泛转发与分享,更容易形成社会舆论,在专业话题讨论中存在着小世界特征,传播路径短、传播速度快[8]。
第二,微信信息传播内容、影响因素研究。金晓玲等从信息内容中提取出影响微信朋友圈健康信息传播的相关因素,认为富含情绪性、有用性和有趣性对电子健康信息的传播行为影响最大[9]。赵大丽等基于理性行为理论构建微信朋友圈知识共享模型,认为用户知识共享态度影响其知识共享意愿,同时关系资本、结构资本和认知资本对用户的知识共享态度具有显著影响[10]。纪慧生等认为推送标题、推送内容、推送时机、数据化分析、二次转发者等是影响微信公众号信息传播效果的主要因素[11]。吴中堂等认为标题中关键词热度、导向性等是影响微信公众号信息传播的重要因素[12]。方婧等研究认为微信公众号文章热度与其主题、推送时间、标题特征有一定正相关性[13]。
第三,微信信息传播模型构建与仿真。李莉等以传染病模型为基础,建立基于微信的信息传播模型,考察了信息发布率、信息不关注率、重新关注率和讯息屏蔽率等因素对微信平台内信息传播的影响[14]。朱海涛等建立了改进SEIR信息传播的系统动力学模型并进行了仿真,分析了用户相似度、信息价值和信息出现频次等因素对微信信息传播的影响[15]。彭慧洁等提出用户接受阈值及关系动机对于微信信息传播速度与广度具有重要影响,微信用户更愿意接收并接受来自亲近好友所传播的信息[16]。王宏波基于微信朋友圈紧密度、免疫系数及策略改变机制等因素构建了基于SIR模型的微信朋友圈信息传播演化模型,并进行仿真模拟[17]。
第四,微信信息传播的案例研究。余张瑞睿等以大学生群体为研究对象,以深度访谈的方法探明不同的性别、年级以及专业对微信信息分享动机的影响[18]。付永升等以华中农业大学信息专业学生微信使用情况所构成的社会网络为案例进行分析,认为中心性、凝聚子群和整体网络密度对微信朋友圈信息传播特征具有重要影响[19]。
第五,信息传播影响力评价、障碍与对策。苏云等以天津港爆炸事件为例对双微信息传播数据进行分析,指出利益相关者对信息传播失真具有影响,从法律法规、政府管理、技术平台和信息伦理4个层面提出了双微信息传播失真的防范策略[20]。冀芳等认为微信公众平台在自身功能建设存在不足,信息内容存在隐患,舆情引导与监管尚不到位等问题,构建了涵盖公众平台、粉丝、传播内容与传播方式的微信公众平台传播效果评价体系,建议通过聚焦粉丝与传播方式,特别是关注粉丝的依赖性与传播互动性提升微信传播效果的策略[21]。
现有研究成果,为研究微信朋友圈的信息传播奠定了理论基础。目前的微信朋友圈信息传播模型构建中鲜见有针对用户行为分析的研究,本文从信息发布者、信息接受者、信息内容3个方面提取出5个特征对用户转发行为进行分析建模和仿真,对分析微信用户行为、揭示朋友圈信息传播规律具有理论意义和应用价值。
微信朋友圈这一半封闭的社交平台具有大众信息传播的功能,随着版本的升级,微信朋友圈信息传播功能不断完善,其媒介属性也在不断增强。由于微信朋友圈本身设计的特殊性,用户彼此之间发表的评论仅针对互为好友双方可见,在一定程度上限制了信息的自由流动,控制了信息的扩散速度,其信息传播的流动性和累积程度与微博相比相对较弱,一般不会形成跟微博一样的舆论事件。
在微信朋友圈信息传播的网络中,用户发表信息后,其微信好友通过朋友圈会以一定的概率看到该信息,如果好友对该信息有兴趣,就会转发,如果不感兴趣,转发行为就不会产生。进行转发的好友将成为信息发布者,使得信息在其朋友圈中传播,由此,信息沿着好友的关系一直传播扩散下去,直至转发行为的停止。
图1 微信朋友圈关系示意图
图1表示微信朋友圈的关系示意图,用节点1、2、3、4分别表示微信的4个用户,箭头方向表示好友关系。节点1与节点2、3、4互为好友,同时节点4也与节点2、3互为好友,在微信中,好友的关系是相互的,这就决定了信息在微信好友之间传播具有双向性。当节点1发表朋友圈后,其好友节点2、3、4同时看到信息,他们将根据实际情况决定是否转发,如果节点2或者节点3转发该信息,节点4会同样看到该信息,由于微信好友之间的这种复杂性,导致节点4最终转发的概率是其多次看到信息后所进行选择的结果。
目前国内外针对微信朋友圈转发行为的影响因素研究主要集中在用户特征、用户需求以及转发成本等3个方面。关于用户特征的研究,李照[22]研究认为微信用户群体具有“年轻、高学历”等特点,尽管使用微信朋友圈的男性用户数量多于女性,但分享意愿却弱于女性用户;李晨等[23]运用问卷调查方法,对微信朋友圈转发行为动机进行了实证分析,结果显示依赖习惯、普遍化趋势和便捷生活的需求是微信用户转发的重要因素;邓胜利等[24]利用五因素方法分析了微信用户的转发行为,得出外向型和开放性与社交媒体信息分享呈正相关,而尽责性与社交媒体信息分享呈负相关。关于用户需求研究,Sally M.Li等[25]通过研究信息分享行为的强大影响力等5类信息分享行为动机,指出扩展社会影响社交圈是主要转发动机;蔡剑等[26]从研究生用户群着手,利用马斯洛需要层次理论得出收藏动机、名誉声望、自身需求、利他动机、安全需求和社交动机是影响研究生信息分享行为的因素。关于转发成本研究,姜雪[27]认为成本对于信息分享有特殊意义,包括时间、金钱、个人隐私等成本;柳瑶等[28]指出安全性因素是影响自媒体用户生成内容的主要动机。这些成果对微信朋友圈转发行为的特征提取具有重要借鉴意义。
特征选取直接决定着模型的合理性。在已有研究基础上,本文认为微信朋友圈内信息的转发行为与信息发布者、信息接受者以及信息内容等因素相关,本文从这3个方面进行特征选取。
2.2.1 信息发布者
信息发布者的影响力采用PageRank方法进行评价[29]。该方法的优点是同时考虑了用户自身及其微信朋友圈关系两方面特征,能够更真实地评价信息发布者的影响力。信息发布者的影响力越高,信息接受者转发的概率越大,其发布的微信朋友圈信息相对来说更容易被转发。其计算公式如式(1):
(1)
其中:RU为信息发布者U的影响力;I(U)为信息发布者RU的好友集合;CV为信息发布者V的好友数量;d为阻尼系数,根据经验取0.85。
2.2.2 信息接受者
决定转发行为的信息接受者因素主要包括用户习惯、与信息发布者亲密度以及用户兴趣。首先,不同用户使用微信朋友圈的意图不同,有倾向于通过发表原创信息来表达个人的状态或者针对某些问题的观点,也有倾向于转发信息提高个人关注度的;其次,信息接受者与信息发布者之间沟通交流相对较多,表明他们之间的关系越亲密,那么他们之间发生转发的概率就会越高;第三,信息接受者与信息发布者之间兴趣爱好的差异也会导致转发行为的不同。因此,在表征信息接受者对转发行为影响时,采用转发活跃度、用户亲密度与兴趣相近度进行度量。
①转发活跃度Ar代表在一定时间t内,信息接受者转发信息的数量与发布原创信息数量的比值,计算公式如下:
(2)
其中:ri为信息接受者在i时间的转发信息的数量,pi为信息接受者在i时间发布的原创信息数量。
②用户亲密度C表示某一时间范围内信息发布者与信息接受者之间信息交往的频度,以转发和评论这两种行为占用户总行为的比值来衡量交互频度,体现了一方对于另一方的重要性。信息交往主要包括信息评论和信息转发,C可由式(3)得到:
(3)
其中:rUV为用户U转发V的微信信息次数,cUV为用户U评论V的微信信息次数,rU为该时间段内用户U转发微信信息的总次数,cU为该时间段内用户U评论微信信息的总次数。
③兴趣相近度可以通过用户之间内容整合的特征距离表示。微信朋友圈作为信息传播的平台,为用户开展信息传递和沟通带来了便利,以原创信息和转发信息为依据将与用户相关的信息进行整合,通过分词和特征值选取的方式建立向量矩阵F,采用VSM模型计算特征距离[30],计算方法如下:
(4)
(5)
通过公式(4)、(5)计算出特征距离后,采用特征距离对兴趣相近度进行表征,特征距离越大,用户之间微信朋友圈信息相似度越大,信息接受者转发的概率越大。微信朋友圈中好友之间的关系以熟人为主,人员组成相对稳定,虽然随着时间的变化用户的关注点发生改变,但是他们之间相似度相对稳定。因此,某一时间用户之间的相似度能够代表某一周期的状态。
2.2.3 信息内容
微信朋友圈用户的转发行为是用户结合自身的认知,对朋友圈信息进行选择和决策的过程,而不是一个简单的瞬息行为。因此,微信朋友圈用户在进行转发时是有选择的,在众多的信息中,仅有部分信息被转发,其影响力被进一步强化。微信朋友圈的信息内容在信息传播的过程中被大家熟知的比例越大,热议值越高,被转发的概率就越大。微信平台利用大数据的思维发布了微信指数。在微信指数中,微信平台为了方便查询在某一时间段内的某词汇的热度,对大量用户的搜索和浏览数据进行分析,形成了当日、7日、30日以及90日动态指数变化分析。本文采用微信指数中7日内“关键词”动态指数的平均值表征微信朋友圈信息热度。
在进行转发行为预测时,建立如下方程表征好友在看到信息后所采取的行为:
YUV=f(U,V,W)
(6)
其中:U为信息发布者,V为信息接受者,W为信息内容,YUV=1代表转发,YUV=0代表不转发。
微信朋友圈中信息的转发行为符合机器学习中的二分类问题的特点,用户的转发概率与影响转发的属性特征呈现出线性关系。因此本文在进行每个用户转发概率时,采用LR模型进行分类,进而沿着好友关系逐级进行计算并判断是否转发,最终确定转发规模。
结合微信朋友圈的特点得到转发的预测公式如下:
P=1/(1+e-ωCu)
(7)
其中:P为信息接受者V的转发概率,Cu为影响信息接受者转发行为的特征向量,ω为特征权值向量,代表每个特征对转发行为的影响程度,采用极大似然函数来求取每个特征的权重。
在微信朋友圈信息传播机制分析和预测方法建立的基础上,通过信息接受者转发概率表征个体的信息转发行为。构建一个微信朋友圈的关系网,用G(A,B)来表示,其中A是该网络中所有用户的集合,B是微信朋友圈中所有用户之间存在好友关系的集合。网络中用户节点的状态有3种:信息发布者、信息转发者和信息不转发者。网络中各用户节点的状态如图2所示。
图2 微信朋友圈各节点状态
在进行微信朋友圈中节点状态预测时,采用沿信息发布者好友路径逐级预测,判断信息接受者的转发行为,依次进行迭代直至不产生新的转发节点为止,统计转发节点规模,具体步骤如下:
第一步,基础参数准备。搜集微信朋友圈用户历史行为数据,根据行为特征,计算特征权值向量。
第二步,状态初始化。以信息发布者U为基础,建立微信朋友圈好友的关系网络模型,对网络中节点状态进行初始化。
第三步,预测阶段。计算当U发布微信朋友信息W后其每个好友进行转发的概率,设定转发阈值门限θ,θ∈[0,1],假设当P(FUi)≥θ时,转发行为发生,否则转发行为不发生。将新增的转发节点与A(N)合并,得到某一时刻的At(N)。
第四步,迭代阶段。以At(N)为初始值,进行用户的转发行为预测,将新增加的转发用户增加到At(N)中。在迭代过程中,如果遇到V节点从n个节点中获取信息,则可以得到V节点转发的概率为:
(8)
第五步,结束阶段。反复进行迭代,直到At(N)不变停止,得到最终的A(N)。计算集合中A(N)的转发节点个数,得到转发规模。
3.3.1 实验数据采集与处理
本文以西南科技大学某学院大三年级本科生为研究对象,对各行为的特征向量进行求解和仿真,验证模型的可靠性。采用问卷调查的方式调研了微信好友之间的关系矩阵,以“1”表示是微信好友,“0”表示不是微信好友。利用UCINET软件对150位同学构成的社交网络进行分析,计算出该网络的出入度标准化的平均值作为影响力的初始值,同时笔者添加了150名研究对象为好友,搜集研究对象的1个月的转发信息作为研究数据基础,共获取信息总量7 210条,平均每人发布或者转发信息47.1条,通过分析得到信息接受者转发活跃度、用户亲密度以及兴趣相近度的关系矩阵。本文将获取的数据分为两部分,前半个月作为训练数据集,用于建立预测模型,后半个月作为测试数据集,对模型的准确性进行验证。
3.3.2 转发行为预测分析
引入总体命中率Y来评价总体的预测效果,Y表示实际发生转发和非转发信息被预测准确的比例。其计算公式如下:
Y=(X1+X4)/(X1+X2+X3+X4)
(9)
式中X1表示实际转发预测正确的比例,X2表示实际转发预测错误的比例,X3表示实际非转发预测错误的比例,X4表示实际非转发预测正确的比例。
图3 总体命中率与转发阈值之间关系
在选取转发阈值θ时按照总体命中率Y最大化的原则,图3表示Y与θ之间的关系,从图3可以看出,转发阈值θ在0~1之间变化时,总体命中率Y呈现出先增大后减小的趋势,当转发阈值θ=0.60时,Y值最大为0.92,说明此时模型的预测精度最高。预测结果如表1所示。
表1 实际预测结果
3.3.3 传播效果预测分析
网络中信息传播规模增长速度呈现出先上升后下降,最终趋于0,转发的规模最终趋于稳定。由于转发信息数量规模呈现出幂律分布的特点,因此本文在评价时采用数量级来划分规模,划分的方法如下。
假设正整数a、b和m,满足a
(10)
在Sm区间的规模数属于同一数量级,如果预测的规模数Np和实际转发Nf的规模数为同一数量规模时,则式(11)成立。
|Np-Nf|<10「lgNf⎤-10⎣lgNf」)/2
(11)
其中:「⎤和⎣」为分表表示向上和向下取整。
然后对150名研究对象的3 000条转发量较大微信朋友圈信息进行了转发规模预测,预测准确率如图4所示。从图4可以看出,该预测模型对于不同用户的预测准确率基本都能达到0.80以上,总体准确率为0.89,能较好地预测转发规模。
图4 转发规模预测准确率
微信朋友圈信息传播效果研究对于舆论监控、信息发布以及热点搜集具有重要意义。本文分析了微信朋友圈的信息传播机制,从影响用户转发行为的信息发布者、信息接受者以及微信朋友圈信息内容三方面凝练出5个特征因素,基于LR算法建立了微信朋友圈转发模型的预测方法,提出了微信朋友圈信息转发规模的预测方法。
以西南科技大学某学院大三年级本科生为研究对象进行模型的验证,结果表明该方法对转发行为预测的准确率为0.92,传播规模预测的准确率为0.89,能够客观反映出用户转发行为对微信朋友圈信息传播的影响。后续将在本文基础上对微信朋友圈信息传播规律和传播路径的形成机理作进一步的研究。