基于关注者贡献量化的传播行为特征分析与影响力判断方法研究

2024-12-19 00:00:00黄昊晶陆飞曹德安
科技资讯 2024年23期
关键词:群体行为粉丝

摘要:"通过分析短视频网站的视频转发数据,提出一种用户个体影响力的判断和计算方法,进行了活跃用户群体的转发特征统计实验,对分析电商用户行为和社交舆情传播具有重要意义。结果表明,高影响力和低影响力个体的粉丝数和追随者数量几乎没有相关性;当影响力达到一定值时,粉丝和追随者的数量具有强相关性;高影响力的用户转发相同短视频的频率一般都比较低,其转发对象的分布律一般较高。与粉丝互动的频率因个人认证名人用户、企业、媒体机构和其他认证用户的需求而异;当短视频形成广泛传播趋势时,转发数量非常接近评论数量,甚至显著超过评论数量,而对评论的答复数量与个人影响力之间没有显著相关性。

关键词:个体影响力""群体行为""关注者"""粉丝"""传播行为特征

中图分类号:TP393.092

Research"on"the"Dissemination"Behavior"Characteristics"Analysis"and"Influence"Judgment"Methods"Based"on"Followers'"Contribution"Quantification

HUANG"Haojing""LU"Fei""CAO"De’an

Guangdong"Open"University(Guandong"Polytechnic"Institute),"School"of"Engineering"and"Technology"Guangzhou,"Guangdong"Province,"510091"China

Abstract:"By"analyzing"video"forwarding"data"from"short"video"websites,"this"paper"proposes"a"method"to"assess"and"calculate"the"individual"influence"of"users,"conductes"a"statistical"experiment"on"the"forwarding"characteristics"of"active"user"groups,"which"is"of"great"significance"for"analyzing"e-commerce"user"behavior"and"social"public"opinion"dissemination."The"results"reveal"that"there"is"virtually"no"correlation"between"the"number"of"fans"and"followers"of"individuals"with"high"or"low"influence;"When"the"influence"reaches"a"certain"threshold,"there"is"a"strong"correlation"between"the"number"of"fans"and"followers;"Users"with"high"influence"generally"exhibit"a"lower"frequency"of"forwarding"the"same"short"video,"yet"their"distribution"of"forwarding"targets"tends"to"be"more"diverse."The"frequency"of"interaction"with"fans"differs"based"on"the"needs"of"individual"verified"celebrity"users,"businesses,"media"organizations,"and"other"verified"entities."When"short"videos"form"a"trend"of"widespread"dissemination,"the"number"of"forwards"is"very"close"to"the"number"of"comments,"or"even"significantly"surpasses"it,"while"there"is"no"significant"correlation"between"the"number"of"replies"to"comments"and"personal"influence.

Key"Words:"Individual"influence;"Group"behavior;"Followers;"Fans;"Dissemination"behavior"characteristics

在短视频站点中,个体的影响力是个体之间互动产生的相互作用,也是一种个体能够影响其他个体,使之进行分享、转发和评论等传播行为的能力,是造成信息传播的先决条件之一。具有高影响力的真实用户个体,在短视频站点中对信息的传播有重要的推动作用,一般是信息传播的源节点或骨干转发节点。如果能准确地判断用户的影响力,就能预测信息的传播的方向、路径和范围,为社会舆论的传播预测、企业的精准营销策略、主题的传播范围等应用提供真实有效的数据和结论支持。对群体数据深入挖掘和统计分析,是获得个体兴趣爱好与行为规律的主要方法。本文面向短视频站点,对于关注与粉丝群体的数量、比例、转发、评论等数据进行实证分析,研究群体的传播行为和过程,总结出群体行为特征与个体影响力的关系,分析判断个体影响力的几个关键因素,提出了用户影响力判断方法,最后进行实验分析。

1""相关研究

国内外对网络个体影响力判断方法以及对社交信息传播的影响,进行了丰富而卓有成效的研究。王璿等人[1]提出,影响力最大化的研究,是在某种社交网络传播模型中,如何选取一组种子用户,使信息通过这些用户实现最大范围的传播。现有算法主要存在两个问题:一是由于影响范围有限,时间复杂度高,难以适用于大规模社交网络;二是仅局限于特定传播模型,只能解决单一类型社交网络下的影响力最大化问题,当使用在不同类型社交网络上时效果较差。刘小洋等人[2]提出了一种基于局部节点以及度折扣的社交网络节点影响力推荐系统,包括网络节点获取模块、计算筛选模块和扩散推荐模块,可以用于向节点进行产品推荐。刘鑫哲等人[3]提出了一个基于图表示学习的框架,可以解决竞争场景下的群体影响力识别问题。张海粟等人[4]融合拓扑势和因子图,提出影响力因子图模型,可以推断网络用户节点间影响力,并对每个节点分配不同影响参数。叶佳鑫等人[5]提出了一种基于影响力传播的社交网络群推荐方法,综合考虑个体兴趣与其受核心群体影响而产生的兴趣,从而进行社交网络群推荐服务。Mikolov"T等人[6]提出一种学习网络中节点隐藏表达式的算法,它通过随机行走模型获得网络中的节点序列,然后使用Word2Vec的思想将节点转换为低维向量并用于分类。杨杰等人[7]提出了一种融合覆盖范围和结构洞的影响力的最大化算法NCSH,解决了传统算法只考虑单一的网络中心性,没有综合考虑节点特性和网络拓扑结构的问题。Thakoor"S等人[8]使用对比学习的思想从图中随机删除边缘,以进行数据增强。毋东等人[9]提出了一种基于时间约束的影响力最大化方法。Pandit."S等人[10]提出了在给定邻居节点可以相互影响的网络中,把一条信息可以分布到k个节点,可以通过找到k个节点来最大化信息传播效果,并通过现有的传输模型来判断信息传输量。Jingxuan"L"I等人[11]提出了一种有利于提高信息传播量并且可扩展的多项式时间算法,其优点是它不明显依赖于任何类型的调谐参数,还提出了一种用于预测社交网站用户的基于连续时间马尔可夫过程的动态信息传输模型。

2""群体行为特征数据分析

通过分析短视频站点的用户群体数据后,本文对群体的具体行为数据进行研究和分析。研究内容包括:对发送和转发的短视频,评论、粉丝和关注的分布特征等内容进行数据统计,总结特征分布的原因和群体的行为规律。

2.1""关注与粉丝的比例

2.1.1"""群体行为分析

在短视频站点中,关注是节点获取其他节点信息的主要方法,当A节点关注节点B后,A增加了一个关注,而B增加了一个粉丝。因此,在节点数量不变的情况下,在整个短视频站点中,关注与粉丝的总数量是相等的。

节点的关注和粉丝的数量取决于节点自身的行为活跃度。可把用户根据活跃度和行为分为三类节点:传播源点,经常更新和发送短视频信息,较少关注或转发他人信息;传播节点,经常阅读关注传播源节点的信息,会转发其信息;传播终点,不管是否有阅读短视频,均不会转发信息的节点。短视频用户群体的行为也可以分为两种:在线浏览和发送短视频(转发、评论等)。

通过分析短视频站点用户关注数量和粉丝数量的分布发现,短视频用户的关注数量分布没有明显的规律。产生这种现象的原因是,短视频用户之间的关系是一种单向的兴趣链接,也就是说用户只要对其他用户有社会交往或浏览短视频等兴趣,就可以单向链接对方,而无须经过对方同意,也无须双方产生相互的兴趣。这种拓扑结构导致大量用户的关注数量小于粉丝数量,其关注数量分布在160~450范围内,关注分布近似服从幂律分布。用户的粉丝数量基本服从幂律分布,拥有大量粉丝的用户数量少,大部分用户的粉丝数量并不多;随着粉丝数量增加,用户数量呈下降趋势。

对用户行为特征研究后,发现用户观看短视频的在线时间越长,关注数量发生变化的概率越大。一般情况下,关注数量随在线时间呈上升趋势,但用户在线时间与粉丝数量的变化并没有明显的相关性。其次,如果用户经常在线发短视频,或者转发其他短视频;当节点关注的数量提高时,粉丝的数量也会发生相应的变化。因此,可以判断短视频的数量和质量与粉丝数量有强关联性。正常情况下,短视频数量大,内容质量高的用户,粉丝数量大。

2.1.2""四类个体行为分析

名人、媒体等高影响力账号的关注较少,而粉丝数量很大,这是短视频站点作为舆情传播媒体的重要特征,即高影响力节点引发信息传播。由于明星和媒体的粉丝数量远远大于关注数量,引发信息大面积传播的概率也大于一般的个人。这些用户账号的在线时间较长,发送、转发和评论短视频的数量多,一般粉丝数量远远大于关注数量。大部分用户账号在线时,主要以阅读关注者的短视频为主,活跃度低,较少发送和转发短视频,一般粉丝数量小于关注数量。目前,还有一种针对信息传播或提高帐号等级等行为而创建的账号,这类账号通常活跃度极低,只转发某些固定的广告或信息,关注数量和粉丝数量的差距非常大,如表1所示。

关注和粉丝的比例是判断一个用户的影响力的关键因素,可以把短视频的各种用户总结为四类,分别是活跃用户、普通用户、僵尸用户和虚假用户。一般来说,活跃用户包括获得个人认证的明星或普通人帐号、获得机构认证的媒体、企业帐号、短视频达人帐号等,他们经常发送或转发短视频,是引发信息大面积传播的传播源点,拥有庞大的粉丝数量和很少的关注数量,因此关注与粉丝的数量比值非常小,影响力很大。普通用户主要包括获得个人认证的用户账号、普通的短视频会员账号等,以浏览短视频或转发短视频为主,有较多的关注和较少的粉丝,其比值较大,是传播节点或传播终点,引发信息广泛传播的概率较小,影响力低。僵尸用户是指一些活跃度低,在线时间很少的认证或非认证用户账号,关注和粉丝数量都很少,其比值与活跃用户相似,很难引发信息传播,影响力很小。虚假用户以关注其他用户和转发各种广告信息为主要目的,因此粉丝数量很少,关注数量较大,其比值也大,无法引发信息传播,几乎没有影响力。

分析结果表明,影响力大和较小的用户,粉丝数量和关注数量之间几乎无相关性,影响力达到一定的数值时,粉丝数量和关注数量为强相关性。

2.1.3"""粉丝数量和质量

部分研究认为,粉丝数量大,影响力高,粉丝数量大的节点,容易在较短的时间达到信息传播的最大范围,个体的粉丝数量是判断个体影响力的一个重要因素,用户的粉丝越多,影响力越大。但是近年来,随着短视频营销的流行,越来越多的企业机构或个人利用信息传播销售产品或发送广告。网上出现了许多刷粉丝、购买粉丝的行为,导致短视频的虚假用户和被盗用的僵尸用户数量急剧增加。因此,单纯计算粉丝数量无法判断个体真实的影响力,还需要判断粉丝的类型和活跃度,只有符合影响力判断标准的粉丝数量才能成为计算的有效数据。

用户活跃度是反映用户参与社交活动的积极程度的指标,也是一种判断粉丝质量的方法。把用户在短视频站点中的活跃度定义为单位时间内用户发表的原创短视频数量、转发短视频数量或评论数量的和。有的用户经常发送短视频、与粉丝互动,有的用户只浏览别人的短视频,自己很少发送或评论。如果经常发送短视频或者评论别人的短视频,证明用户具备较强的信息传播能力,在网络的活跃度高。

2.1.4""转发对象分布与转发频率

转发行为是最直接的信息传播行为,用户阅读了感兴趣的短视频后,发送到自己的短视频页面中,也可同时提醒给其他用户查看。转发的对象是用户的关注者following的短视频,正常来说,用户会转发哪些关注者是没有规律的,其对象的分布是离散的。如果其对象分布相对集中,可能这部分关注者对用户产生了较大的影响力。对于虚假用户,通常呈现出转发分布高度集中的特点。

一般情况下,用户只会对感兴趣的短视频转发一次,不会多次转发同一条短视频。用户多次转发相同的短视频,极有可能是发送广告等商业营销行为。用户转发相同的短视频频率越高,其身份为虚假用户或僵尸用户的可能性越大。这类用户虽然也会传播信息,但大多是人为地传播某种广告,并不是用户自发的信息传播行为,会严重干扰预测正常的信息传播和舆论方向。

2.1.5""信息传播行为分析

当个体浏览关注者的短视频时,如果对这条短视频产生了兴趣相似性或观点一致性的意见时,用户可以对该短视频进行留言评论,或转发到自己的短视频主页。当自己的粉丝看到这条短视频时,也可能做出相同的行为,从而形成了短视频传播的过程,这种行为可以称为信息传播行为。当关注者看到粉丝的评论或留言,可以对评论进行回复,这就产生了社交互动。关注者和粉丝频繁互动有利于强化彼此的友谊以及相互的影响力。

如图1所示,在粉丝数量和活跃度较高,短视频内容质量高的前提下,用户发送短视频的数量越大,可能被陌生粉丝转发和评论的概率和数量越高。从理论上看,短视频数量与被转发的数量有成正比的规律。有趣的是,越是熟悉的人,产生转发的概率和数量却呈下降趋势。这与易成岐等人[12]的传播研究得出的结论一致,越是关系好和熟悉的人,越容易形成观点的封闭空间,转发对方的视频的概率和数量都很低。

如图2所示,明星账号拥有海量的粉丝,短视频更新速度快、数量大,每条短视频的都会产生大量的评论和转发,但明星很少会回复一般粉丝的留言和评论。因此,互动中的评论和回复,并没有明显的正比关系。相反,用户与自己熟悉了解的朋友或认识的人,产生互动的频率和概率远远高于陌生的粉丝,朋友之间的评论与回复数量几乎完全成正比。

3"个体影响力判断方法设计

通过对群体行为数据分析和研究,决定判断个体影响力的若干关键因素,设个体影响力判断方法如式(1)所示:

其中,设发送(含转发)和评论短视频的行为表示forwording,关注表示following,粉丝表示follower,N表示行为或节点的数量。因此fforwording表示转发(评论)相同短视频的频率,Nforwording表示发送(评论)短视频的数量,dforwording表示最近200次转发(评论)短视频的分布率,Nfollowing和Nfollower表示关注的数量和粉丝的数量,两者的商为关注节点与粉丝节点的比例。Ix表示x用户个体的影响力,Ʃy"follows"x"."Iay→x表示x的粉丝y对x的影响力贡献;(1-fforwording).Nforwording表示发送内容不同的短视频数量。对于个体x的粉丝y对x的影响力贡献表示Ʃy"follows"x"."Iay→x。部分研究者认为y的影响力是平均分配给每一个关注者的。但实际上,粉丝关注了许多朋友,并不是对所有朋友的关注程度都一致。短视频站点为用户提供了特别关注功能。该功能可以把用户希望经常关注的朋友进行分组,并提供快速阅读特别关注者的短视频等功能。设对每一个关注者的影响力贡献为一个数列,数列中的每一个数是对每一个关注者的影响力贡献项,如:{yn}="y1,"y2,"y3,"...,yn,...,n为关注者的数量。把该影响力贡献数列yn=f(n),当n趋向于无穷大时,对应的yn=f(n)会无限接近于某个确定的数值。根据对短视频站点用户影响力的研究和极限的定义,数列f(n)与常数k有下列关系:设k为个体的影响力值当对于任意小的给定的正数q,总存在正整数N,使得ngt;N时一切均成立,则可以证明影响力贡献数列收敛于k。因此,公式可以化为如式(2)所示:

4"实验分析

根据前面章节获取的短视频数据和总结的群体行为特点,对个体影响力判断计算,进行活跃用户属性与转发特点数据统计实验与分析。表2是统计了个体的基本属性和短视频转发的特点,对用户的影响力进行计算后获得的用户影响力排名。统计的个体均为活跃用户,基本属性包括短视频、粉丝和关注的数量;转发特点包括转发或评论其他用户的分布律,以及转发或评论相同短视频的频率。如表2所示,数据说明,高影响力的个体转发相同短视频频率的一般都比较低,其转发对象的分布律一般较高。这与高影响力的演员、歌手、CEO和传媒这些用户,都是信息的传播源点有关,他们较少关注其他用户,转发同一条短视频的可能性非常低;而转发他人短视频的行为只集中在少数熟人或朋友用户上,因此集中分布律较高。从用户的基本属性看,活跃用户的影响力与短视频和粉丝的数量有直接的关系,而关注数量通常较小,说明个体影响力与关注数量并无关联。

5""结论

根据短视频用户群体传播数据分析的结果,本文提出一种个体影响力判断及计算方法。该方法以粉丝和关注的数量、转发和评论的数量,转发分布律和粉丝对节点的影响力贡献为条件,通过影响力贡献数列计算粉丝对不同的关注者不同的影响力贡献。统计结果解释了社交网络的群体传播现象,总结了个体影响力与活跃用户自身属性、转发特点和粉丝行为的关系。本方法可以为社会舆论的传播预测、企业的精准营销策略、主题的传播范围等应用提供有效的个体影响力量化方法。但是,研究是从活跃个体的传播行为角度进行分析的,只能说明传播源节点自身影响力的部分规律,下一步还需要从传播群体的兴趣相似性和消息主题的重叠性方面做深入分析才能发现更多潜在的规律。

参考文献

    \t
  • 王璿,张瑜,周军锋,等.基于社交网络的影响力最大化算法[J].通信学报,2022,43(8):151-163.
  • \t
  • 刘小洋,吴松阳,李祥.基于局部节点以及度折扣的社交网络节点影响力推荐系统:CN112148989B[P].2021-08-24.
  • \t
  • 刘鑫哲,方勇,贾鹏,等.基于图表示学习的社交网络群体竞争影响力识别[J].四川大学学报(自然科学版),"2024,61(3):218-228.
  • \t
  • 张海粟,王龙,祁超.融合拓扑势与因子图的在线社交网用户影响力推断[J].小型微型计算机系统,2024,45(5):1157-1162.
  • \t
  • 叶佳鑫,熊回香,易明,等.融合影响力传(2021-02-12)"[2024-3-27]."https://arxiv.org/abs/2102.06514v1.
  • \t
  • 毋东,何楠群,张霄宏.一种带时间约束的影响力最大化方法[J].小型微型计算机系统,2022,43(9):1862-1868.
  • \t
  • "PANDIT"S,YANG"Y,CHAWLA"N"V.Maximizing"Information"Spread"through"Influence"Structures"in"Social"Networks[C]//IEEE"International"Conference"on"Data"Mining"Workshops.IEEE"Computer"Society,2012."
  • \t
  • "JINGXUAN"LI,PENG"WEI,TAO"LI,et"al.Social"network"user"influence"sense-making"and"dynamics"prediction[J]."Expert"Systems"with"Applications,2014,41(11):5115–5124.
  • \t
  • "易成岐,鲍媛媛,薛一波,姜京池.新浪微博的大规模信息传播规律研究[J].计算机科学与探索,2013,7(6):551-561.

猜你喜欢
群体行为粉丝
新生代大学生群体观念与群体行为特点的解读及其应对策略
群体行为识别深度学习方法研究综述
化工园区突发事件情景下的群体行为模拟演化研究*
基于因果分析的群体行为识别
应急疏散中的群体及其行为研究
科技资讯(2016年34期)2017-04-21 03:50:19
真我与偶像:新媒体语境下的明星与粉丝
今传媒(2016年9期)2016-10-15 22:12:01
群体行为驱动:流行语的社会心理分析
当代修辞学(2011年6期)2011-01-29 02:49:44