高校BBS活跃用户信息行为分析

2011-05-17 02:49罗泰晔
现代情报 2011年1期

罗泰晔

〔摘 要〕高校BBS中的活跃用户发帖量大,而且都积极回复他人的帖子。根据所发主题帖数和获得回帖数的不同,可将活跃用户分为领袖型、实力型、热情型和回应型4类。活跃用户的点入度和点出度呈显著正相关关系,活跃用户的回帖数和获回复数显著正相关,活跃用户所发主题帖数与他们回复的主题帖数也显著正相关。

〔关键词〕高校BBS;活跃用户;信息行为

DOI:10.3969/j.issn.1008-0821.20.01.038

〔中图分类号〕G253 〔文献标识码〕A 〔文章编号〕1008-0821(20)01-0150-03

Analysis of Information Behavior of Active Users in University BBSLou Taiye

(Xinhua College,Sun Yat-sen University,Guangzhou 510520,China)

〔Abstract〕Active users in university BBS submit many posts and reply other posts positively.They can be classified as four types according to the number of topic posts they submit and the replies they get:leading members,powerful members,enthusiastic members and responding members.It is found that the in-degree of active users is positively correlated with their out-degree.The number of their replies is positively correlated with the number of replies that they gain.And the number of topic posts they submit is positively correlated with the number of topic posts they reply.

〔Keywords〕university BBS;active users;information behavior

高校BBS是大学生议论社会热点问题、表达意见的首选场所,具有讨论内容广泛、传播速度高效等特点,对大学生的价值观念和行为有着重要影响。活跃用户是高校BBS中的主要用户,是高校信息传播的主要力量。本文以国内一个高校BBS中“今日世界”版2008年4月至6月的数据为例,对高校BBS中的活跃用户的信息行为进行分析。

1 活跃用户

1.1 活跃用户定义

借鉴布拉德福定律[1]的划分方法,我们根据发帖量的大小将用户进行降序排列并划分到3个区域,使得每个区域中用户的发帖总量大致相当。具体划分情况如下列3个表所示。表1 “今日世界”版4月的用户划分情况

区域用户数(ID量)发帖总量第一区83 394第二区243 335第三区5633 151

表2 “今日世界”版5月的用户划分情况

区域用户数(ID量)发帖总量第一区83 177第二区323 061第三区6003 016

表3 “今日世界”版6月的用户划分情况

区域用户数(ID量)发帖总量第一区83 931第二区303 763第三区6813 706从以上3个表中可以看出,发帖用户分布符合“关键的少数,次要的多数”原则,即前两个区的用户只占用户总数的6%左右,但他们的发帖量却占到了发帖总量的2/3左右。根据发帖情况,高校BBS用户可分为活跃用户和不活跃用户两类[2]。因此,本文将前两个区的用户定义为活跃用户。

1.2 活跃用户的特点

高校BBS用户的信息行为以发帖为主,发帖包括发主题帖和回帖。分析发现活跃用户的发帖行为有2个明显的特点(以4月的数据为例):

1.2.1 发帖量大

表4反映了今日世界版4月活跃用户的发帖情况,平均发帖量超过了200个。表4 今日世界版4月活跃用户发帖概况

活跃用户人数平均发帖量发帖量最大值发帖量最小值32212.166179

1.2.2 回帖量大

活跃用户都积极回复其他用户发的帖子。表5是今日世界版4月活跃用户的回帖情况:表5 今日世界版4月活跃用户回帖情况

活跃用户人数平均回帖量最大回帖量最小回帖量32195.164878

20年1月第31卷第1期高校BBS活跃用户信息行为分析Jan.,20Vol.2 活跃用户聚类

由于发帖量大,回复别人的帖子积极,活跃用户对所在版面的贡献是最大的。但不同的活跃用户起到的作用又有所不同,他们的影响力也有差别。因此,我们有必要对活跃用户进行分类,以分清不同类别活跃用户的作用。本节以今日世界版4月的数据为例进行分析。

数据分析发现,不同活跃用户在所发主题帖数量上的显著差异。例如,用户jasons发主题帖最多,达到了105个;而cuirubber 和supercamel没发一个主题帖。

活跃用户虽然都积极回复他人的帖子,但自己所发帖子获得的回复数量却有很大不同。例如,用户Xiaopeng获得了658个回帖,而用户cuirubber和supercamel未获一个回帖。

因此可以采用所发主题帖数和所获回帖数为指标对活跃用户进行聚类分析[3]。聚类结果如表6:表6 聚类结果

Cluster1234ValidMissing5.0001.00024.0002.00032.000104.000

从表6可以看出,按照以上2个指标,可将活跃用户分为4类。其中第一类5人,第二类1人,第三类24人,第四类2人。最后聚类得到的各类的中心如下表:表7 最后各类的中心

指标Cluster1234主题帖数13.60131.004.7188.50获回帖数200032606

根据这4类用户2个指标的特点,我们把这4类用户分别命名为:实力型(上表中的Cluster 1)、热情型(Cluster 2)、回应型(Cluster 3)和领袖型(Cluster 4)。

实力型的活跃用户所发主题帖数少,但获得的回帖数多。

热情型的活跃用户所发主题帖数大,获得的回帖数少。

回应型的活跃用户所发主题帖数少,获得的回帖数也少,但他们总是积极地回复别人的帖子。

领袖型的活跃用户所发主题帖数大,获得的回帖数多,即他们所发的主题帖引起了其他用户的广泛关注和热烈讨论。

具体分类如下表:表8 今日世界版4月活跃用户分类

类别用户ID实力型owyo,OZ,anymore,hdg,Wings热情型liangges回应型Poem,vtlOO,chenting,whomi,plarq,huxlic,leilong,generalys,cuirubber,Employee,acryan,supercamel,wazzit,linki,dreamsnow,Sarasate,bluevelvet,diib,Rayease,firedragon,xiuson,esselee,caleb,seaflows领袖型Xiaopeng,jasons3 活跃用户与版内用户交互情况分析

3.1 交互情况的相关分析

一些学者在对BBS用户的交互情况进行研究时,借助图论的思想,把用户作为节点,把用户间的回帖关系作为边,从而构建起一个图结构,这个图结构也被称为BBS的互动网络。点入度(in-degree)和点出度(out-degree)是学者们在对BBS或网络社区的用户的交互网络进行研究时经常使用的两个指标。一个节点的点入度反映的是该节点所代表的用户获得了多少用户的回复,而点出度则反映该用户回复了多少别的用户[4-5]。

本节利用今日世界版4~6月3个月活跃用户的数据为样本来分析活跃用户与该版中用户的互动情况。4~6月3个月的活跃用户共0个,其点入度和点出度情况如表9。表9 0个活跃用户样本点入度和点出度描述性分析

指标总数最小值最大值平均值标准差点入度0014822.9127.682点出度017629.2915.733

为探索活跃用户点入度和点出度间的关系,我们对这0个样本的点入度和点出度进行相关分析。相关分析的结果如下表:表10 点入度与点出度相关分析

指标用户点入度点出度点入度Pearson Correlation10.328(┆唱常㏒ig.(2-tailed)0.000 N00点出度Pearson Correlation0.328(┆唱常1Sig.(2-tailed)0.000N00

从表10可以看出,显著性概率Sig=0.000<0.01,点入度与点出度呈显著的正相关关系。因此,总的看来,活跃用户的点出度增加时,点入度也相应地有所增加。

在BBS用户的实际交互过程中,两个用户之间可能发生多次交流,即一个用户可能多次回复同一个别的用户,也可能多次获得同一个其他用户的回复。而在对点入度与点出度进行统计和分析时,并不能反映这样的情况,所以我们有必要对活跃用户的回帖数和获得的回帖数的关系进行分析。这0个活跃用户样本的回帖数和获回帖数的情况如表所示。表 0个活跃用户样本的回帖数和获回帖数情况

指标总数最小值最大值平均值标准差获回帖数0066087.43131.058回帖数030689171.47149.929

对回帖数和获回帖数进行相关分析,结果如表12:表12 回帖数与获回帖数相关分析

指标用户获回帖数回帖数获回帖数Pearson Correlation10.270(┆唱常㏒ig.(2-tailed)0.004N00回帖数Pearson Correlation0.270(┆唱常1Sig.(2-tailed)0.004N00

从表12可以看出,显著性概率Sig=0.004<0.01,获回帖数与回帖数呈显著正相关关系。因此,总的看来,活跃用户的回帖数增加时,获得的回帖数也相应有所增加。

一般说来,一个用户发了主题帖后总希望能够得到他人的回复,自然他也了解其他主题帖作者的这种愿望,因此这个用户很可能会去回复他人的主题帖。下面就活跃用户所发主题帖数与回复的主题帖数做相关分析,在计算回复的主题帖数时,重复多次回复同一个主题帖只计1。相关分析的结果如表13所示。表13 所发主题帖数与回复主题帖数相关分析

指标用户所发主题帖数回复主题帖数所发主题

帖数Pearson Correlation10.263(┆唱常㏒ig.(2-tailed)0.006 N00主题帖数Pearson Correlation0.263(┆唱常1Sig.(2-tailed)0.006N00

从表13可以看出,显著性概率Sig=0.006<0.01,所发主题帖数与回复主题帖数呈显著正相关关系。也就是说,总的来看,活跃用户所发的主题帖数增加时,他回复别人的主题帖的数量也有所增加。

3.2 领袖型活跃用户的作用

领袖型活跃用户在BBS信息传播和交流中的作用反映为有领袖型活跃用户参与的主题帖的讨论变得更加热烈[6]。这里我们以今日世界版4月的数据为例进行说明。通过第2节的分析我们知道用户jasons和Xiaopeng是领袖型活跃用户。经过分析发现,jasons参加了9个主题帖的讨论,这9个主题帖平均每个获得回帖31.4个,平均每个主题帖有个用户参与讨论。Xiaopeng参加了159个主题帖的讨论,这159个主题帖平均每个获得回帖33.4个,平均每个主题帖有13.2个用户参与。而整个版面该月所有主题帖平均获得回帖15个,平均每个主题帖有6.4个用户参与讨论。由此可见领袖型活跃用户在话题讨论中的引领和推动作用。

4 结 论

本研究通过对活跃用户与版内用户交互情况的分析,发现活跃用户的点出度与点入度呈显著正相关关系,活跃用户的回帖数和获回帖数也显著正相关。因此,从信息传播的角度来看,一个用户如果想让自己的帖子内容受到关注,一条可能的途径是通过大量回复别人的帖子成为论坛中的活跃用户,同时也可借助领袖型活跃用户的作用来吸引更多用户的注意。

参考文献

[1]曹作华.论帕累托原则与布拉德福定律对馆藏建设的综合效用[J].图书情报工作,2004,(3):2-25.

[2]Chima Adiele.A Formal Design of Web Community Interactivity.G.Dong et al.(Eds.):APWeb/WAIM 2007,LNCS 4505.2007:797-804.

[3]郝黎仁,樊元,郝哲欧.SPSS实用统计分析[M].北京:中国水力水电出版社,2002.

[4]彭小川,毛晓丹.BBS群体特征的社会网络分析[J].青年研究,2004,(4):39-44.

[5]Marcelo Maia,Jussara Almeida,Virgílio Almeida.Identifying User Behavior in Online Social Networks.Proceedings of the 1st workshop on Social network systems.Glasgow,Scotland.April.2008.

[6]宫辉,徐渝.高校BBS社群结构与信息传播的影响因素[J].西安交通大学学报:社会科学版,2007,(1):93-96.