代艳华+张栋栋+郑晓康+秦秋莉
摘 要 本次研究中选定人人网为研究对象,使用社会网络分析的方式探索社交世界的交流模式。社会网络分析在我国是一门刚刚引入的新鲜学科,本文采用这一先进技术,用社会网络分析法和统计学方法对社交网络进行科学描述,主要探究人人网内部连接情况、找到位于社群中心位置的用户、并分析用户的中心位置与活跃度是否存在内在关系,最后使用可视化技术将研究结果呈现。
关键词 人人网;社会网络分析法;统计学方法;可视化技术
中图分类号:TP392 文献标识码:A 文章编号:1671-7597(2014)04-0035-02
1 人人网数据的采集及处理
采用滚雪球抽样的方法抽取样本,选定初始的三个人人网用户,使用火车头数据采集器采集对应的好友网址,采集结果直接保存在本地数据库中。编写C语言程序在三个起始用户的人人好友中随机抽取12个二级用户,继续采集12个人人用户的好友,最后获取了2059个样本数据。利用createpajek软件将样本数据文件转化为.net的格式,方便后续分析软件的使用。处理结果使每个用户对应不同的编号,并用对应关系表示好友关系的存在。
2 社会网络分析
利用社会网络分析法的四项指标对采集的人人网数据进行分析,分别是网络密度、可达性、点度中心度和图的点度中心势指数。将采集数据导入pajek软件中,进行分析。
2.1 网络密度分析
抽象地说,一个图的密度就是对这个图的完备性的一种测度。网络密度在一定程度上象征着这个网络中关系的数量与复杂程度。密度为1,则每个个体都与其他所有个体产生关系。
利用pajek软件实现对人人网网络密度的测量,具体的步骤是在PAJEK中选“Info-Network-General”项目。结果显示,在所有2059个样本组成的网络中,该网络的平均网络密度仅为0.03,考虑到可能是图的规模使得结果偏小,为了使结果更加准确我们采用样本密度估计总体密度的办法,随机抽取3个30人的样本,结果分别为0.08,0.10,0.11,取平均值0.097,有研究指出在实际网络中能够发现的最大密度是0.5,可见人人网的网络密度值偏小。
2.2 可达性分析
可达性考察一个网络的连通性(connectivity),它的意义是:图中所有个体在多大程度上通过有限个步骤相互联络在一起。测量可达性的指标是直径(diameter)。直径表示图中任意可连通的两点之间的最大距离。直径短,表示可以通过很少的步骤访问完整个网络/最大关联图。
利用pajek软件实现对采集数据的diameter测量,具体的步骤是“Net—Paths between 2 vertices—Diameter”。软件处理的结果表明,直径为5,根据“六度分隔”理论的内容,在现实社会中表明人人网用户之间的可达性较强。最大关联图规模较强,基本实现了互联。
2.3 点度中心度分析
形象地说,度数就是某个点引出来的线的条数。反映在数据上,某个个体的度数就是邻接阵中这个个体所对应的行的行和或者列的列和(考虑到对称性)。点度中心度(point centrality)是社会网络分析的重点之一。如果一个点与其他许多点直接相连,就说该点具有较高的点度中心度。该点所对应的行动者也是中心人物,拥有最大权力。这里的权力是指网络中行动者之间存在的一种互动模式。
在进行点度中心度和图的点度中心势指数分析时,根据统计学分析中参数估计的原理,随机抽取样本总体中20个人人用户,并查找他们之间的好友关系。将用户之间的好友关系用一个邻接矩阵的形式表达出来,矩阵中“1”表示好友关系存在,“0”表示不存在。
通过UCINET软件进行点度中心度的测量结果和点度中心势的测量结果分别如图1、图2所示。
图1 点度中心度的测量结果
图2 点度中心势的测量结果
从图1来看,不同的用户表现出不同的中心度,中心度最高的用户,即他的好友数量最多,如20号用户中心度为9,1号和2号用户中心度为8,说明他们在人人网信息传播中拥有较大的权利,他们发布的消息为更多人所注意。但是其内中心度最大值为9,平均值仅为3.1,可见,是过大的外中心度干扰了中心度的测量,造成了它们“位于网络中心”的表象。
2.4 图的点度中心势指数分析
点度中心势指数(centralization of a graph),指的就是网络中点的集中趋势,不同结构的图中心趋势存在很大差异,从另一个角度来说,如果一个网络中“点的点度中心度差异很大”,则该网络的向心趋势就较为明显,反之,则中心势较小。
图2中结果样本的整个网络标准化中心势为4.05%。中心势越接近1,说明网络越具有集中趋势(centralization)。抽取的样本中集中化中心势为11.50%,说明有较强集中趋势,但不十分明显。
3 统计学定量交叉分析
在测量点度中心度抽取的20个人人用户中,采集20个用户的最近访客数量、近三个月内的月状态平均更新数量、以及每条状态的平均回复数量。由于人人网的权限设置以及采集的时间等问题,对一些不合格样本进行了剔除。并利用spss软件定量分析样本的点度中心度和更新频率、点击率、回复数之间的相关关系。
进行点度中心势和更新频率、点击率、平均回复数之间的相关性测量结果如图3所示。
图3 点度中心度和活跃度相关性测量
从图3可以看出,点度中心势和更新频率、点击率、平均回复数之间的相关系数分别是0.325,0.543,0.298,点度中心度和更新频率、点击率、平均回复数之间的显著性P均大于0.01,所以点度中心势和三者之间都不存在明显的相关关系,统计结果不显著。有较高点击率、经常更新状态并且能够得到较高回复数的人人用户不一定位于社交网络人人网群落的中心。endprint
4 可视化实现
利用pajek软件绘制3D化处理的社群图如图4所示。
图4 3D化处理社群图
从图4中可以很明显的看出,抽取的样本中存在很明显的子群分割,人人网的好友关系一般都是真实关系的反应,与此同时我们揣测,作为真实关系的线上反应,人人用户间的网络关系是呈现出一定的自动分割的。
这些结群点称作社团结构,同一个社团结构相互之间有着比较大的相似性,而与网络中的其他节点有着较少的联系。而这样的社团结构在社交网络中往往是一些有着某种或某几种共同特性的“圈子”,这对于一些商品和信息的推荐有非常重要的意义。
5 结论与启示
1)抽取的样本具有明显的代表性,可以依据样本的特性来推测总体数据,得出目前人人网的网络密度一般,各个人人用户之间的可达性一般,基本实现了互联,但是人人网并不具备较强的集中趋势。
2)人人网在活跃性方面高于全国平均水平,但较高的活跃性并没有带来网络连接的高紧密度。研究数据显示,人人网网络的连接密度相对与美国比较低,连接强度一般,网络可达性不高,网络整体聚类规模小,目前大多数人使用人人网只是为了和好友保持联系,对于一些话题的参与度并不高。但是未来的社交网络必然是深关系化的发展,必然要从淡出的交流分享衍生为获取专业信息、解决待定问题为主的信息分析、整合。
3)调查显示,目前人人好友的推荐机制主要是共同好友的数量,很多时候,两个人虽然拥有比较多的共同好友,但在现实中彼此并不相识,也不会选择成为对方好友。人人网可以通过对用户主页的文本和行为挖掘,实现超越真实线下关系的推荐,使更多人找到和自己志趣相投的朋友,增强网络的连接密度。
4)统计学定量分析的结果显示,活跃度高的人人用户不一定位于社交网络人人网群落的中心。点度中心度高的用户往往具有更高的“权力”,而信息及资源的传递往往受“权力”大小的影响,权力大的被称为“意见领袖”,他们在网络舆情传播中起着重要的作用。
5)同一个社团结构的成员对彼此有更高的信任度,所以信息在社团内部的推广性远远高于整个网络,所以利用社团进行信息传播是一个非常大的商机。
参考文献
[1]李林容.社交网络的特性及其发展趋势[J].新闻界,2010(5).
[2]汤汇道.社会网络分析法评述[J].学术界,2009(3).
[3]SNS新型社交网络的传播解读与思考[J].今传媒(学术版),2009(11).
[4]苏雪皎.SNS社区网络探析——以校内网和同学网为例[J].青年记者,2009(23).
[5]窦炳林,张世永.基于结构的社会网络分析[J].计算机学报,2012(4).
[6]曾繁旭,黄广生.网络意见领袖社区的构成、联动及其政策影响:以微博为例[J].传播与网络,2012(4).
[7]杨媛媛.应用自我中心法分析社会网络[J].实践与经营,2009(9).
[8]平亮,宗利永.基于社会网络中心性分析的微博信息传播研究[J].情报、信息与共享,2010(6).
[9]徐媛媛,朱庆华.社会网络分析法在引文分析中的实证研究[J].理论与探索,2008(2).
[10]Yang ZHANG, Wanyang LING, A comparative study of information diffusion in weblogs and microblogs based on social network analysis[J]. Chinese Journal of Library and Information Science, 2012.04.
[11]A Social Network Analysis Methods based on Ontology, 2010 Third International Symposium on Knowledge Acquisition and Modeling[C]. wuhan hubei,2010.10.endprint
4 可视化实现
利用pajek软件绘制3D化处理的社群图如图4所示。
图4 3D化处理社群图
从图4中可以很明显的看出,抽取的样本中存在很明显的子群分割,人人网的好友关系一般都是真实关系的反应,与此同时我们揣测,作为真实关系的线上反应,人人用户间的网络关系是呈现出一定的自动分割的。
这些结群点称作社团结构,同一个社团结构相互之间有着比较大的相似性,而与网络中的其他节点有着较少的联系。而这样的社团结构在社交网络中往往是一些有着某种或某几种共同特性的“圈子”,这对于一些商品和信息的推荐有非常重要的意义。
5 结论与启示
1)抽取的样本具有明显的代表性,可以依据样本的特性来推测总体数据,得出目前人人网的网络密度一般,各个人人用户之间的可达性一般,基本实现了互联,但是人人网并不具备较强的集中趋势。
2)人人网在活跃性方面高于全国平均水平,但较高的活跃性并没有带来网络连接的高紧密度。研究数据显示,人人网网络的连接密度相对与美国比较低,连接强度一般,网络可达性不高,网络整体聚类规模小,目前大多数人使用人人网只是为了和好友保持联系,对于一些话题的参与度并不高。但是未来的社交网络必然是深关系化的发展,必然要从淡出的交流分享衍生为获取专业信息、解决待定问题为主的信息分析、整合。
3)调查显示,目前人人好友的推荐机制主要是共同好友的数量,很多时候,两个人虽然拥有比较多的共同好友,但在现实中彼此并不相识,也不会选择成为对方好友。人人网可以通过对用户主页的文本和行为挖掘,实现超越真实线下关系的推荐,使更多人找到和自己志趣相投的朋友,增强网络的连接密度。
4)统计学定量分析的结果显示,活跃度高的人人用户不一定位于社交网络人人网群落的中心。点度中心度高的用户往往具有更高的“权力”,而信息及资源的传递往往受“权力”大小的影响,权力大的被称为“意见领袖”,他们在网络舆情传播中起着重要的作用。
5)同一个社团结构的成员对彼此有更高的信任度,所以信息在社团内部的推广性远远高于整个网络,所以利用社团进行信息传播是一个非常大的商机。
参考文献
[1]李林容.社交网络的特性及其发展趋势[J].新闻界,2010(5).
[2]汤汇道.社会网络分析法评述[J].学术界,2009(3).
[3]SNS新型社交网络的传播解读与思考[J].今传媒(学术版),2009(11).
[4]苏雪皎.SNS社区网络探析——以校内网和同学网为例[J].青年记者,2009(23).
[5]窦炳林,张世永.基于结构的社会网络分析[J].计算机学报,2012(4).
[6]曾繁旭,黄广生.网络意见领袖社区的构成、联动及其政策影响:以微博为例[J].传播与网络,2012(4).
[7]杨媛媛.应用自我中心法分析社会网络[J].实践与经营,2009(9).
[8]平亮,宗利永.基于社会网络中心性分析的微博信息传播研究[J].情报、信息与共享,2010(6).
[9]徐媛媛,朱庆华.社会网络分析法在引文分析中的实证研究[J].理论与探索,2008(2).
[10]Yang ZHANG, Wanyang LING, A comparative study of information diffusion in weblogs and microblogs based on social network analysis[J]. Chinese Journal of Library and Information Science, 2012.04.
[11]A Social Network Analysis Methods based on Ontology, 2010 Third International Symposium on Knowledge Acquisition and Modeling[C]. wuhan hubei,2010.10.endprint
4 可视化实现
利用pajek软件绘制3D化处理的社群图如图4所示。
图4 3D化处理社群图
从图4中可以很明显的看出,抽取的样本中存在很明显的子群分割,人人网的好友关系一般都是真实关系的反应,与此同时我们揣测,作为真实关系的线上反应,人人用户间的网络关系是呈现出一定的自动分割的。
这些结群点称作社团结构,同一个社团结构相互之间有着比较大的相似性,而与网络中的其他节点有着较少的联系。而这样的社团结构在社交网络中往往是一些有着某种或某几种共同特性的“圈子”,这对于一些商品和信息的推荐有非常重要的意义。
5 结论与启示
1)抽取的样本具有明显的代表性,可以依据样本的特性来推测总体数据,得出目前人人网的网络密度一般,各个人人用户之间的可达性一般,基本实现了互联,但是人人网并不具备较强的集中趋势。
2)人人网在活跃性方面高于全国平均水平,但较高的活跃性并没有带来网络连接的高紧密度。研究数据显示,人人网网络的连接密度相对与美国比较低,连接强度一般,网络可达性不高,网络整体聚类规模小,目前大多数人使用人人网只是为了和好友保持联系,对于一些话题的参与度并不高。但是未来的社交网络必然是深关系化的发展,必然要从淡出的交流分享衍生为获取专业信息、解决待定问题为主的信息分析、整合。
3)调查显示,目前人人好友的推荐机制主要是共同好友的数量,很多时候,两个人虽然拥有比较多的共同好友,但在现实中彼此并不相识,也不会选择成为对方好友。人人网可以通过对用户主页的文本和行为挖掘,实现超越真实线下关系的推荐,使更多人找到和自己志趣相投的朋友,增强网络的连接密度。
4)统计学定量分析的结果显示,活跃度高的人人用户不一定位于社交网络人人网群落的中心。点度中心度高的用户往往具有更高的“权力”,而信息及资源的传递往往受“权力”大小的影响,权力大的被称为“意见领袖”,他们在网络舆情传播中起着重要的作用。
5)同一个社团结构的成员对彼此有更高的信任度,所以信息在社团内部的推广性远远高于整个网络,所以利用社团进行信息传播是一个非常大的商机。
参考文献
[1]李林容.社交网络的特性及其发展趋势[J].新闻界,2010(5).
[2]汤汇道.社会网络分析法评述[J].学术界,2009(3).
[3]SNS新型社交网络的传播解读与思考[J].今传媒(学术版),2009(11).
[4]苏雪皎.SNS社区网络探析——以校内网和同学网为例[J].青年记者,2009(23).
[5]窦炳林,张世永.基于结构的社会网络分析[J].计算机学报,2012(4).
[6]曾繁旭,黄广生.网络意见领袖社区的构成、联动及其政策影响:以微博为例[J].传播与网络,2012(4).
[7]杨媛媛.应用自我中心法分析社会网络[J].实践与经营,2009(9).
[8]平亮,宗利永.基于社会网络中心性分析的微博信息传播研究[J].情报、信息与共享,2010(6).
[9]徐媛媛,朱庆华.社会网络分析法在引文分析中的实证研究[J].理论与探索,2008(2).
[10]Yang ZHANG, Wanyang LING, A comparative study of information diffusion in weblogs and microblogs based on social network analysis[J]. Chinese Journal of Library and Information Science, 2012.04.
[11]A Social Network Analysis Methods based on Ontology, 2010 Third International Symposium on Knowledge Acquisition and Modeling[C]. wuhan hubei,2010.10.endprint