赵 爱,毕硕本,王 军,黄 铜,万 蕾
(南京信息工程大学地理与遥感学院,江苏 南京 210044)
基于网络舆情的信息空间网络结构及特征研究
赵 爱,毕硕本,王 军,黄 铜,万 蕾
(南京信息工程大学地理与遥感学院,江苏 南京 210044)
本文利用社交网络分析法和GIS可视化,在地理学视角下,对微博中“山东毒疫苗事件”信息传播路径进行定量分析。研究发现:①空间结构与社会经济具有相对一致性,表现为网络中节点的出入度与社会城市发展具有指向性,在个别中心城市间(北京、广东、上海)有所区别;②舆论微博传播具有地域性,不同的地域都形成中心节点城市,这些城市主导着周边乃至全国范围内的舆论方向;③相同时间段内的舆论信息传播路径数量在空间分布上呈现出不对称性,东部地区要比中西部地区密集。
网络结构;空间特征;社会网络分析(SNA);网络舆情
微博(Micro-Blog)集成了手机短信、博客与社交网站的瞬时通信优点,将用户从原来单纯的信息接收者变成了发布与接收的完全参与者,从而让社会的个体群众走进了“自媒体”时代。互联网的快速发展让人为主体的社会网络突破了空间的限制,重构全球的物理和虚拟空间结构形式[1]。与此同时,基于微博社交形成网络信息空间让互联网承担并加速了舆情的发展。
在信息空间的分类研究上,Castelles等[2-4]提出城市应抽象成为网络中的“信息流空间”,并强调了城市节点在塑造整个网络空间中的价值;甄峰等[5]将空间划分为实空间、虚空间和灰空间。信息空间的划分强调了地理空间向网络信息空间的变化,且肯定了网络信息空间的真实作用。对于微型博客与信息空间对社会、经济、地理等方面的实证研究,国外学者侧重研究信息空间中群体之间的关系;国内则侧重于在社会[6-7]、经济[8-11]视角下研究个体用户、个体城市之间的关系。陈映雪等[12-13]利用社交网用户关系(用户之间关注与被关注关系)信息地理空间结构进行研究,得出信息空间对称程度与经济社会发展具有相对一致性;经济关联的互联网已经具备中等网络规模,并指出多中心的网络协同发展已初步形成。韩运荣等[14-17]根据对微博事件传播的三种类型研究,分析了微博舆论的三种演化模式,即漩涡蔓延型、星系扩散型及节外生枝型,并对事件发展进行预测分析,揭示微博用户信息传播行为的动机。国外学者[18-21]则利用社交网络所形成的信息空间研究政治行为、舆情状况应该考虑到社交网络服务的多样化,对线上数据挖掘的同时要结合线下的参与人群所产生的影响。
总体而言,对微博研究目前还处于起步阶段,研究方法还处于定性阶段,研究工具单一,视角狭窄。大部分研究利用微博用户粉丝与关注者关系构建网络[5-13],然而用户这种关系行为受用户发布内容影响,具有很大的不确定性。鉴于此,本研究从地理空间的视角,将“山东毒疫苗”舆论信息在网络中传播的路径关系构建网络,拓展地理学在微博研究的内容和方向,分析信息空间网络在传播过程中的空间分布规律以及网络结构,为社交网络发展和舆论引导提供依据。
2016年3月,山东省发生一起幼儿注射疫苗死亡案例。此事经过媒体报道之后,在相近时间段内,全国又发现相似案例近百起。有关部门在舆情重压与媒体监督下,迅速被查实了黑色疫苗产业链内幕。各地网民积极参与到此次公共舆论,对快速解决现实问题起到了督促与监督的作用。
本文借助此次“山东毒疫苗”引发的社会热点话题为例,以新浪微博作为平台、社交网络中的实体用户构成的网络节点,研究节点之间关于此次公众舆情事件传播过程中的信息空间结构特征。以地理学的视角分析微博信息传播路径的数据。社交网站的用户所在城市作为信息传递网络的各个节点,用户的转发、发布信息方式作为节点间的联系[22]。将各个用户之间的信息交流理解为节点之间的出度、入度关系,从而构建基于微博的网络信息传递形成的网络空间,提取节点所在转变为具有地理属性的城市网络。以期为信息化的社会公众舆论引导、中国城市体系演变趋势、城市信息传播管理提供一定的科学依据。
提取参与舆论的用户行为与属性信息,把发布、转发的时间、地点、舆情内容等作为研究样本,同时选取涉及舆情范围内的经济等辅助研究相关数据。数据采集后,筛选标准如下:①信息空间的“节点”,即样本中用户真实地理位置,其落入中国国内;②只选取与该事件有关的信息;③用户的关注用户和粉丝年龄均在30岁以上; 2016年3月18日至4月8日期间采集数据165536组。最终,共获得104965组舆情有效用户关系数据(剔除标签为海外地区、地理属性缺省、城市标签为“其他”、存在重复“结构洞”的节点[6])。本文选取的449个代表中国城市的舆情节点数据共96536组,占有效舆情总数的91.97%,节点城市覆盖全国。选取的数据具有普遍性,可以代表此次网络舆情发展情况。
社会网络分析方法[23]是一类刻画网络整体的形态、特性和结构的重要分析方法。社会网络分析具有突出的关系表达优势,这种方案建立在如下假设之上:在互动的单位之间存在的关系非常重要,关系是网络分析理论的基础。本文利用用户之间的信息互动,提取共同的城市属性归结到一个节点上。利用社会网络分析法中的总体特征分析、中心性分析来对比基于信息空间的中国城市网络中不同节点的中心性,网络整体与区域之间的空间分布。
(1)数据有向化和标准化处理。构建网络中有向信息流的关系矩阵,公式如下:
(1)
(2)计算网络连接性矩阵:
(2)
(3)
(1)网络密度是社会网络分析常用的网络测度,描述各个节点之间的关联密切程度。网络密度的定义为该网络中各个城市节点信息交互的次数与节点连接最大量之比。由于本文数据采取用户的发布以及转发信息作为节点内部的交流,提取用户所在城市作为公共节点。在计算密度时,密度为实际连接数量与城市节点间理论最大量的比值。所以本文的网络密度为相对密度,其密度值在理论上可以大于1。计算公式为:
(4)
在网络中,“出度”即节点向外传播信息的次数,“入度”即节点接收信息的次数。中心度是度量构建网络中心化程度的重要指标。基于舆情信息流向所构建的网络中,处于中心位置的节点更容易获得信息,对舆情发展的贡献越大。
(2)点度中心度是衡量节点位于中心位置程度的指标。节点的点度中心度越高,其处于网络中的地位越靠近中心。点度中心度的相对数计算公式为:
(5)
其中,Ci表示节点城市i;d(Ci,Cj)为节点连接度二值化的值,本文将Tij阈值设置为3,d(Ci,Cj)取值情况如下:
(6)
(3)介中心性是衡量节点对整个网络资源的控制能力,它所表示的意义是:该节点在网络中是其他节点成员中介的程度。在本文构建网络里表示对信息的“中转”能力。其中,Gjk(Ci)表示包含节点城市i时,两个城市之间的短程线数量;Gjk表示城市j与k之间存在短程线的数量。介中心性元素NB(Ci)矩阵为:
(7)
本文分别从显示地理城市的经济要素、信息空间结构和地理城市相互关系,分析社交网络信息传递空间特征以及内在的空间逻辑。
(1)网络度与密度的地理分布不均,社交网络中的连接性与区域的发展具有相对的一致性,整体呈现东高西低的态势。本文选取了舆情网络中出现频率较高的449个县级市、直辖市作为节点,不考虑城市节点间信息联系稳定性的条件下,节点出度数量阈值P>1的地区数量占据地区总数的96.0%,P>50占据的地区为86.7%,大于500的地区占据26.5%,大于1000的地区占据14.5%。大部分地区的舆情节点度数量都落在1~50之间,极个别地区(例如事件发生地、经济文化发达区域、人口密度大的区域)出现极端的舆情峰值。整个网络密度为0.28,各个节点的度分布不均匀。整体的网络密度分布统计情况见表 1,在全国尺度下,社交网络的信息在东部、中东部、东南以及东北传递联系行为相对频繁。网络化程度较低的西藏、青海、内蒙古地区与中部、东部的网络节点出度频次较少,而西部各个节点之间的内聚薄弱。
表1 各省市地区信息空间的网络密度
(2)信息网络结构分散程度在各个空间区域差异大。此次构建的整体网络的密度各个节点之间的密度标准差为0.68,极差为2.66,密度均值为0.81,各个区域的网络密度相差较大。
从基于信息空间的区域网络角度来看,东部地区的各个城市对节点之间信息传递和交互能力最强,中部次之。东部省份、自治区中北京、广东的网络密度达到了2以上,是整个网络中联系最为密集的省份地区,与王波[13]等东部网络研究结论一致,但在中部信息交流地区产生差异。主要由于中部地区的舆论受到东部地区舆论影响较大,相比之下,其内部信息流显得较少;其他研究采用用户关注与被关注数据,故无法准确表达中部真实情况下的数据流向。网络密度大于整体0.81以上省份地区,东部地区有61.54%,中部地区有40.00%,西部地区有16.67%;主导此次舆情信息交互大部分是东部和中部地区。西部地区经济较发达的地区如四川、陕西、重庆,这些地区的网络密度相比于其他地区(广西、云南、甘肃、西藏、宁夏、青海等)出现“西部高密度”的情况。这些地区的各个网络节点信息交换频繁,成了整个西部地区的“舆情中心”。
表2 各区域网络密度统计
(3)距离衰减效应是地域综合规律重要组成部分,是地理学基本规律,反映了事物或者现象的作用力随着地理距离的增加而逐渐减小、变弱的现象。密度位居第三的是山东省,值为1.96。山东省是本文选取事件“源头”地区,其产生的舆情“聚集”也符合了这样的规律。考虑到各地区经济发展水平,选取度大于1000的省份为基本节点,按其2016年第二季度人均可支配收入排序(见图 1)。对人均GDP、信息流数目相关性检验,p判断阈值取0.05,相关系数r=0.384,p=0.158,并不存在明显相关性。节点度的数量虽总体呈现出东多西少的地域趋势,拟合线与城市发展水平呈东向西递减趋势。特殊区域如政治、经济中心以及事件发生“源头”的局部地区,成为带动舆情发展的“高地”,其衰减过程与经济的地域衰减形式不同。
以省份、直辖市、特区作为单位节点,地理距离靠近的两个节点连接性相差不大,且与外界节点联系路径相似。多维标度(Multidimensional Scaling,MDS)是一种将多维空间的研究对象(样本或变量)简化到低维空间进行定位、分析和归类,同时又保留对象间原始关系的数据分析方法。按照各个结点间网络连接距离与中心节点链接维度关系,如图2所示。北京、上海、广东、江苏、安徽、山东、浙江地区所处的网络维度相近,且节点网络连接性最大;黑龙江、广西、天津、河北的网络维度相近,湖北、辽宁、江西、福建、河南网络维度相近。可见,在实际空间距离视角下,各地区的网络连接性与距离东部地区的距离有一定的关系,偏远地区如海南、云南、澳门、内蒙古、新疆、台湾均处于独立的最外维度的网络节点上。
就发布量和转发量来看,从2016年3月21日抓取数据开始,截至4月3日,北京、广东、山东、江苏、浙江、上海排名靠前,可见东部地区的用户对此次公共事件的关注度较高,网络舆情数量增长快速。
中心性是舆情网络中传播信息的节点的地位重要性指标,它是节点在网络中权力的量化。当其中一个节点处于许多节点交流的路径上时,则该节点具有控制其他两个节点的信息传送能力,则该节点处于重要地位。
图1 节点所在省区经济水平与度关系对照
图2 整体网络MDS关系链接图
对于节点城市来说,相对介中心度越高,说明它越能在信息交流中控制其他节点,越能引导舆情方向。从分析结果看,不同的城市表现出不同的点入度和点出度(见表3),其中上海、北京分别占据出度中心和入度中心性第一的位置。上海虽然在信息传播中做出了重要贡献,但是并不能很好地充当信息接收者,其入度中心性没有北京、广州高。北京地区的中间中心度最高,相对介中心度为15.32,是整个网络的中心。其次是上海、广州和成都,和度中心性想比排名浮动变化不大。因此,在各个节点传播信息中,北京、上海、广州和成都作为控制中间节点,控制其他节点的能力最强,对整个网络信息流的传递起着导向作用。
表3 城市中心性统计
事件发酵过程中,舆论话题通过节点向外传播后得到发展,分为三个阶段:潜伏期、爆发期、消退期。如图 3所示,①潜伏期:现实社会中发生的事件能够唤起人们的注意,形成一定的意见;②爆发期,经过传播在一定范围扩散开来,形成公众意识;③消退期,在社会上产生影响,完成舆论目标,舆论次数开始下降。群体性事件中社会舆论形成的过程,基本上也经历这样三个阶段,且在不同的阶段,舆情发展的特征有很大区别。此次事件舆情发展在2016年3月17日之前处于潜伏期;3月18日至25日是爆发期,此阶段舆情发展最快,公众参与也是最多的阶段;3月25日后舆论数量逐渐趋于平缓,进入了舆论消退期。
图3 舆情发展趋势图
基于构建的信息网络,对各区域形成的网络空间按地域进行划分。进一步分析舆情所形成的网络体系空间特征。本文将标准出度≤3 的“弱连接”节点去掉后的节点分为4个层级。选取2016年3月17日至25日具有传播代表信息扩散传播的爆发期的数据,舆情过程路径在空间上发布如图 4所示。而中部与东部交流中,在东部内部扮演着“三分天下”重要地位的珠三角地区与中部地区联系微弱。相比东部内部的交流(见图 4a),上海成了中部联系的“重心”,形成了以上海为中心向中部城市辐射现象;沈阳、北京成了北方地区的信息纽带。东部与西部的联系途径大集中于北京与西部地区、成都与东部地区,(见图 4c)原先的上海、广州、沈阳与西部联系微弱。(见图 4d)中部地区内部联系薄弱,网络结构松散。可见,在全国的信息交流中,北京处于绝对的“中心地位”,主导着全国的舆情走向。西部地区在标准出度≥3的连接性较少,此处未做出讨论。
二模化网络矩阵来源于中心性矩阵,二模网络为我们分析“宏观与微观”提供了可能,并方便标识出节点派系与分组情况。信息空间中各个区域信息承载的重心不同,网络成层聚现象不同。沿海、东部之间的信息交互紧密,参与的城市数量也比中部、西部多。将东部信息空间流按照出、入度双向关系“二模化”(见图 5a)显示出度节点总体上呈现出以北京、上海为核心,济南、深圳、杭州、临沂、青岛聚集分布的现象;当北京、上海当作内部信息交互的入度结点时,其吸收能力并没有传播信息的能力强;作为入度节点,南京、上海、深圳、沈阳、济南、广州、青岛对于信息的接收能力相差不大。因此在东部存在较大的出度和较小的入度差距,可以得出:东部地区网络发挥着向外传播的作用;这种差距主要体现在北京、上海、沈阳对中部的信息输送。武汉、合肥、长沙、南昌、郑州、亳州形成聚集,各个节点共同分担中部的扩散信息。在全国尺度下,北京、上海、广州出度明显(见图 5b)。
图4 东部、中部、西部网络联系图
图5 信息空间二模网络图
对“山东毒疫苗”事件的舆情分析,发现微博社会空间视角下的中国等级城市有着明显的等级关系,每个区域的信息交互过程中都有不同的中心城市。舆论网络中的链接数量与城市的经济实力、事件起源地有一定的正相关性,即存在大部分节点,城市经济越发达,网络链接度越多,相同时间段内信息交互次数也越多;存在事件发生地的链接度数量发生跃升,其舆情发展也比周围地区较快。
根据节点之间链接度与地理分布的关系,本文发现北京、上海在全国的信息交互中不管是出度、入度还是中转节点作用,其影响力辐射了此次事件传播的大面积区域。同时,上海、广州、北京分别成为东部及沿海范围内长三角东侧、珠三角地区、渤海周边舆论集结重心,这也进一步验证了舆论的分布、集结与城市的发展程度、经济水平有一定的正相关。东部与中部舆情发展的信息交互中,珠三角区域影响力下降,沈阳对北方舆情的影响力加强。东部与中西部之间差距显著,城市间出现不同的层级,与国内现有学者研究一致。
同时,本文还发现了个别城市在此次事件传播中地域性特征明显。广州仅仅在东部珠三角地区影响力较大;沈阳虽然在东部地区,但是对东部舆论影响较小,对中部地区影响却很大。北京和上海这两个城市不管在哪个尺度上,其舆论影响都是最大,具有引导舆情发展的绝对能力。
当然,微博形成的新型社会网络只是信息加速了舆情的发展。舆论信息交流在网络扩散也处于互联网初级阶段,仅仅通过不同节点间单一的转发、话题参与,大部分节点并不能如现实生活中多次频繁交流,对现实理性的舆情影响到底有多大的比重还有待考证。但毫无疑问,网络中的舆情发展所带来的社会效应已经成为各个部门解决事务的参考途径。
[1]JOHN F. The world city hypothesis[J]. Development & change,1986,17(1):69-83.
[2]CASTELLS M. The rise of the network society:volume I[J]. Cities,1996,48(2):132-134.
[3]FRIEDMANN J R.The world city hypothesis [J].Development and change,1986,17(1):59-83.
[4]巴凯斯,路紫.从地理空间到地理网络空间的变化趋势——兼论西方学者关于电信对地区影响的研究[J]. 地理学报,2000(01):104-111.
[5]甄峰.信息时代新空间形态研究[J]. 地理科学进展,2004(03):16-26.
[6]李响.基于社会网络分析的长三角城市群网络结构研究[J].城市发展研究,2011(12):80-85.
[7]唐佳,李君轶.基于微博大数据的西安国内游客日内时间分布模式研究[J].人文地理,2016(3):151-160.
[8]段淼然,陈刚,于靖,等.基于新浪微博的省域出游驱动力空间分布特征[J].地域研究与开发,2015(2):96-102.
[9]甄峰,王波,陈映雪.基于网络社会空间的中国城市网络特征——以新浪微博为例[J].地理学报,2012(8):1031-1043.
[10]王德忠,庄仁兴.区域经济联系定量分析初探——以上海与苏锡常地区经济联系为例[J]. 地理科学,1996(01):51-57.
[11]李响.长三角城市群经济联系网络结构研究——基于社会网络视角的分析[J].上海金融学院学报,2011(4):105-1.
[12]陈映雪,甄峰,王波,等.基于社会网络分析的中国城市网络信息空间结构[J].经济地理,2013(4):56-63.
[13]王波,甄峰,席广亮,等.基于微博用户关系的网络信息地理研究——以新浪微博为例[J].地理研究,2013(2):380-391.
[14]韩运荣,高顺杰.微博舆论传播模式探究[J].现代传播:中国传媒大学学报,2012(7):35-39.
[15]田野.基于微博平台的事件趋势分析及预测研究[D].武汉大学,2012.
[16]刘大均,胡静,程绍文,等.中国旅游微博空间分布格局及影响因素——以新浪旅游微博为例[J].地理科学,2015(6):717-724.
[17]钟杰,王海舟,王文贤.基于话题的微博信息传播拓扑结构研究[J].信息网络安全,2016(3):64-70.
[18]CASTELLS M. Communication,power and counter-power in the network society[J]. International journal of communication,2007,1(1).
[19]CHAN M. Social network sites and political engagement:exploring the impact of facebook connections and uses on political protest and participation[J]. Mass communication & society,2016:430-451.
[20]MELLON J,PROSSER C. Twitter and facebook are not representative of the general population:political attitudes and demographics of social media users[J]. Available at SSRN,2016.
[21]COBB N K,JACOBS M A,WILEYTO P,et al. Diffusion of an evidence-based smoking cessation intervention through facebook:a randomized controlled trial.[J]. American journal of public health,2016,106(6):1130-1135.
[22]周芳如,吴姗姗,吴晋峰,等.旅游信息微博传播网络结构及时空特征[J].经济地理,2016(6):195-203.
[23]刘军.整体网络分析讲义[M].上海:上海人民出版社,2009.
SpatialStructureandCharacteristicsofInformation-NetworkBasedonNetworkPublicOpinion
Zhao Ai,Bi Shuoben,Wang Jun,Huang Tong,Wan Lei
(School of Geography and Remote Sensing,Nanjing University of Information Science and Technology,Nanjing 210044,China)
The dissemination of internet-based information changed the previous pattern of geography,while micro-blog has formed an important platform for exchanging information. Using the method of social network analysis(SNA) and GIS visualization,this paper tries to analyze the path of information transmission in micro-blog from the perspective of geography. Eventually the results show as follows.①The spatial structure and the social economy are relatively consistent.The number of in-out degree in network is consistent with the development of the economic level,while situations of dissemination are different in certain central cities.②The space of network information has the geographical features.Those cities as center-nodes dominate the direction of public opinion in the surrounding areas,even nationwide direction.③In network,the dissemination number of public opinion is regional during the same time frame.
Network structure;Spatial characteristics;Social network analysis;Public opinion
K901
A
国家自然科学基金项目 (41271410、41071253)。
2017-01-23
赵爱(1990-),男,江苏人,硕士研究生:研究方向:空间数据挖掘、大数据分析。
(责任编辑 沈蓉)