李 纲 海 岚 陈璟浩
(1.武汉大学信息资源研究中心,武汉,430072; 2.广西大学公共管理学院,南宁,530004)
突发自然灾害事件,是指突然发生、造成或者可能造成严重社会危害,需要采取应急处置措施予以应对的自然灾害事件,是突发公共事件的一种[1]。我国政府高度重视突发自然灾害事件信息的发布,于2007年颁布的《中华人民共和国突发事件应对法》和《中华人民共和国政府信息公开条例》,为媒体播报突发自然灾害事件提供了规范,并充分保障了公民的知情权,成为我国政府和媒体应对突发事件和发布相关信息的主要指导文件。此外,随着信息资源的网络化,媒体开始利用互联网媒介发布灾难信息,网络媒介成为了突发事件信息汇集的重要平台,对事件信息的管理和控制起到了重要作用。在灾难事件中,来自各种渠道的网络舆情信息流,间接反映了媒体和网民对突发事件的关注情况。这为研究突发自然灾害事件舆情信息在网络中的传递状态、生命周期、衍生过程以及灾难处理情况提供了有力的参考,使得利用网络媒体信息来侦测灾难舆情热点、评估灾难损害程度以及对突发事件进行预警成为可能。
为此,本文试图通过生存分析方法分析突发自然灾害事件网络新闻语料,以期揭示突发自然灾害网络舆情的生存时间分布,探明可能影响我国突发自然灾害事件网络媒体报道的周期因素,为提升我国政府的突发自然灾难舆情应对能力提供决策参考。另外,需要指出的是,由于地震灾难和台风灾难较为常见,为保证研究的代表性,本文选取地震和台风灾难网络新闻作为主要研究对象。
目前国内外有关危机传播和灾难舆情的研究主要集中在以下两个方面:①危机传播的生命周期研究,揭示危机传播各阶段特征。Steven Fink提出的危机传播阶段分析理论[2],把危机事件划分为潜伏期、爆发期、延续期、痊愈期和评估期四个阶段,并针对不同阶段信息传播特点,提出危机传播的应对策略。杨品舒研究了媒体报道自然灾害的制约因素,评估了自然灾害的新闻传播效果[3]。陈璟浩研究了突发公共卫生事件、突发事故灾难事件的网络舆情传播方式和内在演化机理,对突发事件生存时间分布、影响因素进行了分析[4]。②网络舆情信息传播模型研究,强调利用传播模型来描述危机信息传播规律。Culotta通过采集Twitter流行性感冒信息,提取相关关键词,构建分类词袋(bag-of-words),建立关键词频率与美国疾病防控中心(CDC)发布的流感感染率多元回归方程,来评估预测模型对危机状态描述的准确性[5]。Leysia Palen团队对互联网危机信息传播做了一系列深入的研究,他们的研究包括利用网络信息来评估危机发展态势,对危机信息网络交流、社会媒体对危机信息传播的影响等进行评估[6-7]。Kira等人以新闻语料库作为支撑,构建了灾难信息预测模型,通过计算危机事件发生的概率,来推测危机事件在未来发生的可能性[8]。刘鲁团队对突发事件的破坏指数、爆发模式等进行了系列的研究,提出了通过Web内容分析来测度突发事件破坏性的指数,并构建了突发事件新闻报道的爆发模型来评估事件发展态势[9-10]。沈阳和吴荆棘通过文本分析、聚类分析和结构方程模型的方法,假设了23个舆情推演影响因子,建立了网络舆情推演模型,对舆情推演影响因子的相互关系进行了分析,并对模型的准确性进行了评价[11]。葛月对台风新闻语料进行了分析,构建了台风突发事件的衍生网络模型[12]。
综上所述,突发公共事件生命周期的研究更偏向于定性研究,较少在数量上证明影响因素与生命周期之间的作用关系。网络舆情信息传播模型研究主要以定量分析为主,研究重点集中于对社会安全事件、公共卫生事件舆情的监测和预警。而目前有关突发自然灾害事件网络舆情报道周期的影响因素的研究还较少,为此,本文尝试利用生存分析和内容分析方法探明我国突发自然灾害事件网络媒体报道的周期特征。
网络媒体对突发灾难事件的报道往往因为媒体追逐热点的天性而产生截断,与此同时,报道数据具有分布类型不易确定、影响因素复杂不易控制、难以用现有参数模型进行拟合等特点。这都决定了诸如线性回归、逻辑回归等统计分析方法并不适用于本研究,而生存分析方法可以很好地解决上述问题。通过Kaplan-Meier分析我们可以很好地评估地震灾害和台风灾害新闻的生存时间分布,Cox分析则能有效应对生存时间分布不确定的状况,并具备同时考察多个影响因素对生存时间的作用效果。因此,本文最终选取上述两种生存分析方法来对自然灾害网络新闻语料进行定量分析,分析工具为SPSS19.0统计分析软件。同时,考虑到地震和台风事件的生命周期遵循着不同的发展模式,这导致了不同类型事件的新闻报道周期受不同的影响因素所影响,即便是同一影响因素,其在不同类型的事件中的作用效果也不同。因此,本文对地震和台风灾害分别进行Cox回归分析。当然,单纯的通过数理统计的方法来解释网络媒体对灾难事件的报道规律仍有一定局限性,为此,在定量分析之后本文还利用定性分析的方法对网络媒体报道突发自然灾害事件的周期特征进行了考察。
(1)事件定义
生存分析中能否准确定义事件对分析结果的正确与否具有重要影响。通常情况下,在生存分析中,事件的定义指的是研究对象从一种状态向另一种状态迁越的过程[13]。本文分别研究地震灾害事件和台风灾害事件网络媒体报道的影响因素及周期特征。根据此定义,地震灾害事件的网络媒体报道周期指的是从地震发生当天媒体报道开始至应急救灾响应终止、灾后重建开始后,媒体进入沉寂期(15天以上不再对此问题报道)的这一段时间。台风灾害的网络媒体报道周期指的是从台风未登录但有预警新闻报道开始至应急救灾响应终止、灾后重建开始后,媒体进入沉寂期(15天以上不再对此问题报道)的这一段时间。
(2)Kaplan-Meier分析[14]
Kaplan-Meier过程采用乘积极限法来估计生存率,同时还可以对一个影响因素进行检验,是最为基本的一种生存分析方法。
在Kaplan-Meier分析中,得到的累计生存函数的估计值为:
其中,ti为第i个事件发生时刻,di为在时刻ti发生事件的个体数,yi为在时刻ti面临风险的个体数。为生存率的标准误差,用于生存率可信区间的估计。
生存函数的p分位点xp为:
常用的分位点为四分位点和二分位点。
(3)Cox回归分析
Cox回归又称为比例危险度模型(Proportional Hazard Model),是生存分析中的一个重要模型,可以分析生存时间无一定规律,且具有完全或截尾状态的诸多危险因素之间的定量关系。
Cox比例回归危险率模型是广义的回归模型,其假定危险率函数是一个带有若干个协变量的随机变量。Cox回归分析的比例危险度模型为:
X1,X2,……,Xm是危险因素(Covariates,协变量),可以是定量、定性或等级资料。β1,β2,……,βm是回归系数,由样本估计而得。h0(t)是基准危险函数,该函数无任何限定条件,不需要指定生存时间分布,具有半参数特点,这也是Cox被称为生存分析方法中的半参数方法的原因。βI>0表示该协变量是危险因素,越大使生存时间越短;βI<0表示该协变量是保护因素,越小使生存时间越长。采用Cox生存分析需要满足两个条件:①首先其具有一般回归模型的特征,要尽量减少协变量之间的交互作用(即共线性);②满足Cox生存模型的比例风险假设,即要求协变量的影响效应不随时间而改变。
本文的研究数据来自权威门户网站:新浪新闻中心[15]和凤凰资讯中心的新闻专题汇总[16]。数据的采集时间为2003年7月至2014年2月,近10年突发自然灾害事件新闻信息。利用Java计算机程序语言对新浪新闻专题和凤凰新闻专题共79个案例,23620条新闻进行了抓取。通过对案例集的筛查发现,所获取的案例中以地震灾害和台风灾害案例为主,其中地震灾害26例,台风灾害31例,共16591条新闻。由于其他类型的自然灾害样本量太小,这会造成分析结果出现较大偏差,因此在本文的分析过程中我们去除了非地震灾害和台风灾害的案例。
另外,本文假设,当突发自然灾害事件爆发后,媒体会迅速跟进,发布突发自然灾害事件信息,跟踪事件发展整个过程中,直至事件得到妥善解决。
利用Cox回归模型探析媒体报道地震灾害和台风灾害的周期影响因素,首先需要确定模型中的危险因素(Covariates,协变量),这些因素可以是定性、定量或等级资料。详见表1和表2。
表1 地震灾害影响因素
4.3.1 Kaplan-Meier分析
本研究共选取了57个突发自然灾害事件案例,其中地震灾害26例,台风灾害31例。截尾数据占整体的3.5%,在正常范围内(见表3)。
出现地震灾害截尾数据的原因如下:①地震灾害事件发生时通讯中断,影响前线记者准确报道,之后随着救援持续进行,报道的热度降低,特别是人员伤亡较少的灾情,因此这些灾情数据没有进一步更新,只经历短暂几天便不明原因地结束报道。②较为综合和全面的灾害分析专家意见或者政府的相关决定需要经过一定决策时间才能向公众公布,因此存在报道时间上的截断。③灾后重建问题往往与灾难新闻报道之间存在时间差,发布灾后重建计划或完成情况则引起新的舆情。
表3 两类突发自然灾害事件案例汇总
从表4中可以看到,地震灾害事件和台风灾害事件在网络媒体报道中的平均估计生存时间分别为22.063天、12.419天,总的平均生存时间为16.571天。其中地震灾害事件被网络媒体报道的中位生存时间均为13天,台风灾害事件为8天。台风灾害的生存时间较短是因为台风灾害发生前已经获得天气预报并已做好相应预警和防范,台风过境后处理得当,基本不会发生较为严重和长时期的次生灾害。而地震灾害则不同,地震灾害爆发突然,破坏性大,受灾情况和灾害地人口密集程度与房屋建筑状况有直接关系,舆情方面尤为关注伤亡、救援、政府行为以及灾害与其他事件的关联程度,因此生存时间相对较长。
4.3.2 Cox回归分析
(1)地震灾害
将地震震级、当天死亡人数、当天受伤人数和当天新闻量作为生存时间的协变量,选择“进入”方法,各影响因素均未通过原假设。改换“向前:LR”方法,即以最大局部似然为基础作似然比概率检验,通过将变量依次带入Cox模型,比较对数似然值的差,评估最优模型效果,最终发现当天死亡人数对生存时间影响显著(见表5),β<0表示当天死亡人数是保护因素,该值越小新闻对地震播报的时间越长。当天死亡人数每上升一个级别,生存时间相应延长的概率是(1-0.395)*100%=60.5%。
进一步分析发现,地震震级和当天受伤人数分别与新闻对灾难事件的报道时间也存在因果关系,通过显著性检验(结果略),地震震级每上升一个级别,生存时间相应延长的概率是(1-0.561)*100%=43.9%,当天受伤人数每上升一个级别生存时间相应延长的概率是(1-0.609)*100%=39.1%。当天新闻量与生存时间不存在因果关系。
将三个协变量单独带入Cox比例风险模型,各变量对生存时间的影响显著,但是总体的模型拟合效果却不理想,说明协变量之间可能存在交互作用,经过协变量交互分析我们发现三个变量之间的确存在交互作用(表6),且两两变量之间也存在交互作用(结果略)。根据前述采用“进入”方式将影响因素带入方程所得到的分析结果,可以判断这三个因素同时作用的效应明显小于单个危险因素作用的效应,为负交互。
表4 生存时间平均数和中位数
表5 当天死亡人数通过显著性检验
表6 三个协变量之间的交互作用
从生存分析的结果来看,地震震级和当天死伤人数对网络媒体报道周期的影响之所以显著,主要是因为灾害发生时,公众普遍较为关注灾难的破坏程度以及对人生命财产的威胁程度。而死伤人数的初步统计(“当天”)最能够体现灾难带给公众的冲击力,直接影响着后续舆情的发展。
(2)台风灾害
根据4.2确定的Cox模型的危险因素,我们将对台风灾害危险因素相互之间的共线性进行检验,各协变量之间无显著的共线性(结果略),故可以选择Cox回归分析。从回归方程中我们发现,登陆当天新闻量、登陆前伤亡人数都通过了显著性检验。进一步改换“向前:LR”方法,即以最大局部似然为基础作似然比概率检验,向前逐步选择自变量,得到相同结论(见表7),登陆当天新闻量每上升一个级别,生存时间相应延长的概率是(1-0.985)*100%=1.5%,登陆前伤亡人数每上升一个级别,生存时间相应延长的概率是(1-0.535)*100%=46.5%。
表7 登陆当天新闻量和登陆前伤亡人数对生存时间的影响
从生存分析的结果结合台风灾害的预警情况,我们发现,登陆前伤亡人数作为一种台风预警信息,之所以对网络媒体报道周期的影响显著,是因为灾害未发生时即造成了舆论影响,吸引了公众的视线。登陆当天新闻量体现媒体和民众对于台风初始状态的关注,这些因素均能影响着舆情的发展。
一直以来,媒体对于各类突发自然灾害事件的报道遵循着特定的模式,并没刻意对不同类型的自然灾害报道进行区分,然而在对所选两类灾害新闻语料进行内容分析后,我们发现网络媒体在报道不同类型的突发自然灾害事件的过程中表现出不同的周期性特点。
地震灾害爆发突然,预测困难;破坏性大,易造成基础设施的瘫痪;主震后伴随持续一定时间的余震,次生灾害容易发生;灾区的恢复和重建的周期比较长。这样的特点决定了网络媒体在报道地震灾害时呈现出“爆发”和“长尾”的生命周期特征:首先,地震发生后媒体会迅速反应,在灾害发生24小时之内即开始报道,在此期间媒体报道的焦点主要集中于人员伤亡、失踪人员搜寻、财产损失等内容,地震震级和当天死伤人数这两个变量通过了Cox的显著性检验也能印证这一点。由于地震灾害通常会对当地通信和电力造成影响,因此,在地震报道初期各网络媒体会表现出灾情事实情况播报、灾情事实复核、灾情事实再播报的循环播报现象,即媒体会在这一阶段对各种死伤数据不断进行纠偏,对救援进度予以实时跟进。该阶段的持续时间主要受地震震级及受灾地区人员伤亡程度而定。重大地震灾害的媒体报道规律,还与地震灾害中的“救援黄金72小时”紧密相关,呈现爆发态势,随着救援的结束,若再无重大灾情,网络媒体报道进入沉寂期,报道会表现出明显的长尾特征,这包括对灾后补给、灾害排险、典型人物、灾民安置等多方面的报道,直至整个抢险救援工作的正式结束。
台风灾害则不同,台风灾害具有季节周期性,且我国目前的气象监测系统已能准确预测台风的运动轨迹,发布预警信息。因此,网络媒体在报道台风灾难时呈现出“前紧后松”的播报特点。台风未登陆我国前,新闻媒体会对台风的级别,境外人员伤亡及损失进行跟踪,在这段时期,网络媒体会密集播报预警信息,包括台风级别、境外损失情况、灾民转移情况等。此阶段有关台风的报道会随着台风的接近逐渐攀升。当台风登陆后,网络媒体对台风的报道迅速达到顶峰,此后媒体报道焦点开始转向,主要关注人员伤亡、财产损失、受灾情况评估等信息。由于我国具有较为完善的台风预警防灾机制,因此相较于地震,台风造成的伤亡损失要小得多,地震报道中的长尾现象在台风报道中较为少见。
本文通过探索性的分析,得出灾难发生时的死伤人数、灾难级别和相关预警信息对自然灾害网络媒体报道的周期有着明显的影响。这一方面是由于自然灾害的接近性所引起的,一般自然灾害事件都会给公众的生命和财产带来威胁,因此,公众对于灾难级别和预警信息比较敏感;另一方面,这一结论也与我国新闻记者的职业素养所契合,我国政府部门要求媒体在播报新闻的过程中要在第一时间播报灾难事实,抓住事件焦点,报道内容要包含人文关怀,而灾难的死伤人数越多、级别及预警信息越强,则说明灾害的危害性越大,越有可能成为民众关注的焦点,其舆情生存周期和媒体报道周期也越长。另外,通过对媒体播报的周期特征分析,我们发现地震报道呈现出“爆发”和“长尾”的生命周期特征,台风报道则表现出“前紧后松”的报道特点。
此外,本文在研究中还存在以下不足:①研究的新闻语料以媒体报道为依据,然而突发自然灾害事件网络舆情本身的时间跨度与研究所取时间范围有一定出入,媒体的沉寂并不能准确定义事件的结束,对于不在事件时限范围的灾难报道难以全面分析。②由于缺乏经验,对于因素间的交互作用只能进行判断而未能具体分析因素与应变量之间的交互关系。
[1]中华人民共和国国务院.中华人民共和国突发事件应对法[S].中华人民共和国主席令第69号.北京:2007,8
[2]Fink S.Crisis Management:Planning for the Inevitable[M].New York:American Management Association,1986:120-140
[3]杨品舒.我国自然灾难报道的现状及策略研究[D].北京:北京林业大学,2012:22-35
[4]陈璟浩.突发公共事件网络舆情演化研究[D].武汉:武汉大学,2014:59-100
[5]Culotta A.Towards detecting influenza epidemics by analyzing Twitter messages[C]//Proceedings of the First Workshop on Social Media Analytics.New York:ACM,2010:115-122
[6]Vieweg S,Hughes A L,Starbird K,et al.Microblogging During Two Natural Hazards Events:What Twitter May Contribute to Situational Awareness[C]//Proceedings of the 2010ACM Conference on Human Factors in Computing Systems(CHI2010).New York:ACM,2010:1079-1088
[7]Hughes A L,St.Denis L A A,Palen L,et al.Online public communications by police &fire services during the 2012 Hurricane Sandy[C]//Proceedings of the 32nd annual ACM conference on Human factors in computing systems.New York:ACM,2014:1505-1514
[8]Radinsky K,Horvitz E.Mining the web to predict future events[C]//Proceedings of the thirteen International Conference on Web Search and Data Mining(WSDM'13,2012,Rome,Italy).New York:ACM,2013:1-10
[9]蔡华利,李红,刘鲁,等.基于 Web挖掘的突发事件破坏指数测度研究[J].情报学报,2011,30(4):410-416
[10]刘志明,刘鲁,苗蕊.突发事件新闻报道与微博信息的爆发性模式比较[J].情报学报,2013,32(3):288-298
[11]沈阳,吴荆棘.基于复杂因子的网络舆情推演研究[J].情报学报,2013,32(12):1315-1325
[12]葛月.突发公共事件台风的衍生网络模型研究[D].大连:大连理工大学,2012:30-40
[13]Allison P D.Survival analysis using SAS:A practical guide[M].Cary,NC:SAS Institute Inc,2010:10-20
[14]彭非,王伟.生存分析[M].北京:中国人民大学出版社,2004:20-30
[15]新浪新闻中心.社会新闻[EB/OL].[2014-09-01].http://news.sina.com.cn/zt/col_society/
[16]凤凰资讯中心.凤凰网专题汇总[EB/OL].[2014-09-01].http://www.ifeng.com/special/