随着突发事件复杂性的不断提高和风险灾害危机管理的艰巨性不断被人们所认知,关于风险灾害危机管理(即应急管理)研究方法论体系也在不断拓展。在理论构建、案例研究、跨学科合作之后,大数据分析当前很受青睐。
大数据分析是指有效利用海量的数据抓取、挖掘与分析其中有意义的信息。以互联网为技术平台的经济社会生活形成了海量的数据即大数据。客观存在的大数据本身是没有意义的,需要经过新处理模式才能转化为更强的决策力、洞察发现力和流程优化能力,成为海量、高增长和多样化的信息资产。在风险灾害危机管理领域,基于互联网、云计算、物联网等泛互联网思维和技术,可以对大数据进行获取、存储、传输、融合和异构等处理,使之转化为决策和解决问题方案的能力。其中,互联网将有关的无关的、直接的间接的、过去的现在的信息“一网打尽”,可以为风险灾害危机管理各参与主体以及利益相关者提供共享信息,体现了共建共治共享;云计算可以将风险灾害危机管理流程转变为数字化服务,从而使管理流程具备高度的可配置性和可扩展性;物联网将物理世界的资源与计算世界的智慧联系起来,提升现实世界防范风险、应对灾害、管理危机的能力。可见,泛互联网技术和大数据驱动将促使传统的风险灾害危机管理思维和范式产生根本性变革,能够将繁乱的数据转变成现实的管理能力,使风险灾害危机管理的整体性、协同性和智能化成为可能。实践既已如此,对风险灾害危机的研究当然也离不开大数据分析。
作为“基于社会正常运行的例外”①,突发事件是社会经济自然系统中一类具有特殊属性的现象,这一特殊属性体现在风险、灾害与危机之间的相互关联和相互转化。这一现象具有产生、形成与动态变化或演化等一系列的复杂系统行为,也可以把它理解为复杂社会经济自然系统中子相空间的形成或存在。一般而言,相空间都具有巨大维数,相空间中的任一状态都是由无数细节构成的,我们可以把任何一个突发事件都理解为相空间中的一个可能物理态。在这里,不仅个别的可能物理态,甚至突发事件子相空间都具有动态性与演化性,而动态性与演化性的动力学机理包括了结构化、半结构化和非结构化特征。因此,针对突发事件的风险灾害危机管理,都要以此为基本依据,建立在精准的源头风险识别与分析基础上。
我国现行的以“一案三制”(即应急预案,加上应急体制、机制、法制)为核心的综合应急管理体系在自然灾害、事故灾难、公共卫生事件以及社会安全事件等领域取得了较好的效果,②风险灾害危机管理水平有了很大的提升。然而,从十余年的管理实践来看,仍然存在着诸多不足,表现出一系列的发展不平衡,包括:(1)灾害响应强,风险预警弱。强调事后的响应,忽视事前的预警,近期发生的河北邢台洪灾便在此列。(2)灾害响应强,危机沟通弱。片面强调政府响应,忽视与公众的沟通,2015年的“天津港火灾爆炸”便是典型。(3)灾害处置强,应急决策弱。在灾害响应中,强调灾害处置的措施,而忽视应急决策的科学性,2015年的“哈尔滨大火”就是如此。
造成上述发展不平衡的主要原因在于对引发突发事件的全要素缺乏精准识别与分析。每一个突发事件产生的背后都有着大量复杂的因素存在,特别是社会、经济、文化、自然、地理、生态等不同因素对于事前准备、事中响应与事后处置都有着不同层面的影响,③因此风险灾害危机管理需要建立在对突发事件进行全要素识别与分析的基础上,开展多维度、多尺度、多方位的数据集成、融合,以及对应急处置信息进行数据挖掘与数据耕耘。然而,传统的应急管理方法不能做到对数据、信息的全方位采集特别是实时分析,从而造成现行的应急管理体系主要进行事后的随机应对,并且主要根据已有的突发事件“案例库”进行比对分析,基于以往的经验制定应急处置的决策与措施。可以说,传统的风险灾害危机管理方法较多地沿用案例或样本思维,但在如今各方面不确定性急剧增大的风险社会中,④案例或样本思维对多维(海量)、复杂(不确定)的数据(信息)的敏感性较弱,响应效率不高。
突发事件,特别是突发事件的管理应对具有强烈的情景依赖性,参与主体(包括政府、公众、企业、NGO等)的内在需求(包括主体特征、利益诉求、行为偏好等)以及主体间行为的交互(包括信息交互、互动影响、风险分配等)、外部环境(包括自然环境、技术环境、经济环境等)的变化构成了应急管理的情景特征。情景认知不足容易引发预警失效、响应不灵以及处置不当等后果,然而传统应急管理体系在情景分析,特别是情景要素的提取与建模方面缺乏有效的方法支撑。
综上,传统研究方法与管理实践均缺乏对突发事件应对的主动性与前瞻性。随着大数据的出现,这种被动应对的局面有望得到改变。
相较于传统研究方法,大数据是在与现象和个体所相关联的整体信息思维下对该现象和该个体的描述。因此,大数据能够切实地保证在全信息下对研究对象的整体性描述,并为相关决策制定提供高质量的数据基础。
关于大数据的研究兴起于2008年,并呈现出典型的跨学科特征。被广为援引的文献包括:《自然》杂志的专题文章《大数据:从数据中提取意义》⑤、国际数据资讯公司(International Data Group,简称IDG)的研究报告《从混沌中提取价值》⑥、《科学》杂志的专刊文章《挑战与机遇》⑦、麦肯锡全球研究院(Mckinsey Global Institute)的两份研究报告《大数据:创新、竞争和生产力的下一个前沿》《开放数据:用信息流动释放创新与绩效》⑧⑨、舍恩伯格和库克耶的《大数据时代:生活、工作与思维的变革》⑩,等等。这些综合研究讨论了大数据的概念界定、主要特征、研究范式等基础议题,为包括风险灾害危机管理在内的大数据研究提供了必要的背景知识,特别是大数据的出现为科学研究提供了“数据密集型科研”的研究范式,从数据中直接查找或挖掘所需要的信息、知识和智慧,引发了科学研究的方法革命,这也被称为继实验科学、理论科学、计算科学之外科学研究的“第四范式(The Fourth Paradigm)”。这一范式的特点表现为:不在意数据的杂乱,但强调数据的海量;不要求数据精确,但要求数据有代表性;不刻意追求因果关系,但重视规律总结。
联合国在大数据白皮书(Big Data For Development: Opportunities & Challenges (2012))中指出,满足如下条件才能称之为“大数据”:(1)数字化,即数据是以数字方式创建的,并且可由一系列计算机语言“0”和“1”存储,从而实现计算机全过程识别与操纵;(2)被动化,即数据是被动地由日常数字服务所产生,而非人为地主动地去索取;(3)自动化,即有一个系统可以在自动地提取和存储相关数据;(4)可追踪,即数据可以进行追踪溯源,例如移动电话位置数据与呼叫持续时间等;(5)连续化,即对数据可以进行实时分析。据此,风险灾害危机管理领域目前可用的大数据构成如图1所示:
不过在实际中也不必过分苛求。现在许多实践和研究中处理的巨量数据,尚不能完全满足联合国的《大数据开发报告》的要求,但这并不妨碍我们据此尝试着做大数据分析,并逐步地从不完全符合到完全符合联合国《大数据开发报告》的要求。
例如,在大数据概念出现之前,最接近大数据的就是气象数据,即以各种传感器输送的巨量庞杂数据。2012年3月,广东省与国家气象局签署《关于加快气象现代化试点省建设合作备忘录》,一方面探索建立基于云计算和大数据技术基础上的气象大数据试验平台;另一方面以此为依托,建立省、市、县(区)三级突发事件预警信息发布中心,发布自然灾害、事故灾难、公共卫生事件等三大类各种预警信息,实现预防、预警、预案三项工作一体化。其中,阳江市是先行典型,他们的创新实践见图2:
在图1和图2中,风险灾害危机管理大数据主要表现为遥感大数据和社交大数据等两大类型,来源于公共部门、私人部门和个体等三类主体。这表明大数据的获取需要不同类型的利益相关者共同努力,从而使风险灾害危机管理者能够获得全样本数据。大数据的主要特征包括数据容量巨大(Volumn)、数据类型繁多(Variety)、数据价值高(Value)以及处理速度快(Velocity),即4V特征,这给大数据在风险灾害危机管理领域的应用提供了帮助。有证据表明,如果在突发事件的前期有数据支撑的话,就能够有效提升应急响应效率,特别是一些有价值的数据,例如具有快速传播功能的社交媒体数据等。最近全球防灾中心(Global Disaster Preparedness Centre,简称GDPC)进行的一项研究表明,社交媒体数据不仅可用于灾害应对,而且还具有风险预警的潜力。该研究进一步指出,社交媒体大数据能够扩大危机沟通的覆盖面,提高灾害评估内容的有效性等。此外,在突发事件发生时,社交媒体作为信息高速传播的渠道也能够在应急响应中承担部分责任,有助于备灾。
需要指出的是,大数据的类型多种多样,在风险灾害危机管理中,并不一定都要求数据海量且高速率,针对突发事件的应急响应需要准确识别数据之间的关联性特征,例如,在对公众进行危机沟通时往往只需要识别出群体中少数有影响性与权威性的个体即可。在风险灾害危机管理中,全样本数据的提取、清洗、转化、处理与储存能够识别与分析数据的有效性和关联性特征,从而在事前准备阶段、事中响应阶段、事后处置与救援阶段发挥积极的作用,包括降低灾害传播风险、提升应急准备效能、强化危机沟通效果等。
目前大数据分析方法主要包括文本分析、语义识别、多元回归等,大数据分析的目的在于对多维多尺度数据的获取、融合与表达,以及多维数据集成下的情景建模。从大数据的获取来看,主要涉及数据挖掘。基于社交媒体的大数据除了采用爬虫(Crawler)进行获得以外,也需要应用新的方法技术以提高数据获取的精度、效率和普遍性。基于开放数据的大数据获取则有赖于实地调研和与政府、企业的合作。此外,数据的分类、聚类方法也需要应用与发展,为核心子课题提供技术辅助。从大数据的融合来看,主要涉及不同来源大数据的融合、多源数据的集成与映射、基于MapReduce或Hadoop的衍生分析方法等。从大数据的表达来看,主要涉及数据的特征识别(如数据流、时间序列)、内容建模(如数据驱动)和语义理解(如机器学习)。
随着技术水平的提升,大数据分析在市场营销、服务运作、公共卫生等领域发挥了积极影响和推动作用,并且社交媒体等大数据已经证明有潜力在突发事件应对中发挥积极的作用。
如前文所述,大数据既包括来自社会的数据,如政府开放的数据;也包括通过传感器收集的来自物理空间和网络空间的数据,如自媒体数据(社交媒体、博客、微博等)、日志数据(搜索引擎、运营商、网购服务、金融服务等产生的用户行为、交易的日志等)和富媒体数据(文本、音视频、图片、文字等)。目前,应用大数据分析研究风险灾害危机管理议题主要借助于社交媒体(如推特Twitter、微博、Facebook等)数据。
美国学者苏顿(Jeanette Sutton)对推特信息的转发与政府预警发布、公众的风险感知与防护行为之间的关系进行了系列的案例研究。基于“夏威夷海啸”(Hawaii Tsunami)的案例研究显示,信息预警应该通过多渠道(Multiple channels)发布,而社交媒体可以成为发布渠道之一。基于“沃尔多峡谷大火”(Waldo Canyon Wildfire)的案例研究显示,在政府部门通过推特发布信息的转发(Retransmission)行为中,在信息字数受到限制的情况下,信息的发布应该明确、具体,以免产生“磨洋工”行为(Milling behavior),导致公众不能迅速采取防护行动。基于“波尔多洪水”(Boulder Floods)的案例研究表明,在扩散预警信息时,即使是通过推特发布的短文本信息(Terse message),也应该提供灾害事件的信息、影响和自我保护的可行动建议;地方应急领导人发布的信息更容易被其他组织转发,预警信息应该同时注重解释性(Declarative/Explanative)内容和指导性(Imperative/Instructional)内容。针对“波士顿马拉松爆炸”(Boston Marathon Booming),通过对官方账号发布的推特信息的负二项回归分析(Negative Binominal Regression)则显示:官方推特账号信息的转发受到信息内容、风格和发布者特征的共同影响;在恐怖袭击的情况下,包括“URL(Uniform Resource Locator,统一资源定位符)”的信息反而会降低转发比率;因此,在今后的反恐中,通过推特发布的预警信息可以加上相应的指导措施,以便提高反恐信息预警的信息扩散,提升反恐信息预警的效率。此外,苏顿等人以文本挖掘方法进行的跨灾害(cross hazards)的比较分析,基于负二项回归模型的分析结果显示,标签(Hashtag)和账户的粉丝数对信息的转发有正面作用,而朝向个体、表达感激或包括URL则会降低信息被转发的可能性。与此同时,一些传统上并不多见也不强调的信息可能会提高信息的转发比率。
国外学者在灾害管理领域的研究也较多。2007年“弗吉尼亚理工枪击事件”(Virginia Tech Shooting)的案例研究显示,社交媒体上的交互信息有助于形成集体智慧(collective intelligence)。“海地地震”(Haiti Earthquake)的案例研究表明,灾后在社交媒体上出现的“志愿推者”(Voluntweeters)有助于加强志愿者的自组织(Self-organization)。“桑迪飓风”(Hurricane Sandy)的案例研究表明,社交媒体可以提升市民参与(Citizen participation)水平,政府与市民对信息的共同生产(Co-production)有利于提升应急响应的适应能力。近些年,基于中国社交媒体的应急响应研究也见诸于英文文献。例如,“汶川地震”的案例研究显示,中国网民如何利用“天涯”在线论坛进行应急响应和灾后恢复,发展了基于天涯论坛数据的分类框架。“玉树地震”的案例研究则利用新浪微博的数据,展示中国网民如何通过社交媒体来开展应急响应。台湾学者也以“莫拉克台风”(Typhoon Morakot)为案例,讨论了台湾网民利用社交媒体进行的应急响应。
对社交媒体的危机沟通研究最早可追溯到2001年的英国“口蹄疫事件”,农场主们在网上建立虚拟社区以满足信息需求,使得地理上分散的公众得以联系起来,从而改变了原来以地域为界的社区概念。2007年“南加州大火”的一项案例研究表明,社交媒体促使公众在互联网上寻找共同体,这既表明了公众的信息渴求(Information dearth),也可能导致信息过载(Information overload);另一项研究则显示,美国的危机管理在组织设计上是弹性的,社交媒体为美国政府的危机沟通提供了非正式渠道(Back channel),与正式渠道相比,这种非正式渠道是点对点的沟通(Peer to peer communication),是秘密的、非常规的。2009年“西雅图暴力事件”(Seattle Violent Crisis)的案例研究则证实,推特已经成为市民、新闻组织和其他机构共享危机信息的重要方法。这些研究为理解社交媒体对个体层面的危机沟通的影响提供了帮助。
目前的情况是,企业运用大数据经商创业走在最前面,因为有利益驱动;政府运用大数据精细管理紧随其后,因为被压力所逼;相比之下,学界运用大数据做研究反倒落在后面了,因为趋利动力不足,困境压力不大。
国外学者运用社交媒体等大数据开展风险灾害危机管理的研究,对我们构建大数据分析范式提供了借鉴。大数据分析已经成为风险灾害危机管理中的一项重要资源,必然推动传统的应急管理理论和体系发生变革和演化。大数据分析与传统风险灾害危机管理基本范式的融合促使了新的范式形成。特别是随着互联网、云平台及智能终端的进一步广泛使用,不同结构的数据通过异构、融合和流动来为应急响应全过程提供智能化服务。本文探索构建如下的大数据驱动风险灾害危机管理的研究范式:
(1)“数据-信息-知识”关键资源链的重构
大数据背景下风险灾害危机管理的重大变化在于,以数据、信息为基础融合而成的知识成为最基本、最重要的资源,它能极大地拓展原有风险灾害危机管理信息的边界,提升管理主体的决策能力,增强对突发事件不确定性的管控。因此,大数据背景下风险灾害危机管理的价值体现与能力体现的基础,即为“数据-信息-知识”这一关键资源链的重构、配置和管理。这就需要依据大数据背景下风险灾害危机管理全过程中的主体行为特征、任务特征、环境特征、组织特征,构建“数据-信息-知识”关键资源链的动态演化规律、属性描述方法与模型。
(2)风险灾害危机全成因分析与全景式建模
全成因分析是风险灾害危机管理的前提,只有找准源头,才能实现有针对性的应急预警。由于有关风险灾害危机成因的数据不仅包括分散在公安、消防、医疗卫生、气象气候、地理地质等不同政府部门与组织的开放数据,还包括经济数据、自然数据、交通数据、社会数据等其他相关基础数据,因此需要综合运用数据挖掘与数据耕耘技术,对多来源、多维度与多尺度的信息进行数据清洗和集成,并进一步采用时序跟踪、关联分析以及网络聚类等大数据分析方法,对风险灾害危机大数据进行数据捕获、融合与更新,实现由传统的信息采集转向数据加工、数据挖掘和数据处理的“大数据驱动”转变。针对潜在的风险灾害危机事件进行全景式重构与再现,构建计算机程序处理方式,实现由突发事件“实际现象”抽象至“概念情景”的转变,从而为实现风险灾害危机事件的有效应对奠定数据与建模基础。
(3)基于信息研判的风险预警
在全成因分析与全景式建模的基础上,对风险灾害危机数据予以信息整合,再对相关信息进行研判,确定相应的预警信息,并通过发布、传递风险预警信息,推动风险预警信息的扩散,既使政府的预防与准备做得更有针对性和有效性,又增强社会公众的自我防护意识。
(4)基于靶向思维的应急响应
基于靶向思维的应急响应方案序列设计,运用循证学的方法,通过在已有的具体突发事件应对实践中提取关于应急响应方案设计的最佳证据,在明晰突发事件的特征向量与循证案例匹配程度的基础上,进一步优化应急响应方案。同时,运用并行、串行与混合等方式构建应急响应“靶点”序列,设计有指向性的保障措施与响应路径。
(5)基于社交媒体的危机沟通
在风险灾害危机管理的全过程中,充分发挥大数据所具有的4V特征之优势,运用社交媒体对突发事件信息进行及时披露与沟通,消除由信息不对称所造成的公众恐慌等不利后果。
在此框架下,我们这些年开始了一些有益的探索。
2016年6月23日,江苏省盐城市阜宁县发生特大龙卷风灾害。以此为案例,我们一边投入救灾志愿者行动,一边运用参与式观察和体验、实地调查和访谈等方法,研究了微信在灾害应急管理中的作用,结果发现:与其他通讯手段和信息渠道相比,微信在信息发布上占一席之地,在危机沟通上遥遥领先,在治理参与上行之有效;但在重视微信正面功能的同时,也不能忽视其在真实性、冗杂性和不平衡性等方面的不足,并通过技术的提升、管理的改进予以弥补。
我们还对发端于江苏省淮安市、推广及全国范围的网络信访进行研究。发现网络信访不仅方便了信访人,让“数据多跑路、群众少跑腿”,而且极大提高信访办理工作的效率。此后又接受国家信访局的委托,承担“构建信访大数据研判与应用机制研究”的课题,经过课题研究认识到,“发展基于信访大数据的社会预警已经超出了信访部门信访办理的范畴,这就需要跳出信访部门的视野局限,站在更高的层面上来予以筹谋和规划,由传统的信访办理走向信访治理。在这种意义上,发展基于信访大数据的社会风险预警是一项事关社会和谐稳定和国家长治久安的战略设想。”
在大数据环境下,风险灾害危机管理及其研究,本质上就是数据提取、清洗、转化、处理、分析与储存的综合体。而要真正实现大数据驱动的风险预警、应急决策与危机沟通等目标,还需要注意以下几点:
(1)学科交叉
大数据驱动的风险灾害危机管理及其研究,超出了任何单一学科的承载能力,因此,需要综合集成计算机科学、管理科学、社会科学、政策科学、技术科学等不同学科的理论与方法,开展跨学科的合作与交叉研究,这是推进大数据分析在风险灾害危机管理及其研究领域发展的重要科学基础。
(2)数据集成
在风险灾害危机管理及其研究中应用大数据分析,其前提在于足量的、连续的、有效的数据保障。特别是作为风险灾害危机管理的主导方,政府的数据更加需要开放与整合,政府的不同部门(例如公安、卫生、气象等)需要相互打通数据接口,通过数据共享以实现对风险灾害危机事件的及时响应。
(3)信息规范
大数据时代,社交媒体数据的传播速度与广度足以制造一个新的突发事件,政府应通过健全相应的法律法规来约束公众信息传播,发挥大数据的正能量传递,防范并遏制虚假信息、恐慌信息等负能量的扩散。同时,还要注意保护社会公众的隐私,实现数据开放与隐私保护之间的平衡。
(4)社会参与
大数据的优势在于能够实现非结构化数据、半结构化数据的结构化,因此,虽然公众、NGO等社会组织的数据存在杂乱无序的可能性,但为了保证数据的全面性与系统性,需要积极推动社会公众等其他主体参与风险灾害危机管理的数据供给。
(5)技术创新
随着信息技术的快速发展,机器学习、内容建模等大数据分析技术也在不断更新升级,因此要积极推动情景耕耘、模式识别等人工智能技术的创新,从而为突发事件的分析和预测提供有力的工具。
(6)体系健全
如前文所述,我国现行的综合应急管理体系存在不足之处,需要融入大数据分析技术,因此,政府需要制定专门的政策、规章、办法来保障大数据分析技术的应用,从而推动风险灾害危机管理体系的健全和完善。
①童星:《风险灾害危机连续统与全过程应对体系》,《学习论坛》2012年第8期。
②童星:《论风险灾害危机管理的跨学科研究》,《学海》2016年第2期。
③马奔、毛庆铎:《大数据在应急管理中的应用》,《中国行政管理》2015年第3期。
④童星:《论风险灾害危机管理的跨学科研究》,《学海》2016年第2期。
⑤F. Frankel, R. Reid, “Big data: Distilling meaning from data”,Nature, No.7209, Vol.455 (2008), p.30.
⑥J. Gantz, D. Reinsel,Extractingvaluefromchaos, Massachusetts: IDG IVIEW, 2011, p.6.
⑦Science Staff, “Challenges and Opportunities”,Science, No.6018, Vol.331 (2011), pp.692-693.
⑧J. Manyika, M. Chui, B. Brown, et al,Bigdata:Thenextfrontierforinnovation,competition,andproductivity, McKinsey Global Institute, 2011, p.15.
⑨参见J. Manyika, M. Chui, P. Groves, et al,Opendata:Unlockinginnovationandperformancewithliquidinformation, McKinsey Global Institute, 2013.
⑩参见V. Mayer-Schönberger, K. Cukier,Bigdata:Arevolutionthatwilltransformhowwelive,work,andthink, Houghton Mifflin Harcourt, 2013.