基于文献计量分析的国内山洪灾害现状研究

2017-05-12 07:14王宏伟曹永强
关键词:共词分析研究热点聚类分析

王宏伟,郑 爽,曹永强

(1.辽宁省本溪市水文局,辽宁 本溪 117000;2.辽宁师范大学 城市与环境学院,辽宁 大连 116029)

基于文献计量分析的国内山洪灾害现状研究

王宏伟1,郑 爽2,曹永强2

(1.辽宁省本溪市水文局,辽宁 本溪 117000;2.辽宁师范大学 城市与环境学院,辽宁 大连 116029)

科技文献能够充分反映科学研究的发展动态,通过文献计量的方法可以很好地提示学科领域的研究前沿与热点问题。为揭示近20年来山洪灾害领域的研究现状,本文从文献计量学的角度出发,以CNKI和web of sciece数据库为统计源,以“山洪灾害”为关键词,运用共词分析法、聚类分析法以及多维尺度分析法对国内的相关文献进行统计分析,结果表明:(1)山洪灾害的研究受到了学科发展和社会需求的双向驱动;(2)山洪灾害研究热点集中在影响和防御两个方面;(3)山洪灾害的研究形成了成因、影响和防灾减灾分析三大类群体,且三者之间联系紧密。

山洪灾害;关键词;共词分析;聚类分析;研究热点;现状分析

1 研究背景

山洪灾害是指由于降雨在山丘区引发的洪水灾害及由山洪诱发的泥石流、滑坡等对国民经济和人民生命财产造成损失的灾害[1]。山洪灾害是较为常见的一种自然灾害,具有突发性强、水量集中、流速大、冲刷能力强和地域性差异大等特点。破坏性极强,灾后恢复工作十分困难[2]。造成山洪灾害的原因有自然因素和人为因素两个方面,自然因素是造成山洪灾害的根源,人类不合理的活动因素,加剧了山洪灾害的形成与发展。我国地貌类型复杂,气候多变,暴雨频发,再加上人类活动的影响,导致我国重大山洪灾害频发。山洪灾害已成为威胁人民群众生命财产安全的突出隐患。

近年来,突发性和局地性极端强降雨诱发的山洪灾害已导致大量人员伤亡,伤亡人数占洪涝灾害死亡总人数的比例呈上升趋势[3]。如2010年8月8日,甘肃省甘南藏族自治州舟曲县发生特大泥石流灾害,共造成1 434人遇难,331人失踪;2013年8月16日,辽宁省清原县特大型山洪灾害造成77人死亡,直接经济损失76.34亿元;2013年7月10日,四川省都江堰特大型高位山体滑坡事件中,造成45人死亡,116人失踪,并造成严重财产损失。为避免山洪灾害造成的经济损失和人员伤亡,对山洪灾害的形成机理和规律特征的把握和研究已成为有效防治山洪灾害的热点问题。

国内学者对山洪灾害防治领域研究较为广泛,王礼先等[4]尝试以前期实际15 d雨量和发生灾害当日雨量为输入值,构建了山洪泥石流BP神经网络预报模型;周金星[5]在分析北京山区山洪及泥石流灾害发生成因及特点的基础上,建立了北京山洪及泥石流灾害空间预报信息系统,并对北京山区山洪及泥石流灾害空间分布进行了预报;刘苏峡等[6]针对“5·12”汶川特大地震造成的灾区地表松动,使处于雨季的灾区面临山洪灾害的严峻挑战,提出了汶川特大地震灾后山洪灾害预估与应对措施。随着经济的快速发展和山洪灾害带来的损失的增加,我国加大了山洪灾害的防治力度。2006年10月,国务院正式批复了《全国山洪灾害防治规划》,该规划以非工程措施为主、非工程措施和工程措施相结合为原则,建成了我国山洪灾害防治区以监测、预报、通信和预警等措施为主的防灾减灾体系,再一次强调了对山洪灾害防治的重要性。因此,研究和掌握山洪灾害发生的规律,为防治山洪灾害提供科技支撑是当前我国防治山洪灾害的重要任务之一。

2 山洪灾害期刊论文发文统计

2.1数据获取文献资料的获取会直接影响数据的分析结果,不同的文献数据库在主题表达、收录范围和表现形式等方面都存在差异。鉴于CNKI数据库和Web of science数据库有收录范围广、表现形式全面、数据库更新及时等优势,本文选取CNKI中国知网学术期刊网络出版总库和Web of science数据库作为统计源,以山洪灾害作为关键词进行检索,检索时间范围为1996年1月1日—2015年12月31日,经过检索,共得到符合条件的期刊论文2 400篇。每年期刊论文数量分布如表1所示,统计时间为2016年。

表1 1996—2015年“山洪灾害”期刊论文分布

2.2数据分析与结果以论文发表年度为横坐标,以每年的论文发表数量为纵坐标。得到所研究的相关文章的逐年分布图和我国山洪灾害研究的发展趋势。每年期刊论文数量分布见图1。

图1 山洪灾害类论文随时间分布图

由图1可以看出,从1996—2015年有关山洪灾害的论文呈总体上升趋势,但并不是逐年上升;在2009、2010年出现了下降情况,说明当年对山洪灾害的防治措施达到了一定的效果;在2011年增长趋势突增,相关论文数为244篇,占总文献数的10.17%。一方面,经过查阅发现2010年我国发生多次重大山洪灾害事故,损失严重,引起了我国研究者对山洪灾害的高度关注;另一方面,山洪灾害问题受到关注,山洪灾害方面的科研取得卓越成果,也是论文数目增长的原因。

3 山洪灾害高频关键词及词频分析

不同的论文对相同含义关键词的表述存在一定的差异,因此,对部分同义词、近义词进行合并处理,防汛、防汛部门、防汛检查、防汛抗旱、防汛抗旱指挥部合并为防汛工作;防御、防御对策、防御工作合并为防御工作;监测预警、监测预警系统、预警、预警系统合并为监测预警;洪涝灾害、洪水、洪水灾害、流域性大洪水、水旱灾害合并为洪涝灾害。使用文献计量分析软件Bibexcel对关键词进行统计分析,结果显示关键词词频大于30次的关键词有38个,见表2,这38个关键词在一定程度上代表了山洪灾害领域研究核心和热点问题。

表2 1996—2015年高频关键词及其词频

从表2中可以看出,(1)近20年以来,洪涝灾害、防洪减灾和防御对策一直是山洪灾害研究领域的核心问题,由此可见,我国的山洪灾害问题已经日趋严重。(2)防御、防洪、防汛和监测预警等是主要研究热点,在灾害发生之前或者之后,通过对民生、经济和社会等各个方面的准备,减少灾害带来的影响,通过对所造成的影响和损失的可能性进行量化评估,从而找出降低风险的手段方法,这对山洪灾害的研究起着至关重要的作用。(3)对于泥石流、地质灾害和水旱灾害等的研究也较多,通过对山洪灾害的研究来分析导致山洪灾害的主要原因和山洪灾害所引发的消极影响,这为解决山洪灾害问题及提出防治措施提供了理论基础。

以上这些关键词在山洪灾害论文中出现频次比较高,在一定程度上代表了山洪灾害的研究核心和热点,但仅按出现频次分析,还不能完全反映它们之间的关系,因此本文采用Bibexcel软件对上述38个关键词进行两两配对,统计它们在2 400篇文献中共现频次,形成38×38的共词矩阵(表3)。其中主对角线的数据为关键词出现的频次,非主对角线上的数据表示两个关键词共同出现在同一篇论文中的次数。通过共词矩阵,更加直观的体现出山洪灾害领域的研究热点问题。

表3 1996—2015年高频关键词共词矩阵(部分)

表3中的共词矩阵,反映的仅是一种表面现象,因为两个关键词共现频次的多少直接取决于各自关键词词频的大小,由于关键词的频次相差悬殊,因此共词矩阵中的数据相差较大。本文引入共现相对强度的指标Ochiia 系数[7]计算关键词共现的强度,揭示关键词之间的共现关系。Ochiia系数计算公式如下:

利用式(1)计算得到关键词共现相对强度构成的相异矩阵,如表4所示。

为了更好的展现出关键词之间的相关性,从而更加直观的表现出关键词之间的内在联系,可用Netdraw软件绘制共词网络图谱,得到高频关键词共现网络可视图,见图2。

如图2所示,是38个关键词形成的共现网络可视图,共现图中一个节点表示一个关键词,节点大小表示关键词出现频次高低,节点之间的连线表示关键词之间有共现关系,连线的粗细则反应词汇之间共现次数的多少,越靠近中心的连线越粗越密集,节点也越大,图2中山洪灾害,出现频次最高,并位于共现关系图的正中心且该节点与监测预警、防汛检查、防洪减灾和防御等周围节点共现次数较多。表明1996—2015年间我国山洪灾害研究的主要内容是山洪灾害,而监测预警、防汛抢险、防洪减灾和防御等是与之相关的研究热点。围绕着洪涝灾害、防汛、防御形成了省防汛抗旱指挥部、人民群众、地质灾害、群防群策和非工程措施等研究热点的结构主体,它们之间具有紧密的关联性。

表4 1996—2015年高频关键词共词相异矩阵(部分)

图2 高频关键词共现网络可视图

图3 系统聚类分析冰柱图

图4 系统聚类分析树状图

4 山洪灾害高频关键词共词聚类分析

聚类分析是根据“物以类聚”这一原理的一种科学有效的研究方法,它的基本思想是先将待聚类的n个变量各自看成一类,共有n类;然后按照事先选定的方法计算聚类统计量,将关系密切的变量合为一类,从而判断出一大类样品中每个单独变量之间的亲疏关系。本文采用系统聚类的方法对38个高频关键词进行聚类分析,首先将每一个关键词看成单独的一类,通过选定的方法把最近的两类合并,然后重新计算各类之间的距离,再把距离最近的两类合并,如此下去,每次重复都减少一类,直到最后所有的关键词都归为一类为止。以上文构造的38×38相异矩阵为基础,运用SPSS软件中的系统聚类方式进行聚类分析,得出聚类冰柱图和聚类树形图,如图3、图4所示。

结合系统聚类分析冰柱图(图3)和系统聚类分析树状图(图4),可以将上述高频关键词划分为3个主要的聚类群体,每个聚类群体包含的关键词见表5。

由表5可知,关键词的聚类结果可划分为3类聚类群体。

(1)群体1包括成因、暴雨、灾害和小流域等关键词,主要研究引发山洪灾害的诱因及山洪灾害的一系列特点,由于山洪往往发生突然、空间尺度小、分布数量多、成灾迅速,如果预先对山洪风险度进行评估和分析,可以对山洪风险进行有效管理,预防损失的发生以及减少损失发生的影响程度,以保证获得最大的利益。因此,很多学者将各种新理论和新方法引入了山洪风险分析中,如ANN、Bayesian方法、灰色、模糊和集对分析等。张平仓等[8]对中国山洪灾害进行了区划,将全国划分为3个山洪灾害防治一级区、12个二级区和33个三级区。唐川等[9]借助于GIS将危险评价图与易损性图进行叠加分析,完成了红河流域的山洪灾害风险区划图。吴燕华等[10]利用集对分析方法对区域泥石流危险性进行了评价。刘希林等[11]提出了基于生态环境的风险价值的泥石流灾害综合风险分析方法,并以汶川地震区都江堰市八一沟泥石流灾害为例,对评估模型进行了初步检验。

表5 关键词聚类群体划分

(2)群体2研究的内容包括临界雨量、流域性大洪水、中小河流、山洪灾害、洪涝灾害、直接经济损失、强降雨过程、除险加固、水库安全、防台风、防汛抢险和蓄滞洪区等,经过文献分析,可以把群体2主要研究方向归结为山洪灾害带来的各种影响、山洪灾害引发的一系列地质灾害和对山洪预警指标的研究,以及对山洪灾害的防御措施等,目前国内外山洪预警指标主要采用临界雨量、水位和流量[12]。在我国,陈桂亚等[13]提出利用历史雨量资料分析计算地区山洪灾害的临界雨量方法。叶勇等[14]应用该方法分析浙江省小流域山洪灾害临界雨量。另外,江锦红等[15]从河道安全泄量出发,提出最小临界雨量与临界雨力的概念和计算方法,并以此构建暴雨临界曲线作为山洪预警的标准。在国外,山洪研究开展较早,方法较为成熟,预警指标常用动态临界雨量,典型代表为美国国家气象局水文研究中心研发的山洪预警指南系统(Flash FloodGuidance,FFG)[16-19]。

(3)群体3研究包括避灾、防御工作、监测预警、群测群防和非工程措施等,主要从灾害防治的角度和方法进行山洪灾害研究。山洪灾害防治非工程措施主要是通过监测预警系统,实时收集主要控制点雨水情、工情等信息,来掌握雨水情变化,重点区域重点监控;开展系列非工程措施建设来完善防御预案、强化群测群防体系、宣传防御知识、提高全民防灾避灾意识等,对山洪灾害进行有效防御,尽量使山丘地区的山洪灾害日影响降到最低,在极短时间内紧急转移大批的人员和财产,最大限度地减少人员伤亡和财产损失,保障人民群众生命财产安全。非工程措施在山洪灾害防治中的具体应用,能有效提高山洪灾害防治工作的质量和效率,确保群众的生命和财产安全,将山洪灾害的破坏降到最低。

图5 多维尺度分析结果

为了更加显著的看出关键词之间的聚类群体,采用SPSS统计软件中的多维尺度分析(ALS⁃CALE)功能来构建多维尺度可视化图谱,从可视化图谱中可以直观、形象的看出关键词之间的聚类群体[20-21],多维尺度分析的模型拟合指标为:stress=0.14077,RsQ=0.7772,其中,RsQ即决定系数,表示总变异中能够被相对空间距离所解释的比例;Stress值是依据克鲁斯卡尔(Kruskal)应力公式I计算的结果“克鲁斯卡尔曾给出一种经验评价Stress优劣的尺度:若Stress>0.2,则近似程度较差;若Stress<0.2,则近似程度较为满意”,本文研究模型的拟合指标stress=0.14077<0.2,所以模型的解释程度是比较好的。多维尺度分析结果如图5。

5 结论

(1)近20年来,我国山洪灾害方面文献数量总体呈逐渐增长趋势,从发展角度来看,我国对于山洪灾害的研究受到了学科发展和社会需求的双向驱动。从1996—2015年我国山洪灾害学科的研究热点是山洪灾害的影响和防御措施。本文通过采用层次聚类分析与多维尺度分析的结果,在对山洪灾害的研究过程中,形成了山洪灾害的成因、山洪灾害的影响和防灾减灾的分析三大类群体,且四者之间具有一定的相互联系。(2)基于共现网络可视图,山洪、防汛和防御等处于核心位置,是最重要的研究方向。在其研究基础上形成了省防汛抗旱指挥部、人民群众、地质灾害、群防群策、非工程措施等研究热点的结构主体,它们之间的关联性较为紧密。(3)本文选取累积出现频次达到30的前38个关键词作为高频关键词,其集中性和囊括范围比较适中。但是,也不排除一些频次较低的关键词可能成为未来的研究热点。这种共词聚类方法主要针对近20年的研究,对于预测未来发展趋势上还不够有说服力。

[1] 山东省水利厅.山东省山洪灾害防治规划[R].济南:山东省水利厅,2010.

[2] 张辉,许新宜,王红瑞.2000~2010我国洪涝灾害损失综合评估及成因分析[J].水利经济,2011,29(5):5-11.

[3] 张红萍.山区小流域洪水风险评估与预警技术研究[D].北京:中国水利水电科学研究院,2013.

[4] 王礼先,于志民.山洪及泥石流灾害预报[M].北京:中国林业出版社,2001.

[5] 周金星.山洪及泥石流灾害空间预报技术研究[J].水土保持学报,2001,15(2):112-116.

[6] 刘苏峡,夏军,蔡强国,等.汶川特大地震灾后山洪灾害预估与应对措施[C]//中国科学技术协会2008防灾减灾论坛论文集.北京:中国科学技术协会,2008.

[7] 张晗,崔雷.运用共词聚类介析法研究生物信息学的学科热点[J].医学情报工作,2001(5):327-330.

[8] 张平仓,赵健,胡维忠,等.中国山洪灾害防治区划[M].武汉:长江出版社,2009.

[9] 唐川,朱静.基于GIS的山洪灾害风险区划[J].地理学报,2005,60(1):87-94.

[10] 吴燕华.集对分析方法在区域泥石流危险性评价中的应用研究[J].四川大学学报,2012,44(1):54-59.

[11] 刘希林,尚志海.泥石流灾害综合风险分析方法及其应用[J].地理与地理信息科学,2012,28(5):86-89.

[12] 李昌志,孙东亚.山洪灾害预警指标确定方法[J].中国水利,2012(9):54-56.

[13] 陈桂亚,袁雅鸣.山洪灾害临界雨量分析计算方法研究[J].人民长江,2005,36(12):40-44.

[14] 叶勇,王振宇,范波芹.浙江省小流域山洪灾害临界雨量确定方法分析[J].水文,2008,28(1):56-58.

[15] 江锦红,邵利萍.基于降雨观测资料的山洪预警标准[J].水利学报,2010,41(4):458-463.

[16] CARPENTERA T M,SPERFSLAGE J A,GEORGAKAKOS K P,et al.National threshold runoff estimation uti⁃lizing GIS in support of operational flash flood warning systems[J].Journal of Hydrology,1999,224:21-44.

[17] GEORGAKAKOS K P.Analytical results for operational flash flood guidance[J].Journal of Hydrology,2006,317:81-103.

[18] GEORGAKAKOS K P.Mitigating adverse hydrological impacts of storms on a global scale with high resolution,global flash flood guidance[C]//Abstracts Volume of International Conference on Storms/AMOS-MSNZ National Conference.Australian Meteorological Society,Brisbane,Australia,2004.

[19] USACE.HEC-HMS hydrologic modeling system user’s manual[Z].US:Hydrologic Engineering Center,Davis,CA,2001.

[20] 刘景亮,裴丽.基于供词聚类的国外Folksonomy研究热点分析[J].图书馆学研究,2013(8):8-12,21.

[21] 钟伟金,李佳.共词分析法研究(三)—共词聚类分析法的原理与特点[J].情报杂志,2008(7):118-120.

Research review on the analysis of mountain torrents disaster situation based on the statistics of keywords

WANG Hongwei1,ZHENG Shuang2,CAO Yongqiang2
(1.Benxi Hydrology Bureau of Liaoning Province,Benxi 117000,China;2.School of urban planning and Environmental science,Liaoning Normal University,Da Lian 116029,China)

Science and technology literature can fully reflect the development trend of scientific research,and the bibliometric method can be used to reveal the research frontier and hot issues.This paper,from the perspective of the bibliometric and based on the theme of mountain torrents disaster published in the network publishing database of China National Knowledge Infrastructure(CNKI)and Web of science,uses Co-word Analysis Method and Cluster Analysis Method and Multidimensional Scaling Analysis of related lit⁃eratures to reveal the status of mountain flood disaster areas in recent 20 years.The results show that.(1)The research on mountain flood disaster is driven by disciplinary development and social needs.(2)Re⁃search hotspot focuses on two aspects of influence and defense.(3)The research on mountain flood has de⁃veloped three types of groups that have close relationship with each other.the groups include causes,ef⁃fects and disaster prevention and reduction.

torrential-flood disaster;keyword;co-word analysis;cluster analysis;situation analysis

TV877

A

10.13244/j.cnki.jiwhr.2017.01.004

1672-3031(2017)01-0029-08

(责任编辑:王成丽)

2015-12-23

国家自然科学基金项目(51579126,51279072)

王宏伟(1976-),男,辽宁本溪人,高级工程师,主要从事水文预报研究。E-mail:278471145@qq.com

曹永强(1972-),男,内蒙古乌盟人,博士,教授,主要从事水文水资源研究。E-mail:caoyongqiang@lnnu.edu.cn

猜你喜欢
共词分析研究热点聚类分析
近五年我国职业教育研究热点综析及未来展望
基于德温特数据库的关键共性技术分析
国内图书馆嵌入式服务研究主题分析
基于文献计量分析我国生物科学素养研究状况(2001~2016年)
基于知识图谱的智慧教育研究热点与趋势分析
农村居民家庭人均生活消费支出分析
自闭症谱系障碍儿童的教育干预
基于省会城市经济发展程度的实证分析
基于社会网络分析的我国微课研究探析
基于聚类分析的互联网广告投放研究