朱 霞,张 戈,王 耕,黄学勇
辽宁师范大学 城市与环境学院,辽宁 大连 116029
文献计量是图书情报学的分支学科,主要以不同科学文献的数量作为研究对象,通过数学与统计的方法来分析科学文献的研究状况和发展趋势[1-2],是一种可以分析不同学科领域文献外部特征信息的定量分析方法,研究文献的数量变化、发展趋势、结构分布,进而探讨研究领域的重点、特征和规律,具有显著的客观性、定量化、直观化的宏观研究优势[3-6]。
地质灾害是指在自然或人为作用下形成的,对人们生命财产安全造成威胁并对地质环境造成破坏的现象[7-9],其中突发性地质灾害是一种比其它自然灾害更难预测和监控的灾害,给人类造成的危害更大。近年来全球气候变化,全球突发性强降雨增多,局部地质灾害事件频发;人类社会经济的发展可能直接导致局部地质灾害的发生。当前,以中国期刊全文数据库为数据来源,以主题“文献计量”和“地质灾害”检索全文与此相关的文献,仅检索到276篇相关文献,其中部分文献是通过文献计量来分析地质灾害中特殊的灾种,比如滑坡、泥石流和地震等[10-11]。但使用文献计量的方法来统计和分析地质灾害的相关文献较少,论文将使用文献计量的方法来分析地质灾害的研究现状和趋势,统计国内外地质灾害文献研究的热点,分析地质灾害研究侧重于灾前监测预报、灾后救援治理、灾种分析、灾害分析方法、技术应用等方面,明确国内外研究的侧重点,初步探索地质灾害的研究热点和趋势,以期为更深层次的研究做铺垫。
国内数据来源于中国期刊数据库(CNKI),检索主题为“地质灾害”的相关文献,由于在CKNI中搜索的以“地质灾害”为主题的论文涉及到环境、矿业、交通运输、测绘等诸多领域,所以将论文限制在地质方面;最终筛选出共计6 246篇(检索时间为2018年10月18日)国内文献。国外数据来源于WEB OF SCIENCE的WEB OF SCIENCETM核心合集,检索主题为“geological hazard”,类型为article的相关文献,最终筛选出共计3 165篇与地质灾害相关的国外文献。
将已选出的6 246篇国内文献和3 165篇国外文献分别导入Bibexcel软件,分别得出国内和国外文献的高频关键词,但两者得出的关键词都较多。为了更好的突出研究热点,通过同义词、近义词合并减少不必要的重复。最终国内选取词频大于30的关键词共56个,国外选取词频大于13的关键词共55个。继续利用Bibexcel软件分别导出国内和国外两个56×56和55×55的共词矩阵。将两个矩阵导入UciNet6软件中分别生成##h文件,运用Netdraw软件做出地质灾害高频关键词共现网络可视图。
在CKNI上统计到的以“地质灾害”为主题的关于国内地质灾害文献每年的发表数量如图1所示。从柱状图可以看出文献发表的数量大体上呈波动线性上升趋势,尤其2008年汶川特大级地震引起受灾区群发性地质灾害频发,统计显示触发的地质灾害多达56 000处[12],但在2009年文献发表数量才达到历史最高,可能是受到了文献发表滞后性的影响。
图1 国内“地质灾害”相关论文每年的发表数量Fig.1 Number of publications of domestic “geological disasters” related papers per year
国内文献数量增长大致可以分为四个阶段。(1)初步探索时期(1991—2001年),此期间许多年份发文量<2篇,发文量最多的2001年也仅有7篇,可能是对地质灾害的开始初步探索,重视程度、研究深度都不够高。(2)萌芽阶段(2002—2009年),此阶段每年的发表数量逐年增加,在2009年达到416篇,此阶段增长83.2倍;特别是2008年汶川地震引起的地质灾害问题引起了许多学者关注并对其进行研究分析,导致文献数量猛增。(3)平稳阶段(2010—2014年),这个阶段文献的发表数量相比2009年有所下降,但基本保持平稳的发表状态,可能与这一期间基本没有发生特重大地质灾害事件有关。(4)波动增长阶段(2015—2018年),相比较2014年,2015年发表数量突增,增长1.5倍,可能与2015年出台的地质灾害评估规范,提出了统一的评估技术标准和“十二五”期间国家开展以“查孕灾背景、评灾害风险”为目标的关于崩塌滑坡泥石流灾害调查有关[13];2018年数据只截止到11月份,不能代表全年数据。
国外也大致分为四个不同的发展阶段。(1)萌芽阶段(1983—1992年),在此期间1991年发文最多也仅有10篇,国际上关于地质灾害的文献较少,此期间大部分年份发文量为0或1篇。(2)波动上升阶段(1993—2011年),在此期间的发文量基本呈波动增加的趋势,从1993年的21篇增长到2011年的159篇,增长7.5倍,可能与国际减灾十年(1990—2000年)活动以及后续工作有关。(3)沉淀阶段(2012—2014年),从2012年的230篇下降为2014年的182篇,虽然论文数量减少了,但这一阶段发表文献质量较之前有明显提高,从注重数量逐渐向注重质量转变。(4)加速增长阶段(2015—2018年),2015年发表量为248篇到2017年是333篇,增长1.3倍;图中所示2018年的数量只截止到11月份,不能代表全年发表数量,但是数量已经明显超过了2016年。
图2 国外“地质灾害”相关论文每年的发表数量Fig.2 Number of published papers on foreign“geological hazards” each year
关键词就是能概括文献主旨的词汇,具有高频次的关键词能代表一定的研究方向和热点,关于某一研究出现的词频越多,说明该词就是关键词[4,14]。使用Bibexcel软件统计国内文献中关键词出现的频次,为了凸显地质灾害研究的现状和热点,筛选出词频大于30的关键词共计73个,合并归纳其中的同义词和近义词,如:“WebGIS”和“地理信息系统”归并为“GIS”,“防治对策”“防治”“防灾减灾”“对策”“措施”归并为“防治措施”等,除去最高频次的关键词“地质灾害”,将73个频次大于30的关键词最终合并为56个,结果如表1所示。
表1 国内“地质灾害”相关文献中高频关键词和频次Table 1 High frequency keywords and frequency in the literature related to domestic “geological disasters”
由表1可以看出,国内关于地质灾害研究的高频次关键词为“防治措施”,出现频次高达3 122次,说明我国关于地质灾害的研究主要集中在防治措施。次一级频次的关键词为:危险性评价(455次)、滑坡(347次)、分布规律(260次)和GIS(238次),其中滑坡灾害是我国频发度最高的地质灾害,这与李媛等[15]对中国地质灾害主要类型的研究相吻合,滑坡灾害点和隐患点平均每年占全国灾害总数的50%以上,是我国主要地质灾害类型;进一步找寻滑坡灾害点的分布规律继而进行危险性评估,近年来运用GIS技术获取和分析灾情等一系列问题已经发展的相当成熟。
利用Bibexcel统计国外文献中的关键词频次,选取词频大于14的关键词共计66个,合并其中的同义词和近义词,如:“landslide(滑坡)”“landslides(滑坡)”合并为“landslide(滑坡)”,“earthquake(地震)”“seismicity(地震)”“earthquakes(地震)”归并为“earthquake(地震)”,“geological hazard(地质灾害)”“geological hazards(地质灾害)”“geohazards(地质灾害)”归并为“geological hazards(地质灾害)”将66个频次大于14的关键词最终合并为55个,结果如表2所示。
表2 国外“地质灾害”相关文献中高频关键词和频次Table 2 High-frequency keywords and frequency in foreign literature related to “geological disasters”
可以看出,国外关于地质灾害研究的高频次关键词为“landslide(滑坡)”,这说明国外的研究主要集中在滑坡这一地质灾害类型。次一级频次的关键词为“seismic hazard(地震危害)”“earthquake(地震)”和“GIS”等,可以看出国外在地质灾害研究中对地震灾害的研究比较重视;对GIS技术的应用十分熟练和频繁,在这一方面与我国具有一致性。
通过对国内外文献中高频关键词的分析发现,对滑坡这一灾害类型的研究是国内外共同的研究热点,在国内文献中出现的频次为347次,国外文献中出现的频次是245次。国内外文献中GIS的出现频次都比较高,从不同的侧面运用GIS对地质灾害进行研究。美国的Earl E. Brabb在1986年最早将GIS应运于地质灾害的研究与分析;1989年,Michael A. Finney 和Nancy R. Bain开始运用GIS对滑坡灾害进行研究与分析[16]。我国对GIS的应用起步较晚,但经过近几十年的发展,GIS在地质灾害领域的研究中应用越来越广泛、深入。
上述得出的国内外高频关键词在一定程度上能体现出关于地质灾害研究的热点,但是仅凭高频关键词在文献中的重复率来定义研究热点是不太准确的。利用Bibexcel软件进一步对这些高频关键词进行分析,统计它们在6 246篇中文文献和3 165篇外文文献中的共现频次,形成56×56和55×55两个共词矩阵,将其导入UcInet6软件中绘制出高频词共现网络可视图,如图3和图4。每个节点代表一个关键词,节点的大小代表的是关键词出现频次的高低,节点越大表示该关键词与其它关键词一起出现的频次越高,节点越小则反之。节点间的连线代表两个关键词之间的共现情况,线条越粗代表两词在同一文献中出现的频次越高。
图3所示的由56个高频关键词所组成的共现可视图中,清晰的展现了高频关键词之间的交错关系,突出重点关键词如:位于关系图中的高频关键词“危险性评估”“滑坡”“泥石流”“防治措施”基本位于关系图的中心位置,节点较大,与其它关键词的连线也较多,则说明“危险性评估”“滑坡”“泥石流”“防治措施”联系紧密。同时也可以看出滑坡、崩塌和泥石流三者连线最粗,构成地质灾害中的“铁三角”关系。
国外文献中的55个高频关键词构成了相互交错的关系网络,从图4可以看出“landslide(滑坡)”节点最大,表明滑坡在国外文献中与其它关键词出现在同一篇文章中的次数最多,可以说明滑坡是国外研究的热点。“earthquake(地震)”“GIS”节点仅次于滑坡,成为国外研究的次热点。
由于检索到的国内外相关文献数量相差较多,国内外高频关键词共现频次差距也较大,最终得出的高频关键词共现可视图明显看出国内共现密度高于国外。国内可视图的密度较大,较难清晰的看出关键词之间的关系,但国外共现可视图就可以十分清晰的看出关键词之间的关系。可视化分析得出国内连线最粗、关系最密切的是崩塌、滑坡、泥石流,出现频次最多的是危险性评估。国外文献中关键词的联系比较广泛,比如,“landslide(滑坡)”和“susceptibility(易发性)”之间的连线很粗,“GIS”和“remote sensing(遥感)”及“frequency ratio(频次)”之间的连线也较粗。
图3 国内地质灾害研究高频词共现可视图Fig.3 Domestic geological disaster research high-frequency words co-occurrence view
图4 国外地质灾害研究高频词共现可视图Fig.4 High-frequency words in foreign geological disasters
国外文献中的55个高频关键词构成了相互交错的关系网络,从图4可以看出“landslide(滑坡)”节点最大,表明滑坡在国外文献中与其它关键词出现在同一篇文章中的次数最多,可以说明滑坡是国外研究的热点。“earthquake(地震)”“GIS”节点仅次于滑坡,成为国外研究的次热点。
由于检索到的国内外相关文献数量相差较多,国内外高频关键词共现频次差距也较大,最终得出的高频关键词共现可视图明显看出国内共现密度高于国外。国内可视图的密度较大,较难清晰的看出关键词之间的关系,但国外共现可视图就可以十分清晰的看出关键词之间的关系。可视化分析得出国内连线最粗、关系最密切的是崩塌、滑坡、泥石流,出现频次最多的是危险性评估。国外文献中关键词的联系比较广泛,比如,“landslide(滑坡)”和“susceptibility(易发性)”之间的连线很粗,“GIS”和“remote sensing(遥感)”及“frequency ratio(频次)”之间的连线也较粗。
聚类分析是一种将不同对象归为相对同质的统计分析方法,相对同质的对象之间有一定的相关性[17-19],也就是将不同数据归纳到不同的类或簇的过程,同一类或簇中的数据会有很大的相似性[20]。以Bibexcel软件产生的国内56×56相异矩阵和国外55×55相异矩阵为基础,运用 SPSS软件进行聚类分析,得出高频关键词群集如表3和表4所示。
表3 国内关键词群集成员表Table 3 Domestic keyword cluster members
从表3可以看出,关键词的聚类可以划分为4个群集。群集1归纳了对地质灾害研究的诸多方面,主要有成因分析、地质环境、发育趋势、风险评估、防灾减灾、防治措施和GIS等关键词,从不同的角度分析地质灾害发生的原因以及防治措施。群集2主要研究崩塌、滑坡和泥石流,这三种类型的地质灾害关系十分密切,构成“铁三角关系”。崩塌滑坡产生的固体物质是泥石流的主要物质来源,在发生崩塌和滑坡之后遭遇强降雨,发生泥石流的概率将会大大增加,同时也突出崩塌、滑坡和泥石流是频发度很高的三种地质灾害类型。群集3主要研究地质灾害的分布规律和发育特征,通过对规律的掌握针对性的防治地质灾害的发生。群集4主要包括建设用地和危险性评估,突出人类开发建设土地与地质灾害危险性的关系,不合理的开发建设用地容易诱发地质灾害,增加人为灾害发生的机率。人类对自然环境的开发力度越来越大,而不合理的开发利用土地已经引起了一系列的地质灾害问题,更多专家学者已经注意到了问题的严重性,对它的危险性评估也越来越重视。
表4 国外关键词群集成员Table 4 Foreign keyword cluster members
从表4可以看出,国外文献关键词的聚类可以划分为3个群集。群集1归纳的内容比较庞杂,涉及了气候变化、灾害种类、数值模型等众多领域;包含了地质灾害发生频率较高的国家意大利(Italy)、中国(China)、伊朗(Iran)和意大利中部(central Italy)、喜马拉雅(Himalaya)等地区。群集2主要包含了主要灾种滑坡(landslide)、获取和分析地质灾害的工具GIS和RS以及处理数据的方法逻辑回归(logistic regression)。群集3仅有地震灾害(seismic hazard),可能是地震灾害易引发滑坡、崩塌、泥石流等次生灾害,形成地震灾害链,是地质灾害中比较特殊的灾害类型,对人民生命安全和社会经济发展造成无法估量的损失。
从国内外关键词的聚类分析可以看出国内外文献关键词归类不一致。国内归纳的4个群集与国外归纳的3个群集,基本没有相同的聚类群,这表明国内外对地质灾害研究的区域对象、使用方法、研究机制、侧重点等都有所不同。
(1)国内外文献数量总体都呈上升趋势增加,这与地质灾害越来越严重以致成为社会经济发展的重大影响因素有关;我国对地质灾害的相关研究比国外起步较晚,国外对地质灾害的研究始于上世纪70年代,而我国始于上世纪80年代后期;在联合国“减灾十年”(IDNDR)(1990—2000年)计划之后,国内外文献发表数量进入快速增长阶段,我国的发表数量较高于国外。
(2)国内外研究热点有所不同,国内侧重对地质灾害的危险评估和防治以及特殊地质灾害崩滑流的研究;国外侧重对特定地质灾害类型发生机理的研究,特别是对滑坡和地震深层次研究;国内外研究的共同热点是滑坡和GIS技术的应运, 滑坡是最频发和灾害较严重的地质灾害类型,在我国,滑坡在地质灾害点中所占比例可达到51%。国外对GIS的应运始于上世纪80年代末,我国起步较晚但发展迅速,特别是1994年成立“中国GIS协会”以来,GIS技术的应运更加广泛和深入。
(3)国内外研究热点有所转移,国内目前的研究热点从之前的灾后治理逐渐转向灾前预防措施,灾害危险性评价和预警预报成为今后研究的重点。国外的研究热点从之前的灾害评估转向对特定的某一地质灾害的研究,特别是对地震和滑坡的研究,在灾后救治和重建方面需加强措施。
国内外对地质灾害的研究热点有所差异,研究侧重点也不同。国外在深入研究灾害点的发生区域、成因机理、防治措施的同时,利用现代GIS和RS等技术以及数学模型,重点筛查灾害点的主要灾害类型以及损失,已经建立了较完善的预报预警系统。目前国内学者对地质灾害的危险评估和防治措施两大方面研究较多,地质灾害的评价从定性评价逐步转向定量评价;从区域、风险特征、灾害类型等方面通过数理模型方法进行更深层次的分析,利用GIS和RS等技术,易于获取灾情信息和及时处理灾情。目前,我国的灾害风险评估工作还处在不断完善的过程中,在建立预报预警系统方面还待加快进展,注重对专业人才的培养,剖析地质灾害对社会经济的深层次影响,为我国经济可持续发展道路清除障碍。