可视化知识图谱的中国SWAT模型研究趋势分析

2019-06-13 00:42尤丽萍林雪儿林美娇刘君成何东进游巍斌
武夷学院学报 2019年3期
关键词:水文聚类可视化

尤丽萍,林雪儿,林美娇,刘君成,何东进,游巍斌

(福建农林大学 林学院,福建 福州 350002)

分布式水文模型研究是水文界研究的热点,是真实描述和科学揭示流域水文过程和规律的一个有效途径,为研究水文、生态和环境问题提供了一种有效的工具。SWAT(Soil and Water Assessment Tool)是一种具有很强的物理基础的长时段的流域分布式水文模型[1-2]。该模型适用于具有不同的土壤类型、不同的土地利用方式和管理条件下的复杂大流域,能在资料缺乏的地区建模,在加拿大和北美寒区具有广泛的应用[3]。随着模型发展和推广,目前SWAT模型成为流域水文和生态环境问题研究的重要工具。SWAT模型自1990年开发以来,在国外已广泛应用于水质和水量的模拟评估、非点源污染负荷估算及形成机制探讨、情景分析与预测、环境变化及农业管理措施对水文水质的影响、气候变化对区域水循环和作物生长的影响等多方面[4]。

国内SWAT模型的研究和应用从2000年前后起步,SWAT模型的引入为西部寒冷地区水文过程的模拟提供了有用工具,它独特的分布式结构和运行控制方式也为我国分布式水文模型的研制开拓了视野[5]。SWAT模型除了分布式径流模拟功能之外,还能用于面源污染、水土流失、土地利用和农业管理等方面的研究,是一个十分值得推广的综合性流域水文模型[6]。因此本文基于中国知网(CNKI),以“SWAT模型”为主题词,对1990—2017年期间国内学者发表的相关文献进行计量分析,从文献数量与研究趋势、文献关键词、文献期刊分布、文献研究机构与合作网络及文献研究作者合作网络这五方面进行简要梳理国内对SWAT模型应用研究的发展历程及现状,以期服务于SWAT模型在我国的发展,并为我国的水资源管理、水土保持工作提供决策支持与依据。

1 研究方法

1.1 基于中国知网(CNKI)的文献计量

以中国知网(CNKI)为检索数据源,考虑到SWAT模型最早的版为SWAT90s,故将检索时间段设置为:1990—2017年(2017年12月31日)。为保证检索结果的全面性,文献类型选择期刊和学位论文两类;最终以主题=“SWAT模型”or摘要=“SWAT”进行检索,获得文献1 726篇;在文献所属学科基础上,剔除不符合本研究要求文献16篇;最终确定1 710篇文献作为分析数据库。

1.2 基于知识图谱的可视化分析

伴随着数据仓库技术、信息技术和网络技术等的发展,对数据进行单纯的计量统计已经难以看出数据间更深层次的特点,数据可视化不仅能通过关系数据来识别和分析数据信息,而且能以更为直观的方式看到数据间的结构关系,从而对数据信息进行更加深入的观察和分析[7]。本文基于上文确定的中国知网(CNKI)的数据源,利用信息可视化软件Cite Space Ⅲ,Cite Space软件由美国费城德雷克塞尔大学(Drexel)信息科学与技术学院的陈超美博士开发,他是国际上信息可视化领域的权威专家,多年致力于信息可视化方法及相关算法的研究。通过对文献信息的可视化,我们能够较为直观地识别学科前沿的演进路径及学科领域的经典基础文献[8]。本文通过运用信息可视化方法、文献计量统计方法和数据挖掘算法等,对引文进行相应数据挖掘和计量分析,以可视化的形式展现有关国内SWAT模型应用研究的发展进程和结构关系,掌握SWAT模型的研究现状、研究路径演变和发展趋势。

2 结果与分析

趋势[9]。关键词的中心度能较准确地反映了特定时期的核心研究主题和未来发展趋势[10]。根据关键词聚类图谱(图2),整理出中心度较高的关键词进行分析(表1),以期更全面地了解不同时期的SWAT模型应用研究的进展。

从每年发表文献数量和研究主题演变趋势来看(图1和表1),我国应用SWAT模型的研究趋势总体上可划分为3个阶段:(1)1990—2005年,年发文量61篇,占1990—2017年发表文献总量的3.27%。国际上SWAT模型最早的版本始于1990年,然而我国较早研究SWAT模型是在2001年由北京林业大学水土保持学院的牛志明等共同创作的综合性论述文章 《非点源污染模型在土壤侵蚀模拟中的应用及发展动态》[11]。这说明在这段期间对于SWAT模型的关注度较少,在此阶段的研究主题主要集中于国外SWAT模型的基础认识和相关理论的引入,以及对国内SWAT模型应用案例的评价。因此SWAT,分布式水文模型,SWAT模型等三个关键词的中心度较强,并且是整个研究领域的核心节点。(2)从2006—2015年开始,对SWAT模型的关注度开始提高,文献数量迅速增加,在2015年最高达216篇。随着“3S”技术的发展,SWAT模型趋向于与高程模型(DEM)相结合,并与地理信息系统(GIS)和遥感(RS)集成。该阶段的关键词中心度具有相对的稳定性,变化幅度较小,大部分在 0.13~0.32 之间波动,个别关键词中心度在 0.02~0.08之间波动。在此阶段的研究阶段主要集中于开展了非点源污染形成机制和水质模拟评估的探讨[12-13],并在GIS的辅助下开始对流域模拟进行探讨以及土地利用变化产生的水文响应进行模拟预测[14],表明SWAT模型在面源污染和覆被变化下的水文效应这两方面的研究在此期间是我国新的研究热点(3)在2016—2017年期间,发表文献与2015年的峰值相比,文献略有下降,但是国内SWAT模型开始出现了新的研究内容:气候变化对水文的响应研究[15-16]和水资源的管理研究[17-18]。在全球变暖背景下,研究气候变化对水文资源的影响将成为新的研究热点方向。

2.1 SWAT模型文献数量与研究趋势

一定时期内的文献数量反映所研究对象的科学产出的多少,有助于了解目前学科研究的状况与发展

表1 中国1990-2017 SWAT模型关键词中心度信息Table 1 China's 1990-2017 SWATmodel keyword centrality information

图1 中国SWAT模型研究文献数量的时间分布Figure 1 The time distribution of the number of literature in the study of SWATmodel in China

2.2 文献关键词聚类分析

学科领域较长时期大量学术研究成果的关键词集合,可以揭示该学科总体内容特征、研究内容之间的内在联系、学术研究的发展脉络与发展方向等[19]。中国SWAT模型研究呈现出典型的研究初期状态,各聚类主要集中于2007—2012年,研究网络具有较强的集中性。从关键词的连线分布可以看出,研究围绕关键节点形成多个研究聚类,且以相似的颜色呈现(图2)。剔除关键词SWAT模型、SWAT和一些小聚类,因此,笔者将中国SWAT模型的研究领域重新划分为#1聚类敏感性分析、#2聚类空间分布、#3聚类径流模拟、#4聚类土地利用变化和#5聚类非点源污染5个知识群组。

(1)“敏感性分析”聚类群。该群组的文献数量多。通过原文献追踪发现该聚类的研究主要集中在模型参数敏感性分析综述性研究。主要概括了SWAT模型构建及参数不确定分析、利用不同方法分别对模型进行敏感性分析以进行参数率定和利用不同算法进行流域的参数优化工作等综述性文章[20],总结了SWAT模型中参数率定不确定性,以期为后面的研究者在应用SWAT模型时得到更准确的结果提供参考。

(2)“径流模拟”聚类群。该群组文献数量较多。在该群组中“土地利用/覆被变化”、“径流量”和“水文响应”等关键词出现的频率较高。且从节点间连线的颜色可以看出径流模拟一直贯穿于整个SWAT模型研究之中。研究邻域包括水量、土地利用变化及气候变化的水文响应、融雪和冻土对水文循环的影响[21-22]。

(3)“土地利用变化”聚类群。此聚类中“土地利用/覆被变化”、“人类活动”和“气候变化”等关键词存在一定的共生关系。表明了在人类活动响应下景观格局变化对流域水质和水量的影响越来越受到我国学者的重视。通过原文献研究发现,土地利用变化与径流量之间的关系备受关注,针对特定区域,弄清土地利用变化与水文变化之间的联系,已经逐渐成为区域资源问题、环境问题及生态问题上政策效应分析的重要手段。

(4)“空间分布”聚类群。该群组文献数量较多。“水文模型”、“空间适用性”和“流域污染控制”等相关关键词不断出现。水资源时空分布不均匀是我国水资源短缺的主要原因,合理调配水资源,不仅能解决局部水资源短缺的问题,还能促进当地经济经济和社会的发展。

(5)“非点源污染”聚类群。该群组文献数量较多。通过原文献研究发现,该群组的研究主要分为“非点源污染模拟研究”[23-24]和“非点源污染的负荷评估”[25-26]两个方面。其中前者侧重于运用调查、识别和监测等步骤来模拟流域非点源污染,作为有效控制水环境污染、保证用水安全的重要手段。后者则侧重于通过探讨非点源污染负荷的时间分布规律对地表径流非点源污染进行定量分析和评价,以期为模拟流域非点源污染的动态变化奠定基础。

图2 中国1990—2017 SWAT模型研究文献关键词聚类图谱Figure2 KeywordsclusteringofChinese1990 to2017SWATmodels

2.3 载刊的期刊分布

学术期刊是反映学科发展动态、方向和水平的重要媒介[27]。从表2来看,无论是单篇文献引用次数、文献引用总次数,还是载文比例,排在前三的都是水利学报、资源科学和水土保持研究,由此表明这三个期刊发表文章的篇数和被引用次数都比较高。就影响因子而言,不同刊物的影响力差别明显,资源科学影响因子最高,达到3.541,而水资源与水工程学报的影响因子只有0.544。从载刊的期刊类型来看,SWAT模型研究主要依托水土保持学(如《水土保持研究》、《水资源与水工程学报》)、水电学(如《水利学报》、《水电能源科学》)、资源环境科学(如《资源科学》)和其他学科(如《农业工程学报》、《北京师范大学学报(自然科学版)》)等学科刊物发展。

较之早期SWAT模型文献集中于水土保持与水电学刊物,如今的文献分布刊物涉及学科广泛。这一现象表明SWAT模型作为一项综合性流域水文模型,深深根植于水土保持学和水电学的同时,逐渐在农业[28-29]、气象[30]、环境[31]、生态文明[32]等资源与环境和农业管理方面表现出广泛的应用前景。

表2 国内涉及SWAT模型的研究文献主要载刊(排名前10)Table 2 Domestic studies involving SWATmodels are mainly published(top 10)

2.4 研究机构及其合作网络

基于研究机构共现网络的机构合作网络图谱,实现对某技术研究领域中研究机构合作情况的可视化分析可以为学术资源的引进、开展合作以及学术成果评估提供参考[33]。在图中,彩色圆环节点表示机构名称,节点越大,表示该机构发文量越大。 每一层圆环的厚度越大,表示当年发文数越多。任意两个节点之间有连线表示两者存在合作关系,连线越粗,表明合作越频繁[34]。从表3可以看出,在这些研究机构中,无论是单篇文献引用次数还是文献引用总次数,排名前3位的依次是中国科学院地理科学与资源研究所、北京师范大学和武汉大学。不同机构单篇文献引用次数差异较明显,最高的是中国科学院地理科学与资源研究所达到42.79,较低的是西北农林科技大学仅3.63。从研究合作网络(图3)来看,中国对SWAT模型应用研究主要形成2大合作机构(见图3黑色方框)。分别在研究机构聚类合作图谱中形成了以中国科学院地理科学与资源研究所为核心的区域合作网络和以武汉大学水资源与水电工程科学国家重点实验室以及河海大学水文水资源学院为主的合作网络,这两个聚类在整个网络中非常突出。

表3 SWAT模型主要研究机构简况(排名前10)Table3 The SWATmodel focuses on institutional profiles(top10)

2.5 文献作者合作网络分析

发文作者是科学研究的主体,通过对发文作者合作网络的结构特征分析,可以反映出该领域的核心作者群之间的合作关系[35]。将1 710篇有效文献数据转换后导入Citespace软件,并进行相关设置后生成作者共引聚类知识图谱(图4)。图4中的节点数量与大小代表了核心作者群体共现频次,线条数量与粗细反映了作者合作关系与合作强度[34],它们共同组成了作者群与合作网络的知识图谱。从合作网络来看,SWAT模型应用研究形成了4个主要的核心研究团队(见图4黑色方框),各团队之间联系强度比较强。

图4 中国1990—2017 SWAT模型研究高产作者合作网络Figure 4 China's 1990 to 2017 SWATmodel research cooperation network for high yield authors

3 结论与讨论

基于中国知网(CNKI)数据库,以信息可视化软件Citespace和文献计量为研究手段,对我国涉及SWAT模型应用研究的文献数量与研究趋势、文献关键词、文献期刊分布、文献研究机构与合作网络及文献研究作者合作网络5个方面进行系统梳理。研究结果显示:

(1)从文献数量与研究趋势分析来看,中国SWAT模型应用研究发文数量总体趋势明显增加,相对于国外,国内对SWAT模型的研究时间较短,并主要侧重于水文模拟方面和非点源污染研究方面,对城市化进程的水文响应模拟和在水土保持、非点源污染的控制管理工作方面尚不完善。

(2)从关键词的共现图谱来看,“敏感性分析”、“径流模拟”、“土地利用”、“气候变化”、“非点源污染”等是近年来SWAT模型研究中的高频关键词。该模型研究关键词共现图谱基本沿着这5个方向发展的同时,研究视角趋于多元化且呈现多学科交叉的特点。在人类活动下导致的土地利用/覆被变化和环境变化日趋强烈的背景下,SWAT模型在土地利用方式和气候变化条件下对径流产生的水文响应研究是新热点。

(3)从文献所在期刊来看,《水利学报》《资源科学》和《水土保持研究》3个期刊从单篇文献引用次数、文献引用总次数,载文比例上均位列前三。

(4)从研究机构分布与机构合作网络的可视化分析来看,无论是单篇文献引用次数还是文献引用总次数,中国科学院地理科学与资源研究所和武汉大学的文献引用次数都比较高,而且都形成了以其为主的2大合作机构。从发文作者合作网络分析来看,SWAT模型应用研究形成了4个主要的核心研究团队,各团队之间联系强度比较强。

近年来,国内外均对水资源评价和水文学研究逐渐被重视。国外应用SWAT模型研究内容涉及河流预测、水质评价、非点源污染控制等诸多方面。由上文可知,径流模拟和非点源污染模拟是我国研究的重点,涉及了水文循环中各要素的分析和不同气候、不同土地利用的水文响应。与国外相比,我国在管理措施、水资源利用和作物产量关系、模型的比较与联用方面的研究还比较欠缺。并且,Coffey等[36]应用SWAT模型模拟大肠杆菌在爱尔兰集水区的运输过程,得到比较理想的结果。而国内应用SWAT模拟细菌传输的研究涉及较少。此外,随着水资源越来越紧缺,我国又是一个干旱缺水严重的国家,因此有必要借鉴国外在水资源管理领域、环境变化及农业管理措施对水文水质的影响、气候变化对作物生长的影响等多方面的先进经验,以期为水土保持、资源的合理规划、环境影响预测等工作提供比较有效、便捷的研究手段。

由于有些文献存在内容相近或相似的现象,根据文献数量分析SWAT模型发展历程存在一定的偏差。此外,Citespace分析工具对关键词共现率有门槛值要求[8],这可能会导致最新发表的重要文献无法在分析中体现出来。尽管Citespace分析软件拥有先进的图谱绘制功能,但解读图谱仍然是一项有难度的工作,容易出现诸如误读、漏读和选择性解读等问题[8],这些情况会在一定程度上影响结果分析,后续研究需要在Citespace方法应用上强化图谱解读的规范性和严谨。

猜你喜欢
水文聚类可视化
一种傅里叶域海量数据高速谱聚类方法
基于CiteSpace的足三里穴研究可视化分析
自然资源可视化决策系统
思维可视化
发展水文经济 增强水文活力
自然资源可视化决策系统
浅谈水文档案的价值和开发利用
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法
江西省水文文化建设的思考