基于知识图谱的热带气旋研究热点与趋势分析

2019-09-13 07:38李军利甘瑞杰吴文君
巢湖学院学报 2019年3期
关键词:气旋热带热点

蒋 浩 李军利 甘瑞杰 吴文君 张 洁

(1.安徽农业大学 资源与环境学院,安徽 合肥 230036;2.芜湖宣城机场建设投资有限公司,安徽 芜湖 241000)

0 引言

热带气旋是地球上破坏力最强的天气系统,是在热带或亚热带水域,有组织的对流和明确的气旋表面风环流而形成的非正面天气尺度气旋的总称[1-2]。近三十年来由于海水变暖,热带气旋强度增加,由热带气旋和台风引发的灾害性天气频度增加,成为当前全球突发性自然灾害之一[3]。2005年Katrina飓风是美国历史上造成经济损失最严重和人员伤亡最多的热带气旋[4-6]。目前已有不少学者聚集于热带气旋结构、强度、运动、强暴雨等方面研究[7-8],也有侧重于热带气旋生成机制、能量学、气候学及年际变化研究[9-10],以及热带气旋天气动力理论、数值模型、预报方法等研究。Bacmeister等利用全球耦合模型探讨热带气旋年际特征,描述热带气旋降雨的空间结构[11-14]。热带气旋不仅产生经济损失,引发社会问题,也会对生态环境产生影响。James等研究了空气质量在热带气旋活动季节因降水、海洋气团输送和增强的上升运动而改变[15]。热带气旋降水易引发山体滑坡和风暴潮[11-12]。近几年来,一些新兴技术和方法不断应用到热带气旋研究中,如Hoffmann等使用卫星遥感及地面雷达对热带气旋几何特征进行了研究[16-17]。Chen等[18]使用社交媒体开展热带气旋发生过程中地理信息聚合相关研究。上述的研究均从不同的角度对热带气旋开展了相关研究,但从文献计量角度,科学定量分析热带气旋相关研究领域发展趋势的研究并不多见。

文献计量作为一种科学的定量分析文献趋势的方法,是分析各个研究领域研究趋势的有效工具[19]。国内外众多学者使用该方式对各自领域研究内容进行总结和趋势探索,例如地理本体库的研究趋势[20]及全球远程医疗发展状态[21]。知识图谱分析是可视化的知识图形与序列化的知识谱系[22]。科学知识图谱使研究者对学科结构、研究内容、学科关系和研究热点有清晰的把握,并可预测学科发展前沿和趋势[23]。利用文献计量结合知识图谱方法,既可以展现领域发展脉络,又可以定量分析研究领域发展趋势。Christian[24]提出了一种基于网络分析的文献计量方法来跟踪和理解复杂系统模型科学发展。胡凯等[25]用文献计量学和社会网络分析方法分析夜光遥感发展概况与趋势。本文从热带气旋文献入手,基于传统文献计量并结合知识图谱开展定量分析,通过文献特征、作者生产力、期刊生产力、国家和地区、机构以及作者关键词[26-30]等指标分析,探寻热带气旋研究的发展脉络与研究热点,以期获得一些该研究领域内研究的特点和规律趋势,为该领域研究提供科学参考。

1 数据来源与方法

数据来源于Science Citation Index Expand(SCIE)及 Social Science Citation Index (SSCI)数据库。尽管当前也出现了一些新的文献数据库,但SCI数据库以及SSCI数据库在分析科学文献出版上是目前使用频率最高包含内容最丰富的两个数据库[31-32]。 利用“tropical cyclone”,“tropical cyclones”,“hurricane”,“hurricanes”,“typhoon”,以及 “typhoons”作为搜索关键词,搜索时间为2018年4月26日10点,搜索从1991年到2017年的所有文章,搜索范围包括标题,关键词,摘要等内容,共得到22678篇关于热带气旋的文章,从中提取出作者、国家、机构、出版年份、学科分类、期刊名称与关键词的信息,借助CiteSpace与VOSviewer等软件工具开展知识图谱可视化文献网络分析[33-35]。

为进一步规范统计尺度,参照文献[20],在统计文献来源国家信息时,将由英格兰,北爱尔兰,苏格兰,威尔士发表的文章全部归为英国发表;将中国香港,中国澳门以及中国台湾发表的文章分地区单独计算。作者分析中,因为英文缩写造成的名字重合,通过国家、机构与领域等信息,将文献一一区分。

2 分析与讨论

2.1 热带气旋文献产量分析

图1红线表示文献产量趋势,黑色拆线表示文献产量。从图可知文献数量从1991到2017的变化趋势。2006年以前,相关文献数量均偏少,并且增幅变化不大;从2006年开始,文献数量开始有大幅的增长,相比1991年到2006年呈现更高的增长率。

在所有文章类型文献当中,英语是主要的语言类型,22678篇文章中,总共有22461篇是英文,占总文章数的99.04%,随后依次是中文(81篇,占 0.36%);西班牙语(77 篇,0.34%),俄语和法语(32篇,0.14%),以及其他14种语言发表的27篇文献。

2.2 热带气旋文献作者分析

作者文献数据统计表明,有42508位作者发表了22678篇与热带气旋相关的文章,发表文章超过10篇或者10篇以上的作者有只有906位,占2.1%。表1展示了文献产量排名前20的作者文章的发表情况,包括作者姓名 (AU)和机构(INS)总发文量(P)、作为第一作者发表的文章数量(FAU)、作为通讯作者发表的文章数量(RP)、平均每篇文章的引用量(TC/TP),以及作者高引用次数H-index[36-37]。

图1 热带气旋1991—2017发文量变化

表1 热带气旋发文量前20名作者分析

来自美国科罗拉多州立大学的Montgomery Michael T是发表文章数量最多的作者,总共有129篇,其中作为第一作者的有21篇,作为通讯作者的有11篇。从图2中可以看出来自宾夕法尼亚州立大学Zhang Fuqing和台湾大学的Wu Chun-Chieh两位作者处于节点中心的位置,均篇文献的引用率比较低,但是H-index指数都是30,并且从他们的文献中可以发现,这两位作者近三年年均发文量都大于15篇,而发表时间都集中于近期,从引用率推测,预计这两位研究者将是热带气旋研究领域中未来几年比较有发展潜能的研究者。

图2 热带气旋核心作者图谱分析

2.3 热带气旋研究国家与机构分析

文献计量表明,共有1238篇文章不包含国家地区和机构信息,包含有效国家地区和机构信息的文章总共是21440篇。统计表明共有133个国家或地区发表了关于热带气旋的文章,其中有79个国家或地区加发表的文章不超过10篇,占所有国家或地区的59.4%,发表文章超过100篇的国家或地区,总共有17个,占所有国家或地区的12.8%。表2给出了发表文章数量排名前20的国家或地区的排名,其中包含单独完成的文章数占该国家或地区发表的总文章数比(SP/TP),单独完成的文章均篇引用量和合作完成的文章均篇引用量 (TC/SP,TC/CP),TP中的百分比表示国家的出版物数量占包含国家信息的出版物数量的百分数,合作完成的文章数量(CP),单独完成的文章数占该国家或地区发表的总文章数比(SP/TP),以及单独完成的文章均篇引用量和合作完成的文章均篇引用量(TC/SP,TC/CP)。在排名前20的国家或地区中,有7个欧洲国家,7个亚洲国家或地区,2个位于大洋洲的国家,3个北美洲国家,1个南美洲的国家,没有位于非洲的国家,七个最发达的工业化国家G7(美国、日本、德国、英国、法国、意大利和加拿大)均排在前20位之列,可以看出国家的经济水平与该国热带气旋科研水平有一定的相关性。

表2 热带气旋国家或地区发文量分析

在21440篇文章中,有16038篇文章,即74.8%的文章由一个国家独立完成,5401篇由国家合作完成,合作完成的文章数量超过100篇的国家有11个,占所有国家8.2%。从表2中还可以看出,大部分国家的TC/CP都比TC/SP要高。可以看出在热带气旋的研究当中,大部分的科研成果是由一个国家独立完成的,国家之间的合作并不频繁,而另一方面,由国家合作完成的文章,受到的关注比由国家独立完成的文章要更多。

由图3可以看出美国排在第一位处于中心位置,与其他国家合作广泛。同时,美国的TP、SP、CP、TC都要远远的高于排名第二的国家,所有的文章中有48.5%的文章都都有美国的参与,可以看出,美国不仅是世界上经济最发达的国家,同时在热带气旋相关学术研究上也处于重要地位。这个结果与很多其它学术领域的研究成果是类似的,美国在很多领域上都处于世界的领先地位[38]。在排名靠前的国家中,除了美国作为合作的中心以外,合作数量的多少跟该国家或地区所处的区域有一定的关系,例如位于亚洲的中国、韩国与台湾地区的合作相比别的大部分国家地区合作要更加紧密,而如德国,法国,意大利,瑞士,荷兰,西班牙等几个欧洲国家之间的合作,明显要比同别的其它地区国家合作更加紧密,与美国合作除外。

图4给出了研究热带气旋机构发文量前十的机构,这些机构有8所分布于美国,另外两个分别为中国科学院和台湾大学。

图3 热带气旋研究国家及地区分析

图4 排名前十机构发文量

2.4 热带气旋研究核心期刊群分析

表3描述统计了发表文章数量排名前20的期刊,以及其发表文章的总量(TP),中心度(TC/TP),以及影响因子(IF)。杂志影响因子来自Journal Citation Reports(JCR),根据汤森路透解释,Journal Citation Reports(JCR)基于可量化、统计的引用数据,利用系统的方法精确地评估世界上的尖端杂志[38]。

表3 热带气旋排名前20期刊分析

总共有4601份SSCI以及SCI的期刊杂志刊登了与热带气旋相关的文章,其中有2567份期刊(55.8%)的期刊只刊登了一篇关于热带气旋的文章,发表了1篇以上5篇及以下文章的期刊共有892份,占34.07%,而刊登了上百篇关于热带气旋文章的期刊,仅仅只有25份。可以看出关于热带气旋研究的文章所涉及的期刊很广,但并不是很集中。图5是期刊密度分析图,可以清晰的看到MONTHLY WEATHER REVIEW、NATURAL HAZARDS、JOURNALOFCLIMATE、JOURNAL OF COASTAL RESEARCH等聚类中心,这四个期刊都发表超过300篇热带气旋相关文献,影响因子最高的是美国BULLETIN OF THE AMERICAN METEOROLOGICAL SOCIETY期刊。从表3中可以看出,只有MONTHLY WEATHER REVIEW发表的文章数量超过1000篇,占所有文章总数的5.69%,总引用数(TC)最多的也是该期刊。根据JCR的分类,MONTHLY WEATHER REVIEW杂志主要研究GEOSCIENCES,MULTIDISCIPLINARY,Water Resources,Meteorology&Atmospheric Sciences几个学科的内容,这些学科刚好与热带气旋研究涉及最广的几个学科基本吻合,更进一步说明了该杂志与热带气旋领域的密切联系,并且在大部分的期刊中,热带气旋的文章平均每篇的引用量都大于从JCR上获取的期刊影响因子,这从另一角度说明,热带气旋的文章对于期刊的影响因子具有良好的促进作用。

2.5 热带气旋学科分类

图5 热带气旋研究期刊分析

图6 热带气旋排名前10学科分类

根据JCR的经典学科分类,从1991年到2017年发表的与热带气旋相关的文章总共覆盖141个学科,体现了该研究覆盖的学科范围比较广泛。Meteorology&Atmospheric Sciences是文章数量最多的一个学科,总共有8500篇文章,占文献总量的19.59%;排在后面的9种分类依次是Geology(3611,14.04%),Environmental Sciences&Ecology(3354,13.68%),Engineering(2588,13.55%),Oceanography(1848,10.74%),WaterResources(1698,8.91%),Physical Geography (951,7.84%),Marine&Freshwater Biology(944,7.12%),Public,Environmental&Occupational Health(738,6.50%),Science&Technology-Other Topics(624,4.30%)。

图6描述每个学科逐年文章数量的变化,10个学科文章数量的变化总体上均呈出明显的增长趋势,整体的增长趋势与每年文献总量的增长趋势相近。其中Meteorology&Atmospheric Sciences不仅在发文量上遥遥领先,增长幅度也比较大,其余9个学科增长率相似。2006年各学科发文量都明显增加,而从2013年开始,各学科呈现总体增长,但部分有出现小幅上下波动。

2.6 热带气旋关键词分析

2.6.1 关键词词频分析

在所有文献中,包含作者关键词的文章总共有13318篇,总共出现了69604种关键词,而62328种关键词只出现过一次,占关键词种类的89.55%,3310个关键词只出现过两次,占所有关键词的4.75%,出现过20次及以上的关键词只有325个,占所有关键词的0.46%,表明热带气旋的相关研究所涉及内容十分广泛,但研究重点比较集中,部分只使用过一次的关键词,从某种层度上表明了其研究存在不可持续性,或者与热带气旋研究焦点关联度不高[39]。

表4展示使用频率最高的20个关键词近3年的变化情况,表格中显示的百分比是指关键词占该时间段包含关键词数量的文献数量的量。因为从SCI以及SSCI下载的1991年以前的文献信息均不含有作者关键词的信息,所以该表格展示了作者关键词从1991年到2017年每3年的变化情况。从表中可以看出,热带气旋产生的灾害(Disasters)是热带气旋中研究最多的内容并且关键词频次呈稳定增长趋势。从变化趋势可以看出,热带气旋扰动(Disturbance)的研究具有持续性,也一直都是热带气旋研究中的热点,而气候变化(Climate Change)在热带气旋的研究中呈现出十分明显的增长趋势,这表明在热带气旋研究中,气候变化已成为一个研究热点。关键词恢复力(Resilience)和恢复(Recovery)同样呈现出明显的增长趋势,表明它们在热带气旋的研究进程中,逐步受到更多关注,成为新的研究重点和热点。其中,卡特里娜飓风(Hurricane Katrina)是20个关键词中唯一的灾害事件,它的出现与它所造成的影响力是不可分割的,作为美国历史上造成经济损失最严重的热带气旋,以及造成死亡人数最多的五个飓风之一,卡特里娜飓风自2005年开始出现,热度激增,至2011年后热度逐渐下降。在表格中,大部分关键词增长变化趋势还是比较较稳定的,从某种程度上,表明了它们在研究中一直具备可持续性,并且一直是热带气旋研究中热门的内容。遥感(Remote sensing)作为新技术能够追踪热带气旋移动轨迹,监测灾害成为专家学者研究热点。近5年来新兴大数据关键词如Socila media、Twitter频次虽然排名不够靠前,但是发文数量在逐渐增多,且近年来有迅速上升的趋势,表明社会感知等新兴社交媒体技术,在热带气旋等相关灾害型天气研究过程的灾前、中与后当中发挥着重要作用。

表4 热带气旋研究使用频率最高的20个作者关键词逐3年频次统计

2.6.2 研究热点时序演进

从图7所示的研究热点时间脉络来看,随着时间的演变,学科分阶段不断涌现新的关键词,形成新的热点和趋势。节点为年轮状,年轮的厚度与该年的关键词频次成正比。根据年轮大小及分布可知,热带气旋领域1991年起始时研究热点聚焦明显,集中于台风、飓风的扰动与模式以及与自然灾害的关系上,中期自2005年起产生两个聚类中心分别是气候变化和Hurricane Katrina,体现了热带气旋研究热点开始转移。后期的研究热点分散分布,人类健康、海平面上升、恢复力等成为新的研究热点。

2.6.3 研究前沿动态分析

图7 热带气旋研究热点演进时区知识图谱

突变词可以反映相关研究在某些年份文献中骤增及延续的状况,较适合表征研究热点的发展趋势[40]。突变检测算法检测热带气旋中频次变化率高,增长速度快的关键词,得到1991—2017年热带气旋领域排名前20关键词突变时序列,如表5。Strength表示突变强度,Begin和 End是关键词成为突变热点的起止时间。加黑斑点是突变关键词热度持续时间。从1991年开始,扰动(disturbance)、热带气旋运动 (Tropical cyclone motion)、热带雨林 (Tropical forest)和中尺度(Mesoscale)成为研究时间段早期研究热点,说明早期学者们对于热带气旋领域研究集中于热带气旋的模式与机制。Hurricane andrew、Hurricane hugo和Hurricane sandy这三个由热带气旋造成的灾害关键词突变强度高,持续时间长,说明热带气旋造成的灾害破坏力强,影响范围大。恢复力(Resilience)、适应能力(Adaptation)、快速强化(Rapid intensification)、海平面上升(Sea level rise)及追踪(Track)是近年研究前沿,说明热带气旋研究热带已经从对于热带气旋模式研究转移到灾情预报、灾后重建。波多黎各(Puerto rico)、中国南海(South China sea)、美国(USA)和路易斯安那(Louisiana)作为地名突变词,说明这些国家地区饱受热带气旋灾害困扰。分析发现,当前热带气旋研究热点集中于新生的热带气旋灾害及灾害发生地、新技术运用和灾害与生态环境的关系。

2.7 热带气旋领域研究趋势分析

研究前沿通常表现为新主题词的大量出现、词间关系变化、含义变迁及异常变化等,文献主题词及相关属性的变化可以表明研究前沿的出现或转变[41]。利用CiteSpace膨胀词探测技术和算法,通过考察词频的时间分布,将其中词频变化率高的词从大量的主题词中探测出来,依靠词频的变动趋势,而不仅仅是频次的高低,来确定热带气旋的前沿领域和变化趋势。借助表6总结出热带气旋当前有以下三个发展趋势。

表5 前20热带气旋突变关键词

第一,海平面上升(Sea level rise)是膨胀系数最高的膨胀词,说明热带气旋与海平面上升之间的相互影响机制与产生的影响是目前及未来一段时间内的研究热门内容。第二,恢复力(Resilience)与适应力(Adaptation)分别是频次最高与膨胀系数第二的膨胀词,说明在热带气旋的灾害过程与灾后地表环境与人类社会的恢复会是研究的重点。第三,膨胀词表中的另外两个膨胀词社区(Community)、健康(Health)凸显了热带气旋灾害最主要的承灾体即是社会功能和人类,也表明热带气旋对于人类社会造成的影响在未来依然会成为研究重点。

表6 热带气旋领域膨胀词表

3 结论

本研究利用知识图谱等方法对对1991—2017年SCI与SSCI收录的热带气旋相关文献的研究热点与趋势进行了分析。结果表明:(1)从时间上来看,热带气旋研究发文量一直呈上升趋势,其中2006年后增长犹为明显。(2)从发文的国家与地区分布来看,文献数量最多的国家是美国,在热带气旋的国际合作知识图谱当中,是一个核心链接结点,表明热带气旋学术研究中处于重要地位,77.51%的文章由一个国家独立完成,国家之间的合作以美国为中心,合作趋势呈现地域相关性。(3)从发文量机构来看,排名前十名的发文量排名前十名的机构有8家来自美国,另两个分别为中国科学院和台湾大学,分析表明少数机构在热带气旋领域有显著且长效的贡献;美国国家海洋和大气管理局(NOAA)是发表文献数量最多的机构。(4)从JCR的学科分类与期刊来看,热带气旋涉及最多的6个科目分别是,Meteorology&Atmospheric Sciences、Geology、Environmental Sciences&Ecology、Engineering、Oceanography、Water Resources。发表与热带气旋相关文献最多的三个期刊是MONTHLY WEATHER REVIEWJOURNAL OF THE ATMOSPHERIC SCIENCES、GEOPHYSICAL RESEARCH LETTERS,其中 MONTHLY WEATHER REVIEW唯一发表的文章数量超过1000篇的期刊,占所有文章总数的4.51%,并且其总引用数也是所有期刊中最高的。(5)发文最多的四位作者分别Montgomery Michael T,Chan,Johnny C L,Zhang Fuqing 与 Wu Chun-Chieh。 其中Montgomery Michael T是发表文章数量最多的作者,结合H-index以及均篇引用率的分析,发现Zhang Fuqing,Wu Chun-Chieh两位作者是近几年新晋的比较有发展潜力的学者。(6)热带气旋领域前沿热点表明,从领域关键词词频分析来看,热带气旋产生的灾害、洪水、暴雨及其本身台风和飓风是热带气旋研究最多的内容,说明热带气旋所造成的灾害一直是领域内研究热点;从热点时序演进来看,海平面上升、灾后恢复、社区与健康、灾害、气候变化研究内容近年来不断增多,说明热带气旋领域与气候学、生态学领域的交叉成为新的研究热点;从突变词检测来看,遥感和追踪表明新技术对热带气旋监测具有极大的促进意义,是近年来新兴的研究热点;新媒体关键词如Socila media,Twitter等,虽然排名不够靠前,近五年发文数量在逐渐增多,预计未来几年是一个新兴学科交叉研究热点。

基于知识图谱分析可以较好地开展热带气旋相关研究领域与热点趋势,但是还存在一些研究难点问题有待解决。文中并没有对热带气旋相关具体的学术研究成果展开广泛而深入分析,未阐述某一具体方向研究的变动趋势。后续研究将进一步考虑对热带气旋相关研究领域中的研究理论与方法,综合其它文献计量方法开展专题分析,为相关学术研究提供有益参考和借鉴。

猜你喜欢
气旋热带热点
热点
2003年3月北大西洋上两个爆发性气旋的“吞并”过程及发展机制分析❋
氨还原剂喷枪中保护气旋流喷射作用的研究
热带风情
热带的鸟儿
热点
T 台热带风情秀
结合热点做演讲
北太平洋上一个爆发性气旋族的结构分析❋
2014年3月大西洋上一个爆发性气旋的研究