气象和大气科学领域人工智能科学研究的国际态势分析

2021-12-24 08:21何晓欢张定媛
科学咨询 2021年46期
关键词:洪水

吴 灿 戴 洋 何晓欢 张定媛

(1.中国气象局气象干部培训学院 北京 100081;2.国家气象中心 北京 100081)

2018年以来,人工智能推动科技、产业发展和社会变革的巨大潜力得到全球更加广泛的认同。荷兰爱思唯尔(Elsevier)出版集团相关研究报告发现,全球人工智能科研的发展趋势呈现研究成果加速诞生,学术论文产出增速达12%,中美表现遥遥领先,同时新兴研究中心开始崛起等特点。人工智能在气象行业的发展和应用也日益受到关注。2017 年,国务院印发的《新一代人工智能发展规划》中明确提出,要加强人工智能对自然灾害的有效监测,围绕地震灾害、地质灾害、气象灾害、水旱灾害和海洋灾害等重大自然灾害,构建智能化监测预警与综合应对平台。可以预见,人工智能将成为气象行业未来的关键赛场,竞争将异常激烈。要更好地抓住机遇,加快实现人工智能与气象的融合创新发展,调研分析国际主要发展态势是非常必要的。

利用文献计量学指标评价科技成果质量、科研机构乃至整个国家的科技水平与影响力,可以为有关部门的管理和决策提供定量依据和支持。针对气象领域人工智能研究这一主题,从目前已开展的研究工作来看,通过文献计量的方法,对大气科学领域人工智能应用研究进展进行全面、系统的梳理,定量化评估科技发展水平的研究还比较少。本研究从科技论文的角度出发,系统分析过去10年(2010—2019年)气象和大气科学领域人工智能的研究文献,定量评估该领域的全球主要进展态势及各国发展水平。

一、分析方法与数据来源

本研究以WOS 的SCIE 数据库为来源,从人工智能在气象和大气科学领域应用的方法入手,制定关键检索词。检索策略为从主题字段检索关键检索词,从年代角度限定发文起始时间为2010—2019 年,再从研究领域和WOS 分类筛选气象和大气科学领域,选择文献类型为“Article”“Review”“Letter”和“Editorial Material”。编制检索式:TS=(“artificial intelligen*” OR “artificial intellect*” OR“machine learning” OR “deep learning” OR“neural Network” OR “decision tree” OR“fuzzy logic” OR “hierarchical clustering”OR “k-means clustering” OR “support vector machine” OR “logistic regression” OR “ridge regression” OR “elastic nets” OR “random forests” OR “gradient boosted regression tree” OR “natural language processing” OR“Deep Belief Nets” OR “Deep Boltzmann Machine” OR “Long Short-Term Memory”OR “evolutionary programming” OR “analog ensembles” OR “nonlinear principal component analysis” OR “NLPCA” OR “Genetic Algorithm” OR “advancing forecasting” OR“expert system*”) 。检索时间为2020年6月25日。最终,检索得到2672条有效数据。

借助InCites数据库,对2672篇文献的发文国家、研究机构和关键词等字段进行清洗,最终处理得到经过归类汇总的待分析基础数据。以这些文献为基础,采用科学的定性定量分析方法,运用大数据处理与可视化分析软件,对近10 年气象和大气科学领域人工智能研究的论文产出进行定量分析,为科研学者和科技政策制定者提供一定的数据支持和定量参考。

二、气象和大气科学领域人工智能科学研究文献计量分析

(一)整体发文态势分析

2010—2019年气象和大气科学领域人工智能研究经历了从平缓运行到迅速增加的显著变化(图1)。2016年前气象和大气科学领域人工智能学术研究成果数量总体稳定,年均维持在200篇左右。2016年,随着DeepMind推出的阿尔法狗战胜人类围棋冠军李世石等事件的发生,全球人工智能第三次热潮到来,当年气象和大气科学领域人工智能研究成果数量迅速增加到了290篇。2017年,随着人工智能“落地年”(大量人工智能产品问世)的到来,相关研究成果的数量呈“井喷式”增长,该年气象和大气科学领域人工智能研究成果数量突破300篇,到2019年已突破500篇,2017—2019年3年间发表的学术成果数量和前7年(2010—2016年)发表的学术成果数量相当,且这一趋势还在继续(统计2020年前半年的文献数据发现,气象和大气科学领域人工智能研究仍维持在高位)。

图1 历年发文与增长情况(2010—2019年)

发文量的多少可以凸显一个国家在某一领域的科研体量,同时也是科研实力的一种体现。近10年全球气象和大气科学领域人工智能研究的论文产出来自110个国家。在TOP15发文国家中,欧洲国家共有6个,另有6个亚洲国家(中国、伊朗、印度、韩国、日本和土耳其)、2个美洲国家(美国、加拿大)和1个大洋洲国家(澳大利亚)。美国一直处于气象和大气科学领域人工智能研究的领先地位,2013年以后中国脱颖而出,成为和美国并驾齐驱的领跑国。

本文统计分析了在该领域发文量最大的全球TOP20机构(表略)。从数量分布来看,美国占据了半壁江山(10家机构),分布广泛,优势明显;另中国、法国、印度、德国分别各有5家、2家、2家和1家机构。综合各机构的总发文量、第一作者和通信作者发文量来看,中国科学院以显著的优势位列第一,美国国家海洋与大气管理局排名第二,法国国家科学研究中心排名第三。此外,北京师范大学、印度理工学院虽然发文量不算多,但第一作者发文占比与通信作者发文占比均较高。

(二)研究影响力分析

从发文的被引频次(总被引频次和篇均被引频次)、使用频次(通过文章引用率体现)与发文新颖度(通过近3年发文占比体现)等方面(表1),可以衡量出各国在气象和大气科学领域人工智能研究的影响力情况。2672篇文献总被引频次为39 559次,篇均被引达14.8次/篇。

表1 TOP15国家影响力指标一览表

美国在总被引频次上远远领先于其他国家,且篇均被引频次也表现良好,位列第四,反映了其学术影响力优势明显,但在近3年发文占比上优势不明显,受到了其他国家的冲击。中国的总被引频次排名第二,但篇均被引频次排名不佳,文章引用率排名也表现平平,反映出我国仍需在学术影响力方面努力提升。但可喜的是,我国在近3年发文占比方面表现良好,位列第四。

此外,德国、法国、英国、意大利和澳大利亚无论是在论文被引频次方面,还是在使用频次方面均表现良好,说明这些国家在该领域研究的学术实力不容小觑。在亚洲国家中,伊朗和土耳其的表现值得关注,其篇均被引频次和文章引用率均超过了中国,说明其有着较高的关注度,学术影响力表现不俗。在发文新颖度方面,表现良好的国家除中国外,还有荷兰、澳大利亚、日本和英国。

针对最优秀的前1%的论文,即被引频次位于该学科所有论文前1%的论文(也称为ESI高被引论文),其数量特征也可以在宏观上从一个方面反映学术实体的学科影响力和竞争力。在2672篇文章中,有36篇被选为ESI高被引论文,亚洲国家在ESI高被引论文产出方面表现不俗,且亚洲国家的第一作者或通信作者论文数占总论文数的比例也普遍较高。这些结果说明,在气象和大气科学领域人工智能研究中,亚洲国家的研究实力逐步提升,且主导型学术论文的产量越来越多。但结合之前的分析结果可以看出,虽然亚洲国家在该领域拥有较大的研究体量,也有一定的高质量的研究积累,但其整体文章质量依然不均衡。

在机构层面上,采用同样的方法和指标,对TOP20机构的影响力进行分析(表略)。发现:美国的国家海洋与大气管理局和国家大气研究中心在总被引频次和篇均被引频次方面遥遥领先,稳居第一和第二位,学术影响力优势十分显著。除这两家机构外,在引用频次方面表现良好的机构还有法国国家科学研究中心和美国加州大学系统。中国机构发表论文的引用表现平平,在5家中国机构中,中国气象局的篇均被引频次最高(15.19次/篇),是上榜中国机构中唯一超过全球平均水平的机构。在文章引用率方面,印度理工学院系统、法国索邦大学和德国亥姆霍兹联合会的文章引用率较高,说明其开展的研究获得了较高的同行关注。在发文新颖度方面,中国科学院大学、北京师范大学和德国亥姆霍兹联合会的近3年发文较多。

(三)合作网络分析

通过国家间的合作网络分析,能够识别出气象和大气科学领域人工智能研究国家之间的合作关系。合作网络图中节点的大小反映了各国的发文数量,节点越大,表示发文量越大。节点中带有紫色外圈年轮的表示该节点的中心性(Centrality)高。紫色外圈越粗,节点的中心性越高,说明其在整个合作网络中的重要性和影响力越大。从TOP20国家之间的合作网络来看(图2),美国、德国和法国是整个合作网络的中心性国家(其Centrality值分别为0.26、0.25和0.23),意大利、加拿大和日本为次中心国家(其Centrality值分别为0.11、10和0.10)。这些中心和次中心国家,除日本为亚洲国家外,其余均分布在欧洲和北美洲,说明气象和大气科学领域人工智能研究的国际合作主要还是集中在欧洲和北美地区,这些地区的国家在国际合作网络中占据了主导地位,拥有较大的影响力。中国的Centrality值为0.07,但由于发文量最大,因此在合作网络中也是最重要的桥梁性国家。除中国外,合作网络中的桥梁性国家也多为亚洲国家,如韩国、印度、马来西亚、土耳其、伊朗等。

图2 TOP20国家合作发文网络图

(四)研究方向与热点前沿分析

从发文所属的研究领域来看,气象和大气科学领域人工智能研究的主要交叉领域为地质学、水资源学和环境科学,其论文占比分别为29.4%、22.8%和17.2%。从TOP20国家发文的主要交叉领域分布来看,美国、德国、英国、加拿大和澳大利亚更侧重于与环境科学领域的交叉,而中国等亚洲国家以及法国、意大利等少数欧洲国家则更偏重于与地质学领域的交叉。

从发文内容来看,通过标题与摘要关键词聚类分析,可以得出气象和大气科学领域人工智能研究SCI论文的研究内容(图3),大致可以分为四类:①蓝色聚类为气象和大气科学领域人工智能技术的理论研究,主要关键词包括人工神经网络、随机森林、遗传算法、机器学习、支持向量机、主成分分析等。这一聚类相对分散,比其他聚类交叉性较大,这与其研究涉及多学科科学的实际相符;②橘色聚类为人工智能技术在预报业务中的应用研究,主要关键词包括数值天气预报、预报验证、统计预报、集合预报、可能性预报、模型、预报技巧等词汇;③浅橙色聚类为观测技术中人工智能的融入,主要关键词包括卫星观测、雷达以及数据分类、最小化、降尺度等与数据处理有关的词汇;④浅蓝色聚类为陆面遥感及灾害管理,主要关键词有滑坡、洪水、灾害评估、GIS等。

图3 标题与摘要关键词聚类图

将2672篇文章的研究内容进行归类、整理,通过高频关键词(论文中使用频次较高的关键词,图4)分析可以得到,气象和大气科学领域人工智能研究中,天气和气候预报模式、天气系统及灾害性天气的识别是最主要的研究对象,其次是气象探测技术、生态和大气质量监测。第三类是可再生能源、航空预报。第四类研究对象为智能决策辅助系统。从关键词体现的研究方向来看,数值模式资料同化、数值模式参数计算(如云和对流参数化)、模式产品后处理、临近预报、定量降水客观预报和台风集合预报、霾预报、数值预报订正、精细化预报、超分辨率处理(气候模式降尺度)等天气、气候预报模式的研发和方法改进研究是最主要的研究方向,其次是气象探测设备的自适应(具有自检测、自标校、自校准、自补偿能力)、广泛分布所产生海量数据的大数据挖掘技术应用、基于非气象观测设备的气象信息反演技术等智能气象观测技术研究。此外,人机互动的预报智能编辑和基于自然语言生成的预报产品智能生成等智能决策辅助系统研究也是一大研究方向。从方法性词汇来看,气象和大气科学领域人工智能研究主要涉及的研究方法包括人工神经网络、深度学习、机器学习、决策树、模糊逻辑、支持向量机、随机森林、回归树、非线性主成分分析、遗传算法等。

图4 高频关键词云图

美国气象学会百年进展中有关人工智能的分析指出,随着更高分辨模式的出现,新观测仪器的部署以及更多遥感方法的实施,观测数据开始迅猛增长。基于数据的天气预报技术研究成为人工智能技术在气象和大气科学领域中最普遍的研究之一。其次是概率预报研究。目前,已研究出了多种可同时处理多个NWP系统和多套历史数据的人工智能方法。第三是气候应用研究。如利用人工智能技术模拟大西洋振荡、太平洋-北美遥相关、厄尔尼诺-南方涛动、准两年振荡、季节内振荡等气候变率的主要模式,或利用人工智能技术对气候信息进行后处理。第四是仿真研究。现代预测模型大都是基于从基本原理推导的偏微分方程加上一系列物理参数化,这些物理参数化只是对物理过程的部分理解,因此人工智能是否能够有效地模拟这些过程,并形成混合模型,成为了该领域研究的关键问题。第五是图像识别和处理研究。图像分析识别在雷达、卫星图像领域被广泛应用。从引频次较多的高被引论文,以及经典的综述性文章来看,近年来诸如卷积神经网络(CNN)、生成式对抗网络(GAN)、递归神经网络(RNN)等深度学习方法是目前该方向的研究热点。本文研究结论与此基本一致。

三、结论与展望

(一)国际研究态势总结

通过计量分析发现,全球在气象和大气科学领域人工智能的研究一直保持着稳步发展态势,且发展速度有着明显的加快趋势,在2010—2019年的近10年中,2017—2019年最近3年发表的学术成果数量与前7年(2010—2016年)发表的学术成果数量相当,通过对2020年前半年的文献发表数据统计显示,这一趋势还在继续。

从国家层面来看,中美两国在全球处于领先地位,两国在技术的发展上各有所长。美国在理论及算法研究方面,成果产出明显较多,中国的成果产出以天气业务为主。在应用气象领域,中国优势明显,产出了一批高质量、高影响的研究成果,但研究涉及的主题不及美国广泛。总体而言,美国在论文数量、质量上更胜一筹:其在总被引频次、篇均被引频次和高被引方面均表现优异。但在近3年发文占比方面,美国优势不明显,这与其在该领域的研究历史长、研究体量大有关。中国在气象和大气科学领域人工智能研究中呈现出良好的发展态势,虽论文整体影响力仍有待提高,但科研论文产出数量可观,且在国际合作影响力方面也有较大的上升空间。

除了中美在气象和大气科学领域人工智能研究中的领先优势外,亚洲国家整体有着令人欣喜的表现:亚洲国家发文量多,对气象和大气科学领域人工智能的研究有较高的热度,伊朗、印度、马来西亚等亚洲国家成为该领域的新兴力量。如伊朗虽然在传统气象学领域并无突出表现,但近三年来,伊朗的信息科技市场发生了很大的变化,所以伊朗在这一领域内已有不少的人才储备。因此,该国在气象和大气科学领域人工智能研究方面的论文表现令人瞩目。印度是全球人工智能领域的后起之秀。目前其国内有800多家公司已经或正在部署人工智能,拥有近2.9万名人工智能专业人才。2018年印度发布的《人工智能的国家战略》还部署了该国未来将在人工智能领域优先布局的五个领域。东南亚在人工智能领域充满活力,各国大多表现出了积极发展人工智能产业技术的意愿,部分国家特别是东南亚传统的领先国家新加坡和马来西亚已经在政府政策层面上推出一些鼓励人工智能发展的战略,比如新加坡的《AI新加坡》、马来西亚的《国家大数据分析框架》,并在相关学术研究领域占据优势。此外,其他国家也不甘落后,如越南以及印尼、泰国等国在应用领域,均在积极探索。但值得指出的是,虽然亚洲国家(包括中国在内)作为该领域的后起之秀,近年来在该领域拥有较大的研究体量,也有一定的高质量的研究积累,但其整体文章质量仍不均衡。

与上述国家形成对比的是英德法日等传统气象强国,在该领域表现相对平平。如英国是人工智能领域的传统强国。政策支持、人才聚集、不断完善的数字生态系统,以及善于将数据资源社会化等因素决定了其在人工智能领域的独特优势。然而,在气象和大气科学领域,似乎没无特别建树。欧洲国家普遍面临人工智能人才流失的境况,但其在气象和大气科学领域拥有深厚研究基础和领先优势,在数据比较和反演特别是图像智能识别领域也有很强实力。因此,这些地区的气象和大气科学领域人工智能研究也不忽视。

从合作角度来看,气象和大气科学领域人工智能研究的国际合作主要集中在欧洲和北美地区,这些地区的国家在国际合作网络中占据主导地位,拥有较大的影响力。中国等亚洲国家虽然在该领域拥有较大的发文量,但大部分均来自国内,国际合作的参与度较低,未来可期。

从研究方向来看,气象和大气科学领域人工智能研究的主要交叉领域为地质学、水资源学和环境科学。从关键词聚类来看,研究主要以人工智能技术与天气预报业务的全链条的融合为主,其次是陆面遥感及灾害管理研究。从高频关键词分析来看,主要研究对象有:天气和气候预报模式、天气系统及灾害性天气的识别是最;气象探测技术、生态和大气质量监测;可再生能源、航空预报;智能决策辅助系统。从代表性高被引论文来看,该领域的全球研究主要有5个方向,分别是人工智能技术在天气预报、概率预报、气候应用研究、仿真研究和图像识别和处理研究中的应用。

(二)建议与展望

人工智能被认为是较为适合处理气象预报预测的有效方法。气象数据具有海量、多源、开放、不同类型、多时空尺度、高质量的特点。这些是人工智能方法和技术在气象领域应用的有利条件,也是先发优势。展望未来,人工智能在气象和大气科学领域的应用的发展,可能会在图像识别(如极端天气型分类和异常检测)、超分辨率处理(气候模式降尺度)、时间预测和空间预测等方面取得较大进展。为此,相关科技管理部门应加大对这些研究方向的扶持力度,并引导研究成果向业务应用的转换。

培养和吸引顶尖人才,加强高层次人才储备是必不可少的。麦肯锡2018年发布的报告《人工智能的未来之路》指出,中国的核心算法领域远远落后于英美同行的一个主要原因是缺乏顶尖的人才。而在大气科学领域也同样面临相同的困境:目前大部分人工智能技术方法研发还是以大气科学专业背景人员为主,需要统计学、计算科学、大数据挖掘等专业背景的科学家加入,尤其是同时精通大气科学和人工智能的人才,才能在核心基础领域实现突破。建议对已在相关研究领域和前沿方向中取得相当科研成果的科学家和工程师长期跟踪、关注发展,择机引进。此外,对后起之秀国家的研究人员,也可以保持关注,寻求多种形式的合作。

还应加强合作。2018年以来,各国人工智能战略布局进一步升级,人工智能正在从少数大国关注走向全球布局的新格局。未来,中国应注意加强与相关方的合作。一方面应注意与传统气象强国合作的优先着眼点,如美国在机理分析方面的合作,与欧洲在数据反演方面加强合作等,另一方面应注意与亚洲国家以及一带一路倡议中表现活跃国家的合作(如中国与马来西亚共建该国首个人工智能产业园),并关注伊朗、印度等国发展等,取长补短,借助各自的优势谋求共同发展。

相信假以时日,从量变到质变,我国在气象大气科学领域人工智能的研究将更坚实地进入国际领先水平行列,为保障国家的应急防灾减灾能力、保障民生提供更有力的支持。

猜你喜欢
洪水
暴雨洪水来袭,记住以下几点,有可能救命!
洪水来了
“百年一遇”的洪水为啥老能遇到
Analogies and Analogical Reasonings in the Mencius
论《洪水》二元创作模式的生成
爸爸的“洪水”暴发了
又见洪水(外二首)
洪水漫家园军魂筑长城
该做的和不该做的
筑起堤坝,拦住洪水