匡秋明 于廷照
(中国气象局公共气象服务中心,北京 100081)
2019年4月23—25日,美国国家海洋和大气管理局(NOAA)在其天气和气候预测中心主办了利用人工智能(Artificial Intelligence,AI)技术开发利用卫星观测资料和数值天气预报的研讨会。研讨会的目的是促进遥感/地球观测/数值模式等气象科学专家和人工智能领域专家之间的知识交流,探索使用人工智能解决NOAA在有效利用爆炸性增长卫星观测数据方面面临的重大挑战。会议指出,人工智能是环境数据处理和开发利用以及NWP中的一项潜在的变革性技术,特别是处理卫星和其他大容量数据的革命性技术。
卫星图像云、雾、雪的检测、识别和预测是各类气象服务的基础,有效的云、雾、雪相关算法研究对提高气象要素预报精度具有一定指导价值。基于人工智能机器学习方法的云检测技术由来已久,Ting等[1]提出一种多特征融合方法,通过融合谱特征、纹理特征和归一化植被指数特征,用支持向量机(SVM)对高分卫星图像进行检测,识别准确率达到91.45%。多特征融合方法是有效的,但其最大的问题在于特征提取方法需要很强的先验知识,因此,云检测准确率在很大程度上依赖于底层特征选择。为解决此问题,Shi等[2]和Cai等[3]分别提出基于深度网络的方法,通过网络自动挖掘云层的潜在判别信息。卫星图像首先通过线性迭代聚类转换为超像素子区域,网络对每个子区域分别检测识别。针对小型卫星遥感图像,Zhang等[4]提出一种基于Unet网络和小波变换的云检测识别技术,通过红光、绿光、蓝光和红外四种波段,在Landset-8数据集上云识别准确率达到97.45%。Li等[5]提出还有一种多尺度卷积特征融合技术,采用自动编码器模型提取多尺度、高层空间特征,不同层特征融合后,通过主流卷积网络可以实现云检测分割。此外,Ozkan等[6]提出深度金字塔网络结构,Hayatbini等[7]提出基于梯度的云检测分割,其最大优势是可以逐像素点识别云层类别。Tan等[8]和Mohajerani等[9]最近也提出多种基于卷积长短时记忆网络和全卷积网络的云检测方法。
雾在卫星图像的呈现形式上与云具有很强相似性,Egli等[10]提出基于多元混合数据和随机森林的雾检测方法。Colabone等[11]、Han等[12]将各种气象要素时间序列转换为二维图像,通过卷积神经网络可以预测短时的雾产生消散情况。Xie等[13]提出多分支深度网络方法,每个分支在多尺度上分别进行厚雾、薄雾、无雾的检测识别。此外,利用人工智能技术可以实现卫星图像云、雾的去除,对地物观测识别[14-15]、地面能见度分析[16]具有指导作用,对交通流量管理[17-18]、航海[19]、航班飞行[20]等海陆空专业气象服务也具有重要应用价值。
云、雾、雪底层颜色特征和局部纹理特征的相似性使得如何区分三者之间形态也是当前人工智能技术的发展方向。Zhan等[21]提出一种全卷积网络,可以在卫星图像像素级实现云和雪的分类识别分割。尽管此类方法效果明显,其仍然存在两方面缺陷:从模型角度此类方法易产生梯度消散并造成模型退化,从数据角度此类方法无法充分利用各类有效数据,从而造成监测识别精度的降低。为解决以上两点问题,Xia等[22]提出基于多维输入的深度残差网络(Multidimensional deep Residual Network,M-ResNet),通过多维信息输入实现有效信息互补,该技术可以有效提取卫星图像特征及谱信息,在多谱段卫星图像上可以实现无云雪、云、雪、云雪混合四种模态识别。Nijhawan等[23]提出基于深度特征和浅层特征的融合方法,该方法分为两部分,第一部分以在计算机视觉领域预训练的主流卷积网络为基础,提取卫星数据谱图像的深度卷积网络特征,第二部分基于传统手工特征提取合成孔径雷达图像的判别式特征,该方法在验证集积雪识别的准确率对比主流方法提高了2%。此外,不仅积雪覆盖区域会影响日常生活,积雪区域的变换也会影响人们的日常生活安排及出行计划,为此,Varade等[24]提出基于稀疏表示和字典学习的积雪覆盖区域变化识别方法,将积雪覆盖区域表示视作图像,以K-SVD分解得到图像表示的一组完备基,即字典,再通过稀疏反编码技术获取最终积雪覆盖区域的变化信息,该方法比基于支持向量机的方法效果有明显提升。Zhu等[25]提出一种针对山地地区高时空分辨率积雪覆盖区域识别的一种半监督方法,称为半监督多时段积雪提取法(SMCE)。该方法最大的特点是可以实现多时段相同区域图像的耦合模型训练,不同时段的图像视作相同地表观测的不同描述形式,然后通过迭代的耦合训练即可实现大规模无标注数据的有效利用,即半监督方法。
太阳能辐射预报随着各种新能源设备、技术的普及也逐步展开,并且人工智能技术需求日益提高[26-30]。Senkal等[31]利用经纬度、高度、时间、辐射等气象卫星数据和地理位置作为输入信息,并基于神经元网络实现了对任意位置的太阳能辐射预测,以归一化共轭梯度为优化算法,该神经元网络与传统方法最大的不同在于其采用弹性传播机制而非主流反向传播,使得神经元网络的收敛速度明显加快。Marquez等[32]利用卫星数据和神经元网络实现了未来2 h逐30 min全球水平太阳能辐射预测,由于太阳能辐射量与云层位置及其厚度有很大关系,该方法首先根据提供的卫星图像数据估算感兴趣区域云的平均移动速度,进而估计在未来短时间内该运动造成云覆盖量变化对全局辐射的影响,在多种评价准则条件下该方法优于冻结云传导(Frozen Cloud Translation)模型。Voyant等[33]利用静止卫星获取的全球的二维太阳能时间序列作为神经元网络,实现了对地球上偏远或无标定地区的太阳能预测。不同于主流基于均方误差优化目标的方法,该方法在太阳能预测领域首次引入基于互信息评价准则,该准则相较均方差目标能够最大化感兴趣区域损失,后来该方法在计算机视觉领域得到广泛推广,即注意力(Attention)机制。Zhou等[34]利用中分辨率成像光谱仪(MODIS)遥感数据,基于随机森林方法实现了太阳能辐射的逐日预测。随机森林是机器学习领域常见的一种集成学习方法,简单起见,博伊西州立大学直接采用开源随机森林模型,其最大特点是采用耦合方式,融合了地面观测数据和遥感数据,使得随机森林模型可以综合考虑多模式输入的优势。Jang等[35]基于多源卫星图像和支持向量机实现了太阳能辐射预测方法。同Marquez等[32]一样,该技术首先基于卫星图像的大气运动向量(AMVs)实现了大气层运动信息估计,并利用4年的卫星信息观测数据实现了基于支持向量机的太阳能辐射时序预测。Srivastava等[36]首次提出基于长短时记忆网络的太阳能辐射预测技术,并在欧洲16个观测点和美国5个观测点全球共计21个地点对该技术进行验证,证明了该技术的有效性。长短时记忆(LSTM)网络是深度学习领域一种特别适用于时序估计的模型,该模型由于增加了遗忘门、输入门、输出门及中间状态四种控制信息,可以实现对长短时记忆的自动选择,提高时序估计性能。Lago等[37]提出基于神经元网络的短时太阳能辐射预测技术,该技术主要利用卫星观测数据和气象预报数据,以多模式数据为输入,以卷积网络为方法,以短时太阳能辐射为输出,其最大优势是可以实现跨地区预测,并在荷兰25个观测点验证了该技术的有效性。
地物系统是人工智能领域也是研究热点,如土壤水分含量预测、作物森林植被覆盖预测等。Panda等[38]早在十多年前就利用卫星图像并基于神经元网络实现陆地湖泊水质估计。Ahmad等[39]最早引入针对卫星图像的支持向量机技术,用于土壤水分估计。很多水文相关的应用如干旱、洪涝、灌溉等都需要高分辨率土壤水分数据,Srivastava等[40]研究了多种机器学习技术,如神经元网络、支持向量机、相关向量机、广义线性模型等在卫星土壤水分图像上的降尺度方法,Ali等[41]也对此类相关技术展开了细致调研。Xing等[42]利用神经元网络技术,隐式获取卫星观测数据与土壤水分之间的高度非线性关系。Efremova等[43]基于序列到序列最新人工智能技术,从卫星图像出发,识别分割出作物及其所在陆地区域并实现了土壤水分估计。高精度卫星图像作物识别对食物安全等具有重要影响,Kuwata等[44]研究了基于支持向量回归技术和深度网络技术的卫星图像作物区域估计。卫星数据的重要性不言而喻,但其标注数据却少之又少,Xie等[45]利用迁移学习技术,充分利用了多种卫星图像数据实现了地物区域估计[46]。而后You等[47]又提出基于手工特征提取、卷积网络、长短时记忆网络、高斯过程的时空相关作物估计技术。手工特征提取根据人工专家先验提取判别性特征信息,卷积网络从数据分布出发隐式提取模型最具判别性特征,长短时记忆网络通过自带的输入门、遗忘门、输出门及中间状态实现时域长短的自适应选择,高斯过程可以实现预估数据的平滑。Kussul等[48]、Garnot等[49]也提出基于卫星图像和深度网络的陆地作物分类技术。除作物覆盖外,森林覆盖也是地物重要组成部分,Shao等[50]研究了堆叠稀疏编码器、多步线性回归、k近邻、支持向量机、反向传播网络、随机森林等机器学习技术针对卫星数据的森林覆盖及地面生物量估计。Khan等[51]构建了一种多尺度网络,将森林覆盖问题转换为机器学习中的区域分类问题,实现了纯数据驱动的区域表示分类。
环境质量与人生活息息相关,基于卫星数据的空间统计方法研究火热,与人工智能方法相结合的环境质量检测技术方法也是研究热点[52-54]。Ma等[55]基于中国国内PM2.5监控网络,提出地理加权回归方法(GWR),与卫星观测的气溶胶光学厚度数据相融合,可以估计每天PM2.5浓度变化。通过交叉验证实验表明,多模式气象要素及地面观测信息可以极大的提高模型预测性能。Song等[56]同样基于地形加权回归技术,可以预测珠三角地区PM2.5浓度变化。考虑到浓度随时间的变化规律,Bai等[57]在地理加权技术的基础上提出时域地理加权技术(GTWR),基于500 m气溶胶光学厚度数据可以预测地面PM2.5浓度。具体来说,GTWR通过气溶胶反演算法(SARA)预测气溶胶厚度(AOD),然后结合数值天气预报的多模式气象要素如行星边界层高度(PBLH),相对湿度,风速及温度等可以实现PM2.5浓度的时空动态变化预测。Li等[58]是早期将深度网络技术应用到地面PM2.5浓度预测的机构之一,在主流深度信念网络框架下,将地理距离信息和PM2.5时空相关信息融合起来,可以刻画隐空间PM2.5关键特征,预测未来PM2.5浓度信息。Liu等[59]利用卫星观测数据,基于随机森林方法实现空间0.01°分辨率网格的长时PM2.5浓度预测,随机森林法是机器学习领域常用的一种集成学习方法,该方法最大的优势是可以预测长时间段的PM2.5浓度变化。Shen等[60]提出一种纯数据驱动技术,利用深度网络隐式地学习PM2.5浓度、卫星气溶胶光学反射率、观测角度和气象要素之间的关系。Khaefi等[61]基于气象数据、卫星图像和社交媒体图像多种信息,利用深度网络技术实现了空气质量预测。由于主流时域地理加权技术均采用线性回归作为基本方法,线性假设限制了模型表达能力,为此,Li等[62]在时域地理加权技术的基础上,充分挖掘数据的非线性关系,将线性回归泛化为深度卷积网络,提出时域地理加权深度网络,具有更强的非线性表达能力,可以预测0.1°空间分辨率的PM2.5浓度,并提出交叉验证方法[63]。Sarafian等[64]分别检验了高斯马尔科夫随机场模型和线性混合模型对卫星数据PM2.5浓度预测的效果,结果表明高斯马尔科夫随机场模型优于线性混合模型。卷积网络最早成功的应用于计算机视觉领域,Inception、VGG等模型在物体识别、物体检测、物体分割领域效果突出,为了验证该类方法是否能有效解决PM2.5浓度预测问题,Hong等[65]对此展开研究,并利用卫星图像数据、地面观测数据和卷积网络技术,验证了以上多种新型深度网络模型如Inception、VGG等在户外PM2.5浓度预测上的效果。
IBM 绿色地平线是基于卫星观测等资料,利用AI技术实现空气质量监测、预报和防治的典型实践案例。IBM依托收购全球最大气象公司之一的TWC公司的相关业务,利用长达30年跨度的国际气象数据分析及预报经验,从多个尺度挖掘了大气复合污染成因及传输规律。该平台利用认知计算、大数据分析以及物联网技术的优势,分析空气监测站和气象卫星传送的实时数据流,凭借自学习能力和超级计算处理能力,提供未来 72 h的高精度空气质量预报,实现对城市地区的污染物来源和分布状况的实时监测。该平台是基于数据驱动的机器学习典范,该方法通过模拟人类大脑的神经连接结构,将数据在原空间的特征表示转换到具有语义特征的新特征空间,从而可以不经过人工先验知识设计,自动地学习得到数据的层次化特征表示,提高预报性能[66]。由IBM研究院研发的“污染过程多维认知案例库”,可以实现针对全国367个特定城市、20多个维度的历史污染过程和天气形势全自动化认知分析,助力专业管理机构决策。通过同化融合海量历史数据(诸如空气质量、气象、遥感监测等),从污染传输、气象条件、遥感反演等多个维度实现对PM2.5、臭氧等多种污染物的历史同期污染过程深度对照。
海洋中洋流[67]、旋涡[68-69]、海面温度[70-71]对海上作业具有重要影响。Keating等[72]提出一种随机滤波技术,可以基于卫星高度测量数据估计海洋漩涡热量传递,且该技术计算成本低。蔚山国家科学和技术研究所是早期采用机器学习技术和卫星数据检测沿海水质的机构之一,Kim等[73]利用包括随机森林、支持向量回归等模型技术,实现了叶绿素和悬浮物浓度监测,Lee等[74]利用决策树、随机森林技术,实现了南极冰川厚度估计。Kim等[75]提出基于深度网络的南极海冰密度估计技术。该方法首先基于贝叶斯多模型融合构建集成区域气候模式(RCM),该模型由于充分考虑了单个模型的时空变化性,使得集成后的区域气候模式可以最小化单个区域模式的不确定性,并用于生成高分辨率观测数据,然后通过深度神经网络(DNN)非线性的拟合海冰密度这一要素与各类气候因子之间的隐式依赖关系,并估计未来10~20 a海冰密度的变化趋势。由于该模型以气象先验为指导对网络结构、损失函数、优化算法及激活函数等对整个模型学习过程进行优化,模型性能提升明显。Su等[76]基于支持向量机技术,利用卫星数据实现了印度洋海平面表面温度、高度、盐度异常监测。Wang等[77]基于卷积网络和合成孔径雷达数据实现了地球两极海冰密度的估计。以合成孔径雷达数据为输入,以海冰密度为输出,在不经过任何特征提取或图像分割技术的前提下,卷积网络可以通过反向传播按照既定的优化目标函数及优化方式实现模型自动更新。Savitha等[78]新提出一种最小资源分配网络和增长剪枝径向基网络,以序列化的方式实现了海浪高度预测。Ducournau等[79]采用超分辨率卷积网络,实现了卫星图像降尺度,并用于海平面温度的降尺度估计。Huang等[80]基于卷积网络,实现了SAR图像端到端的海洋漩涡检测,在无需任何先验知识的前提下,大大提高了海洋漩涡检测精度和速度。
降水是与人生活关系最密切的气象要素之一,自Shi等[81]提出基于卷积长短时记忆网络(ConvLSTM)的降水技术以来,Shi等[82]、Hernandez等[83]、Ha等[84]、Cao等[85]、Manandhar等[86]都对此展开深入研究。基于卫星数据的降雨估计在覆盖率和时空分辨率上明显优于地面降雨估计,为提高基于卫星数据的降雨估计精度,Tao等[87]提出一种二阶段网络技术,第一阶段填充缺失值,第二阶段实现点对点精准降雨估计。第一阶段,模型通过堆栈式噪声自动编码器实现面积无雨区域的消除以及有雨区域的精确描述。第二阶段,模型仍然通过堆栈式噪声自动编码器在保证扭曲分布的前提下,实现降水精准估计。随后,Tao等[88]又在此基础上引入星载红外、水汽数据,提出多模式卷积网络对该方法进行改进,且验证试验表明多模式数据尤其是水蒸气通道数据对提高识别有无降雨具有明显提升作用。
利用机器学习技术针对卫星数据的风要素估计由来已久,早在20年前,Chen等[89]、Cornford等[90]就开始探索用神经元网络描述卫星散射计与海洋风力场之间的反演物理关系模型。最近,基于机器学习技术的风速估计非常火热,如Liu等[91]、Wang等[92]、Ghaderi等[93]。基于主流机器学习方法,Xie等[94]、Feng等[95]、Khodayar等[96]主要探究短时风速预报,Wan等[97]主要探究逐天风预报。此外,Zhang等[98]基于玻尔兹曼机、Qureshi等[99]基于回归和迁移学习、Hu等[100]基于深度迁移网络、Khodayar等[101]基于深度生成网络、Qu等[102]基于长短时记忆网络等均取得了一定进展。Cardona等[103]最近基于主流卷积网络、递归网络,实现了对自然场景拍摄图像0.75~11 m/s的风速估计。该方法首先通过耦合式卷积神经网络提取图像的隐式判别式特征,而正如风在自然界中是一个连续的过程一样,该方法随后通过递归神经网络实现风速变化趋势的拟合,进而通过特征分类器实现当前时段的风速估计。该成果2019年发表于机器学习及人工智能领域的顶级会议——“神经系统信息处理研讨会”,是较为前瞻的AI在气象领域的先进算法。
Wu等[104]最近使用卷积神经网络实现了静止卫星反演路面温度数据,提出多尺度特征聚合卷积神经网络,不同于传统方法只能实现小片区域的温度补全,MSFC-CNN可以通过卷积网络高度复杂的非线性特征实现对大片区域的温度补全。Singh等[105]则采用多线性回归、多层感知器和自适应神经模糊推理系统技术实现了多深度土壤温度预报模型。Hendee等[106]研发珊瑚礁预警系统网络,应用NOAA卫星海洋表面温度产品和人工智能分析软件实现了实时监测珊瑚表面温度。Shiguemori等[107]应用神经网络方法实现了卫星资料反演大气温度,通过辐射传输方程直接刻画卫星数据特征,为神经网络模型提供训练数据,神经网络模型选择人工智能领域经典的径向基函数网络,并以数据为基础通过反向传播优化网络参数。Shiguemori等[108]改进了神经网络模型,实现对垂直温度场的反演,并与HIRS/2高分辨率红外辐射探测仪的真实辐射数据以及无线电探空仪测量的温度剖面相比较,结果表明,神经网络模型反演结果与温度垂直探测结果非常接近。
各种自然灾害如冰雹等对工业、农业破坏性强,因此与之相关预警研究具有重要意义。Pullman等[109]研究了基于卫星图像的冰雹检测、预警新技术,该技术以主流深度学习网络为框架,并通过2006—2016年的观测数据验证了该技术的有效性。此外,Czernecki等[110]通过随机森林方法也实现了对冰雹灾害的精准估计。由于多数人工智能方法均基于数据驱动,研究者首先从数据多样性出发,融合了雷达反射率数据、闪电探测数据以及ERA5再分析对流指数数据等,极大地提高了模型的鲁棒性,并降低了误报率。Burke等[111]主要研究了如何通过机器学习方法对模式预报结果进行相关后处理,提高冰雹预测精度。同前述文献一样,该方法同样基于多源数据融合及随机森林模型提高模型预报精度和鲁棒性,不同之处在于该方法基于模式预报后的数据后处理,即冰雹最大期望范围。
大风天气影响强、范围广,每年大风都会造成巨大的生命财产损失,对台风、风暴等大风信息预警具有实用价值。Kovordanyi等[112]较早开展了基于神经元网络并针对卫星数据的气旋风的跟踪预报,通过模拟人脑机制的多层神经元网络实现的气旋风跟踪估计方法在测试集的方向准确率达98%,并且该研究指出,除卫星图像外,风速、水温、相对湿度、气压等额外气象要素可以有效提高预报精度。Qiu等[113]基于模糊集合理论、支持向量机技术及闪电预警信息,提出风暴预警技术。Zhang等[114]基于卫星图像序列,根据当前和历史卫星图像,以气象知识为先验,通过卷积网络提取与最具判别性的视觉特征,通过计算云的局部运动信息实现了短时大风预报。Hong等[115]在卫星图像基础上,提出一种新型专用于台风中心跟踪的卷积网络,该网络用于提取台风中心显著判别特征,线性回归模型实现台风中心预测。Ruttgers等[116]利用最新生成对抗网络技术,实现了针对遥感卫星数据对台风未来6 h轨迹跟踪,该技术在80 km误差范围内准确率为42.4%,120 km误差范围的准确率为74.5%。生成对抗网络是近年来较为火热的AI技术之一,与传统卷积神经网络不同,该网络分为两部分,第一部分为生成器,用于对任意的输入生成目标输出;第二部分为判别器,用于判断对任意的输入是否为真实数据。生成器和判别器的训练过程是一个博弈的过程,当二者达到纳什平衡时,模型的输出趋于稳定,模型的输出也即期望输出。此外,Jiang等[117]、Gao等[118]也对海上台风预测的相关机器学习技术展开研究。
对流云的产生通常会伴随着强降雨、风暴等,而对大数据环境下的强天气检测面临巨大挑战,当前主流研究方法大多基于相关物理变量而由专家先验知识定义的阈值,实现强天气精确仍是研究难点,因此,相关研究对降低灾害具有重要意义。Han等[119]在决策树、随机森林、支持向量机等机器学习技术的基础上,利用各种气象、卫星数据,可以实现检测强对流的形成过程。Liu等[120]实现了基于卷积网络的强天气检测作为气象领域强天气检测的一种辅助,是全球首次采用深度学习方法用于强天气检测,但从机器学习角度来看这只是深度学习技术的一次跨领域尝试。尽管该方法对辅助强天气检测提供了有效帮助,但该方法需要大量标注数据,而实际过程中,强天气有多种不同表现形式,如飓风、温带气旋等,实现完全标记需要耗费大量人力物力财力。为此,Racah等[121]提出基于半监督时空自动编码器的强天气检测方法,通过多通道时空编码-解码器刻画数据特征,用于拟合多通道数据、时域变换数据以及无标记数据的重构,实现判别式特征提取,从而实现强天气现象检测。Zhu等[122]实现了基于主流GoogleNet的强天气识别。此外,强天气的出现可能引发诸多灾害,Zhou等[123]提出基于卷积网络的对流天气识别,Zhang等[124]提出基于双流全卷积网络的对流云提取,Bischke等[125]、Biffis等[126]等都提出基于深度网络和遥感图像的强对流洪涝检测技术。
雷电对日常生活影响大、损失严重,当前主流基于卫星数据的闪电预测方法都基于不同光谱通道的亮温观测,一旦该观测达到某一设定阈值,即推送闪电预警。Johari等[127]是早期研究基于AI技术闪电预警的研究机构之一,根据历史观测数据和各类气象数据,该方法设计了一组简单的神经元网络,仅包含两层卷积,通过反向传播优化网络参数,该模型可以实现提前4 h的闪电预警。Booysens等[128]利用卫星时序数据,研究了K-means方法、决策树方法、朴素贝叶斯方法在闪电检测和预警方面的效果。Schon等[129]最近提出多种基于决策树技术和神经元网络技术的卫星图像雷电预警技术,是近年来较为先进的人工智能方法。该技术核心是将卫星图像的二维光流误差信息作为决策树、神经元网络的输入,并且认为光流误差是形成闪电对流的主要影响因子,以此为卷积网络的输入,该技术实现了未来15 min雷电精准预警,预警准确率高达96%,且未来5 h雷电预警准确率达到83%。
森林覆盖在生态中存在的最大隐患就是火点[130-132],森林火点容易造成大量的经济损失和人员伤亡。森林火险预警的一大难题就是如何在有限计算量的前提下,拟合火势扩散的动态趋势,这一过程本身可以视作一种马尔科夫决策过程,而这一过程的主体是火点位置,动作集是火点可能扩散方向,即东西南北四个方位,回报函数是该方法最终是否预测火点正确。在此框架下,Subramanian等[133]基于最新强化学习技术,分别通过值迭代法和策略搜索中的异步优势评论算法,实现了森林火点的动态变化估计。Lee等[134]、Zhao等[135]也提出此类基于深度学习的森林火点检测技术。
尽管AI技术具有极其广泛的应用前景,但该类研究离实际落地应用还有一定差距,人工智能在气象资料的应用领域面临着巨大挑战,主要体现在以下三方面。第一,数据完善及可靠性。AI技术是数据驱动的机器学习机制,其发展离不开大量人工标记数据的支撑,大量气象观测站及气象卫星资料提供了海量数据,但受限于观测手段等各种因素影响,收集到的数据可能存在缺陷,这会给人工智能算法的学习带来一定挑战。第二,平台可拓展及共生性。传统气象领域与当前人工智能领域在技术实现上存在一定差异,气象领域多数基于大量领域内的专家知识先验,而AI技术不以先验为前提,倾向于突出算法模型的自适应能力,因此,如何实现现有气象平台的可拓展性以及如何实现人工智能技术与现有气象平台的对接也给AI在气象领域的应用带来巨大困难。第三,技术落地应用。一种先进方法的落地应用离不开前期基础积累、中期技术升级以及后期性能检验三步流程,为此,需要大量后期性能检验,验证方法技术的有效性,这需要耗费大量的人力、物力、财力,给AI在气象领域的应用带来了挑战。
Advances in Meteorological Science and Technology2020年3期