黄逸宇,魏冠军,任 瑞
(兰州交通大学 测绘与地理信息学院/地理国情监测技术应用国家地方联合工程研究中心/甘肃省地理国情监测工程实验室,兰州 730070)
降雨的形成是多种因素作用的结果,充沛的大气可降水量(precipitable water vapor, PWV)是降雨发生的重要前提条件[1-2]。大气可降水量指的是单位面积内空气柱中的水汽总量,水汽含量会影响大气的垂直稳定性,因此,大气可降水量在气候系统演化以及能量传递过程中具有十分重要的作用[3]。提高中小时间尺度的可降水量预测精度,可以减少极端恶劣天气(如台风、暴雨、暴雪等)对人类造成的影响,对人防工程的建立具有重要的意义和指导价值[4]。
利用神经网络研究大数据模式已经成为科学技术的重要趋势。在人工智能领域,学者们受到生物学模仿人类大脑处理信息过程的启发,建立了人工神经网络[5](artificial neural network, ANN)。由于大气可降水量的变化受多种因素影响,具有很强的非线性特征,因此很难用一般的线性模型进行预测和分析,而反向传播(back propagation,BP)神经网络属于自适应的非线性动力学模型,具有强大的学习、记忆功能,因此适用于大气可降水量的预测[6]。国内外学者对神经网络预测大气可降水量进行了深入研究:文献[7]利用最小二乘估计的方法进行了PWV 预测试验,并得到了精度较好的预测值;文献[8]利用小波网络对全球定位系统(global positioning system, GPS)可降水量时间序列进行试验,得出小波神经网络比传统的BP神经网络具有更高容错性的结论;文献[9]利用经验模态分解和神经网络相结合的方法,进行了PWV的预测,经验模态分解与神经网络结合,比直接利用神经网络预测可降水量精度更高;文献[10]利用遗传小波神经网络进行了GPS-PWV 的预测试验,得出遗传小波神经网络预测PWV 的精度比BP 神经网络和小波神经网络的预测精度高[10]。这些研究均取得了较好的结果,但没有顾及随机初始化参数容易使BP 神经网络模型精度降低的问题。本文分别选取探空站较为连续的 PWV 历史数据和GPS 反演的PWV 数据进行训练,得到效果较好的改进初始化参数,将改进的初始化参数代入神经网络模型进行建模和可降水量预测试验,比较分析改进的BP 神经网络模型与传统BP 神经网络模型的精度。
BP 神经网络由输入、隐含、输出3 个层次组成前馈网络,输入的信号经过输入层,然后传递到隐含层,隐含层经过激活函数后,将隐含层的输出信息传递至输出层,最终得到输出结果。BP 神经网络能学习和记忆很多种类映射函数关系[11],无需先确定数学方程,而是通过误差反向传递到各个层次,不断调整BP 网络的权值和阈值,使网络模型的误差平方和达到最小[12]。
根据BP 神经网络的特性,对BP 算法的原理进行简要的介绍[13-14]。每1 层节点输入层的计算公式为
式中:n代表层数;ωij、jθ分别是第n层的权值和阈值;xi为输入数据的中间参数,其对应的输出层为
式中:LayerOutn,j为输出层计算得到的 PWV 值,利用最常用的 Sigmoid 激活函数把数据从[-∞,+∞]映射到[0,1]区间内。
BP 神经网络的权值更新公式为
式中:y(t)为输出量;δ(t)为误差项;η表示该模型的学习效率。
传统的BP 神经网络采用随机初始化的参数权值ω和阈值θ,但存在2 个问题:①随机初始化的网络参数将会增加迭代次数,从而导致计算量变大,收敛速度变慢;②随机参数的使用也可能导致计算中出现异常值,降低BP 神经网络模型的稳定性。为了解决传统BP 网络模型在区域PWV 建模中的问题,将权值ω和阈值θ作为初始化参数进行BP 神经网络的迭代计算,可以得到对应时刻的改进的模型初始化参数ω′和θ′,然后利用改进的初始化参数建立PWV 模型。
利用改进BP 网络算法预测区域PWV 的具体步骤为:①提取观测历元历史时刻PWV 数据,设置迭代次数N;②将历史观测的PWV 数据代入传统BP 神经网络模型进行计算;③进行模型精度的评定;④保存神经网络模型计算的参数ω′和θ′,以及模型精度;⑤选取精度最高的模型初始化参数ω′、θ′进行保存;⑥利用改进的模型参数ω′、θ′进行 PWV 的预测试验。
本文利用探空站PWV 数据和GPS-PWV 数据分别进行多次数值模拟试验,最终确定隐含层节点数为 4 个和 5 个。将经过归一化处理的探空站站点和GPS 站点的经纬度坐标λ、φ以及站点的大地高h、年积日DOY 值和加权平均温度Tm作为输入参数,将PWV 作为改进BP 神经网络模型的输出值。其网络结构如图1 所示。
图1 改进BP 模型的网络结构
加权平均温度的计算公式为
式中:e为水汽压,单位为hPa;T为大气温度,单位为 K。由于Tm与地面温度Ts高度线性相关[15],Tm的计算公式也可用Tm=a+bTs来表示。本文采用适用于国内地区的分高程加权平均温度模型[16],其计算式为Tm为加权平均温度。
式中:Ts为地面温度,单位为K;h为探空站的大地高,单位为m。
GPS 信号穿过对流层时会受到对流层大气延迟的影响,这种影响称为对流层延迟(zenith tropospheric delay,ZTD)[17]。利用地面 GPS 接收机可以接收这些延迟的卫星信号,通过高精度GPS数据处理软件对这些信号数据进行解算,可以得到精确的对流层延迟值。ZTD 分为静力学延迟(zenith hydrostatic delay,ZHD)和湿延迟[18](zenith wet delay,ZWD)。ZHD 可以通过萨式模型[19]精确求出;ZWD 和转化系数П的乘积可以获得PWV,其计算公式为:
式中:П为转换参数;ρw为液态水密度,单位为g/cm3;Rv为比气体常数,通常取 461.495 J/(kg·K);、k3为大气折射常数,其值分别为373 900 K/hPa、22.13 K2/hPa;由式(7)可知,大气可降水量的转换参数П是关于Tm的函数,因此Tm是构建可降水量模型的重要输入参数之一。
国际探空站提供的 PWV 数据是通过释放探空气球测得的,每日有世界协调时(coordinated universal time, UTC)12:00:00、UTC 00:00:00 2 个时段的PWV数据,时间分辨率为12 h。高精度全球卫星导航系统(global navigation satellite system, GNSS)数据处理软件GAMIT 解算的GPS-PWV,时间分辨率为1 h。本文利用2 种不同的PWV 数据资料来源分别进行大气可降水量的预测试验,对比改进的 BP 神经网络模型和传统BP 神经网络模型的精度。选择平均偏差(Bias)和均方误差(RMSE)作为评估预测精度的标准,Bias 和RMSE 的计算公式为:
式中:N为测试样本的总量;为 PWV 预测值;为探空站获取的 PWV 观测值或GPS 解算的 PWV 值。
探空PWV 资料选取怀俄明大学(The University of Wyoming)提供的我国东南沿海地区 6 个国际探空站2017 年全年的可降水量数据,探空站站点信息如表 1 所示。筛选和剔除数据缺失以及探空高度不足的天数,最终符合要求的数据共有329 d。考虑到可降水量随季节变化的特性,选取年积日第 11~90 天、第 101~116 天、第 152~212 天、第223~275 天、第 277~304 天、第 315~365 天,共计289 d 6 个探空站的PWV 资料数据进行初始化参数ω和θ改正,得到改正后效果较好的初始化参数ω′和θ′,将改正后的初始化参数代入BP 神经网络模型。选取5 个探空站(ZSFZ、ZSAM、Taibei、ZSOW、ZSHK)40 d 的PWV 数据进行建模,并对探空站 HKKP 的 PWV 进行预测,将 HKKP 探空站实测PWV 值作为真值,对比改进BP 网络算法获得的 PWV 预测值和传统 BP 网络算法获得的PWV 预测值之间的精度差异。2 种模型解算的PWV 分布如图2 所示,精度指标如表2 所示。
图2 探空站实测值与2 种模型预测PWV 值分布
表1 东南地区6 个探空站站点信息
表2 2 种模型精度指标分布 单位:mm
从图2 和表2 可以看出:改进的BP 网络模型的平均RMSE 为5.142 mm,传统BP 网络模型的平均RMSE 为5.985 mm,改进的BP 神经网络精度提高了约14.1 %;不同季节平均偏差和RMSE 变化幅度较大,改进的BP 神经网络在不同季节的平均偏差均比传统BP 神经网络低,说明改进的BP 神经网络预测较为稳定;不同季节PWV 有较明显的差别,夏季PWV 最高,冬季PWV 较低,这与香港地区夏季潮湿多雨、冬季凉爽干燥的气候特点相符合;改进的BP 网络模型和传统BP 网络模型在秋季时精度均较低,在夏季精度较高,这可能与其可降水量在秋季变化幅度较大,而BP 网络模型反应较滞后有关。
GPS 数据选择香港地政总署测绘处所提供的香港连续运行参考站(continuously operating reference system,CORS)中 6 个 GPS 站点 2017 年全年的GPS 卫星测量数据,6 个CORS 站站点信息如表3 所示。利用高精度GPS 数据处理软件对6 个 GPS 站点 1 a 的卫星测量数据进行基线解算,获得大气可降水量产品,时间分辨率为1 h。经过处理并剔除GPS 站点数据缺失的天数,共获得357 d 的大气可降水量数据,选择317 d 数据进行初始化参数迭代训练,这样可以获得效果较好的初始化参数。顾及季节变化对 PWV 预测的影响,选取 5 个 GPS 站点(HKMW、HKST、HKOH、HKPC、HKWS)在年积日第 1~10 天、第 91~100天、第 213~222 天、第 305~314 天共计 40 d 的数据建模,并对HKSC 站进行预测试验,将解算的HKSC 站 40 d 的 PWV 作为真值,分析 2 种神经网络的精度。2 种模型解算的PWV 如图3 所示,精度指标如表4 所示。
表 3 香港6 个CORS 站站点信息
图3 GPS-PWV 与 2 种模型预测 PWV 值分布
从图3 和表4 中可以看出:改进的BP 神经网络预测的可降水量曲线与 GPS-PWV 变化趋势更加接近,改进的BP 神经网络拟合精度为0.915 %,高于传统BP 神经网络的0.784 %;改进的 BP 神经网络模型的精度在不同季节均高于传统 BP 神经网络,说明改进的BP 神经网络能有效提高神经网络的预测精度;改进的BP 神经网络全年的平均偏差与传统BP 神经网络相差不大,但是在冬、春、夏3 个季节的平均偏差均比传统BP 神经网络小,只有秋季的平均偏差比传统BP 神经网络模型大,说明改进的BP 神经网络偏离GPS-PWV 的振幅较小,预测结果较好。
表4 2 种模型精度指标分布 单位:mm
本文利用PWV 资料对初始化参数权值ω和阈值θ进行改正,将改正后训练效果较好的初始化参数ω′和θ′代入 BP 神经网络模型,建立改进的 BP神经网络模型。利用探空站PWV 资料和GPS-PWV数据对改进的 BP 神经网络,分别进行 PWV 预测试验,结果表明,改进的BP 神经网络在2 个试验中的预测精度均好于传统BP 神经网络,证明了改进的BP 网络可以有效提高大气可降水量的预测精度。