郭艳萍,高 云,周建慧,彭 炜
(山西大同大学计算机与网络工程学院,山西 大同 037009)
现阶段,借助智能化手段可以实时获取天气预报信息,随着全球气候恶化情况的逐渐严峻,各种突发性、极端天气越来越多见,这类气象具有破坏性较大,影响范围大等特点,对人们日常出行,农作物生产以及施工建设等均会造成一定程度的影响。因此,需要对短时突发天气进行准确预报。
雷达回波外推技术是当前普遍应用的短临预报方法[1],实时、准确的外推雷达回波图像是获取高精度短临预报内容的前提条件[2]。当前普遍使用的雷达回波外推技术多以深度学习和卷积神经网络为基础[3,4],但由于自然环境的多变,导致短临预报结果具有一定误差,且时效性较差。针对上述问题,考虑外推图像与输入图像间的高度相关性[5],提出基于循环动态卷积的雷达回波外推短临预报方法,提升卷积神经网络对于时序图像的处理效果。
循环动态卷积神经网络包含两个主要部分:循环动态子网络、概率外推层。循环动态卷积神经网络以动态卷积神经网络为基础[6],引入循环神经网络,利用其构建相邻时刻输入图像序列间的相关性,以此提升具有时序特征输入图像的外推结果精度。基于循环动态卷积的雷达回波外推短临预报方法实现流程如图1所示。
图1 短临预报实现流程
根据图1所示的基于循环动态卷积的雷达回波外推短临预报方法实现流程可知,在雷达回波外推短临预报过程中,在循环动态子网络内输入采集到的图像,通过循环动态子网络处理获取两个概率向量,以其作为概率外推层的卷积核,并与输入的最后一幅图像实施卷积处理[7],获取外推结果。依据外推结果同短临预报内容间的相关性,生成短临预报内容。
基于循环动态卷积的雷达回波外推过程中包含训练与测试两个环节:
1)训练环节
基于所采集的雷达回波图像构建训练样本集训练循环动态卷积神经网络,利用前向传播与反向传播过程确定输出并获取不同网络层的误差项优化权值参数[8,9]。
(1)
式(1)内,Hx和Cx为序号一致的隐含层与卷积层,kij表示卷积核。
2)测试环节
基于所构建的测试样本集测试训练完成后的循环动态卷积神经网络,利用前向传播获取外推结果,外推结果精度较高的条件下可定义循环动态卷积神经网络满足收敛标准,具有较高的应用价值;相反外推雷达回波图像精度较低时需优化结构参数,直至其符合收敛标准为止。
相较于动态卷积神经网络,循环动态卷积神经网络在外推过程中,t-1时刻处理的雷达回波图像可传至t时刻的动态循环子网络内,可以提升t时刻下循环动态卷积神经网络的外推精度。
动态卷积神经网络由动态子网络与概率外推层组成,通过训练后能够获取输入的雷达回波图像序列动态变化。动态子网络的主要功能是确定概率向量[11],其中包含动态卷积神经网络的所有权值参数,其输出结果可作为概率外推层内的卷积核。概率外推层将输入的雷达回波图像序列内最后一幅图像同卷积核实施处理,获取外推结果。
2.2.1 动态子网络
将采集的雷达回波图像输入至动态子网络后,通过网络处理获取一维垂直向量和一维水平向量[12],分别用VP和HP表示。
动态子网络包含五个卷积层,以Ci(i=1,2,…,5)表示,除C5层卷积核大小为7×7外,剩余各层均为9×9。卷积层内激活函数的输入可采用特征图同卷积核实施卷积处理过后获取的结果与偏置项的结合,通过激活函数能够得到卷积层的输出特征图,具体公式描述如下
(2)
2.2.2 概率外推层
概率外推层存在两个输入,其输入特征图与卷积核分别为最后一幅图像和概率向量。概率外推层内对输入特征图实施两次卷积处理,获取外推结果。图2所示为概率外推层结构图。
图2 概率外推层结构
概率外推层内存在两层结构,分别以DC1和DC2进行表示,各层内的卷积核分别为VP和HP。DC1层内输入的最后一幅图像同VP实施卷积处理,获取输出特征图,其在DC2层内同HP实施卷积处理获取外推图像。考虑VP和HP的元素都是正值,且元素相加值为1,因此,可将概率外推层内两层结构的卷积处理过程理解为纵向与横向的外推过程。
循环神经网络的主要优势体现在可提升网络处理过程中图像处理效果方面,其隐含层内引入反馈连接,因此令其产生记录过去状态的功能,将其与动态卷积神经网络相结合,构建循环动态卷积神经网络,在动态子网络内引入循环网络结构,增强对具有时序相关性特征的雷达回波图像序列的适用性。
假设xt和st分别表示t时刻的输入与隐藏状态,前者描述存在特征维度的向量,后者由xt与前一隐藏状态st-1获取,公式描述如下
st=σ(Uxt+Wst-1)
(3)
式(3)内,σ、U和W分别表示激活函数、xt连接st、st连接输出的权重矩阵。
ot表示t时刻的输出,可描述全部类别的概率向量,其公式描述如下
ot=Softmax(Vst)
(4)
式(4)内,V表示st-1连接st+1的权重矩阵。
根据上述分析可知,通过动态卷积神经网络得到雷达回波图像序列动态变化,同时,结合循环神经网络结构特性,建立循环动态卷积神经网络。在循环动态卷积神经网络中的卷积层引入循环结构,得到不同时间段雷达回波图像序列之间的相关性。根据相关性分析结果,输入雷达回波图像,并通过卷积处理,得到雷达回波外推结果,在此基础上,可以得到短临预报结果。
实验为验证本文研究的基于循环动态卷积的雷达回波外推短临预报在实际应用过程中的有效性,在Matlab软件上对本文方法进行仿真测试。以某市2020年9月4日的降雨过程为仿真对象,采用传统基于卷积神经网络的外推方法和基于深度学习的外推方法与本文方法获取其雷达回波图像。为了保证实验结果的准确性,确保实验条件具有一致性。
本文方法仿真过程中,初始化循环动态卷积神经网络内的卷积核,设定学习率与动量系数分别为0.0001和0.4,训练环节中样本输入量和迭代次数分别为5组和40次。仿真结果如图3所示,其中图3(a)和图3(b)分别为输入的图像序列和实际观测获取的图像,以15min为输入图像时间间隔,图3(c)为本文方法外推结果。同时,为进一步验证本文方法的外推性能,以基于卷积神经网络的外推方法和基于深度学习的外推方法为对比方法,两种对比方法的外推结果如图3和图4所示。
图3 雷达回波图像外推结果
图4 卷积神经网络外推结果
分析图3至图5可得,三种方法中,本文方法与基于卷积神经网络的外推效果优于基于深度学习的外推方法,这是因为本文方法与基于卷积神经网络的外推方法在训练过程中有效地学习了雷达回波图像的波动规律,只要输入的雷达回波图像内存在这种规律,就能够获取精度较高的外推结果。本文方法与基于卷积神经网络的外推方法相比具有更高的清晰度,这是由于自然环境短时间内会产生大量变化,导致雷达回波图像具有较高的复杂度,本文方法相比于卷积神经网络添加了循环神经网络,能够记录过去状态,增强卷积神经网络对具有时序相关性特征的雷达回波图像序列的适用性。
图5 深度学习外推结果
以上仿真结果充分说明本文方法外推结果与实际观测获取的雷达回波图像一致度最高,即本文方法外推结果精度更高。
图6 相关系数变化情况
图6内,由相关系数角度出发得到:在预测时间逐渐提升的条件下,本文方法与对比方法预测结果的相关系数均表现为逐渐下降的态势,但本文方法下降态势更为平缓。由P分析角度出发得到:本文方法的P值接近5h,两种对比方法P值在2.5h—3.5h之间,说明本文方法与对比方法相比具有更长的外推时效。
综合分析上述实验结果可知,本文方法能够有效提升雷达回波序列图像的适用性,短临预报结果具有更高的精准度。同时,该方法在外推时效方面具有明显的优势性,充分说明本文方法的实际应用价值较高。
本文研究基于循环动态卷积的雷达回波外推短临预报方法,在传统动态卷积神经网络的基础上引入循环神经网络,增强卷积神经网络对具有时序相关性特征的雷达回波图像序列的适用性,获取高精度的雷达回波图像外推结果,基于外推结果与预报内容间的相关性实现准确的短临预报。仿真结果表明,与传统基于卷积神经网络的外推方法和基于深度学习的外推方法相比,本文方法的时效性更好,且短临预报效果更佳,可广泛应用于短临预报领域。虽然本文方法实现了对短临预报效果的提升,但是其全面性还有待提升,接下来将针对不同的雷达回波图像进行更加深入的研究,争取提升雷达回波外推短临预报方法的全面性。