张烨方 刘冰 冯真祯 朱彪2,
(1 福建省灾害天气重点实验室,福州 350001; 2 中国气象科学研究院灾害天气国家重点实验室,北京 100081;3 福建省气象灾害防御技术中心,福州 350001)
雷电灾害的发生包含两个组成部分,一是所在区域要有雷电闪络发生,二是所在区域具有一定的承灾体,在荒无人烟的山区中,即使雷电闪络再频繁,其发生雷电灾害事件的概率比直接闪络在居民区、工厂等人员活动区域要低得多。福建省地形以山地为主,素有“八山一水一分田”之称[1],即福建省实际上只有2/10的区域是有人员活动的地方,人类活动意味着雷电在这里的可能引起人员伤亡事故的发生,人类活动意味着该区域存在人类生活、社会运转所必须的电气、电子等雷电灾害敏感设备,也只有这些地方才有可能出现雷电灾害事件,在资源有限的环境下,应该更注重对这些有人员活动的区域有的放矢地开展“靶向”型雷电灾害风险预警工作,避免一些不必要的预警信号或防御行动,可有效地降低雷电灾害防御成本,提高雷电灾害的防御效率。
在雷电灾害的防御领域,研究最多的是结合历史雷电、雷灾、承灾体属性等数据,采用风险度模型和层次分析法等方法,建立雷电灾害风险区划,再根据区划结果进行雷电灾害的风险管理,如顾媛等选用地闪密度和强度作为致灾要素,对浙江省地闪特征及致灾危险性进行评估和分析[2];马虹旭等人结合辽宁省GDP及人口数据,采用AHP法、风险矩阵等方法分析了辽宁省闪电活动时空特征,得出10 km×10 km网格区域雷电易发等级及应对等级[3]; 赵生昊等利用闪电监测资料及该区域数字高程模型,研究了雷电灾害两种主要致灾因子(闪电密度、强度)与3类地形因素(海拔高度、坡度、坡向)之间的关系[4];马明等研究认为重大雷灾伤亡事件直接与承灾体的脆弱性有关[5]。本文结合致灾体(雷电)的密度分布规律,使用高分辨率的遥感影像瓦片作为判断某个区域是否属于人员活动的基础,采用卷积神经网络的深度学习算法,对大批量的遥感影像瓦片进行有、无人员活动的类别划分,以福建省为例对该方法进行了例算,得到可应用于实际业务的精细化雷电承灾体地理信息图层,通过图层的叠加分析,得出实际可能导致雷电灾害的有效致灾雷电的分布规律。
以谷歌地图开放的最新遥感影像图片为这个图片区域是否有人员活动的识别依据,下载福建省L17级别的所有遥感影像瓦片,每张瓦片大小为256×256像素,实际长宽约500~600 m,三通道彩色图片,空间分辨率2.39 m/像素,共754722张图片,约150 GB,瓦片时间为2016年左右,规定以瓦片中心点的经纬度值代表该瓦片的坐标信息,具体示例如图1所示。
图1 遥感影像瓦片图片示例:(a)典型有人员活动,(b)典型无人员活动1,(c)典型无人员活动2
谷歌地图的历史数据为2016年,距离现在的区域变动情况在瓦片精度范围内(500~600 m)大致可以忽略,考虑论文研究的内容与精度,采用谷歌地图的历史遥感影像可以满足研究需求。
对于人员活动属性图层的获取,虽然可以使用乡(镇)级别的地理信息地图替代,但由于乡(镇)级别的地理信息数据为点或面的矢量格式,精度较差(粗略按每个乡镇面积70 km2计算,假设乡镇为正方形形状,取其边长≈8.4 km为精度。),且一个乡镇的行政区划内并非所有区域都有人员活动,因此要保证承灾体具有较好的识别效果,选取一定大小(边长≈0.5 km)的遥感影像瓦片进行识别是较好的途径。
卷积神经网络(Convolutional Neural Network,CNN)是一种专门用来处理类似网格结构数据的神经网络[6],是当前发展和应用最为迅速和广泛的人工智能图像处理模型,它采用具有一定大小、包含权重矩阵的格点网(卷积核,也有称过滤器)对输入图像逐个位置进行扫描和卷积,利用卷积实变函数运算实现对图像局部特征的信息提取并保存在权重矩阵中,加上中间添加的非线性激活函数,使整个神经网络具有很强的学习和非线性处理能力,实践表明该计算方式可以很好地获取到图片的总体与局部特征[7-10],其一般流程是对输入的多通道图像经过多次的卷积、池化操作,提取到图像深层次的高维特征,再将卷积、池化操作后的矩阵展开、拼接成独立列向量,经过一定层数的神经网络层计算后,根据需求输出对输入图像某一种类别属性的预测结论,例如判断输入的图像是哪一种动物、哪一个数字等,其模型示意如图2所示。
图2 卷积神经网络模型示意
根据卷积神经网络的特点,将遥感影像瓦片作为卷积神经网络的待预测图像,经过一定层数的卷积神经网络后输出对该遥感影像瓦片是否属于人员活动区域的属性进行分类和判断。754722张遥感影像瓦片,随机抽取任意一张瓦片,由人工对瓦片是否属于人员活动区域进行辨识(典型图片如图1所示)。考虑安全最大化原则,规定只要瓦片内有出现人员活动的区域,不管该区域大小,都认为该瓦片属于人员活动区域;规定一些无法完全确认的瓦片,也按该瓦片属于人员活动区域的原则进行判定。循环重复上述操作,最后得到3000张人员活动区域瓦片、3000张无人员活动区域瓦片,由于卷积神经网络在处理图片时是将图片转换成二维矩阵来处理的,所有同一张图片、经过角度旋转后得到的矩阵是不一样的,因此可以通过对图片的旋转来实现训练样本扩容,即对得到的6000张瓦片进行批量90°、180°、270°的旋转,得到18000张旋转后的瓦片,与原6000张瓦片组合一起,作为训练样本数据,即最终有24000张的样本图片。
针对本文涉及的遥感影像瓦片雷电承灾体属性识别问题,采用谷歌人工智能深度学习类库(tensorflow)为框架,设计如图3所示的CNN网络结构,整个CNN网络包含了11层卷积、5层池化、2层全连接,最后以一个0、1二分类结果表示输出,其中每个卷积、全连接层的后面使用RELU激活函数进行一次的非线性激活函数计算,每个卷积滤波器设计网格为3×3,步长为1,边界自动填充模式,每层的通道数设计如图3所示,两个全连接层神经单元个数分别为1000、500,模型参数选择与设计如表1所示,设定模型训练过程中准确率最好的参数矩阵保存作为最终训练结果。
表1 训练模型参数(方法)取值表
图3 遥感影像雷电承灾体属性识别CNN模型示意
按上述方法与规则对模型进行训练,绘制整个训练过程的损失(loss)与准确率(accu)曲线,如图4所示。由图4可知,损失曲线下降的速度适均,没有出现损失急转下降或损失下降曲线过于平缓的情况,说明模型设计的初始学习率可行;经过100次训练后,测试准确率就已基本达到并保持在98.9%,测试集与训练集的损失、准确率曲线基本贴合,训练后期也没有出现明显分开的表明过拟合的现象,也说明按论文设计的训练数据提取、遴选方法可行,模型具有一定的稳定性和准确性。
图4 模型训练损失(a)、准确率(b)曲线
使用训练得到的模型对福建省754722张遥感瓦片逐张进行是否属于人员活动区域预测,将得到数据加载在ArcGis上,并格式化为栅格格式,按福建省行政边界裁剪后绘图如图5所示,为了检验本文设计及训练的CNN模型准确率是否能达到精度要求(令CNN错误率p0不得高于0.001%),对总体754722张遥感瓦片及其预测结论进行如下的数理假设检验:
图5 福建省人员活动区域
H0:p≤p0
H1:p>p0
随机抽取120张瓦片,由人工对该瓦片的属性按论文2.2的规则进行辨识,将辨识结果与CNN卷积神经网络模型预测得到的结果进行比对,经查验在120张的瓦片样本中CNN有1张瓦片预测错误,设Xi为第i次抽取的样本,i=1,2,…,120,Xi=1为预测错误,Xi=0为预测准确,取显著性水平α=0.01,有:
查标准正态分布表得
u1-α=u0.99=2.326>1.003
接受假设,即认为本文设计的基于CNN卷积神经网络的遥感影像人员活动属性的分类模型在显著性水平α=0.01时,预测错误率低于0.001%。
根据福建省CNN卷积神经网络的遥感影像人员活动属性的预测结果,福建省行政区域范围内共有190724张遥感瓦片被识别为无人员活动区域,114208张瓦片被识别为人员活动区域,无人员活动的瓦片比为63.55%,由图5可看出,福建省沿海地区的人员活动密度较大,而其他区域特别是西北位置人员活动密度较小,这与文献[1]介绍福建省75%为中、低山地形较为一致(福建省海拔800 m以上的中山和500~800 m的低山,占全省面积的75%,主要分布于闽西、闽中和闽东北地区。)也从另一个角度证明本文设计模型的可行性。
对福建省2004—2019年的闪电定位监测数据按遥感瓦片的栅格位置进行年均频次统计(图6),根据图5中有无人员活动区域的栅格对图6进行分离剖析,得到雷电落在在无人员活动区域(图7)和雷电落在有人员活动区域(图8)的频次分布情况,结果表明,共有291770次闪电闪络在无人的区域,有351482次闪电闪络在人员活动的地方,也就是说有45.36%的闪电是雷电灾害的“无用功”,在图8中,人员活动区域雷电密度较大的地方主要集中在福建省中部、中东部,这与历福建省雷电灾害事故的地区分布情况较为一致[11-13]。
图6 2004—2012年福建省年均闪电密度
图7 2004—2012年福建省闪络在非人员活动区域的闪电密度
图8 2004—2012年福建省闪络在人员活动区域的闪电密度
以福建省县级行政区划为单位,分别统计福建省各个县2004—2012年雷击人员伤亡数除以2012年各个县人口总数(万人)、福建省各个县2004—2012年年均雷击密度、福建省各个县2004—2012年年均有效致灾雷击密度(即只统计闪络在有人员活动格点的雷击数),部分结果如表2所示。
分别计算雷击人员伤亡数与年均雷击密度、年均有效致灾雷击密度的线性相关性,得相关系数分别为0.073、0.116,有效致灾雷击密度与雷击人员伤亡的相关程度明显高于常规意义年均雷击密度与雷击人员伤亡的相关性,可见一个地区有效致灾雷击次数对该地区雷电灾害风险具有更科学的指示意义,特别在福建这样的多山区、丘陵省份,一些人员活动较少的县市常规雷击密度与有效致灾雷击密度的差值较大,如表2中仙游县常规年均雷击密度12.4766次/(a·km2),经处理后的年均有效致灾雷击密度仅4.75853次/(a·km2),有很大一部分雷电并没有落在人员活动区域,对雷击人员伤亡事件的关联性也相应降低或消失,因此采用有效致灾雷击密度可以更好地反映和预测雷击人员伤亡事件的发生。
表2 2004—2012年福建省部分县雷击人员伤亡/区域人口总数、年均雷击密度、年均有效致灾雷击密度
上述的讨论的结果表明,在探测到所有雷电中,只有一半左右的落雷是可能引起雷电灾害事故的情况,气象部门和政府相关防汛救援机构应更注重于对这些落在人员活动区域“有效”雷电的预警和救援,同理于其他的致灾天气(如暴雨、台风等),关注人员活动区域与灾害性天气的结合点是提高气象预警、政府决策服务效果的可行性途径,也有助于有限的救灾资源(例如精准区域、时间发送短信对比大面积发送短信所带来时效性提高与费用降低的效果)能及时、有效地、精准地投放到必要的区域[14]。
本文所得到的人员活动属性格点化数据作为新开发的雷电灾害影响预警产品的承灾体信息,将雷电临近预警的格点化产品与雷电承灾体属性网格进行栅格乘积计算,得到未来可能发生雷电、且该位置存在人员活动的栅格图层,可认为是未来可能发生雷电灾害的栅格集合,已作为雷电影响预警产品进入业务使用,相比常规提供雷电临近预警的产品而言,叠加了人员活动属性的雷电影响预警在灾害防御方面更具有指向性,是当前尝试开展气象灾害影响预警工作的一次有益探索。
本文利用卷积神经网络建立、训练了遥感影像人员活动属性识别的数学模型,对福建省L17级的所有遥感影像瓦片利用该模型进行了预测、假设检验和绘图,将得到的结果与福建省历史雷电数据进行了叠加分析,得到福建省雷电灾害有效影响雷电的次数和分布情况以及有效雷击密度相比常规雷击密度在雷电灾害事故发生上具有更好的相关性和指示意义,利用福建省人员活动属性的格点图层结合雷电预警、预警结果开发了雷电灾害影响预警产品,为开展精细化、靶向服务的雷电灾害预警服务提供必要的基础研究和数据支撑。
采用卷积神经网络、大数据遥感影像瓦片进行的有效致灾雷电分析是当前“人工智能+大数据”浪潮背景下应用“人工智能+大数据”开展灾害风险分析、精细化预警及靶向救援服务的尝试性研究,随着“人工智能+大数据”技术及计算机硬件设备的不断发展,探索基于大数据的气象预警、应急救援、灾害分析研究是目前提升综合防灾减灾能力的有效途径,采用卷积神经网络识别遥感影像瓦片来提取灾害天气下垫面属性的方法除了用于分析有效致灾雷电的分布情况外,实际业务工作中也逐步被应用到雷电灾害影响预警及其他灾害性天气应急减灾支持上[15]。
要提取遥感影像瓦片中更多有效信息,需要使用到更高等级的影像瓦片和分析模型,这将需要庞大的硬盘空间、数据索引、模型结构,从目前的情况来看,L17级的瓦片识别有无人员活动属性是比较折中的处理结果。