基于原型网络的泥石流沟谷图像预测

2022-08-26 01:52:14王旭王保云韩俊徐繁树
现代信息科技 2022年11期
关键词:沟谷怒江泥石流

王旭,王保云,3,韩俊,徐繁树

(1.云南师范大学 数学学院,云南 昆明 650500;2.云南师范大学 信息学院,云南 昆明 650500;3.云南省高校复杂系统建模及应用重点实验室,云南 昆明 650500)

0 引 言

泥石流灾害是一种常见的自然灾害。泥石流借助地形冲入城镇和乡村,破坏建筑设施,造成人员伤亡和巨大的经济损失。由于云南省地形陡峭、降水集中,泥石流灾害发生极为频繁。近年来,许多研究者应用机器学习算法对泥石流数据进行预测。张蓉基于支持向量机建立了泥石流危害性预测模型,具有良好的使用价值;徐黎明等人基于BP神经网络,通过对云南东川蒋家沟泥石流观测数据的训练与预测建立了泥石流平均流速的预测模型,取得了较满意的效果;孔艳基于结合信息量法和层次分析法、逻辑回归法以及人工神经网络法三种方法建立了泥石流危险性评估的预测模型,并构建了泥石流危险性预测模拟平台,实现了对泥石流灾害的预测查询。

目前,深度学习在各类机器学习任务上取得了巨大的成功,但是深度学习需要海量的带有标签的数据支持才能取得好的效果,这限制了一些实际的应用。那么,是否利用少量样本就能训练出较好的模型呢?小样本学习应运而生。顾名思义,小样本学习可以在深度学习的模型下利用少量样本进行学习。在实践中,一些地区泥石流发生频繁,但是很难精准地提取到发生泥石流灾害的沟谷,获取一条准确地泥石流沟谷,需要大量的资料,反复研究和确定,目前获取的泥石流沟谷样本仅有几十张,达不到深度学习所需的样本数量。

为了解决深度学习过度依赖数据的问题,本文采用了小样本学习(few-shot learning),选取原型网络(Prototypical Network)作为小样本学习框架,特征提取网络分别使用了Conv4和ResNet12两种浅层网络,对泥石流数据分别采用4-way 2-shot、2-way 7-shot和2-way 5-shot进行训练,2-way 2-shot进行测试,将小样本学习框架和特征提取网络进行组合,实现了对泥石流是否发生的预测。

1 实验数据

本文研究区域为云南省怒江流域如图1所示,怒江流域位于中国云南西北部,是典型的高山峡谷区。该流域地势跌宕起伏,北高南低,高山与纵谷并列,是泥石流灾害易发区。

图1 研究区域位置图

实验数据提取的是怒江流域的沟谷数字高程模型(Digital Elevation Model, DEM)图像。首先,将发生过泥石流的沟谷记为正样本,未发生过泥石流的沟谷记为负样本。对于正样本,根据查阅到的云南怒江流域泥石流灾害相关新闻报道及文献记录,仔细核查泥石流发生的位置,结合谷歌地球和百度地图,具体到发生的村庄并找到对应的沟谷,用ArcGIS软件提取该沟谷的DEM图作为正样本,共计50条。对于负样本,选取了50条确定未发生过泥石流且附近有房屋建筑的怒江沟谷。在此基础上,将得到的数据进行了处理,图像沟口的方向统一朝左,图像统一裁剪和填充为正方形。最后,将正、负两类样本随机打乱,将数据六分类,测试集每类放12张图像,剩余的18张图像平均放到测试集的六类中。沟谷的DEM图像示意图如图2所示。

图2 怒江流域沟谷DEM示意图

2 研究方法

2.1 原型网络

小样本学习是具有有限个监督样本的机器学习,有限样本与先验知识进行结合,使得模型可以提取样本中的信息。小样本学习的经典学习框架有:匹配网络、原型网络、孪生网络和关系网络。

本文的小样本学习框架主要选取了原型网络。原型网络是由Snell等人提出的。原型网络是基于CNN的度量元学习方法,可以防止样本量少产生过拟合现象。原型网络是将样本投影到一个特征空间,支持集中的每类样本嵌入特征向量的均值为一个类原型,度量与查询集中的样本嵌入特征向量的欧氏距离,利用最近邻思想将查询集的样本分到支持集中正确的类别。

支持集原型的计算如式(1):

其中,C表示支持集每类的原型,S表示支持集中类别的样本总数,x表示类别中的一个样本,y表示样本对应的标签,fx)称为特征嵌入函数,表示支持集标签样本嵌入空间特征向量。

原型网络分类原理如图3所示,其中,、、表示三个不同的类原型,x表示查询集样本嵌入特征向量。

图3 原型网络分类原理

2.2 特征提取网络

本文采用的特征提取网络为Conv4和ResNet12网络。在原型网络作为小样本框架的条件下,这些网络实现了对泥石流沟谷图像的特征提取。Conv4网络是由四个卷积组成的,而每个卷积由卷积层、批量归一化层(batch normalization)、激活层(ReLU)和最大池化层(max pooling)组成。深度残差网络(Deep residual network,ResNet)是由何凯明等人提出的,提出了残差学习单元(Residual Unit),训练出了152层深的神经网络,是目前应用最广泛的CNN特征提取网络。ResNet12网络的深度为12,是一种浅层网络,由Basic Block搭成。该网络中共有三个Basic Block,一个Basic Block由七部分的组成,如图4所示。

图4 Basic Block 残差网络结构

3 实验结果与分析

怒江流域的泥石流沟谷DEM图像作为实验数据,支持集分别为4-way 2-shot、2-way 7-shot、2-way 5-shot,查询集为2-way 2-shot,特征提取网络分别为Conv4和ResNet12。每种组合进行6次实验的平均准确率作为实验结果,实验结果如表1所示。

表1 原型网络对泥石流DEM图像预测结果

由以上实验结果可以得到:怒江流域的沟谷DEM图像数据六分类,原型网络作为小样本学习框架的条件下,使用不同的特征提取网络,不同的N-way K-shot,得到的实验结果不同。不同的特征提取网络下,ResNet12比Conv4效果好;不同的N-way K-shot下,2-way 5-shot的表现最好。其中,特征提取网络为ResNet12,2-way 5-shot的条件下,该组合表现最好,平均准确率最高为75.36%。这表示:该模型有75.36%的可信度预测怒江流域某沟谷是否具有发生泥石流的可能性。

4 结 论

泥石流灾害是一种发生迅速、破坏力强的地质灾害,我国云南省西北部地区是泥石流灾害的重灾区,泥石流灾害的精准预测对相关部门的防灾减灾工作具有至关重要的经济和社会价值。近几年,由于小样本学习所需的标记样本较少,受到研究领域广泛的关注,以深度网络作为特征提取器进行小样本学习的研究发展迅速。但是,如何从少量样本中精准的学习也是小样本学习的主要挑战之一。本文主要采用了小样本学习中的原型网络作为学习框架,选择Conv4和ResNet12特征提取网络,对云南省怒江流域的泥石流数据进行了预测实验,得出以下几点结论:

(1)将沟谷图像进行预处理,有助于提取图像特征,更快地进行训练。

(2)各种组合中,ResNet12+2-way 5-shot表现最佳,准确率达到75.36%。由于数据量过少,准确率不是很高。

(3)小样本学习对于预测泥石流灾害有重要的价值,小样本学习将会更多地用于实际应用,如何提高模型的准确率,如何从少量样本中获取特征仍然是小样本学习的一个挑战。

猜你喜欢
沟谷怒江泥石流
跟着怒江走一走
一图看懂怒江特大桥
怒江卡雀哇节
云南画报(2021年4期)2021-07-22 06:17:16
东河煤矿沟谷地貌下动载防治
泥石流
杂文月刊(2018年21期)2019-01-05 05:55:28
“民谣泥石流”花粥:唱出自己
海峡姐妹(2017年6期)2017-06-24 09:37:36
泥石流
环球时报(2017-06-14)2017-06-14 09:13:39
怒江求学记
中国三峡(2016年10期)2017-01-15 13:59:50
贵州龙里猴子沟沟谷植被及植物多样性初探
贵州科学(2016年5期)2016-11-29 01:25:34
机械班长