基于卷积神经网络的电线塔识别与更新入库

2021-07-25 10:01超,丁婷,杨
地理空间信息 2021年7期
关键词:电线卷积样本

陈 超,丁 婷,杨 锦

(1.江苏省基础地理信息中心,江苏 南京 210013)

基础测绘是为经济建设、国防建设和社会发展提供地理信息的基础性公益性事业,是经济社会可持续发展的重要支撑。《全国基础测绘中长期规划纲要(2015-2030年)》提出要构建新型基础测绘,并明确其应具备“全球覆盖、海陆兼顾、联动更新、按需服务、开放共享”等特征,各地都已进行了一定的探索。开展重要基础地理信息快速、及时更新,既是常规更新工作的重要补充,也是新型基础测绘的扩展。

我国通过高分专项工程已初步构建了高分卫星遥感系统,基本形成涵盖不同空间分辨率、不同覆盖宽度、不同谱段、不同重访周期的高分数据体系,这些遥感影像在土地利用、城市规划、农业管理、军事侦察等方面已发挥了重要作用[1-4]。传统方法是通过人为设计的纹理特征、HOG[5]、LBP[6]、SIFT[7]、Bag-Of-Words[8]等各类特征对影像进行目标检测。近年来,深度学习在遥感影像应用方面已有出色表现,尤其是卷积神经网络(CNN)[9]成为最热门的深度学习模型算法之一。它无需设计目标特征,能根据海量样本数据自行提取有效特征[10-11],且具有良好的泛化能力,在复杂情况下依然能够保持良好的稳健性[3,12]。余东行[13]等利用小尺度浅层神经网络实现了快速目标搜索,利用深层CNN在候选目标中进行了精确定位;任媛媛[14]等对Fast R-CNN网络进行了改进,通过共享卷积层参数来降低参数规模,并利用改进方法实现了农村建筑物的目标检测;徐启恒[15]等结合主成分分析、超像素分割与CNN对国产高分辨率遥感影像开展了云检测。

本文基于高分辨率遥感影像,利用CNN完成了电线塔的识别,并进行增量入库。首先基于基础测绘本底矢量数据构造样本影像块;再利用CNN对电线塔进行识别,实现高精度提取;然后将提取结果与本底矢量数据对比分析,形成增量要素;最后直接更新基础测绘数据库。

1 研究原理与方法

1.1 CNN

CNN是受生物神经学启发而产生的。一个典型的CNN由输入层、卷积层、池化层、全连接层和输出层组成,其中输入层为遥感影像;卷积层为上一层的局部卷积结果,用以提取特征,越深的CNN提取的特征越具体;池化层主要用于特征降维,压缩数据和参数的数量,包括最大池化和平均池化,卷积层和池化层也称隐藏层;全连接层用于对已取得的特征信息作加权和,在网络中扮演“分类器”的角色;输出层为分类结果。带有两个隐藏层的CNN如图1所示。

图1 带有两个隐藏层的CNN

CNN的工作流程为:首先对输入影像进行卷积运算,再通过池化层对卷积特征图进行降采样,然后重复进行卷积与池化操作,最后通过全连接层对最终的特征进行分类,并输出结果。卷积运算的计算公式为:

式中,l为卷积层数;xlj为第l层的第j个输出特征图;为第l层的卷积核;f(·)为激活函数;*为卷积运算符为第l层的偏置;Mj为第l-1层的特征图数量。

池化运算的计算公式为:

式中,down(·)、β分别为下采样函数和系数。

2 实验步骤与结果分析

2.1 实验区概况

本文选取的实验影像为无人机影像,影像分辨率为0.9 m,3个波段分别为蓝、绿、红,影像覆盖面积约为74.55 km2。图2中红线所示范围为校正区域,红线范围外影像为训练区域,用于获取样本影像块参与训练。

图2 实验影像与区域划分

2.2 CNN工作流

本文实验基于eCognition软件中的CNN工作流完成。eCognition中的CNN方法基于Google的TensorFlow API开发,形成了完整的工作流,包括3个步骤:①采集目标与非目标样本;②利用样本训练网络,即通过校正各权重来优化样本分类精度;③利用训练好的网络对未参与训练的校正区域进行分类,创建目标类别热力图。

2.2.1 创建样本

本文选择电线塔作为待更新要素。电线塔是呈梯形或三角形的塔状建筑物,高度通常为25~40 m,钢架结构,多建设在野外,特征较明显。在1∶10 000基础测绘数据中,电线塔均表示为定位点。结合本底矢量数据与训练区域创建的样本影像块可知,训练区域内包括187个电线塔的定位点,非目标样本矢量包括植被2 512个、房屋1 800个、道路1 236个、水域452 个。为了增加目标影像块的数量以及提高网络的鲁棒性,对每个样本点作3×3的缓冲处理,这样每个样本点就成了9个点,最终获取3 500个目标样本影像块和30 000个非目标样本影像块,影像块尺寸均为30像素×30像素。目标与非目标样本影像块的示例如图3所示。

图3 训练样本影像块

2.2.2 训练网络

训练网络时,采用深度为1的隐藏层,隐藏层内卷积核尺寸为11×11,创建了40个特征地图;采用最大池化,学习率为0.001 5,训练步数为5 000,每步训练用到的样本数量为50。训练中,学习率参数用于调整统计梯度下降算法,并可改变每次迭代运算中网络权重参数的更新幅度;若学习率设置过小,学习过程不仅很慢,而且可能以局部最优设置结束;若学习率设置过大,则将加快训练速度,但可能会错过最优值或导致模型无效。本文以软件推荐的经验值0.001 5为基础,以0.000 1为步长分别尝试了不同的参数,最终选择了运行效率与学习效果最佳的参数。网络训练共耗时2~3 min,将训练后的网络应用于校正区域,即可得到分类结果的热力图。其值接近于1表示与目标有较高的相似性,接近于0则表示与目标的相似性较低。

2.2.3 实验结果与分析

图4 a为校正区域的热力图,为了降低噪声影响,已经过平滑处理,越红的区域表示相似性越大;图4b为最终的识别结果;图4c为热力图的局部放大图;图4d为图4c热力图得到的识别结果,已正确识别出4个电线塔;图4e、4f为另外两个放大区域的识别结果,图4e正确识别出3个电线塔,其中一个电线塔的识别位置与样本点位置稍有差异,漏识别2个、误识别1个,图4f正确识别出4个电线塔、误识别2个。

图4 实验结果

本文分别从检测率(DR)、误检率(FPR)两个方面对最终结果进行评价。

式中,TP为正确检测出的数量;MP为漏检测数量;FP为误检测数量。

本文将识别位置与样本数据略有差异、但指向同一个电线塔的识别结果作为正确检测。整个校正区域正确识别出电线塔25个、漏识别8个、误识别15个,DR为0.758,FPR为0.375。通过分析发现,由于道路、硬化地表等部分地物的光谱表现与电线塔近似,因此误识别的电线塔数量较多,后续研究将通过加入其他特征进行后处理,从而进一步降低FPR。

2.3 要素入库

2.3.1 增量定义

将利用CNN获取的电线塔点作为新数据,与本底矢量数据进行叠置分析,并将新数据标记为“增加/修改/未变化”,本底数据标记为“删除”要素。

本文对各标记的定义为:①不存在于本底数据,仅存在于新数据的定义为“增加”;②本底数据图层中的几何要素整体消失定义为“删除”;③图形空间位置变化、属性变化的定义为“修改”。

2.3.2 增量入库

1)对于“增加”的电线塔,直接更新入库;结合网络爬虫、外业调绘等手段获取电线塔对应的电力线名称,并在本底库中更新电力线和属性。

2)对于本底数据中标记为“删除”的电线塔,不做处理,仅为逻辑删除。

3)对于“修改”的电线塔,删除并替换本底数据库中对应位置的电线塔,同时在本底库中更新电力线位置。

4)对于“未变化”要素,不做任何处理。

在校正区域正确检测出的25个电线塔中,标记为“增加/修改/未变化”的要素分别有2个、0个、23个,本底数据中标记为“删除”的电线塔为0个。

3 结 语

本文利用CNN方法对遥感影像中的电线塔要素进行提取,通过叠置分析完成了本底数据的增量入库,并通过实验证明了该方法的可行性。后续研究将加入其他特征对识别结果进行后处理,以降低FPR;同时对形成的规则集开展移植性实验,包括对不同来源、不同分辨率的影像开展提取实验,探索规则集需调整的内容,以提高规则集的通用性,为基础地理信息的快速更新提供有效手段。

猜你喜欢
电线卷积样本
基于3D-Winograd的快速卷积算法设计及FPGA实现
用样本估计总体复习点拨
洪水时遇到电线低垂或折断该怎么办
从滤波器理解卷积
从一名电线工到副总统,都是他妻子的运筹帷幄
1000条蛇守卫电线
推动医改的“直销样本”
基于傅里叶域卷积表示的目标跟踪算法
随机微分方程的样本Lyapunov二次型估计
村企共赢的样本