魏 麟
(1.天津市勘察设计院集团有限公司,天津 300191)
地震灾害是突发性重大自然灾害之一,据了解,2000年以来中国因地震灾害导致死亡的人数达数十万人,占全球半数以上[1]。利用遥感技术获得时效性强、观测范围广、客观真实的数据信息,对震后建筑物倒损信息进行快速评估,从而指导开展震后救援工作,减少生命和财产损失。随着国产高分系列卫星的发射升空,深度学习和计算机技术的发展,许多学者利用震前震后灾区高分辨率遥感影像来研究建筑物受损情况[2];季顺平[3]等通过对阴影的像素抵偿来减少干扰,实现建筑物倒损变化检测;YUAN J Y[4]利用CNN算法来提取建筑物,取得了较好效果。本文基于QuickBird高分辨率遥感影像,对玉树地区震灾倒损建筑进行了研究,采用多尺度分割算法和改进的U-Net网络模型做最优探索,从而更快速准确地识别建筑物倒损情况,为救灾救援等工作提供数据支撑。
本文采用的QuickBird高分辨率多光谱影像,对地物分析有较好的效果,但同时具有地物信息丰富、数据量庞大、阴影和同物异谱现象严重等特点。研究区位于青海省玉树县周边,高分辨率遥感影像拍摄于震前和震后。遥感影像中材质不同的房屋具有不同的光谱特征。本文对建筑物结构、类型进行分析发现,房屋损坏情况与距地震带的距离和建筑材质有关,低矮、土木构造的建筑物比混凝土构造的建筑物更易发生倒损。
多尺度分割方法利用不同尺寸的尺度因子实现影像目标的划分。本文采用影像最优尺度算法,以多尺度分割为基础,融合最小非均匀区域合并算法(FNEA)[5],完善了尺度的选取规则。
目前,通常采用试错法进行尺度选取,但需大量实验才能选择最合适的分割尺度[6]。本文采用ESP方式寻找最优分割尺度。该方法由Drǎgut等基于局部方差设计,局部方差在评价图像分割质量方面具有较高的精度[7-8]。根据尺度的平均局部方差与相邻尺度之间局部方差的差异来判断分割效果,并以此选择最优尺度。
式中,LVi为尺度的平均局部方差;ROCi+1为尺度局部方差变化率,其值越大则表明分割效果越好。
本文选择的分割尺度为70,形状因子为0.6,紧致度因子为0.8,对建筑房屋进行有效分割,结果如图1所示。
图1 最优尺度分割结果
本文以震前影像分割图(图1)为例,进行光谱和形状特征分析。拍摄时段地物亮度普遍较高,建筑物区域与周边光谱相似,分割区域形状无规律,分割区域与地面差别明显。因此,本文将区域最大化差异阈值设置为0.245,小于阈值则分为疑似建筑物区域;再设置光谱亮度阈值为140,大于阈值视作确定建筑物区域。
由于震后影像存在建筑物倒损,因此本文选择分割尺度为30,形状因子为0.7,紧致度因子为0.7进行影像分割。影像中倒塌建筑瓦砾区、裸土、完好建筑物之间有一定光谱相似性,增加了影像分割的难度。根据初步提取结果,分割区域面积在[390'630]区间,视作疑似建筑物区域;设置区域最大化差异阈值为0.24,小于阈值视作确定建筑物区域。
高分辨率遥感影像数据需进行辐射校正,并对建筑物标签数据与原始影像数据进行几何校正,使得二者匹配度更高。匹配完成后,将大幅影像剪切成512×512大小的数据,构建初步样本库。实验研究标签数据包括两类:白色标记为建筑物区域,黑色标记为非建筑物区域(图2)。
图2 训练集与相应标签数据示例
U-Net神经网络最初用于医学影像的分割,随着算法研究的深入,也应用到图像分割分类中。U-Net神经网络结构是对称的,其创新点在于下采样时特征的二次利用,并在上采样时结合前面该层的特征来提取目标边缘信息。
3.3.1 激活函数
在网络训练过程中,由于ReLu函数[9]的存在,训练过程中部分神经元失去效用。若输入值小于0,参数则无法更新,因此采用ELU函数进行替换。
式中,α为转换系数,一般设为1;x为激活前图像的像素值。
3.3.2 网络架构加入BN层
在每次卷积运算后,增加一个BN[9]层对各层特征进行归一化处理,可使网络训练过程特征分布均匀,有利于提升模型的容错能力和加快模型的收敛速度。
3.3.3 防止过度拟合
为了解决网络模型在训练过程中过度拟合的问题,本文采用Dropout正则化方法,通过丢弃隐含层中相应数量的神经元来降低神经网络的复杂度[10]。
3.3.4 损失函数的优化
本文采用交叉熵损失函数计算梯度,计算公式为:
受样本不平衡的影响,少量样本的类别提取难度较大。影像中建筑物像素占比较小,因此本文加入了dice loss损失函数,计算公式为:
式中,X为标签数据图像;Y为分割数据的预测结果;|X∩Y|为X和Y的公共部分;|X|、|Y|分别为X、Y的元素量。
3.3.5 训练过程中增强影像数据
由于提供的数据量有限,因此研究过程中采用多种数据增强操作进行数据量扩充,如翻转维度、旋转图像等。训练完毕后,预测时也需对数据进行增强,从而提高分割结果精度。
本文采用Adam和SGD两种神经网络优化器,SGD更新时对每个样本进行梯度更新,更新频繁导致损失函数震荡较大,学习率也会递减;Adam以自适应方式计算神经网络各参数的学习率,在优化过程中保存前面计算过的梯度的衰减平均值,具有较快的收敛速度,但训练后期会出现波动较大的现象,最终难以达到全局最优解。两种优化器训练得到的损失值曲线如图3所示。
图3 两种优化器训练得到的损失值曲线
4.1.1 多尺度分割方法
本文采用分割尺度为60、形状因子为0.5、紧致度因子为0.6的影像分割图进行阈值分类,得到建筑物的提取图如图4所示,可以看出,分割分类结果具有很大随机性,图4b区域的建筑物识别效果优于图4c区域,后续仍需对各分割尺度数值和分类阈值做进一步优化改进。
图4 震前分类结果
多尺度分割算法建筑物倒损识别结果如图5所示,黄色部分为震中倒损建筑区域。由于震前、震后影像中的建筑物提取均存在误差,因此建筑物倒损识别效果不佳。
图5 多尺度分割算法建筑物倒损识别结果
4.1.2 改进的U-Net网络模型分割
基于改进的U-Net网络模型提取建筑物的精度和准确度较高,但边缘提取效果不佳,也存在少量误提现象,后续需对模型参数做优化,改进分割分类效果。
为了便于比较建筑识别效果,本文对高分辨率影像进行人工分类标记,记为真值,如图6所示,黄色标记为正常建筑区域,红色标记为倒损建筑区域。
图6 建筑物人工标记真值
本文将建筑物提取结果与真值进行比较,采用总体精度、用户精度和Kappa系数进行精度评价(表1)。总体精度为正确分类的像元数与总像元数的比值,用户精度为正确分类的像元数与真值像元数的比值,Kappa系数是反映分割结果与真值之间一致性的客观评价指标。由表1可知,基于U-Net神经网络分割得到的建筑物精度较高,可对震害监测有相当好的效果。
表1 建筑物提取精度评价表
本文采用总体精度、用户精度和Kappa系数3个评价指标对建筑物倒损识别进行精度评价,结果如表2所示,可以看出,基于U-Net神经网络分割的识别精度较高,由于其进行了大量的数据标记训练,因此建筑物提取精度较高;多尺度分割算法也有较高的建筑物倒损识别精度,这是由设置合适的阈值分类达到的效果。
表2 建筑物倒损识别精度评价表
本文以玉树地区为研究区,对震后建筑物倒损区域的识别方法进行了研究。采用两种方法对建筑物提取和倒损识别进行了实验,并利用混淆矩阵横向比较了各方法识别结果的精度。结果表明,利用改进的U-Net神经网络方法进行建筑物倒损识别的总体精度、用户精度、Kappa系数均较高,精度可达80%以上,能为有关部门灾害决策提供数据支撑。然而,本文采用的两种方法都只是对现有方法的实现和较小程度的优化,还存在一些挑战和改进,如影像拍摄时间不同使得同一地区震前、震后影像分割结果有较大差异;深度学习方法依赖于海量的样本,样本的制作比较耗费人力物力,制约了模型的提取精度;对于遥感影像的综合处理,还可加入高程数据、对房屋高度进行监测,从而实现更精确的建筑物倒损识别。