李正伟
(成都理工大学 工程技术学院,四川 乐山 614007)
遥感图像的变化检测可用于监测区域内不同时期的变化,由于遥感图像具有非线性、区分性和不变性等特点,因此,必须提取这些特征后再进行图像的分类和目标检测[1]。在复杂的数据集中,可以通过数据挖掘技术提高分类精度来实现变化检测。散斑噪声是遥感图像中普遍存在的噪声,遥感图像还包括高斯噪声和脉冲噪声[2]。遥感图像变化检测技术主要有:光谱混合分析法[3]、支持向量机(SVM)[4]、分类与回归树模型[5]和人工神经网络(ANN)[6]。文献[7]提出了基于随机森林的变化检测方法,有效降低了漏检率和虚检率。而遥感图像分类的最常用空间特征包括小波纹理、灰度共生矩阵(GLCM)、像素形状记录和形态轮廓[8]。文献[9]提出了基于特征融合的遥感图像分类,有效提高了不同场景分类精度。
为了有效实现遥感图像的分类和变化检测,本文利用自适应中值滤波(AMF)对遥感图像中进行降噪预处理并提取次级特征,从而加快了分类过程。将提取的特征结合增强型反向传播神经网络(EBPNN)进行分类,并识别分类后遥感图像的变化。
本文采用国家遥感中心的资源1号线性成像自扫描仪-4(LISS-4)图像,该图像取自2011年8月12日和2017年4月28日期间河北省沧州市任丘市的遥感图像,任丘市位于北纬38.42、东经116.07,海拔为40 m。重采样技术采用三次卷积并对地形进行了校正,传感器的输出分辨率为24 m。
图1给出了所提出方法的流程。首先,在AMF的帮助下,对2011年12月和2017年4月的输入图像进行降噪预处理。然后对预处理后的图像进行特征提取,最后实现分类及变化检测。
为了降低遥感图像的噪声影响,本文使用自适应中值滤波(AMF)[10]来平滑图像。AMF能够有效处理高密度的脉冲噪声,并且在处理非脉冲噪声的同时,还能保存更多的图像细节。将Sx,y作为中心像素(x,y)的模板窗口,Zmin、Zmax和Zmed分别为窗口Sx,y中的最小灰度、最大灰度和中度灰度,Zx,y为像素(x,y)中的灰度值,Smax为Sx,y的最大容许范围。AMF分两个阶段处理:
阶段1:A1=Zmed-Zmin,A2=Zmax-Zmed,若A1>0且A2>0,则继续阶段2;若Sx,y≤Smax,则重复阶段1;直至输出Zx,y。
阶段2:B1=Zx,y-Zmin,B2=Zmax-Zx,y,若B1>0且B2>0,则输出Zx,y;否则,输出Zmed。
因此,如果Zmed是否为脉冲噪声,则分析阶段1。如果Zx,y是否为脉冲噪声,则不采用阶段2。如果Zmed和Zx,y都不是脉冲噪声,则输出为常量Zx,y。利用该输出代替中间值以此避免丢失遥感图像中的其他信息。通过扩展AMF的窗口技术,可以降低脉冲噪声的谱密度。为了提高该技术的应用,还需对窗口的形状和方向进行改进,从而降低脉冲噪声的空间密度。在完成图像平滑处理后,对图像进行特征提取。
将特征提取与预处理图像结合使用,对2011年至2017年期间的空间时空变化和几何变化建模。在机器学习中,特征提取从最初的一组测量数据开始,刻意地构建特征值以使其有用且无冗余。特征提取的关键是从新的数据中获取最重要的信息,并在较小的维数间隙内表示这些信息。对图像中的每个像素进行特征提取,提取出与其邻域相关的Tamura和Law掩模等特征。
Tamura特征的提出是人在纹理中感知到特征成分的心理物理研究,包括对比度、方向性和粗糙度[11]。Tamura特征取决于人类的图像感知。传统的Tamura特征可用于纹理均匀的图像,并能处理较差的普通图像。
1)对比度:对比度特征有助于测量图像中像素灰度强度的变化,以及其分布偏向黑色或白色的程度:
(1)
其中:σ为标准差,v=0.25,β为峰度。
2)方向性:方向性特征考虑了边缘强度和方向角。根据Prewitt边缘检测算子[12]使用逐像素导数计算:
(2)
其中:Δx和Δy分别为x和y方向上的像素差。
3)粗糙度:利用粗糙度特征可测量图像粒度,识别出显著的灰度空间变化距离。对于固定窗口估计,具有较少纹理成分的纹理比具有较大纹理成分的纹理更粗糙,该方法用于评估纹理的粗糙度。在每个像素(x,y)处,p(x,y)用于计算窗口大小分别为0,1,2,3,4,6周围像素的平均值。在每个像素(x,y)处,计算不同方向相反侧的不重叠平均集,在每个尺度Yi(x,y)上的绝对差值为:
(3)
p(x,y)={Y1,c,Y1,d,Y2,c,Y2,d,…}
(4)
选择变化最大的尺度max(Yi),则最佳像素窗口大小Sbest为2i。通过对整个图像的Sbest进行平均来计算图像的粗度。
Law掩模特征提取利用图像的自然微观结构属性(水平、边缘、斑点和纹波)提取出次级特征并用于分类[13]。序列窗口(SW)和随机窗口(RW)产生Law掩模为3×3的统计参数。根据条件2≤C≤M和2≤D≤N,选择SW/RW的大小C×D,其中,C和D为窗口大小,P和O为图像大小。确定图像上随机窗口的起始位置:
X(n+1)=((q·x(v))+s)%·P
(5)
其中:q和s为窗口数量的决定因素。Law掩模建立了测量固定估计窗口内变化量的纹理能量方法。利用9个5×5卷积掩模的排列计算纹理能量,该纹理能量由9个矢量表示图像的每个像素。
中心加权局部平均值由L5矢量给出。利用E5、S5和R5矢量分别用于检测边缘、斑点和波纹。矢量对的外积得到二维卷积掩模。
Law掩模程序的初始阶段是通过在图像周围移动一个小窗口并从每个像素中减去局部平均值来消除影响。为了得到特征提取的图像,将每个邻域的平均强度降至接近于零的值。窗口的大小取决于图像的类别;特征场景使用15×15的窗口。将二维掩模相乘得到16个纹理能量图。将每个纹理能量图替换为其平均图,并生成9个过滤图像。
对于特征提取的结果,在分类阶段之后进行变化检测,并借助增强型反向传播神经网络(EBPNN)[14]进行检测。分类阶段又分为两个阶段:训练阶段和测试阶段。在训练阶段,根据每个节点的权重创建一个EBPNN,然后根据提取的特征对图像进行分类。根据图像的特征,将遥感图像分为植被、城区和水域三类。测试阶段在EBPNN中执行,以实现最优的权重选择。将提取的特征与测试阶段数据库中积累的特征进行比较得到分类输出。分类后,将识别出2011年12月和2017年4月的遥感图像的变化。
反向传播神经网络(BPNN)是用于训练多层神经网络的直接学习策略。术语“反向传播”表示在输出处处理的错误反向复制,并从输出层开始到隐藏层,最后到输入层。EBPNN算法取决于输出神经元的线性和非线性误差之和,以最少的迭代次数来提高收敛速度。EBPNN算法分为前馈、误差计算和更新权值。结合测试程序用于评估算法的实现情况。EBPNN算法步骤如下。
步骤1:初始化训练集参数s,w,v,Max_v和Min_v(大小、权重、变量、最大变量、最小变量)
步骤2:计算每个节点的隐藏层:
(6)
(7)
步骤3:计算隐藏层之间的距离:
Li=(Max_v,Min_v)2
(8)
步骤4:计算最大权重:
(9)
(10)
其中:sk为隐藏层神经元的数量。
步骤5:计算中心值:
C(s,1)=(Max_v,Min_v)/2
(11)
步骤6:更新输出层权重:
wgba(i-1)=wgba(i-1)+▽wgba
(12)
步骤7:随机选择权重
步骤8:计算隐藏层阈值
步骤9:寻找输出层阈值:
(13)
步骤10:训练过程:创建前馈神经网络,误差计算,更新新的权值;
步骤11:测试阶段;
步骤12:确定网络模型;
步骤13:对图像(植被、水域和城区)进行分类;
步骤14:对分类结果进行分析。
本文在Matlab软件中开发基于变换检测的特征提取。该数据集取自资源1号图像。数据集收集了2011年和2017年的Geotiff图像格式并执行变化检测技术。本文开发了适用于变化检测的EBPNN分类器以提高分类精度。此外,还集成了AMF来消除遥感图像中的噪声。从图像中提取次级特征并进行分类,最后与现有的前向神经网络(FFNN)和卷积神经网络(CNN)进行了比较。
从数据库获取的图像作为自动变化检测技术的输入,如图2和图3所示。
图2 任丘市2011年12月的图像
图3 任丘市2017年4月的图像
通过AMF进行预处理来降低噪声,得到的输出如图4和图5所示。同时保留了两个部分得到的窗口形状和方向变化细节,避免了由于窗口尺寸增大而导致的影响。
图4 任丘市2011年12月的预处理图像
图5 任丘市2017年4月的预处理图像
经过预处理后进行灰度变化等特征提取,包括边缘强度和方向角、次级特征提取、局部物体形状和外观表征、物体不确定度的测量、表面引入变化的测量,最终得到最可靠的特征。利用EBPNN方法进行分类。表1给出了Law掩模特征提取的9个纹理图值,表2给出了Tamura特征的粗糙度、对比度和方向等特征。
表1 Law掩模的9种滤波图像特征
表2 Tamura特征图像
图6和图7给出了任丘市2011年12月和2017年4月图像中的植被区域变化。
图6 2011年12月图像种植被区域变化检测
图7 2017年4月图像中植被区域变化检测
图8和图9给出了任丘市2011年12月和2017年4月图像中的城区区域变化。从2017年4月的图像中可以清楚地看到,与2011年12月相比,任丘市城区化影响比2017年4月有所增加。
图8 2011年12月图像中城区区域变化检测
图9 2017年4月图像中城区区域变化检测
任丘市2011年和2017年的水域变化比较如图10和图11所示。与2011年相比,2017年水域面积明显减少。炎热的夏季使各种水域恶化,给城区带来了负面影响。2011年12月,水域清晰可见,在2017年4月的图像中,水域恶化,基本无法观测。夏季的影响和降雨量的减少对任丘市的水源产生了负面影响。
图10 2011年12月图像中水域区域变化检测
图11 2017年4月图像中水域区域变化检测
图12和图13给出了2011年12月和2017年4月任丘市的变化检测图。从图12和图13可以分析2011年和2017年植被的变化。由此产生的图像显示了2011年和2017年城市化的变化。从图13可以清楚地看出,与2011年相比,2017年城区面积有所增加。
图12 2011年12月图像城市变化检测
图13 2017年4月图像城市变化检测
表3给出了植被、水域和城区区域等各种变化。在2011年,城区面积为148 877像素,2017年增加到216 253像素。因此,城市化对城区环境的变化产生了巨大的影响。在2011年,水域面积为57 965像素,2017年大幅减少到21 834像素。城市炎热的气候对水域产生了负面影响。在2011年,植被面积为743 894像素,2017年减少到712 649像素。
表3 在不同区域检测到的变化
本文选取TP、TN、FP、FN、FPR、FDR、PPV、NPV、灵敏度、特异性、Kappa、虚检率、漏检率和准确度作为评价指标。假阴性(FN)可以表征为变化的像素,即未被检测到,而假阳性(FP)则由于未正确检测到未更改的像素而被计算。真阴性(TN)表示真负数,即像素数准确表示为未改变,而真阳性(TP)表示真正值,即有效地分组为失真的像素数。通过以下公式评估指标:
1)正预测值
(14)
2)负预测值
(15)
3)灵敏度
(16)
4)特异性
(17)
5)准确度
(18)
6)假阳性率
(19)
实际的像素数量归为未更改和更改过的类,其特征为Mu和Mc。则Kappa为:
(20)
其中:PCC为正确分类的百分比。且:
(21)
虚检率为:
(22)
漏检率为:
(23)
将文献[15]提出的FFNN和文献[16]提出的CNN与本文所提出的EBPNN进行比较,如表4所示。
表4 不同方法的性能比较
图14给出了不同变化检测方法之间的准确度、KAPPA和灵敏度的定量比较。与现有的FFNN和CNN方法相比,本文所提出方法在准确度、KAPPA和灵敏度都得到了提高。CNN的准确度为95%,FFNN的准确度为93%,而本文所提出的方法,EBPNN的准确度提高到了97%。因此,本文提出的EBPNN方法在精度上有了一定的提高。在对比现有方法CNN和FFNN时,所提出的EBPNN方法的KAPPA系数为0.840 3,虚检率为0.023 4,漏检率为0.013 5。通过有效的特征提取和EBPNN分类器,可提高变化检测中的精度问题。
图14 不同变化检测方法的定量比较
为了更好实现遥感图像的分类和检测变化,本文提出了一种EBPNN分类器。在该方法中,将区域划分为植被、水域和城区等不同的区域,识别每个类的变换并对变化进行分析。使用AMF预处理技术来消除图像的噪声。在此基础上完成了Tamura特征和Law掩模特征的提取,最后利用具有变化检测的EBPNN分类器算法进行分类。与现有的FFNN和CNN分类技术相比,利用EBPNN进行分类可以有效地检测出图像中的变化且具有更好的性能结果。