基于ELM的遥感影像城市道路提取*

2020-03-04 08:14单德明

计算机工程与科学 2020年1期

蔡衡，楚恒，单德明

(1.重庆邮电大学通信与信息工程学院，重庆 400065；2.重庆高校市级光通信与网络重点实验室，重庆 400065； 3.泛在感知与互联重庆市重点实验室，重庆 400065；4.重庆市勘测院，重庆 400020)

1 引言

从遥感影像中提取道路信息是许多城市应用的前提，如交通管理、城市规划、道路监测、地理信息系统更新等[1]。伴随着高分辨率遥感卫星的发展，影像分辨率也显著提高，地物细节信息更加丰富，纹理更加清晰，但也给道路提取带来了挑战。而且在实际成像中，除了影像中本身的噪声以外，还存在着同谱异物和同物异谱现象[2]，如空地、房屋等与道路具有很大的相似性，道路轮廓会直接受到干扰目标的影响，造成道路提取断裂、模糊及错分现象。因此，如何高效且准确地从遥感影像中提取道路信息具有极其重要的意义。

传统手动标记道路需要大量的人力和时间，且局限性较大，难以满足社会生产建设的需要。近年来，深度学习通过学习高级特征表现出优异的性能，在自动道路提取、节省手动提取成本方面都取得了理想效果。目前常用的道路提取方法主要有CNN(Convolutional Neural Network)[3]、BP(Back Propagation)神经网络[4]、ELM(Extreme Learning Machine)[5]、SVM(Support Vector Machine)[6]等。洪绍轩等[7]将SVM与模糊C均值结合进行道路提取，通过模糊C均值聚类得到建筑类地物，然后利用SVM完成道路提取，但道路最终的提取效果受聚类中心影响较大，难以取得稳定的提取精度。Cheng等[8]提出一种CNN网络实现级联端到端的自动道路提取，利用CNN网络的表现能力，能够较好地解决树木和汽车的复杂背景和遮挡问题，以获得良好的道路提取效果。李洪川等[9]提出了一种道路多特征多核SVM提取方法，以全局核函数和局部核函数加权组合方式构建多核SVM对影像分类，但是该方法需要大量训练样本，核函数的引入导致耗时过多。总的来看，上述方法都能在一定程度上提取道路，但遇到复杂影像时，仍存在精度和提取自动化程度低的问题。

因此，本文提出了一种基于ELM的高分辨率遥感影像道路提取方法。首先，对原始布谷鸟搜索CS(Cuckoo Search)算法进行差分进化改进，从而减少种群迭代次数，加快CS算法的收敛速度；其次，将改进后的CS算法同ELM结合，自适应选择隐含层神经元个数及其所对应的输入权值和偏置值，以提高模型的稳定性；再次，在ELM模型中引入数据样本的几何特征和数据蕴含的判别信息，通过最大化异类离散度和最小化同类离散度，优化ELM输出权值，弥补ELM学习不够充分的问题，进而提高ELM分类性能；最后，结合数学形态学处理，完成道路最终提取结果优化。通过重庆市某地区的影像实验表明：本文方法可以较好地提取出道路信息，并且能准确、较为完整地提取具有一定复杂形状的道路目标。

2 极限学习机原理

Figure 1 Network structure diagram of extreme learning machine图1 极限学习机网络结构图

具有L个隐含层节点激活函数g(x)的ELM数学表达式如下所示：

(1)

其中，i∈[1,N];ωj=[ω1j,ω2j,…,ωmj]T是连接第j个隐含层神经元和所有输入神经元的权重向量，bj是第j个隐含层神经元的偏置值，βj=[βj1,βj2,…,βjn]T是连接第j个隐含层神经元和所有输出神经元的权重向量，ωj·xi表示ωj和xi的内积。对式(1)的N个方程进行简化合并后等价为：

Hβ=Y

(2)

其中，H表示隐含层输出矩阵，β为输出权值矩阵，Y为期望输出矩阵：

(3)

(4)

ELM的训练过程是一个非线性优化问题，其学习过程可以看作求取线性系统Hβ=Y的最小范数的最小二乘解，解的数学计算公式表示为：

(5)

3 改进的CS算法与判别信息

在ELM模型中，隐含层节点的输入权值和偏置值是随机生成的，难免会使网络结构中的某些节点成为死节点，导致网络结构不稳定，无法满足数据要求。本文通过对原始CS算法进行差分变异策略，增加CS算法种群的多样性，提高全局搜索能力，加快CS算法收敛速度；并利用改进后的CS算法来自适应选择ELM隐含层节点数，从而提高ELM的精度和稳定性。

3.1 CS算法的改进

CS算法是通过模拟布谷鸟寄生性育雏行为，来有效求解最优化问题的算法[10]。同时，CS也与鸟类的Levy飞行行为搜索机制结合，使优化算法更有效。每个鸟巢中的卵代表一个解，布谷鸟的卵代表新解，目标是利用新解或者潜在优解替代巢中的劣解。寻找宿主鸟巢的路径和位置更新公式为：

(6)

本文引入一种差分进化算法对CS进行改进，策略如下：

V=Xb+δ(Xi1+Xi2-Xi3-Xi4)

(7)

其中，V代表变异后的鸟巢位置；Xb代表目前群体中最优鸟巢位置；Xik(k=1,2,3,4)是在当前群体中随机选取4个鸟巢；δ是缩放因子，取值为[0,1]。将式(7)引入CS算法中，式(6)变为：

(8)

(9)

如果当前鸟巢的适应度值小于Levy搜索更新后鸟巢的适应度值，则进行位置更新；反之，则不变。

(10)

3.2 改进CS优化ELM模型

利用改进后的CS算法自适应地选择隐含层节点数，选取输入权重和偏置值。对ELM模型网络结构优化的过程如下所示：

步骤1训练样本归一化处理。

步骤2设置改进CS算法的各项参数。被寄主发现的概率参数pa，N个初始鸟巢位置，最大迭代次数T。

步骤4产生随机数rand，如果rand

步骤5若达到最大的迭代次数，则停止搜索和更新，跳转步骤6，否则跳转步骤3。

步骤6选择适应度值最小的鸟巢位置，取整数作为ELM的隐含层节点数L，最终确定当前网络的最优结构。

通过对基本CS算法引入差分变异策略进行改进，使鸟巢种群多样性增加，并扩大了搜索范围，增强了全局搜索能力。综上所述，ELM采用改进CS算法自适应地选择适应度值最小的鸟巢位置，然后取整数作为ELM的隐含层节点数L，并选取输入权值和偏置值，增强了模型的稳定性，提高了精度。

3.3 判别信息下的ELM

在确定ELM的隐含层节点数之后，由于道路样本的复杂多变性，将会导致ELM学习过程中训练不充分问题，于是在优化后的ELM中引入判别信息[11]。对于N个不同的数据样本(xi,yi)，同类离散度矩阵Sa、异类离散度矩阵Sb数学表达式为：

(11)

其中，N为样本类别数，Nc为第c类样本个数，ui为样本类内均值，u为样本总体均值。异类离散度矩阵和同类离散度矩阵分别体现了输入样本的空间分布特征以及蕴含的判别信息。将这2种离散度矩阵进行融合得到信息差矩阵S=Sa-(1-η)Sb,0≤η≤1，η为常量。

信息差矩阵中的η主要用来平衡同类和异类判别信息，当参数η增大时,侧重于类内信息；反之，则偏向类间差异信息。通过上述网络结构优化和调整后，改进的ELM优化问题可表示为：

(12)

其中，C为正则化参数，ξ为训练误差矩阵。式(12)的优化问题可通过构建拉格朗日函数表示:

(13)

令式(13)对β,α,ξ的偏导数为零，可得到如下方程：

β=HTα

(14)

(15)

h(xi)β=yi-ξi,i=1,…,N

(16)

将式(14)、式(15)代入式 (16)便可以得到:

(17)

然后将式(14)代入式(16)可以得到:

(18)

由式(18)得到网络的输出函数为:

(19)

其中，h(x)为待测试样本数据，将选取的影像测试样本归一化后通过式(19)得到期望输出结果，获得相应的道路提取信息。

4 数学形态学优化

经过上述改进后的ELM提取的道路信息，仍存在由于其它噪声干扰造成的断裂和孔洞等现象。数学形态学利用结构元素可以平滑道路边缘，填充孔洞和断裂，以及去除噪声，从而达到优化所提取的道路信息的目的。

5 实验结果与分析

本文2组实验样本由重庆市勘测院提供，第1组实验样本选取重庆市某郊区的QuickBird道路高分辨率遥感影像。该影像包含空间分辨率为0.5 m的全色影像和空间分辨率为1.8 m的多光谱影像，融合后影像分辨率达到0.5 m，样本大小为340×340，原始影像如图2a所示。

为验证本文方法的准确性和高效性，采用参考文献[7]的SVM方法、文献[8]的CNN方法作为对比算法，通过客观与主观相结合的方式对提取效果进行评价，不同方法的道路提取效果如图2所示。

Figure 2 Road extraction map 1 of different methods图2 不同方法道路提取图1

(1) 主观分析：从目视提取效果图来看，SVM的道路提取效果最差，存在大量的道路断裂、畸变，同时一些建筑物或裸地被错分为道路；CNN相较于SVM方法，能够较好地提取道路轮廓，但仍存在错分、孔洞以及道路不连贯等问题；而本文方法通过结合CS算法和判别信息，能明显提高网络稳定性和准确性，道路提取效果要明显优于其它2种方法。同时结合数学形态学处理后道路信息提取完整，未出现错分、断裂和孔洞等情况。

(2) 客观分析：为客观评价道路提取效果，本文通过正确率、完整率和提取质量3个指标对道路提取效果进行客观评价。

①正确率。

正确率是正确提取的道路长度与提取道路总长度的比值：

(20)

②完整率。

完整率是提取道路总长度与影像中实际道路总长度的比值：

(21)

③提取质量。

提取质量是正确提取的道路长度与影像中实际道路总长度的比值：

(22)

为进一步定量分析道路提取效果，验证本文方法的有效性和准确性，通过在原始影像中随机选取5 000个测试样本点，并对道路和非道路样本点数量进行个数统计。图3为随机测试样本点分布图。道路提取评价如表1和表2所示。

Figure 3 Distribution of test sample points图3 测试样本点分布图

从表2中可以看出，本文方法的正确率达到了93.5%，在道路提取完整率上远远优于另外2种方法，达到了97.3%。相比较SVM和ELM，提取质量分别提高了5.7%和2.6%，能够有效地提取出完整的道路信息。

Table 1 Extraction results of road test sample points 表1 道路测试样本点提取结果

Table 2 Road extraction evaluation 1 of different methods表2 不同方法道路提取评价1 %

为了更好地验证本文方法的有效性，采用另外一幅重庆市某城区的WordView-2影像(数据大小为340×340，分辨率为1 m(如图4a所示))，进行验证实验，不同方法的提取效果如图4所示。

Figure 4 Road extraction map 2 of different methods图4 不同方法道路提取图2

从图4可以看出，SVM和CNN均存在错分现象，致使道路提取不连续、断裂和畸变等，道路提取不完整。本文方法能够很好地抑制不连续和断裂情况的发生，道路提取效果更好。道路提取评价指标如表3所示。

从表3中可以看出，本文所提方法与SVM方法和CNN方法相比，正确率和完整率明显提高，正确率分别提高了9.1%和5.5%，完整率分别提高了11.4%和6%，同时提取质量也明显优于它们。在运行时间方面，本文方法远远小于另外2种方法的，比用时最长的CNN缩短近百倍。由上述分析可知，本文方法在训练时间上有突出的优势，且道路提取效果更好。

Table 3 Road extraction evaluation 2 of different methods表3 不同方法道路提取评价2

6 结束语

针对高分辨率遥感影像中城市道路的复杂多变性及ELM快速分类能力，本文提出了一种基于ELM的城市道路提取方法。利用改进的CS算法来优化ELM的网络结构，确定隐含层节点数，提高模型稳定性；引入数据样本的几何特征和蕴含的判别信息，进一步提高ELM的提取性能，实现城市道路的有效提取。通过实验分析和比较可知，本文方法能够完整地提取出道路信息，在地图更新、城市规划、灾害检测等方面有着一定的应用意义。