辛动军 ,袁 梦 ,陈建安 ,钟 旭 ,臧艺元 ,胡 平 ,钟国忠 ,唐 鼐 ,王传立
(1.中南林业科技大学,湖南 长沙 410004;2.黄家湖国家湿地公园管理处,湖南 益阳 413000)
湿地是水陆相互作用形成的独特生态系统,是生存环境和自然界生物多样性的生态景观之一,具有稳定环境、物种基因保护及资源利用的功能[1-2]。遥感影像数据具有较高的空间分辨率、波谱分辨率、丰富的信息量、较高的定位精度,一直是湿地调查、研究与保护的重要数据源之一[3-4]。遥感分类可通过目视解译和计算机自动分类完成[5]。目视解译可充分利用判读人员的知识和经验,解译精度一般高于计算机分类,但其解译精度受限于解译人员的经验,带有很大的主观性。计算机自动分类速度快,能很大程度上降低人的劳动强度,但效果跟算法相关。已有的分类方法有:最小距离分类法和最大似然比分类法[6]。决策树分类法[7-10],面向对象法[11-12],主成分分析法[13],神经网络法[14-15]等。
针对不同的湿地类型,基于遥感的湿地常用提取方法包括单波段阈值法,多波段阈值法,常见的湿地信息提取模式识别技术有监督分类和非监督分类以及以此为基础提出的各种形式的混合分类法。这些方法大多基于数理统计理论,此类方法一般要求样本数目趋于无穷大时才能获得良好的分类精度,故在样本数量少、特征维度低时效果欠佳。支持向量机的湿地信息自动提取方法虽然在整体上提高了分类精度,但依然存在很多错分和漏分情况,主要是由于这些分类方法仅基于影像的光谱特征进行分类,而遥感影像本身存在“同物异谱、同谱异物”的现象。到目前为止,除受遥感影像源限制的原因外,基于以上算法的遥感影像数据湿地分类精度普遍不高[11-15]。因此要想达到理想的分类精度,还需要考虑其它相关特征及其有效提取、分析方法。本文以黄家湖国家湿地公园为例,利用高分辨率遥感影像数据,提出利用快速离散曲波变换和极限学习机相结合的方法对湿地遥感影像进行分类,旨在探讨增强遥感信息提取精度和湿地类型分类准确度的方法。
研究区湖南黄家湖国家湿地公园(东经112°18′30″~ 112°24′34″, 北 纬 28°40′40″~28°45′10″)位于益阳市北7.5 km处,资水尾闾,南洞庭湖之滨,主要包括益阳市资阳区境内的黄家湖、南门湖、甘溪港河的永兴-窑山口段及其周边区域与沅江市境内的黄家湖。湿地公园东连资江甘溪港河,西与迎丰水库尾水渠相连,北与沅江三眼塘区接壤,南到黄家湖管委会的香铺仑村和划香仑村。湖南黄家湖国家湿地公园地处雪峰山余脉与洞庭交接前缘地带,资水中下游以北,属滨湖丘陵地貌类型,海拔最高为266.3 m,最低为24.9 m,地势比较平缓,属第四纪滨湖冲积平原地带。主要地类有湖泊、河流、草本沼泽、森林沼泽、农田、水产养殖场等湿地类型,此外还有道路、民用建筑等非湿地。公园湖泊面积较大,占总面积的43.7%,除湖泊外各类型间交错分布,较为复杂。
1.2.1 快速离散曲波变换
因快速离散曲波变换(Fast discrete curvelet transform)对图像边缘的强大提取和辨析能力,FDCT已被广泛应用于图像处理之中。在文献[16]中介绍了 2 种离散曲波变换算法,分别是基于非等价空间快速傅里叶变换的离散曲波变换算法和基于 Wrapping 的快速离散曲波变换算法。其中Wrapping算法是目前最快的离散曲波变换算法,因此本文采用Wrapping算法。
Wrapping 算法的主要流程:1、对森林斑块遥感影像进行二维快速傅里叶变换,得到二维频域表示。2、对变换后的频域表示与窗函数运算。3、围绕原点作局部化处理。4、进行二维快速傅里叶逆变换,计算曲波系数。曲波系数计算公式如下:
式中:参数j、l、k分别表示曲波变换的尺度、方向和位移。
1.2.2 极限学习机
极限学习机(Extreme Learning Machine)ELM[17],是由新加坡南洋理工大学黄广斌教授提出求解单隐层前馈神经网络的学习算法。相对于传统的单隐层前馈神经网络,ELM随机初始化单隐层前馈神经网络的输入权值和偏置值,通过优化训练误差和输出权值范数,来保证优良的泛化性能。其最大的特点是通过求解隐层输出矩阵的广义逆,直接计算输出权值的解析解,比传统的神经网络速度更快。假设有N个任意的样本(Xi,ti),其中,
对于一个有L个隐层节点的单隐层神经网络可以表示为:
其中,g(x)为激活函数,Wi=[wi,1,wi,2,…,wi,n]T为输入权重,βi为输出权重,bi第i个隐层单元的偏置。Wi·Xj表示Wi和Xj的内积。一旦输入权重Wi和隐层的偏置bi被随机确定,隐层的输出矩阵H就被唯一确定。训练单隐层神经网络可以转化为求解一个线性系统Hβ=T。并且输出权重β可以被解析确定。
其中,H†是矩阵的H的广义逆。
1.2.3 试验设计与过程
ELM结构为单层前馈神经网络,其输入为湿地遥感影像的光谱特征、纹理特征、空间特征,输出为湿地类型,其隐含层神经元数设置为40,学习函数采用连续可微的Sigmod函数[19]。因湿地类型的多样性和光谱特征的不确定性,采用FDCT方法提取地物遥感影像的纹理特征,首先将遥感影像进行FDCT变换分解,获得影像的高频曲波变换系数和低频曲波变换系数,选取高频部分曲波变换系数组合作为地物的纹理特征。最后将训练好的ELM神经网络用于湿地类型自动识别[20-21]。
实验过程如下:
(1)将样本图像和测试图像采用基于Wrapping的快速离散曲波变换进行处理,从而获得曲波变换系数。曲波变换后的结果如表1所示:
表1 曲波变换结果Table 1 The result of curvelet transform
从表1可以看出,图像被划分为4个尺度层。最内层,也就是第一层称为Coarse尺度层(最粗尺度层),是由低频系数组成的一个19×15的矩阵。最外层,也就是第四层称为Fine尺度层(最细尺度层),是由高频系数组成的一个112×92的矩阵;中间的第二层和第三层称为Detail尺度层,每层系数被分割为4个大方向,每个大方向又被划分为4个、8个小方向,每个小方向是由中高频系数组成的矩阵。
(2)对曲波变换分解获得的低频系数再进行旋转变换,形成列向量特征参数。
(3)构建ELM神经网络,在本文中隐含层神经元数为5 000,学习函数采用Sigmod函数,将2步得到的特征参数送入ELM神经网络进行学习、训练和识别。
(4)湿地型分类实验结果如表2所示。
表2 分类准确率Table 2 Classification accuracy
从表2可以看出,FDCT+ELM的方法,识别率达到86.7% ,而SVM的方法为76.5%,但是FDCT+ELM的方法的特征维度为3 904,这会增加计算的复杂度。后期工作考虑对曲波特征进一步降维后再训练,测试精度和时间上的变化。
利用FDCT+ELM方法对湿地进行分类可以得到较为满意的结果,特征识别率达86.7%,Kappa指数达0.83。分类结果如图2所示:
支持向量机(SVM)算法对湿地图片进行特征提取与分类效果如图3所示:
FDCT+ELM算法在各个地类的识别上具有更高的精度,各个地类区分明显,不同地类边界的几何形态较为清晰,SVM分类结果较为破碎,斑点噪声较多,尤其在农田、冬水田与草本沼泽的分类上破碎化程度较为突出,对永久性河流与永久性淡水湖的区分也存在混淆,将永久性河流误判为永久性淡水湖。在对水产养殖场的区分上,两者都表现出较满意的精度。两种算法在对洪泛平原湿地、永久性湖泊除了有细微的差别外,地类区分的特征基本一致[22-23]。总体而言,DCT+ELM算法表现更好。
为证明FDCT+ELM在高分辨率湿地遥感影像分类中的可行性,选取分类精度、错分误差、漏分误差、总体精度和Kappa系数等因子进行评价。两种方法的分类精度如表3和表4所示:
图2 FDCT+ELM方法分类结果Fig.2 The classif i cation result of FDCT+ELM method
图3 SVM分类结果Fig.3 The classif i cation result of SVM method
表3 FDCT+ELM分类精度Table 3 The classification accuracy of FDCT+ELM
表4 SVM分类精度评价Table 4 The classification accuracy of SVM
对比分析表3和表4中分类精度、错分误差和漏分误差数据,基于FDCT+ELM的湿地类型分类方法其分类精度达到了86.7%,明显高于传统SVM的湿地类型分类方法76.5%的分类精度,前者的Kappa系数超过0.83,高于传统SVM分类方法的0.80。
本研究利用高分辨率遥感影像数据,对黄家湖国家湿地公园湿地类型进行了研究。主要得出如下结论:
(1)提出基于FDCT与ELM的湿地类型分类方法,该方法结合快速离散曲波变换及极限学习机求解单隐层前馈神经网络的学习算法,在提高分类精度和运算速度的同时,具有结构清晰、运算高效等优点,在处理多维数据时可以根据需要主动选取分类特征变量,可以有效减少传统分类方法在处理多光谱遥感数据时由于地物和地形过于复杂导致的分类混淆情况。
(2)对基于FDCT与ELM的湿地类型分类方法实验及精度评价分析表明,其整体精度达86.7%。与经典的基于SVM算法分类方法相比,整体分类精度提高了10.2%,Kappa系数提高0.03,尤其是洪泛平原湿地,草本沼泽,非湿地,稻田、冬水田和森林沼泽的分类精度明显提高。
黄家湖国家湿地公园在洞庭湖区域,湿地类型主要包括草本沼泽,稻田、冬水田,非湿地,洪泛平原湿地,森林沼泽,水产养殖场,永久性淡水湖,永久性河流,运河、输水河等景观类型。其中植被一般都是成片分布区域较大,由此,利用快速离散曲波变换和极限学习机相结合的方法(FDCT+ELM算法)可以较为容易地将这些区域区分出来,在草滩和泥滩的过渡带,以及草滩和明水体的过渡带也都能比较准确地区分出湿地植被区域边界。实验表明,与SVM分类算法的湿地分类相比,FDCT+ELM算法使湿地区域各地类类型区分明显,不同地类边界的几何形态较为清晰,识别精度更高。当然,除了FDCT+ELM算法上的优势以外,其中研究区湿地类型70%以上为湖泊河流,相对比较单一,也是获得较高湿地分类精度的因素之一。而基于SVM分类算法的湿地分类结果破碎化程度较高,尤其在农田、冬水田与草本沼泽的分类上较为突出,斑点噪声多,对永久性河流与永久性淡水湖的区分上也存在混淆。
本次实验中FDCT+ELM方法的特征维度高达3 904维,增加了计算的复杂度。后期工作中可考虑对曲波特征进行降维分析,在不降低分类精度的情况下降低计算的复杂度。针对湿地遥感分类,解译者之间存在的相互差异对遥感分类结果的影响还仍然存在,为降低这一影响将是湿地遥感影像自动识别和分类研究有待进一步待解决的关键问题之一。
基于FDCT与ELM算法将高分辨率遥感影像湿地分类方法推广到地物识别、森林类型识别等应用领域,对其进一步研究有着十分重要的意义。
[1]邱煌奥,程朋根,等.多光谱遥感影像湿地水体提取方法综述[J].江西科学,2016,34(1):61-65.
[2]Amani M, Salehi B, Mahdavi S, et al.Wetland Classification Using Multi-Source and Multi-Temporal Optical Remote Sensing Data in Newfoundland and Labrador, Canada[J].Canadian Journal of Remote Sensing, 2017, (58): 1-14.
[3]Ballanti L, Byrd K, Woo I, et al.Remote Sensing for Wetland Mapping and Historical Change Detection at the Nisqually River Delta[J].Sustainability, 2017, 9(11): 1919.
[4]张树文,颜凤芹,于灵雪,等.湿地遥感研究进展[J].地理科学, 2013,33(11):1406-1412.
[5]王卷乐.著鄱阳湖地区环境变化遥感监测与环境管理[M].北京:科学出版社,2016.
[6]MacAlister C, Mahaxay M.Mapping wetlands in the Lower Mekong Basin for wetland resource and conservation management using Landsat ETM images and fi eld survey data[J].Journal of Environ.Manage, 2009,90(7):2813-2823.
[7]Huiping Z,Hong J,Qinghua H.Landscape and Water Quality change detection in urban wetland: a post-classification comparison method with IKONOS Data[J].Procedia Environmen talSciences,2011,10:1726-1731.
[8]严恩萍,林 辉,莫登奎,等.基于ALOS数据的遥感植被分类研究[J].中南林业科技大学学报,2010,30(11):37-42.
[9]曹洪涛,张拯宁,李 明.基于c4.5决策树的多特征遥感分类方法[J].测绘工程,2016,25(3):73-76.
[10]杨 冬, 李恩宝,等.利用决策树模型的湿地提取与分类[J].辽宁工程技术大学学报( 自然科学版),2016,35(5):543-547.
[11]谢 静,王宗明,等.基于面向对象方法和多时相HJ-1影像的遥感分类——以完达山以北三江平原为例[J].湿地科学,2012,10(4):429-438.
[12]朱长明,李均力,等.面向对象的高分辨率遥感影像湿地信息分层提取[J].测绘通报,2014(10): 23-28.
[13]东启亮,林 辉,孙 华,等.多源遥感数据融合方法在湿地分类中的适用性研究[J].中南林业科技大学学报,2013,33(1):52-57.
[14]王庆光.基于人工神经网络的湿地遥感分类研究[D].北京:中国地质大学, 2006.
[15]Bortels L, Chan J C W, Merken R, et al.Long-term monitoring of wetlands along the Western-Greek Bird Migration Route using Landsat and ASTER satellite images: Amvrakikos Gulf (Greece)[J].Journal for Nature Conservation,2011,19(4):215-223.
[16]Mary G J J, Ramachandran A.Quality Improvement in Color Image Compression using New FDCT and FIDCT[J].International Journal of Computer Applications, 2015,123(8):12-17.
[17]G.Huang, Q.Zhu, C.Siew, Extreme learning machine: theory and applications[J].Elsevier Neurocomputing,2006,70(1–3):489–501.
[18]王德娇,史晋芳,吴 倩,等.一种混合降噪方法在辐射图像降噪处理中的应用[J].机械设计与制造,2017(1):97-100.
[19]Chen J, Chen H, Wan X, et al.MR-ELM: a MapReduce-based framework for large-scale ELM training in big data era[J].Neural Computing & Applications, 2016, 27(1): 101-110.
[20]Deo R C, Tiwari M K, Adamowski J F, et al.Forecasting effective drought index using a wavelet extreme learning machine (W-ELM) model[J].Stochastic Environmental Research& Risk Assessment, 2017, 31(5): 1211-1240.
[21]王 乐,王 超.影像融合和面向对象技术在湿地分类中的应用[J].地理空间信息,2017,15(8):22-29.
[22]Cao J, Chen T, Fan J.Landmark recognition with compact BOW histogram and ensemble ELM[M]. Kluwer Academic Publishers,2016: 2839-2857.
[23]Sinha R, Saxena S, Singh M.Protocols for riverine wetland mapping and classification using remote sensing and GIS[J].Current Science, 2017, 112(7): 1544-1552.