栗小东, 过仲阳, 朱燕玲, 戴晓燕
(1.华东师范大学地理信息科学教育部重点实验室,上海 200062;2.华东师范大学河口海岸学国家重点实验室,上海 200062)
结合GIS数据的神经网络湿地遥感分类方法:以上海崇明岛东滩湿地为例
栗小东1, 过仲阳1, 朱燕玲1, 戴晓燕2
(1.华东师范大学地理信息科学教育部重点实验室,上海 200062;2.华东师范大学河口海岸学国家重点实验室,上海 200062)
以上海崇明岛东滩湿地为例,利用改进的BP算法结合主成分分析,将光谱信息的主成分、NDVI、MNDWI以及 GIS数据作为神经网络的输入参数对东滩湿地进行神经网络分类.结果表明,神经网络分类能够有效的提高分类的精度,适合湿地分类.
湿地; 遥感分类; 神经网络
遥感作为一门对地观测性技术,具有探测范围广、采集数据速度快的特点,为研究地表变化提供了多平台、多光谱、多时相、大范围的实时信息.高精度的自动遥感图像分类方法是实现其他各种实际应用的前提和基础方法之一.湿地是自然界物种最丰富的生态景观,也是人类最重要的生存环境之一,被称为“地球之肾”.湿地生产能力很高,具有维护生态平衡,蓄洪防旱,涵蓄淡水,调节气候和保护物种多样性等功能.利用遥感信息进行湿地分类研究,信息更新速度快,覆盖面大,可以客观实时动态掌握各类湿地的分布状况及类型.由于不同类型湿地的光谱特征相近,在影像上直接区分较难,其精度也难以满足要求[1].传统的监督和非监督分类方法是基于像元光谱信息进行分类[2],异物同谱现象比较严重,分类精度不高;近年来出现的一些新型算法提高了湿地遥感图像分类的精度,如面向对象分类方法[2,3],决策树[4]等.但是,小范围的湿地区域依靠光谱信息难以对湿地内各种地物类型进行精确分类,效果并不理想.作为人工智能的主要方法,神经网络具有很好的容错性和鲁棒性,用于遥感分类,尤其高维遥感数据分类有一定的优势[5,6].本文在光谱信息的基础上,引入DEM和GIS数据建立基于神经网络的分类模型,实现湿地信息的自动分类提取.
上海崇明东滩位于中国第三大岛、世界上最大的河口冲积岛屿——崇明岛的东部,处在长江与黄海、东海的“一江两海”交汇处,地理位置十分独特(如图1所示),属长江口典型的河口湿地.崇明东滩从20世纪50年代开始进行筑坝围陆,大坝内建立了以养殖区等为主的人工湿地,大坝外为以滩涂湿地为主的自然湿地.研究区域包含堤外以光滩、互花米草、芦苇和水域为主的自然湿地和堤内的养殖区、绿林地为主的人工湿地.
图1 研究区域位置Fig.1 The location of Dongtan wetland and study area
研究区域湿地系统包含丰富的信息,主要为水体、植被和潮滩信息,本文研究数据选取2003年8月2日崇明东滩的Landsat5TM多光谱影像(图像经过辐射校正、几何校正和增强处理,可以直接使用)以及研究区域的DEM和 GIS数据(大坝(DAM)).
Landsat5TM多光谱影像包含7个波段,空间分辨率为30m,其中第六波段为热红外波段,空间分辨率为60m.本文选取 TM除第六波段外的6个波段,采用标准差归一化和主成分分析得到六个波段的主成分作为神经网络分类的输入参数.其中标准差归一化公式为
通过对遥感影像6个波段的统计分析,完成对影像的标准差标准化,统计结果如图2所示.将6个波段进行主成分分析发现,前三个主成分的累积贡献率已经占了遥感影像信息量的98%以上(见图3),因此选用前三个主成分代表遥感数据6个波段总的信息量.
图2 TM波段统计结果Fig.2 The statistics of the TMbands
图3 主成分分析各主成分特征值和累计贡献率Fig.3 The eigenvalues of the principal components and accumul ative contribution rate
湿地主要包含植被信息和水体信息,采用归一化植被指数NDVI和归一化差异水体指数MNDWI[7]分别增强植被和水体信息,作为神经网络的输入参数进行神经网络分类.其中归一化植被指数为
式中,NIR为近红外波段,RED为红波段.NDVI反映植被在可见光、近红外波段反射与土壤背景之间的差异的指标,非植被区的NDVI小于0,有植被覆盖区的NDVI大于0,且随着植被覆盖度的增大而增大.
归一化差异水体指数[7]
其中MIR为中红外波段,如 TM/ETM+的5波段,Green为绿波段,如 TM/ETM+的2波段.MNDWI指数可以消除地形差异的影响,抑制植被和土壤/建筑信息,增强水体信息,其中MNDWI指数中像元值大于0的为水体信息.
其他数据 东滩鸟类保护区是国际重要湿地,建国以来,不断有大坝修建,建立养殖场等人工湿地.因此,大坝内为人工湿地,大坝为潮滩增长形成的自然湿地,大坝内外不同高程地区形成不同的湿地生态类型.故将DEM和大坝的 GIS数据作为神经网络的输入参数进行分类很有必要.
DEM数据 在不同的高程处有不同潮滩和人工湿地生态类型,因此将DEM作为神经网络学习和模拟的参数,以便神经网络学习知识.本文使用的DEM数据是NASA在2000年2月利用航天飞机获得的SRTMDEM数据,分辨率为90m,将DEM数据重采样为30m,与 TM数据像元大小一致,将缺失的水体部分数据设为-1.
DAM数据 由于东滩大坝内外的湿地生态类型不同,因此将大坝作为神经网络输入参数进行分类.首先数字化出大坝的矢量信息,大坝内设为1,大坝外设为-1,通过矢量数据转化栅格数据,并将像元大小设为30m,与 TM像元大小相同.
人工神经网络(artificial neural network,ANN)是一个可自动提取一组预报变量和另一组自变量之间非线性关系的数据处理系统,网络的建立过程也就是人工神经网络的训练过程,是用自适应算法递归迭代求解因变量与自变量之间的非线性关系,训练后的网络可用于估算或预报预测变量.BP网络是前馈网络的核心部分,结构简单,可操作性强,能够模拟任何非线性输入输出关系[8].BP网络在输入层和输出层之间有若干的隐含层,相邻层次之间通过连接权和阈值相连接,同一层次的神经元之间没有连接[9].
BP神经网络用于遥感影像分类包含两个过程:神经网络模型构建和神经网络模拟.(1)神经网络模型的构建主要是指利用目视解译的已知类别属性的样本对建立的神经网络模型进行训练,建立神经网络分类模型.(2)神经网络模拟是将湿地影像中的每一个像元的相关信号输入训练好的神经网络进行模式识别,得到输出向量,将输出向量对应事先确定好的类别空间,确定每一个像元所属的子空间,达到遥感影像自动分类的目的.在东滩湿地遥感分类研究中,神经网络分类过程如图4所示.首先对TM影像除第六波段外的6个波段进行标准差归一化和主成分分析,提取贡献率大于90%的前三个主成分,结合NDVI,MNDWI,DEM和DAM作为神经网络的输入参数.通过目视解译得到各类别训练像元训练样本并确定各类别的目标参数,带入建立的神经网络进行网络训练,最后利用训练好的神经网络模型仿真东滩湿地数据,根据事先确定好各类别的神经网络仿真的值域范围确定各像元的类别,达到分类的目的.
图4 神经网络分类过程Fig.4 The ANN classification process
2.1 东滩湿地分类系统的确定
湿地包含天然的或人工的、暂时的或长久的沼泽地、泥炭地或水域地带,静止或流动的淡水、半咸水或咸水体,以及低潮时不超过6m的水域[10].湿地分类是湿地生态系统研究的基础,本文根据湿地的概念,结合1990年《湿地公约》以及国内外研究中采用的分类体系[10,11]和东滩湿地生态系统研究的具体应用,同时考虑东滩遥感影像数据源的可解译性,建立东滩湿地的生态系统分类系统:建筑用地;植被(大坝内绿林地;潮滩植被(主要为海三菱藨草和芦苇));湿地(大坝内养殖水域;大坝外光滩;浅水潮滩;潮沟;水域).
由图5可以看出,由于湿地生态类型的复杂性,相同的生态类型的光谱信息可能有所差别,如养殖水域由于泥沙含量的不同而呈现不同的光谱特征.同时,大坝内的绿林地与潮滩的植被(海三棱藨草和芦苇)同属植被信息,光谱信息相似,因此基于光谱数据的分类难以将两者区分开.
图5 典型地物光谱信息Fig.5 The typical ground object spectral information
东滩遥感分类选取的样本应当具有地理上和光谱上的代表性和典型性,训练样本的数量应当根据研究区域内各类别面积的大小而不同:水域和养殖水域的样本较多,建筑用地和潮沟的样本较少.样本的选取通过遥感影像上目视解译的方法进行.
本文以国际重要湿地——上海市崇明东滩湿地为实验对象,分别利用监督分类中的最大似然分类法与基于 GIS的神经网络分类进行东滩湿地的分类研究,并进行对比分析.
基于光谱信息的最大似然分类法通过遥感图像处理软件ENVI4.2来实现,神经网络分类利用Matlab7.0提供的神经网络工具箱来实现,由于标准BP算法具有收敛速度慢、容易陷入局部极小值等缺陷,因此,本文采用附加动量和自适应学习率的改进的BP算法创建3层BP网络.神经网络模型中隐含层数目的选择关系到网络学习知识的能力和网络模拟的泛化能力,因此,本文采用神经网络隐含层神经元数目选取的经验公式[8]
来确定.其中,S为隐含层节点数目,R为输入节点数目,SL为输出层结点个数,a为范围是0~10的经验常数,通过尝试法获得.神经网络的结构越简单,其泛化能力越好,为了防止神经网络过学习,在能够模拟预测的基础上,尽量降低神经网络的规模.本文神经网络模型包含三层:输入层有7个神经元,隐含层有9个神经元,输出层有1个神经元,Matlab中神经网络最大训练次数设置为5000次,训练的目标误差设为0.1,学习率为0.01.将目视解译的样本数据和各类别的训练目标参数输入建立的神经网络模型进行训练,然后将图像中的每个像元输入训练好的网络进行模拟,从而得到每个像元所属的类别.各地物类别的神经网络训练目标参数及各类别的神经网络输出层的值域范围参见表1.
表1 神经网络输出层神经元分类类别值域Tab.1 The ANN output range of each class
分别利用基于TM遥感影像光谱信息的最大似然分类法和结合 GIS数据的神经网络分类方法对崇明岛东滩的湿地进行分类,分类结果如图6和图7所示.最大似然分类法大坝内的绿林地和大坝外的潮滩植被有很多错分现象,大坝内的绿林地中夹杂着零星的潮滩植被,而潮滩上的潮滩植被和光滩也有很大一部分被错分为绿林地信息.同时,水域中也有很多被错分为养殖水域.结合 GIS数据的BP神经网络分类法将 TM影像的地物光谱信息进行主成分分析,同时将NDVI和MNDWI也作为神经网络的输入参数,结合DEM和GIS数据进行神经网络的分类,结果发现,分类结果中光谱信息相似的绿林地和潮滩植被信息被很好的区分,几乎没有错分的现象出现;同时,建筑用地中的道路及其两侧的建筑物也被很好同绿林地中区分开来,建筑格局清晰;大坝内的养殖水域同光谱相近的水域和浅水潮滩以及其他多水的类别分的较清晰,也基本没有错分的现象出现,养殖水域分类结果比较完整.
图6 最大似然法分类结果Fig.6 The classification output of maximum likelihood
图7 BP神经网络分类结果Fig.7 The classification output of ANN classification
本研究采用的是误差矩阵的方式进行精度分析,根据各类别面积百分比在ENVI中随机选取样点进行误差矩阵分析.最大似然方法和BP神经网络分类方法的误差矩阵和精度分析分别见表2和表3.
从总体上看,BP神经网络分类的总体精度比最大似然发分类有了明显的提高,从61.3%提高到了90.65%,Kappa系数也从0.56提高到了0.89,BP神经网络分类方法适合地物类型复杂的潮滩湿地分类.
表2 最大似然法分类误差矩阵和精度分析Tab.2 The error matrix and precision analysis of maximum likelihood classification
表3 BP神经网络法分类误差矩阵和精度分析Tab.3 The error matrix and precision analysis of ANN classification
在生产者精度和用户精度方面,最大似然分类结果中,由于绿林地与潮滩植被(海三棱藨草和芦苇)在光谱信息上具有相似性,因此,有很多绿林地被分为了潮滩植被.但在考虑了DEM以及GIS大坝数据的BP神经网络分类加入大坝内为绿林地,大坝外为潮滩植被的专家知识区分绿林地和潮滩植被,错分现象基本不存在,绿林地的生产者精度和用户精度分别由82.28%和35.59%提高到了99.71%和85.08%.养殖水域位于大坝内,水域位于大坝外,最大似然法分类结果中,大坝外的水域有很多错分为养殖水域,因此,最大似然法分类结果的养殖水域的生产者精度和用户精度分别为76.95%和37.33%,而BP神经网络分类利用专家知识进行分类,对应的精度提高到85.26%和99.62%,表明BP神经网络分类法对于异物同谱具有很好的区分,适合潮滩湿地的分类.作为神经网络的输入参数,NDVI和MNDWI分别可以增强湿地中的植被和水体信息,增强植被和水体的提取精度;DEM作为神经网络分类的参数可以提取出建筑用地沿道路的线状分布模式,将建筑用地与绿林地区分开,同时也可以完整提取出养殖区信息.
潮滩湿地包含复杂的地物信息,异物同谱现象比较明显,基于地物光谱信息的分类方法进行潮滩湿地分类中错分和误分现象明显.BP神经网络分类采用经过主成分分析的地物光谱主成分,结合NDVI,MNDWI指数,DEM和 GIS数据,增强植被和水体信息,提高分类精度.潮滩湿地分类过程中,大坝作为专家经验加入分类数据中,可以有效的解决异物同谱现象,将大坝内外的地物信息区分开.DEM作为分类因素,可以提取与高程相关的连续分布的地物信息,适宜建筑、道路等信息的提取.
[1] 张树清,陈春,万恩璞.三江平原湿地遥感分类模式研究[J].遥感技术和应用,1999(3):54-58.
ZHANG S Q , CHEN C , WAN E P. A st udy on wetland classifying of remote sensing in Sanjiang Plain[J ] . RemoteSensing Technology and Application , 1999 (3) : 54-58.
[2] 江辉,周文斌,刘瑶.鄱阳湖湿地遥感分类研究及应用[J].遥感技术与应用,2008,23(6):648-652.
J IANG H , ZHOU W B , LIU Y. Research and application of t he Poyang Lake wetland classification using remote sensing[J ] . Remote Sensing Technology and Application , 2008 , 23 (6) : 648-652.
[3] 于欢,张树清,崔利,等.基于CBERS-02遥感影像的湿地地表覆盖分类研究[J].国土资源遥感,2008(4):69-73.
YU H , ZHANG S Q , CUIL , et al . Wetland cover classification based on CBER-02 remote sensing image[J ] . Remote Sensing for Land & Resources , 2008 (4) : 69-73.
[4] LI Q , MAO F. Ext racting wetland information f rom spot5 imagery in Nansihu area of Shandong province[J ] . Geoscience and Remote Sensing Symposium , 2008 , IGARSS 2008 , IEEE International , 2008.
[5] BERBEROGLU S , CURRAN P J , LLOYD C D. Texture classification of Mediterranean land cover [J ] . International Journal of Applied Eart h Observation and Geoinfomation , 2007 (9) : 322-324.
MAHESH PAL , PAUL M M. An assessment of t he effective of decision t ree met hods for land cover classification[J ] . Remote Sensing of Environment , 2003 , 86 : 554-565.
[7] 徐涵秋.利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究[J].遥感学报,2005(5):589-594.
XU H Q. A study on information ext raction of water body wit h t he modified normalized difference water index(MNDWI) [J ] . Journal of Remote Sensing , 2005 (5) : 589-594.
[8] 周开利,康耀红.神经网络模型及其Matlab仿真程序设计[M].北京:清华大学出版社,2006.
ZHOU K L , KANG Y H. The Artificial Neural Network (ANN) Model and Simulate Appliance Design wit h Matlab[M] . Beijing : TsingHua University Press , 2006.
[9] 过仲阳,韦桃源,李绿芊,等.BP网络在研究地下水咸淡水界面波动中的应用——以长江河口地区第二承压含水层为例[J].华东师范大学学报(自然科学版),2001(6):65-69
GUO Z Y, WEI T Y, LI L Q , et al . Applied BP network to study groundwater interface fluctuation[J ] . Journalof East China Normal University(Natural Science ) , 2001 (6) : 65-69.
[10] WIL EN B O , TINER D F. Wetland of t he United States [ C] ∥WHIGHAM D. Wetlands of t he United World.Dordrecht : Kluwer Academic Publishers , 1993 : 515-636.
[11] 殷康前,倪晋仁.湿地研究综述[J].生态学报,1998(9):539-544.
YIN K Q , NI J R. Review of wetland studies[J ] . Acta Ecological Sinica , 1998 (9) : 539-544.
Artif icial neural network classif ication of wetland integrating GISdata : A case st udy of Dongtan wetland in Chongming , Shanghai
LI Xiao-dong1, GUO Zhong-yang1, ZHU Yan-ling1, DAI Xiao-yan2
(1. Key L aboratory of Geographic I nf ormation Science ,Minist ry of Education , East China N ormal Universit y , S hanghai 200062 , China;2. State Key L aboratory of Estuarine and Coastal Research , East China Normal University , S hanghai 200062 , China)
This paper took Dongtan wetland in Chongming Island , Shanghai , as a case study ;using the PCA output s of TM surface feature spect rum , NDVI , MNDWI , DEM and the GIS data as inputting element s of an Artificial Neural Network (ANN) , combined with improved BP algorithm, an ANN classification was applied to the Dongtan wetland. The result s show that the ANN classification method improves the classification accuracy , and can effectively distinguish those object s with similar TM spet ra.
wetland ; remote sensing classification ; ANN ;
TP753/TP183
A
1000-5641(2010)04-0026-09
2009-06
海洋公益性行业重点项目(200805080);上海市科委重点项目(07DZ12037)
栗小东,男,硕士研究生,主要从事遥感数据挖掘研究.E-mail:xdlee@163.com.
过仲阳,男,副教授,主要从事数据挖掘的研究工作.E-mail:zyguo@geo.ecnu.edu.cn.