梁志诚,黄文骞,杨 杨,张洋洋
(1.海军大连舰艇学院 海洋测绘科学与工程系,辽宁 大连116018;2.海军91039部队,北京102401)
基于神经网络技术的多因子遥感水深反演模型
梁志诚1,黄文骞1,杨 杨2,张洋洋1
(1.海军大连舰艇学院 海洋测绘科学与工程系,辽宁 大连116018;2.海军91039部队,北京102401)
采用动量BP人工神经网络方法,研究影响多光谱遥感水深反演的各种因素,概括出主要的影响因素,即:泥沙与叶绿素,通过在网络输入端加入泥沙参数因子与叶绿素参数因子,对神经网络进行训练,对大连湾的水深进行反演,取得较好的效果。
神经网络;水深反演;泥沙;叶绿素
利用遥感手段测量水深,可以发挥遥感“快速、大范围、准同步、高分辨率获取水下地形信息”的特长[1]。从20世纪60年代末开始,外国学者在水深遥感研究方面做了不少探索。Paredes提出用波段比值的方法消除不同海底底质反射和水体衰减系数的影响[2]。李铁芳研究表明水体衰减系数越大水深分辨率越大,长波段的衰减系数比短波段大,水体中含沙量增加也会导致衰减系数增加,提高水深分辨率[3]。张鹰等针对影响水深反演因素提出“水深综合影响因子”概念,他们选择合适的水深反演因子和比较多种线性、非线性水深反演模型,通过对水体悬浮泥沙光谱特性的研究,建立适于河口、近岸浅水浑浊水体并考虑悬沙浓度影响的水深反演模型[4]。
本文基于神经网络技术研究多因子遥感水深反演模型,通过分析影响水深反演的各种因素,提取相应的影响因子,将其加入神经网络输入端,参与神经网络的构建与训练。
1.1 影响遥感水深反演的因素
多光谱遥感水深反演研究的重点是削弱环境因素的影响,提高水深遥感解译的定量化水平,但现实中不同水域的水质、底质差别较大,影响遥感测深的因素较多(如水体悬浮物浓度、大气成分等),遥感测深精度还不高,所建模型也无统一的定量模式。
水体性质的差异直接影响了光波在水体中的传输过程,光波进入水体后一方面受到水体内物质的散射和反射作用使到达水底的光辐射量减少,这在一定程度上降低了离水辐射率的强度;另一方面光波传输受到水体中悬浮泥沙、叶绿素、浮游生物等影响,使离水反射率综合反映了水体中的悬浮物与溶解物等信息。提高水深遥感的精度必须要进一步加强光波水体传输中水深信息的模型的构建和水体光学参数确定,加强水体中悬浮物或溶解物的光谱反射规律的研究,去除或抑制水体的叶绿素、泥沙等内部噪声信息的影响以突出水深信息。
1.2 遥感水深反演主要的影响因子
1.2.1 悬沙因子
研究表明,R1(430~500 nm)和 R3(670~735 nm)波段光谱反射率能较好地估算低浓度悬沙含量,此外,R2(550~570 nm)和悬沙浓度相关性也很高,可见R1、R2和R3均含有较丰富的悬沙浓度信息,490 nm、550 nm和670 nm波段附近是悬沙浓度的敏感波段。此外,由于490 nm和550 nm波段分别位于叶绿素的吸收峰和反射峰上,因而这2个波段附近对叶绿素也比较敏感。本文参考国内外比较公认的II类水体悬浮泥沙反演模式,构建了低浓度泥沙因子 Xlr:Xlr=(R2+R3)/(R1/R2)。
对于高浓度悬沙水体,R2(550~570 nm)和R4(780~835nm)与悬沙浓度相关性较高,且R4是估算高悬沙浓度含量的最佳波段,构建高浓度泥沙因子Xhr:Xhr=(R2+R4)/(R1/R4)。
1.2.2 叶绿素因子
在传统的经验方法中,采用TM4、TM3反射率比值作为变量进行的Chl浓度的反演已经取得了一定成效,本文根据肖青等人基于TM4/TM3两波段比值法建立的回归方程[5],构建了叶绿素因子模型:XChl=R4/R3。
2.1 遥感数据
本文选取Landsat-7 ETM+数据,轨道号为120/033,成像时间为2002-06-11。
先对遥感数据进行辐射定标、大气校正、坐标系转换、反演区分割、水陆分离等操作。为获取用于水深反演的光谱信息,基于VC++平台,编程实现遥感图像数据的读取,并将读取的图像灰度数据以文本的形式输出,格式如表1所示。
表1 遥感数据文件格式
2.2 水深数据
本文采用的水深数据为图号C11381海图,如表2所示,该海图是大连港及附近地区的民用数字海图。通过读入海图控制文件map.rec(其中包含了图形文件、索引文件和属性文件),将水深数据以文本的形式输出,格式如表3所示。
表2 大连湾水深数据海图资料
表3 水深数据文件格式
2.3 水深点的匹配
采用距离判别法判断水深点与遥感像素点是否匹配。通过Envi软件查看遥感图像的像素坐标工具,得出每个像素的经纬度的网格间隔如图1所示,即:研究区横向的经度平均间隔为0.000 270 27,纬度平均间隔为0.000 003 99;纵向的经度平均间隔为0.000 005 16,纬度平均间隔为0.000 346 43。
图1 Landsat ETM+图像网格
然后计算L与D的值,取其中较小者为匹配精度。其中D=0.000 013 515,L=0.000 0173 23。显然,D<L,选择0.000 013 515作为匹配精度。即:当水深点和像素点的经度差与纬度差的最大值小于0.000 013 515时,则视这两点为同一点。最终确定的匹配数据点481个,水深范围为0~20 m。
3.1 反演因子的相关性分析
在遥感水深反演中,采用相关系数来衡量光谱值和水深值之间的相关程度。设X为水体反射率,
相关系数的取值范围为-1≤r≤+1。当相关系数为正时,表示两者之间为正相关;反之为负相关。相关系数的绝对值|r|越大,表示两者之间的相关程度越高。对所有单波段及双波段组合因子与水深进行相关性的计算得到结果如表4所示。
表4 波段反射率及波段组合与水深相关性分析
3.2 传统反演模型建立
以水深值为因变量,选用相关性较好的TM2、TM3及波段组合TM1*TM3、TM2*TM3、TM2/TM1作为反演水深的因子。
通过上述数据准备,共得到样本数据481个,其中400个作为参与建模的历史样本,81个作为模型预测的独立样本,用来检验模型的精度。采用最小二乘法建立各模型的非线性回归方程。经计算得到基于反演因子的指数、对数、二次多项式和幂指数4种非线性水深反演模型,如表5所示。
表5 单反演因子反演模型计算结果对比
为了进一步提高水深的反演精度,本文进一步比较每个因子不同模型的反演精度,选择相关性好、精度高的单因子模型项,建立多因子水深反演模型。即选取 (TM2*TM3)2、(TM2/TM1)2、(TM1*TM3)2、(TM1*TM3)1.4365、(TM2*TM3)1.22125个单因子模型项,开展多因子水深反演试验,其反演模型为
利用该模型的平均误差为1.67 m。平均相对误差为31.21%,相对于单因子模型,精度有了较大的提高。
4.1 动量BP神经网络模型
BP神经网络具有自学习、自组织、自适应和非线性动态处理等特性,因而在模拟非线性变化系统上,比传统的统计方法具有更好的能力。本文针对BP网络易陷入局部最小值、收敛速度慢和过拟合等缺陷,通过加入动量项和引入权值控制算法对网络进行改进。
4.1.1 网络结构
采用3层神经网络,包括输入层、隐层和输出层,隐层神经元采用的是tansig传递函数,输出层采用的是purelin函数。其拓扑结构如图2所示。
图2 BP神经网络拓扑结构图
图2中,x1,x2,…,xn是BP神经网络的输入端即反演因子,y为预测水深值。ωij和ωjk为BP神经网络权值。BP神经网络可以看成一个非线性函数,网络输入值和预测值分别为该函数的自变量和因变量。
4.1.2 模型检验
为防止过适应现象的发生,提高网络的泛化能力(即内插和外推能力)。模型建完以后,需要对模型的精度进行检验和修正。利用建完的网络,对检验样本数据进行仿真。然后将反演结果与实测水深值比较。如果误差比较大,要调整训练网络的期望误差,继续训练网络,直至得到的内插误差和外推误差相近为止。
4.2 网络训练及结果输出
4.2.1 网络输入输出端数据
利用与水深相关性较高的波段和波段组合即:TM1、TM2、TM3、TM1*TM3、TM2*TM3 和TM2/TM1作为部分输入因子,另外,考虑到悬沙因子与叶绿素因子对模型的影响比较大,也将其加入输入端。由于反演区属于泥沙含量较高海域,所以本实验的悬沙因子是选择高浓度泥沙因子作为输入因子。选择相应的水深值作为学习矩阵的期望输出。
4.2.2 隐含层及神经元
隐含层起抽象的作用,增加隐含层可以增加神经网络的处理能力,但同时也增加训练的复杂度。Cybenko(1988)[6]指出一个隐含层可以实现任意判决分类问题,两个隐含层可以表示输入变量的任意输出函数。考虑到本文的实际问题,选择单隐含层。
隐含层神经元个数与要解决问题、输入输出端神经元个数都有关系,如果选择的个数过少,会造成局部极小值,难以训练,容错性差;如果选择的个数过多,又增加了网络的复杂度和训练时间,误差也不一定最佳。对隐含层神经元个数的确定,有人推荐如下方法[7]:
1)Hecht-Nielsen认为在输入神经元数为N,隐含层神经元数为2 N+1时,使用单隐含层的神经网络可以实现输入的任意函数。
2)Ebberhart和bobbins建议采用输入结点的半数开始试验。
由于所研究的具体问题复杂性和各种非线性因素,本文采用试错的方法来确定隐含层神经元的个数。分别对隐含层神经元个数为10、15、20、25、30进行测试。发现当隐含层神经元个数为25时,网络的复杂度和训练效率可以取得较好的平衡。
4.2.3 参数确定与反演结果
为对模型进行检验,本文从481个水深点中随机选取400个点作为网络的训练样本,留出81个水深点作为检验样本,在训练网络时不参加建模。通过对输入序列和输出序列之间对应关系的反复学习和训练,确定网络模型的隐层节点数和其他可调参数,并不断调整网络模型输入层与隐层、隐层和输出层之间的连接权值和域值,找出其传递函数的最佳权值矩阵和域值矩阵,从而建立遥感光谱反射率和水深值之间的映射关系。反演结果如图3、图4所示。
最终确定的BP神经网络模型为:输入层节点数取8,隐含层节点数取25,输出层节点数取1;各参数值分别确定为:学习速率取0.05,学习速率增加和减少比率取0.7,动量参数取0.95,训练精度取0.9,误差比率取1.14。通过将模型反演出的水深值和实测值进行比较,结果表明:两者之间的平均绝对误差为1.120 5 m,平均相对误差为24.89%,均方差为2.494 1。
应用上述模型,通过对图5海区的每个数据点进行水深反演,其反演水深结果如图6所示。
图5 反演区TM1图像
试验表明,基于BP神经网络技术的多因子水深反演模型相对于单因子反演模型精度至少提高52.7%,相对于多因子反演模型精度提高了32.9%,具有较高的应用价值。
图6 BP神经网络反演结果显示效果
本文采用动量BP神经网络方法,通过研究影响多光谱遥感水深反演的各种因素,概括出主要的影响因素,即:泥沙与叶绿素。通过在网络输入端加入泥沙因子与叶绿素因子,对神经网络进行训练,对大连湾的水深值进行反演,取得了较好的效果,得到如下结论:
1)多光谱遥感水深反演受多因子的影响,是非线性过程。BP神经网络具有很好的自适应学习能力和非线性映射能力,在处理遥感水深反演的问题上比传统方法有更高的精度;
2)利用遥感反射率和实测水深值之间相关性建立的动量BP神经网络反演模型,可以较好地反演出大连湾的水深,反演值和实测值之间的平均绝对误差为1.120 5 m。
[1]叶明,李仁东,许国鹏.多光谱水深遥感方法及研究进展[J].世界科技研究与发展,2007,29(2):76-79.
[2]Paredes JM,SperoR E.Water depthmapping from passive remote sensing data under a generalized ratio assumption[J].Applied Optics,1983,22(8):1134-1135.
[3]李铁芳,易建春,厉银喜,等.浅海水下地形地貌遥感信息提取与应用[J].环境遥感,1991,6(1):22-29.
[4]张鹰.水深遥感方法研究[J].河海大学学报,1998,2(6):68-72.
[5]肖青,闻建光,柳钦火,等.混合光谱分解模型提取水体叶绿素含量的研究[J].遥感学报,2006,10(4):560-567.
[6]Cybenko G.Continuous valued neural network with two hidden layers are sufficient.Report,Department of Computer Science,Tufts University,Medford,1988.
[7]王玲.基于人工神经网络的水文过程模拟过程[D].南京:河海大学,2002.
Study of the water depth retrieval based on artificial neural network
LIANG Zhi-cheng1,HUANG Wen-qian1,YANG Yang2,ZHANG Yang-yang1
(1.Dept.of Hydrography and Cartograthy,Dalian Naval Academy,Dalian 116018,China;2.91039 Troops,Beijing 102401,China)
Uses Artificial Neural Network method(ANN)to retrive water depth.Study on the factors that influence the retriving technology.Conclude the primary two factors:bedload and chlorophyl.Then add bedload and chlorophyl parameters to the input range,train the net,and retrive water depth of Dalian Gulf with the trained net.The result is good.
ANN;water depth retrieval;bedload;chlorophyl
O433.1;P237
A
1006-7949(2012)04-0017-05
2011-08-03
国家自然科学基金资助项目(40371097)
梁志诚(1986- ),男,硕士研究生.
[责任编辑刘文霞]