张娜 ,张庆河
(1.天津城建大学 土木工程学院,天津 300384;2.天津大学 水利工程仿真与安全国家重点实验室,天津 300072)
我国的渤海和黄海北部海域纬度较高,冬季常受西伯利亚寒潮的影响,每年均会形成海冰,且容易造成海冰灾害(王相玉等,2011;孙劭等,2011;张方俭等,1994)。根据包澄澜主编的《海洋灾害及预报》 (1895-1990年)和国家海洋局发布的《海洋灾害公报》 (1989-2010年)统计的1895-2010年海冰灾害描述,海冰灾害引起的损失在空间分布上呈现北部重而南部轻的特点,如2010年,辽东湾因冰灾导致的直接经济损失最重,占全年海洋灾害总经济损失的55%。近年来,全球气候变化异常现象频发,渤海海域遭受严重海冰灾害威胁的可能性加大,而辽东湾作为中国纬度最高的海湾,冬季海温最低、冰期最长,最有可能遭受严重的海冰灾害。因此,利用卫星遥感对渤海特别是辽东湾冰情进行实时监控,乃至进一步总结气象条件和海冰变化规律间的关系,及时发布冰情预报,对于海冰防灾减灾具有重要意义。
为了得到实时、大范围的、较为准确的流冰外缘线、冰密集度、冰面积、冰厚等参数,大量研究者利用卫星遥感对海冰进行了反演研究。如谢锋等利用美国NOAA气象卫星AVHRR遥感资料对辽东湾海冰进行研究,提出了海冰厚度的反照率反演公式,并用该公式对辽东湾海冰资源量进行了估算(谢峰等,2003)。郭凤莲等(2000)通过微波辐射计的微波辐射亮温值反演海冰厚度,建立了海冰厚度的计算机自动处理系统。罗亚威等(2005)将“海洋1号”卫星应用于反演2002-2003年冬季的渤海海冰。吴龙涛等(2006)利用MODIS的1B级数据进行渤海海冰参数反演,为渤海海冰数值预报提供冰密集度和冰厚度初始场。国巧真等(2007)利用海冰的光谱特征提取了1996-2005年的渤海海冰面积,并建立了海冰面积提取监测系统。武晋雯等(2009)采用可见光和近红外通道反射率阈值法对MODIS卫星进行海冰面积反演,得到辽东湾2004-2007年度的海冰面积变化过程。郭衍游等(2010)利用比值运算法反演MODIS海冰遥感图像,该算法在近岸悬浮物浓度较大的海区由于反射率较为接近,容易造成海冰误判。马龙(2011)认为利用MODIS数据的冰表面温度方法(IST)可以有效提取海冰分布信息。邓钟等(2011)针对环境与灾害监测预报小卫星分别采用表观反射率法、地表反射率法、原始DN值法和水体指数法进行渤海湾海冰面积的提取。
为了进一步提高遥感反演精度,近年来数据挖掘类算法开始应用于海冰遥感反演。王宁(2009)将基于凝聚层次聚类的遥感影像分割算法用于MODIS海冰外缘线提取。Guo等(2010)采用频谱分析方法和支持向量机的方法实现MODIS海冰检测。Shi等(2012)根据渤海海冰反照率的光谱特性,提出区域优化的冰检测算法。任朝辉等(2012)根据海冰的反射率属性,基于C4.5算法对MODIS遥感影像反演了辽东湾海冰分布。
综上所述,虽然目前海冰反演研究已有不少工作,但大多数工作还没有能够充分利用卫星遥感多波段信息进行自动海冰反演,充分利用诸如MODIS卫星的多波段数据提高反演精度的工作仍需要进一步探索。近年来,CART决策树方法在土壤分类、复杂生产过程的质量预测、植被指数提取、林业地类、教学测评以及土地利用等方面越来越得到广泛应用(陈云等,2008)。决策树构建算法具有灵活、直观、清晰、强健、运算效率高等特点,在遥感分类问题上表现出巨大的优势(Iyer et al,2004;Srinivas etal,1994)。为此,本文将基于CART决策树算法,同时利用MODIS卫星数据可见光、近红外和热红外多波段进行自动分类计算,以获得较为准确的海冰反演面积。为了检验MODIS数据反演海冰结果的合理性,进一步采用较高分辨率的环境与灾害监测预报小卫星HJ-1A/1B遥感图像对MODIS卫星的反演结果进行校验。
为了检验各种反演算法对于海洋环境的普适性,分别采用传统阈值法和CART决策树算法反演海冰分布。
MODIS是EOS系列卫星的主要探测仪器,有36个离散光谱波段,光谱范围宽,从0.4μm的可见光到14.4μm的热红外全光谱覆盖,数据分辨率分别为250m、500m和1 km。MODIS数据具有较高的时间分辨率,每天可以得到至少2次白天的更新数据。本文采用的是1 km空间分辨率的MODIS-1B级数据产品MOD02和地理定位数据MOD03进行海冰反演,该数据已经过辐射校正,只需对其进行几何校正即可。
HJ-1A/1B小卫星上装载的CCD相机有4个光谱波段,光谱范围从0.43μm的可见光到0.90μm的近红外,地面像元分辨率为30m。本文采用HJ-1A/1B小卫星数据的2级产品,是经过辐射校正和几何校正,并将校正后的图像映射到指定的地图投影坐标下的产品数据。由于环境卫星有较高空间分辨率,因此可直接通过目视解译区分冰、水和陆地。HJ-1A/1B卫星的成像周期为4 d,在时间分辨率上不及MODIS数据。
因此,最终采用MODIS数据进行海冰面积的遥感反演,HJ-1A/1B则用于检验MODIS的反演精度。反演MODIS海冰分布时,由于冬季沿岸海区覆盖着固定冰,与陆地积雪的光谱信息很相近,极易产生混淆。因此首先利用MODIS的MOD03数据中的陆/海掩膜进行海陆分离,获得渤海海区的影像。
阈值法反演海冰分布主要采用MOD021KM中的B2和B6波段的反射率数据、B31和B32波段的辐射亮度值数据以及MOD03中的Sensor Zenith Angles波段的卫星传感器天顶角数据反演渤海海冰面积。
阈值法反演方法一主要是根据冰、水反射率变化特征,采用比值运算的方法突出冰、水的差异,提高影像上海冰的对比度(郭衍游等,2010),见式 (1):
上式中B2为MODIS第2波段的反射率,B6为MODIS第6波段的反射率。
阈值法反演方法二是利用冰表面温度法IST方法反演冰(海)表面温度,并根据冰表面温度判断海冰(马龙,2011),其反演公式见式(2):
上式中T31为MODIS第31波段的亮温值,T32为MODIS第32波段的亮温值,q为传感器的天顶角,a,b,c,d分别为根据经验确定的大气影响系数。
CART决策树方法反演海冰分布主要基于MODIS的可见光/近红外和热红外数据,采用MOD021KM中的B2、B4和B6波段的反射率数据,B31和B32波段的辐射亮度值数据。
CART决策树方法的基本原理是通过对由测试变量和目标变量构成的训练数据集的循环分析而形成二叉树形式的决策树结构。CART算法采用经济学中的基尼系数(Gini Index)作为选择最佳测试变量的准则,基尼系数的定义如式(3)和(4):
式中:P(j/h)是从训练样本集中随机抽取的一个样本,当某一测试变量值为h时属于第J类的概率;nj/(h)为训练样本中测试变量值为h时属于第J类的样本个数;n/(h)为训练样本中该测试变量值为h的样本个数;J为类别个数。
使用CART进行预测之前须提供一个学习样本集(Learning samples)用于对CART决策树进行构建和评估。CART使用如下结构的学习样本集:
其中:X1,X2,…,Xm称为属性向量,其属性可以是有序的也可以是离散的;Y称为标签向量,其属性可以是有序的也可以是离散的。当Y是有序的数量值时,称为回归树,当Y是离散值时,称为分类树。
将MODIS遥感影像分为海冰、海水和陆地三类。为了构建分类函数,需要对每一个类别选取一定数目的样本,创建冰、水和陆地的分类训练样本。然后选取MODIS阈值法反演海冰常用到的B2、B4和B6波段的反射率数据,B31和B32波段的辐射亮度值数据作为代表数据计算样本的可分离性,由可分离系数(Jeffries-Matusita和Transformed Divergence)表示,这两个参数的值在0~2.0之间,大于1.9说明样本之间可分离性好;小于1.8大于1.4属于合格样本;小于1.4需要重新选择样本;小于1,考虑将两类样本合并为一类样本(Richards,1999)。
根据给定的样本集L构建分类树由以下三步组成:
(1)使用L构建树Tmax,使得Tmax中每一个叶节点要么很小(节点内部所含样本个数小于给定值Nmin);要么是纯节点(节点内部样本的Y属于同一个类);要么只有唯一属性向量作为分支选择。
(2)使用修剪算法构建一个有限的递减(节点数目)有序子树序列。
(3)使用评估算法从第(2)步产生的子树序列中选出一棵最优树作为最终的决策树。
根据ENVI对2010年1月25日MODIS遥感数据选取训练样本,选取海冰样本586个,海水样本1 443个,陆地样本1 097个,计算的可分离系数为1.977,可分离性好,以此训练样本建立CART决策树,生成的决策树模型如图1所示,分为6层,共有23个节点。生成决策树模型之后,即可根据该树生成的判断规则对MODIS遥感数据进行海冰反演。
图1 根据2010年1月25日MODIS遥感数据生成的决策树模型
图2显示了依据MODIS遥感B1、B4和B3波段的辐射亮度值数据得到的真彩色合成图像,图3-图5分别显示了依据比值运算法、IST方法和CART决策树方法反演得到海冰。图6-图11分别显示了环境卫星遥感图像,其中6组图像的左图均为右图所选区域的局部放大。
根据图6所显示的环境卫星遥感图像目视解译可知,辽东湾西南部秦皇岛附近位置存在流冰,而图3基于比值运算法的结果对于这种与海水反射率接近的较薄流冰不能准确识别,归为无海冰。
图2 MODIS的真彩色合成图像
图3 运用比值运算法反演海冰
图4 IST方法反演海冰
图5 CART决策树方法反演海冰
图6 环境卫星显示2010年1月25日辽东湾西南部存在流冰
根据环境卫星图7-图10可知,渤海湾沿岸有海冰分布,离岸一定距离处不存在流冰;莱州湾东部存在流冰,西部不存在流冰,图3中比值运算法结果显示,两个湾内因水域悬浮泥沙含量较高导致误判,将无冰区判别为有冰区。
根据环境卫星遥感图像图11目视解译可知,辽东湾东部冰边缘光滑,不存在流冰。据营口气象站实测资料显示,2010年1月24日有WSW向风,风速为8.7m/s,受此向岸风影响,转天1月25日辽东湾东侧海冰外缘的流冰被吹到固定冰上堆积起来,导致应该出现海冰的低温区无冰。图4基于热红外波段反演海冰的IST方法因只考虑到热力因素,未考虑动力因素,因此将无冰区判断为有冰区,造成海冰误判。
图7 环境卫星显示2010年1月25日渤海湾西部存在固定冰
图8 环境卫星显示2010年1月25日渤海湾离岸一定距离处不存在流冰
图9 环境卫星显示2010年1月25日莱州湾东部存在流冰
图10 环境卫星显示2010年1月25日莱州湾西部不存在流冰
图11 环境卫星显示2010年1月25日辽东湾东部不存在流冰
图5基于决策树方法所显示的反演结果。因同时考虑了可见光、近红外和热红外波段数据用于区分海冰和海水,因此有效避免了上述比值运算法和IST方法导致的海冰误判。海冰遥感结果表明,CART决策树方法能够精确反演流冰外缘线,可以适用于含沙量较高等影响海冰反演的海洋环境中。
综上所述,从各种方法反演海冰的结果来看,多波段的CART决策树反演方法同时兼顾了热红外波段的辐射亮度值数据用于区分因悬浮泥沙浓度较高的海水与海冰反射率接近所导致的海冰误判(比值运算法导致的海冰误判),同时又能根据可见光和近红外波段的反射率有效消除了因风和潮流等动力因素引起的单靠热红外波段反演海冰导致的误判(IST算法导致的海冰误判)。因此CART决策树方法对于反演流冰外缘线具有更高的精度,对于特殊海洋环境仍然具有普适性。
利用收集的多年MODIS遥感数据,根据CART决策树方法对辽东湾海冰进行反演,获得2003-2004年、2005-2006年、2006-2007年、2009-2010年、2010-2011年以及2011-2012年冬季的辽东湾海冰分布,并依据每一个像元代表的面积得到实际海冰面积。2003-2004年、2005-2006年、2006-2007年、2009-2010年、2010-2011年以及2011-2012年冬季辽东湾海冰面积生消变化过程分别见图12-图17。
图12-图17所显示的辽东湾多年冬季海冰生消演化规律,将为进一步研究气象因素变化和海冰面积演化关系提供可靠的数据。
图12 2003-2004年冬季辽东湾海冰面积生消变化过程
图13 2005-2006年冬季辽东湾海冰面积生消变化过程
图14 2006-2007年冬季辽东湾海冰面积生消变化过程
图15 2009-2010年冬季辽东湾海冰面积生消变化过程
图16 2010-2011年冬季辽东湾海冰面积生消变化过程
图17 2011-2012年冬季辽东湾海冰面积生消变化过程
分别应用波段比值运算和IST阈值法以及多波段决策树方法从MODIS遥感数据反演了辽东湾海冰分布,并利用较高空间分辨率的环境卫星遥感图像目视解译结果检验了遥感反演结果。结果表明,比值运算法容易将悬浮泥沙含量较高的海水误判为海冰,而冰表面温度的反演方法IST算法也容易受动力因素影响而出现海冰误判。CART决策树方法结合了可见光、近红外和热红外多波段数据创建自动分类规则来反演海冰,较高分辨率的环境卫星彩色合成图像目视解译结果检验表明,应用CART决策树方法能够精确反演流冰外缘线,不受海域环境变化如含沙量等的影响。
采用建立的决策树方法对2003-2004年、2005-2006年、2006-2007年、2009-2010年、2010-2011年以及2011-2012年辽东湾冬季海冰面积进行了反演,获得了2003年以来辽东湾多年冬季海冰生消演化规律,为进一步研究气象因素变化和海冰面积演化关系提供了基础资料。
Guo H T,Xie HH,2010.Application ofMODISdata tomonitor sea ice in Bohai Sea.2010 Second IITA International Conference on Geoscienceand Remote Sensing Significance,36-38.
Iyer SK,Saxenab B,2004.Improved genetic algorithm for the pemutation flow shop scheduling problem.Computersand Operations Research,31(4):593-606.
Richards JA,1999.Remote sensing digital image analysis.Springer-Verlag,Berlin:240.
ShiW,WangM H,2012.Sea ice properties in the Bohai Seameasured by MODIS-Aqua:1.Satellite algorithm development.Journal of Marine Systems,95:32-40.
Srinivas M,Patnaik LM,1994.Adaptive probabilities of crossover and mutation in genetic algorithms.IEEE Transactionson Systems,Man and Cybernetics,24(4):656-667.
陈云,戴锦芳,李俊杰,2008.基于影像多种特征的CART决策树分类方法及其应用.地理与地理信息科学,24(2):33-36.
邓钟,池天河,张新,2011.基于HJ星影像多方法海冰信息提取对比研究.闽江学院学报,32(2):122-125.
郭凤莲,赵仁宇,王维滨,2000.无源微波遥感技术在海冰测厚中的应用研究.遥感学报,4(2):112-117.
郭衍游,焦明连,2010.利用MODIS数据反演渤海海冰分布.淮海工学院学报(自然科学版),19(1):84-87.
国巧真,顾卫,李宁,等,2007.渤海海冰面积信息提取系统的建立及其应用研究.海洋通报,26(3):105-111.
罗亚威,张蕴斐,孙从容,等,2005.“海洋1号”卫星在海冰监测和预报中的应用.海洋学报,27(1):7-18.
马龙,2011.NASAMODIS海冰产品评价分析.国土资源遥感,88(1):115-117.
任朝辉,邵峰晶,王常颖,等,2012.基于数据挖掘的MODIS影像海冰检测方法.青岛大学学报(工程技术版),27(2):1-27.
孙劭,苏洁,史培军,2011.2010年渤海海冰灾害特征分析.自然灾害学报,20(6):87-93.
王宁,2009.基于MODIS数据的渤海海冰重要参数提取技术与探测系统.中国海洋大学.
王相玉,袁本坤,商杰,等,2011.渤黄海海冰灾害与防御对策.海岸工程,30(4):46-55.
吴龙涛,吴辉碇,孙兰涛,等,2006.MODIS渤海海冰遥感资料反演.中国海洋大学学报,36(2):173-179.
武晋雯,张玉书,冯锐,等,2009.基于MODIS的海冰面积遥感监测及其与气温的相关分析.遥感技术与应用,24(1):73-76.
谢锋,顾卫,袁艺,2003.辽东湾海冰资源量的遥感估算方法研究.资源科学,3(25):17-23.
张方俭,费立淑,1994.我国的海冰灾害及其防御.海洋通报,13(5):75-83.