马梦茹,张永彬,王奕丹
(华北理工大学 矿业工程学院,河北 唐山 063210)
土地利用的监测和管理不仅是我国国土资源部门的主要工作[1]还是勘探我国地理国情的重要手段[2]。迁西作为唐山典型山区县,依靠人工调查、逐级上报的土地利用监测方法[3]对于迁西这样地形复杂的山区县尤其困难。遥感技术拥有经济成本低、监测范围广及工作效率高的特点[4],对地物识别、植被覆盖度反演、时空变化监测和农田灾害监测等具有重要意义[5]。遥感影像分类是影像信息提取的重要步骤,以往研究多是通过影像光谱信息、影像波段说明或借用前人经验及参考文献提到的波段组合进行研究区地物解译和特征提取工作[6-8]。然而随着光谱分辨率的不断提高,影像中相邻波段之间的相关性大大增加,致使波段间存在大量冗余信息,最终导致分类时出现数据处理复杂、计算时间较长的现象。
选择最佳的波段组合对提高影像分类效率和精度是非常关键的,李秀梅等[9]利用标准假彩色432波段合成影像用于植被解译并根据相关性最小、信息量最大化的特点,选取742波段合成影像用于海岸线变化提取。Chavez[10]根据相关性小、信息量大的原则,研究出最佳指数因子OIF(Optimum Index Factor)进行波段组合的选取是非常有利的,文献[11,12]利用OIF指数对影像进行波段计算,根据OIF指数的排名得出波段741和波段245为各自选择的研究区域的最佳波段组合。刘春红等[13]根据OIF指数提出了自适应波段选择ABS (Adaptive Band Selection)的方法,通过ABS指数计算影像的各个波段,选出的波段不仅自身含有丰富信息还要符合与其他波段相关性少的要求。除此之外,还需要判断地物类别可分性,找到最佳波段[14]。郭力娜等[15]通过OIF指数和不同土地利用类型的光谱特征曲线来确定地物可分性,得出波段组合157在土地利用特征提取时精度较高,最适合其研究影像和区域。变换离散度类别可分性计算方式简单但鲁棒性好,在分析地物类别之间的光谱差异是通过统计距离计算的,得到了广泛应用[16,17]。文献[18-21]在综合考虑各波段的信息多少、波段间的相关性高低、波段的可分性大小以及地物光谱吸收特性等因素的基础上,提出光谱数据最佳波段的基本思路和方法。
综上所述,有针对性地选择合适的波段组合是高效开展影像应用研究的基础和前提。基于此,该项研究针对遥感影像Landsat8-OLI影像的9个波段的信息难以充分考虑的情况,以迁西县为例,通过OIF法和ABS法2种不同波段选择方法结合变换离散度进行不同地物的可分性度量,并进行最佳波段选择研究分析,从而提高迁西县的土地利用信息提取精度,以期为迁西县的相关研究提供参考。
研究区域选择河北省唐山市迁西县,距离唐山市约75 km,该县的地理坐标为东经118°6′~118°37′,北纬39°57′~40°27′,坐落于河北省的东北区域,四季分明,属于暖温带大陆性半湿润的季风气候。迁西县的地势南北高中间低,山地众多,海拔70~831.3 m,是唐山市唯一的山区县,境内有滦河、洒河、长河、清河、还乡河等6条河流,土地利用类型多样,林地覆盖率达全县的68%,因其独特的地形地貌特征被评选为国家级生态示范县。
所采用的研究数据来源于地理空间数据云网站下载的迁西县2017年6月1日的 Landsat 8-OLI影像,云量覆盖率为0.01且研究范围内无云量覆盖,影像投影分度带为 UTM Zone 50N,基准面为 WGS84。其他辅助数据包括迁西县矢量边界用于确定研究区精确范围,Google Earth 高分辨率历史影像用于目视解译选取高精度验证样本。
为了精确反演地表辐射亮度值和反射率值,在 ENVI5.1 软件中对遥感影像进行辐射定标和大气校正,利用 Gram-Schmidt 变换方法将大气校正结果与15 m的全色波段进行图像融合,融合后分辨率达到15 m,再利用迁西县矢量文件进行边界裁剪,最终得到研究区范围。
2.1.1单波段标准差计算
多光谱影像每个波段的标准差可以表示像元反射率在空间变化的情况,继而反应每个波段信息量的大小[22]。标准差大则表示该波段的像元灰度级分散,反差大,可以得到更多影像信息。标准差的计算公式为:
(1)
通过预处理大气校正、影像融合以后得到分辨率达到 15 m的7个波段的Landsat8-OLI多光谱影像。通过ENVI软件统计7个波段的标准差并进行大小排序,如表1所示。
表1 单波段的标准差信息
标准差表示图像各像元灰度值与平均灰度的离散程度。波段的标准差与离散程度成正比,标准差越大离散程度越大,换言之即波段包含的信息越丰富。据统计,影像7个波段的标准差从大到小分别是B5>B6> B7> B4> B3> B1> B2。故仅从单波段信息量的角度考虑,由表得知第5波段的标准差最大,也就是说第5波段包含信息最丰富,最小的是第2波段,包含较少的信息。
2.1.2 波段间相关系数计算
一般计算各波段间的相关系数来进行多元统计[23]。相关系数可以表示2个波段间的相关程度,相关系数越小表示两波段间的重叠性越小,即相关性越小。相关性小表示波段间信息冗余少即独立性高,其值由2个波段间的协方差以及各自的标准差决定。数学表达公式为:
(2)
通过ENVI统计出的7个波段间相关系数矩阵,如表2所示。
表2 波段间的相关系数矩阵
图1为各波段间的相关系数,横纵坐标表示7个波段,对角线表示自相关系数,对角线以外表示2个不同波段之间的相关系数,颜色由浅到深表示两波段相关性由小到大。
图1 相关系数图
由表2和图1可知:从Landsat8影像的7个多光谱波段之间相关性的角度考虑,B1、B2、B3这3个波段间存在显著的相关性。即这3个波段的信息彼此重叠多,冗余性高,其中B1和B2的相关系数最大,达到0.996。B5属于近红外波段,由图1可知B5波段的颜色最浅,表明B5波段与其他波段的相关性都较低,其中B4和B5这2个波段的相关系数最小,为0.754,即B4和B5有较高的独立性。另外,B7波段与B3、B4波段的颜色较深,其中B7与B4的相关系数达到了0.977,也存在较高的相关性。
2.2.1最佳指数因子
Chavez教授于1982年在美国提出最佳指数因子(OIF)法[10],该指数因子是在信息统计的基础上,计算波段的标准差和波段间的相关系数,通过比较波段标准差之和、相关系数之和的大小来判断最佳波段组合。数学表达公式为:
(3)
式中:OIF表示最佳指数因子,δi代表图像中的第i波段的标准差,Rij表示i、j两波段的相关系数,n代表选取的最佳波段组合的波段数目,一般为3。
2.2.2自适应波段选择
刘春红等人[13]在2005年提出自适应波段选择(ABS)的新方法,该方法实现特征选择与OIF法相同之处在于都需要计算波段标准差,但不同之处在于ABS法计算的是某一波段与前后两相邻波段的相关系数,其次运算得到各波段ABS 指数值。自适应波段选择的公式为:
(4)
式中:σi表示波段 的标准差,Ii表示波段的ABS指数,Ri-1,i代表波段i与前一个波段的相关系数,Ri,i+1表示波段i与后一个波段的相关系数。Ii越大表示i波段的信息量越大,与周围波段相关性越小,即该波段越具有代表性。
在遥感分类时为判断地物可分性,计算各地类样本基于不同波段组合或波段的距离,这是分类精度得到提高的前提。类对间的可分性判别方法主要有均值间的标准距离、J-M距离及离散度等[24]。该研究采用变换离散度TD(transformed divergence)方法,计算i、j2类样本的变换离散度的公式如下:
(5)
其中dij即离散度,离散度的计算公式为:
(6)
由公式可知,TD有指数约束,计算结果有最大值和最小值,符合所提到的可分性标准要求且方便判读,是相对较好的可分性指示因子[25]。其取值范围为0~2,若TD>1.9 表示2个类别间具有较好的可分性;若TD<1.7 表示2个类别间可分性不佳[26]。
利用TD距离可以进一步分析最佳指数法计算的结果,依据地物类别选择波段组合。
该研究共有7个波段参与波段计算,根据OIF法波段组合的原理,排除重复波段后,共有35种波段组合。通过公式(3)计算得到各波段组合的OIF值如表3所示。
表3 波段组合的OIF值
根据表1得知:单个波段计算标准差后,波段5标准差最大,包含丰富的影像信息。分析OIF法计算的波段组合,筛选包含标准差最大的第5波段且OIF值排名在前10位的波段组合作为最佳波段组合的初选范围,前10位排序依次为:B5-B6-B7> B4-B5-B6 >B4-B5-B7> B3-B5-B6> B2-B5-B6> B1-B5-B6> B3-B5-B7> B2-B5-B7> B1-B5-B7> B3-B4-B5。由表3可知,前10位波段组合中相关性计算结果较高的第1、第2、第3波段没有同时出现或者两两出现在初选范围内。
根据标准差和相关系数通过公式(2)计算ABS指数,如表4所示。
表4 单波段的ABS值
ABS值从大到小依次分别是B7>B5> B6> B1> B4> B3> B2。ABS值越大,表示该波段的信息量越大。ABS值最大的是波段7,最小的是波段2,表示波段7具有较强的代表性,波段2的代表性差。
ABS指数法是从信息量最大、相关性最小的角度进行单个波段计算,为了与OIF法进行对比分析,根据ABS法计算结果,每3个波段为一组进行波段组合,并将波段组合的ABS值相加进行排序,结果如表5所示。
表5 波段组合的ABS值
经ABS法进行计算得到波段7代表性高,故筛选包含波段7的ABS总值排名前10的波段组合作为最佳波段组合的初选范围,前10位排序依次为:B5-B6-B7>B1-B5-B7>B4-B5-B7>B3-B5-B7>B1-B6-B7>B2-B5-B7>B4-B6-B7>B3-B6-B7>B2-B6-B7>B1-B4-B7。
从表6 OIF与ABS波段组合的前15名对比结果可知, OIF法和ABS法计算结果排名第一的波段组合都是B5-B6-B7,波段组合B4-B5-B7均排名第3。但是OIF值排名第9的B1-B5-B7波段组合ABS总值排名第2,OIF值排名第7的B3-B5-B7波段组合ABS总值排名第4,OIF值排名第8的B2-B5-B7波段组合ABS总值排名第6,OIF值排名第2的B4-B5-B6波段组合ABS总值排名第11,OIF值排名第4的B3-B5-B6波段组合ABS总值也跌出前10排名第13,OIF值排名第10的B3-B4-B5波段组合由表5可知ABS总值排名第22。
表6 OIF与ABS波段组合的前15名
OIF法和ABS法寻找的都是波段组合信息量最大、相关性最小的波段组合,以上2种方法选择的波段组合还未满足最佳波段选择原则,即缺乏对地类可分性的评价,因此需要对波段组合的可分性分析。
3.3.1确定土地利用类型
为分析迁西县的土地利用情况,根据GB/T21010-2017 《土地利用现状分类》以及迁西县实际的土地利用情况将迁西县的土地分为如表7所示6类土地类型。
表7 迁西县的土地利用类型及说明
3.3.2变换离散度计算
地物类别可分性评价是指计算类别样本基于各波段组合上的统计距离再进行分析。因此,针对迁西县的地表覆盖类型,依据各类别选取的训练样本,根据表7涉及的6种土地利用类型,分别选取分布均匀且数量足够的样本。其中农用地样本选取 49个;水体样本选取 34个;林地样本选取 55个;居民地样本选取 48个;工矿用地选取51个;其他用地选取 31个。
基于OIF法、ABS法筛选得到的前10组波段组合,分别计算样本之间的TD距离,分析地类之间的光谱差异,实现多数地物之间的相对区分。6种类型两两间样本组合有15种类型,而农用地与林地均为植被,居民用地与工矿用地均为建筑用地易出现难区分情况,因此为减小数据运算和提高分类精度,统计农用地与林地、居民与工矿用地这2组较难区分的地物类别间的TD距离。表8、表9分别为这两地物类别基于不同波段组合的TD距离,并按照大小进行了排序,通过分析地物类别之间的TD距离筛选最佳波段组合。
表8 不同样本间的TD距离(OIF波段组合)
表9 不同样本间的TD距离(ABS波段组合)
由表8、表9可知:最佳波段组合并不唯一,会随着不同地类发生改变。经过变换离散度计算地物可分性后,原本OIF法排序第1的波段组合B5-B6-B7排序下降到了第3,另外在ABS法筛选的波段组合排序中下降到了第5,可见,仅依靠信息量进行波段选择有相对的局限性,应分析提取地物类型的光谱特征及统计地物类别之间的光谱距离后再进行波段选择,可达到提高精度的效果。通过2类对TD距离之和计算结果进行大小排序,TD-h最大的波段组合即为最佳波段组合。最后OIF法筛选得到的最佳波段组合是B4-B5-B7,ABS法筛选得到的最佳波段组合是B1-B4-B7。
根据上述研究结果,对OIF法筛选得到的波段4、5、7进行RGB组合分析,共有6种不同组合结果。经过目视判别得到易于信息提取的波段组合顺序是B7(R)B5(G)B4(B),如图2(a)所示。该波段组合显示下:水域呈深蓝色、工矿用地呈红色,林地呈鲜绿色、耕地呈浅粉色、其他用地呈白色、居民用地呈灰色。同理,对ABS法筛选得到的波段1、4、7进行RGB组合分析,经过目视判别得到最利于土地利用信息提取的最佳波段组合顺序是B7(R)B4(G)B1(B),如图4所示。该波段组合显示下:水域呈现深蓝色、工矿用地呈现粉紫色,林地呈灰绿色、耕地呈黄色、其他用地呈灰白色、居民用地呈青色与灰色的夹杂色。
图2 不同波段组合显示
为了更加科学地判定和比较2种波段选择方法,研究基于以上OIF法和ABS法得到的不同波段组合,采用支持向量机(Support Vector Machines, SVM)的分类方法对迁西县进行土地利用信息提取分析。OIF法的分类结果见图3;ABS法的分类结果见图4。通过目视解译结合Google Earth随机选择足够多的验证样本进行精度对比分析,错分精度见表10,分类精度见表11。
表10 2种方法的错分精度对比
表11 2种方法的分类精度对比
由表10可知,针对主要难区分的地物类别,ABS算法优选的波段组合比OIF算法优选的波段组合错分比例低,更有利于区分。并且查看图3的分类结果可以得知,研究区域的中部在水域周围的工矿用地被错分为居民用地,研究区域的东部有部分耕地被错分为林地。
由表11可知,OIF算法优选的波段组合B7-B5-B4,总体精度为81.404%、Kappa系数为0.764 1,而基于ABS法选择的最佳波段组合B7-B4-B1分类后的总体精度为90.614%、Kappa系数为0.881 1。ABS法优选的波段组合比OIF法更利于研究区的土地利用信息提取。
图3 4-5-7波段组合分类结果 图4 ABS法7-4-1波段组合分类结果
(1)OIF法和ABS法虽然都是基于波段标准差和相关系数,但是2种方法筛选得到的波段组合排序存在差异,OIF法筛选的波段组合之间的相关性越小排序越靠前,ABS法筛选后排序靠前的是波段之间相关性小且信息量大波段组合。
(2)仅使用OIF法和ABS法筛选出排名第1的波段组合B5-B6-B7在该项研究方法筛选的波段组合排名中分别下降为第3和第5。
(3)ABS法选择的B7(R)B4(G)B1(B)满足信息量大、相关性小且地物类别能被较好区分的最佳波段选择原则,并通过SVM的分类方法验证,其解译效果和精度高于OIF法的B7(R)B5(G)B4(B)组合方式,因此B7(R)B4(G)B1(B)为迁西县土地利用信息提取研究的最佳波段选择。