李晓敏, 张 杰, 马 毅, 任广波
(国家海洋局 第一海洋研究所, 山东 青岛 266061)
高光谱遥感技术是 20世纪80年代兴起的新型对地观测技术, 在特定光谱域以高光谱分辨率同时获得连续的地物光谱图像, 可定量地分析识别地物类型和确定物质性质及组成成分。与传统的遥感技术相比, 高光谱具有波段多、光谱范围窄、波段连续、数据量大、信息冗余增加等特点[1]。
利用高光谱分辨率的特点可显著提高地物类型识别的精度, 但同时大数据量也给数据处理和重要信息提取带来了挑战[2]。由于高光谱图像的波段数量较多且波段间相关性较高, 图像光谱信息所包含的高维特征集, 反而可能会导致解译精度随着特征维度的过分增长而呈现下降趋势, 因此一般会通过降维或特征波段选择的方式选取有限的波段来参与分类识别。主成分分析(Principal Components Analysis,PCA)是最基本的高光谱数据降维方法, 通过数学变换将多波段的图像信息压缩到比原波段更有效的少数几个转换波段, 降低特征的维数, 减少波段之间的冗余, 提高图像的数据质量和处理效率, 已经被广泛应用于高光谱图像处理[3-5]、特征提取和维数降低[6-7]、地物分类和目标检测[8-12]中。
目前遥感影像的分类方法较多, 不同分类器因原理和适用性不同而得到不同的分类精度, 同一分类器不同地物的分类精度也不同, 各个分类器间存在一定的互补性。已有的研究结果[13-16]表明: 采用决策级数据融合方法, 充分利用现有分类器的优势,可一定程度上提高地物的分类精度。
综上, 主成分分析方法可提高图像的数据质量和图像的处理效率, 决策级数据融合方法可一定程度上提高地物的分类精度。为此, 作者将主成分分析方法和决策级数据融合方法相结合, 来评价其对高光谱图像地物分类效果的影响。
本研究的实验区域为黄河入海口新老河道交界处(图1), 根据2012年9月的现场踏勘结果, 该区域为典型的滨海湿地, 其地物类型包括芦苇、黄河河道、水库与坑塘等清澈水体、滩涂(包括海滩和河滩)、翅碱蓬和柽柳等, 地物类型的解译图见图2。
作者所用的高光谱图像为CHRIS/PROBA影像。PROBA[17]是欧空局于2001年10月22日发射的新一代微卫星, 星上搭载了 3种传感器, 其一即为紧凑式高分辨率成像光谱仪CHRIS(Compact High Re-solution Imaging Spectrometer), 具有 5种成像模式(表1), 可获取0°、+36°、-36°、+55°和-55°等 5种角度的高光谱图像。作者所用的实验数据是2012年6月获取的CHRIS工作模式2的0°图像(图1), 其光谱范围406~1036 nm, 波段的光谱分辨率从5.9 nm到44.1nm不等, 地面分辨率17 m。采用ESA提供的HDFclean软件去除CHRIS影像的噪声, 包括缺失像元填充、条带噪声去除; 采用BEAM软件对CHRIS影像进行大气校正。
图1 实验区CHRIS影像图(B15B10B5)Fig.1 CHRIS image (B15B10B5)
图2 实验区地物类型解译图Fig.2 The distribution map of the ground objects
PCA变换也称霍特林变换或 K-L变换, 是一种基于信息量的正交线性变换, 该变换主要是采用线性投影的方法将数据投影到新的坐标空间中, 从而使得新的成分按信息量分布, 第一主成分包含的信息量最大, 变换后各主成分分量彼此不相关, 且随着主成分编号的增加该分量包含的信息量减小。PCA变换后图像的信息主要集中在前几个主成分分量中, 在变换域中丢弃信息量小的主成分分量, 将原始的海量高光谱数据变换为少量的几个成分, 在降低数据维数的同时, 最大限度地保持了原始数据的信息[18]。
利用ENVI软件对实验区的CHRIS/PROBA影像进行PCA变换, 得到18个主成分分量, 各分量图见图3, 各分量的贡献值见表2。
表1 CHRIS传感器成像模式Tab.1 The imaging patterns of CHRIS
表2 PCA变换后各分量的贡献率Tab.2 The contribution of different principal components after PCA transforms
图3 PCA变换后的各分量Fig.3 The map of different principal components after PCA transforms
通过表2可以看出, 前3个分量包含了98.9%的信息量, 而前10个分量则包含了99.97%的信息量, 后8个分量仅包含了0.03%的信息量; 同时从图3的目视效果看, 第八分量所显示的地物信息要比第七分量丰富。因此, 为了评价PCA变换对高光谱图像地物分类精度的影响, 作者合成了 8种不同的分量组合图, 分别是:(1)前10个分量组合, 以PC1~10表示; (2) 前9个分量组合, 以 PC1~9表示; (3)前 8个分量组合, 以 PC1~8表示; (4)前7个分量组合, 以PC1~7表示; (5)前6个和第8个分量组合, 以PC1~6, 8表示; (6) 前6个分量组合, 以PC1~6表示; (7)前4个分量组合, 以PC1~4表示;(8)仅前3个分量组合, 以PC1~3表示。
利用8种常用的监督分类方法分别对CHRIS高光谱原始图像和PCA变换后8种不同的分量组合图进行地物分类, 分类采用的ROI见图4, ROI颜色所代表的地物类型同图2。8种监督分类方法选择最大似然法(ML)、支持向量机(SVM)、人工神经网络(ANN)、最小距离(MD)、马氏距离(Mad)、二进制编码(BE)、光谱角度法(SAM)和光谱信息散度法(SID)。
通过对各种方法的地物分类结果和地面真实地物类别进行逐个像元统计, 建立误差矩阵, 使用总体精度、Kappa系数、生产者精度(PA)和用户精度(UA)来评价地物分类的精度, 见表3~表6。
图4 监督分类采用的ROI分布Fig.4 Region of Interest map used in supervised classification
通过表3和表4可以看出: 最大似然法、支持向量机和人工神经网络 3种分类方法的总体精度和Kappa系数都较高, 总体精度多在 80%以上, Kappa系数多在 0.7以上, 分类结果见图5。其中, 利用最大似然法对CHRIS高光谱原始图像进行分类的结果总体精度最高, 为85.096%; 利用最大似然法对PCA变换后前 9个分量组合图进行分类的结果总体精度次之, 为84.978%。
通过表5和表6可以看出, 对于实验区内的6种地物类型, 利用不同的监督分类方法和图像类型所得到的分类结果精度有高有低, 且最高的生产者精度和用户精度对应的监督分类方法和图像类型不一。6种地物类型最高的生产者精度和用户精度对应的监督分类方法、图像类型及其精度见表7。
表3 分类结果的总体精度表(%)Tab.3 The overall accuracy of the classification result (%)
表4 分类结果的Kappa系数表Tab.4 Kappa coefficient of the classification result
充分利用各分类器的优势, 从 3个方面考虑:(1)分类结果一致的, 采用共识的结果; (2)采用每类地物分类精度最高的结果; (3)采用总体分类精度最高的结果, 提出了两组决策级融合策略, 每组融合策略又分两种方式进行。
融合策略一: 最优和次优的算法分类结果一致的, 采用共识; 分类结果不一致, 采用每类地物分类精度最高(PA、UA、PA+UA)的, 空穴和缝隙采用总体分类精度最高的。分两种方式: 一是按照从类型1(芦苇)至类型6(柽柳)的顺序; 二是按照分类精度从高到低的顺序。
融合策略二: 直接采用每类地物分类精度最高(PA、UA、PA+UA)的, 空穴和缝隙采用总体分类精度最高的。同样分两种方式: 一是按照从类型1(芦苇)至类型 6(柽柳)的顺序; 二是按照分类精度从高到低的顺序。
针对全部 8种监督分类方法的分类结果和总体分类精度较高的3种分类方法(ML、SVM、ANN)的分类结果, 分别采用上述两组融合策略进行决策级分类, 分类结果图见图6, 分类结果精度表见表8。
总体来看, 两组融合策略的分类结果均有如下特征: (1)PA+UA最高的分类表现最好, 即综合考虑生产者精度和用户精度的情形下地物分类精度最高;(2)仅使用总体分类精度较高的 3种分类方法(ML、SVM、ANN)的地物分类精度较使用全部8种分类方法的地物分类精度有提高; (3)按照分类精度从高到低顺序进行的融合分类要比按照类型顺序进行的融合分类效果好。
融合策略一两种方式的地物分类总体精度和Kappa系数都较 8种监督分类方法中效果最好的最大似然法有提高; 且在综合考虑生产者精度和用户精度的情形下, 仅使用ML、SVM和ANN 3种分类方法, 按照分类精度从高到低的顺序进行的融合分类效果最好, 总体分类精度为87.007%。融合策略二两种方式的地物分类效果, 在仅考虑生产者精度的情形下不理想, 仅考虑用户精度的情形下较最大似然法有提高, 在综合考虑生产者精度和用户精度的情形下最优; 同样是在综合考虑生产者精度和用户精度的情形下, 仅使用ML、SVM和ANN 3种分类方法, 按照分类精度从高到低的顺序进行的融合分类效果最好, 总体分类精度为 87.82%, 较最大似然法的 85.10%提高了 2.7个百分点; 同时较最大似然法明显减少了误分现象, 尤其是对于分布面积较小的翅碱蓬和柽柳, 滩涂被误分为翅碱蓬、芦苇被误分为柽柳的现象大大降低。在高光谱图像的其他应用中, 如水果质量检查[19]、城市制图[20]和林种制图[21]等, 同样也发现决策级融合方法可提高高光谱图像地物分类结果的检测与识别精度。
表5 分类结果的生产者精度表(%)Tab.5 The producer accuracy of the classification result (%)
表6 分类结果的用户精度表(%)Tab.6 The user accuracy of the classification result (%)
图5 ML(左)、SVM(中)、ANN(右)对原始图像和8种分量组合图的分类结果Fig.5 The classification map of original image and eight kind of principal components combination using Maximum Likelihood (left), Support Vector Machine (middle) and Artificial Neural Network (right)
表7 不同地物类型的优势分类方法及其精度表Tab.7 The best classifier and its accuracy of different ground objects
图6 不同融合策略的分类结果图(左: PA最高; 中: UA最高; 右: PA+UA最高)Fig.6 The classification map of different fusion strategies (left: the highest producer accuracy; middle: the highest user accuracy; right: the total of the producer and user accuracy is highest)
表8 不同融合策略的分类结果精度表(%)Tab.8 The classification accuracy of different fusion strategies(%)
高光谱数据具有波段多、数据量大、信息冗余增加的特点, 利用主成分分析方法可降低高光谱数据的维数, 提高图像的质量和处理效率; 而采用决策级数据融合方法, 则可充分利用各分类器的优势,在一定程度上提高地物的分类精度。为此, 作者基于8种常用监督分类器对高光谱原始图像和PCA变换后不同分量组合图的分类结果, 设计提出了两组地物分类结果的决策级融合策略, 并将其应用于覆盖黄河入海口新老河道交界处的CHRIS/PROBA高光谱图像中, 评价了主成分分析方法和决策级数据融合方法对高光谱图像滨海湿地地物分类结果的影响。
需要注意的是, PCA变换将原始数据映射到一个新的空间, 在新的空间中, 原始数据的大部分信息被压缩到较少的几个波段(主成分)中, 改变了原始波段的物理意义[22], 使得PCA变换后的各主成分分量没有明确的物理意义, 因此对于不同的高光谱图像, 获得的各主成分分量具有不确定性, 很难直接进行比较。所以在作者所用高光谱影像中适用的方法, 在其他时相、其他地域、其他传感器的高光谱影像中是否适用还需进一步的实验进行验证。此外, 高光谱图像预处理过程[23]、监督分类样本的选择[24]、不同监督分类方法参数的设置[25]等也对地物分类结果的精度有影响。
[1]张良培、张立福.高光谱遥感[M].北京: 测绘出版社,2011.
[2]Anna M S, Annamaria C, Mariangela D, et al.Combined approach based on principal component analysis and canonical discriminant analysis for investigation hyperspectral plant response[J].Italian Journal of Agronomy, 2012, 7(3): 247-253.
[3]Chen G Y, Qian S E.Denoising of hyperspectral imagery using principal component analysis and wavelet shrinkage[J].IEEE Transactions on Geoscience& Remote Sensing, 2011, 49(3): 973-980.
[4]Koksal E S.Hyperspectral reflectance data processing through cluster and principal component analysis for estimating irrigation and yield related indicators[J].Agricultural Water Management, 2011, 98(8): 1317-1328.
[5]Qian D, Fowler J E.Low-complexity principal component analysis for hyperspectral image compression[J].International Journal of High Performance Computing Applications, 2008, 22(4): 438-448.
[6]Jaime Z, Ren J C, Ren J, et al.Structured covariance principal component analysis for real-time onsite feature extraction and dimensionality reduction in hyperspectral imaging[J].Applied Optics, 2014, 53(20): 4440-4449.
[7]Chen G Y, Qian S E.Denoising and dimensionality reduction of hyperspectral imagery using wavelet packets, neighbour shrinking and principal component analysis[J].International Journal of Remote Sensing, 2009, 30(18): 4889-4895.
[8]Rodarmel C, Shan J.Principal component analysis for hyperspectral images classification[J].Surveying and Land Information System, 2002, 62(2): 115-123.
[9]Bachmann C M, Donato T F, Lamela G M, et al.Automatic classification of land cover on Smith Island, VA, using HyMAP imagery[J].IEEE Transactions on Geoscience and Remote Sensing, 2002, 40(10): 2313-2330.
[10]Zhang L P, Liu Q H, Zhao C S, et al.The detailed vegetation classification for airborne hyperspectral remote sensing imagery by combining PCA and PP[C]//in 2ndWorkshop on Hyperspectral Image and Signal Processing: Evolution in Remote Sensing, WHISPERS 2010, Iceland: Reykjavik, 2010: 1-4.
[11]Pierre G, Jacquez G M, Andrew M.Geostatistical and local cluster analysis of high resolution hyperspectral imagery for detection of anomalies[J].Remote Sensing of Environment, 2005, 95(3): 351-367.
[12]Shahin M A, Symons S J.Detection of Fusarium damaged kernels in Canada Western Red Spring wheat using visible/near-infrared hyperspectral imaging and principal component analysis[J].Computers &Electronics in Agriculture, 2011, 75(1): 107-112.
[13]Licciardi G, Pacifici F, Tula D, et al.Decision fusion for the classification of hyperspectral data: outcome of the 2008 GRS-S data fusion contest[J].IEEE Transactions on Geoscience and Remote Sensing, 2009, 47(11): 3857-3865.
[14]He Y, Qian D, Ben M.Decision fusion on supervised and unsupervised classifiers for hyperspectral imagery[J].IEEE Transactions on Geoscience and Remote Sensing, 2010, 48(4): 875-879.
[15]Kalluri H R, Prasad S, Bruce L M.Decision-level fusion of spectral reflectance and derivative information for Robust hyperspectral land cover classification[J].IEEE Transactions on Geoscience and Remote Sensing, 2010,48(11): 4047-4058.
[16]Wei L, Prasad S, Fowler J E.Decision fusion inkernel-induced spaces for hyperspectral image classification[J].IEEE Transactions on Geoscience and Remote Sensing, 2014, 52(6): 3399-4012.
[17]曹斌, 谭炳香.多角度高光谱 CHRIS数据特点及预处理研究[J].安徽农业科学, 2010, 38(22): 12289-12294.
[18]张兵, 高连如.高光谱图像分类与目标探测[M].北京: 科学出版社, 2011.
[19]Nanyam Y, Choudhary R, Gupta L, et al.A decision-fusion strategy for fruit quality inspection using hyperspectral imaging[J].Biosystems Engineering, 2012, 111(1): 118-125.
[20]Huang X, Zhang L P.A multilevel decision fusion approach for urban mapping using very high-resolution multi/hyperspectral imagery[J].International Journal of Remote Sensing, 2012, 33(11): 3354-3372.
[21]Stavrakoudis D G, Dragozi E, Gitas I Z, et al.Decision fusion based on hyperspectral and multispectral satellite imagery for accurate forest species mapping[J].Remote Sensing, 2014, 6(8): 6897-6928.
[22]刘智深, 丁宁, 赵朝方, 等.主成分分析法在油荧光光谱选择中的应用[J].地理空间信息, 2009, 7(3): 12-14.
[23]盖利亚, 刘正军, 张继贤.CHRIS/PROBA 高光谱数据的预处理[J].测绘工程, 2008, 17(1): 40-43.
[24]王晓玲, 杜培军, 谭琨.高光谱遥感影像 SVM 分类中训练样本选择的研究[J].测绘科学, 2011, 3: 127-129.
[25]杨希明.高光谱遥感图像分类方法研究[D].哈尔滨:哈尔滨工程大学, 2007.