胡艳 杨瑞 戚玉娇
摘要:以塔河地区的HSI高光谱遥感数据为基础,结合相关的统计学知识,利用非监督分类法和混合像元分解法分别提取森林植被类型,并对其进行精度检验。得出非监督分类总体精度为70.78%,混合像元分类的精度为76.87%。结果表明混合像元分解定量解算植被类型是更有效的方法。
关键词:HSI;混合像元分解;植被类型
A Classification of HSI Vegetation Types Based on Mixed Image Elements——A Case Study of Tahe County, Heilongjiang Province
HU Yan,YANG Rui*,QI Yu jiao
(College of Forestry,Guizhou University, Guiyang, Guizhou550025, China)
Abstract:Based on the hyperspectral remote sensing image (HSI) data of the Tahe County, Heilongjiang Province, and combined with relevant statistical knowledge, unsupervised classification method and mixed-pixel decomposition method are employed to extract the forest vegetation types. Accuracy test is conducted through the second class survey data of Tahe in 2012. The accuracy of unsupervised classification method is 70.78% and that of mixed pixel decomposition method is 76.87%. The result show that mixed pixel decomposition of quantitative elements is more effective to calculate the vegetation types.
Key words:HSI; mixed pixel decomposition method;forest vegetation types
傳统的森林类型识别法人工目视解译虽然充分发挥了技术人员的知识水平,灵活性强,但是时效性差、工作量大,对于高精度的多类性识别难度大[1]。计算机分类法相对于传统的遥感识别法有了很大的改进。基于专家知识的决策树分类法虽然提高了分类精度和工作效率,但是获取决策知识点过程复杂,不易实现;对于面向对象的分类方法对图像的分辨率要求较高,不适合于HSI高光谱低分辨率的遥感图像。
HSI遥感影像中的像元有的是包含着单一树种的纯像元,有的是包含着不同的树种类型的混合像元,需进入内部分解混合像元。混合像元分解的实质就是从多地面光谱混合数据中提取各种成分和它所占比例。能解决高光谱影像分辨率低的问题[3]。本研究以大兴安岭塔河县有林地HSI遥感影像数据为例,利用混合像元分解法提取森林类型信息。为森林资源的合理经营和生物多样性研究提供有效的数据支持。
1研究区域概况和方法
1.1研究区域概况
塔河县地处黑龙江省的北部,是位于中国最北边的两个县之一。东边与呼玛县相接,西边与漠河县相邻,南面依附着新林区及呼中区,北面和俄罗斯隔江而望[4]。年平均气温-2.4℃,温差较大。据统计,塔河县内平均无霜期仅有98 d,年日照时数为2015~2865 h。每年的平均降水量为463.2 mm,降雨量充足。区域内植被类型丰富,分布着落叶松、樟子松、杨树、白桦等十余种树种,以落叶松为主的针叶林带分布在北面,南部是针叶阔叶混交林带逐渐向蒙古栎的温带阔叶林过渡区域。森林资源独特,森林覆盖率高达81%。
1.2研究方法
1.2.1数据处理
本研究所用的是大兴安岭地区原始的HSI 2级产品数据。HJ-1/HSI高光谱遥感传感器搭载在HJ-1-A平台上,对地成像宽为50 km,像元分辨率为100 m×100 m[5]。大气的散射、吸收、地面地形起伏以及传感器本身产生误差会对成像结果产生影响,因此,获取的遥感图像需要进行预处理。
1.2.2去条带
HJ-1A星中的蓝绿波段容易受到大气散射的影响,HSI数据波段中出现了明显的倾斜条带,遮挡了图像的部分纹理信息,影响了数据应用的精度[6]。基于HSI数据进行植被类型分类的研究首先要对图像做去条带处理。确定图像两个顶点的坐标值,求取两点所连直线和法线之间夹角的正切值,利用反三角函数解算旋转夹角[7]。图像旋转垂直后,运用列像元的平均值、标准差等之间的差异,分波段进行线性化修正像元,去除条纹的影响,结果如图2。
1.2.3传感器定标与大气校正
光谱成像仪工作原理是太阳辐射透过大气层以某种特定的方式入射到地物体的表面,然后再反射回传感器。本研究要通过HSI遥感影像获取塔河县物体表面的光谱特性,就必须从遥感影像中提取目标信息。在本次研究中对影像进行大气校正主要是在ENVI软件下的FLAASH功能模块实现的。在FLAASH中没有直接的校正HSI遥感影像的参数,需要根据HJ-1/HSI的参数特点进行大气校正。在FLAASH大气校正过程中需要输入的参数包括(图3)传感器的类型、传感器高度及时间、影像中心位置、地面的平均高程、空间分辨率、所用的气溶胶模型、大气模型及大气能见度等。完成大气校正。
1.2.4HSI图像的拼接与裁剪
本次研究所用的大兴安岭塔河县的影像图是由很多景HSI遥感影像数据组成,研究对多景遥感影像进行拼接。图像拼接是将具有相同地理坐标的图像拼成一幅图。用ENVI5.1中Map模块下Mosaicking功能进行基于地理坐标的图像拼接。由于拼接的影像有多余的的部分,需要用塔河县的边界shape格式的矢量文件进行裁剪。在ENVI5.1中,打开矢量数据,矢量数据的地理坐标信息应与遥感图像一致,并将矢量数据作为目标区域ROI。得到研究区域数据,并按105、70、40波段组合成彩色图像。
1.3非监督分类法提取植被类型
非监督分类提供了两种算法[8],一种是Iso Data算法,另一种是K—Means算法。本实验采用K—Means算法和聚类分析法提取植被类型,K—Means算法通过输入k个聚类数和有n个数据对象的数据库。本次研究中K取9,n取值20进行分类(图4)。
1.2.5非监督分类法森林植被类型分类评价
分类精度(Overall Accuracy)定义为正确的分类像元数目除以总的像元数目。本实验采用混淆矩阵方法对分类结果进行精度检验。在ENVI5.1软件中,选择Classification—Post Classification—Confusion Matrix—Using Ground Truth ROI,得出本次分类精度检验表中70.78%。
1.4混合像元线型模型分解
1.2.6模型简介
混合像元分解是通过进入像元内部,将像元分解为不同的终端单元(Endnumber)即不同的地物类型,并求出这些终端单元所占的比例即地物所占比例。HSI遥感影像中的像元有的是包含着单一树种的纯净像元,有的是包含了不同的树种类型信息的混合像元。近几年,国内相继提出了几种不同的分解模型[9]。
几何光学模型:将像元表示表示为树冠C、阴影T、背景地面G、树阴下的地面Z这四个Endnumber,它们在像元中所占的面积是一个如下的数学函数。
R=(AcRc+ArRr+AGRG+AZRZ)/A
其中,R为混合像元的反射率,A为混合像元面积,Ac、Ar、AG、AZ分别是4个Endnumber在像元中所占的比例,Rc、Rr、RG、RZ分别为4个Endnumber的反射率。
随机几何模型:是几何光学模型的一个典型,不同的是它把类型的几何参数作为随机变量[10]。
概率模型:以概率统计知识为基础,应用统计特征分析来计算方差,得到协方差矩阵,利用简单的马氏距离来判断Endnumber的比例,分类精度低。
模糊模型:模糊模型:基于模糊理论与统计特征分析,把每个像元分到一类或是几类中,分类模糊,不能对每个像元准确分类。
线性模型是将像元在其中一个波段的光谱反射率表示为含有特定比例的各个Endnumber反射率的线性组合[11]。
Riλ=∑nK=1fKi+εiλ
∑nk=1fki=1(k=1,2,3…n)
式中:Riλ为λ波段的I像素的光谱反射率(已知),fki被称为对应于I像素的K端元的值(未知);εiλ为残差值;n为基本组分数目。通过提取出的Endnumber的光谱特征值,然后求解线性方程组即可求得Endnumber在像元中所占的面积比重,从而将所有像元进行分解。线性分解模型简单、能对每个像元准确分类。因此本实验采取线性分析模型对混合像元进行分解。
1.2.7终端单元(Endnumber)的初步确定
本文以塔河县的HSI高光谱影像为数据源,提取塔河县植被类型信息。根据研究区域从实地调查获得的外业数据和非监督分类图像分析结果,初步确定研究区域内的植被类型为白桦、落叶松、樟子松、山杨、柞树、云杉、杨树、黑桦、柳树,并选取这9种树种类型作为终端单元(Endnumber)数目和类型,进行混合像元线性分解。
1.2.8HSI遥感数据MNF变换
高光譜数据的特点为:多波段、数据信息量大。为了得到更有效的数据,需要进行MNF(Minimum Noise Fraction)变换[12]。MNF变化通过对图像的每一个波段做一定比例的扩展。在ENVI5.1软件中,选择Spectral—MNF Rotation—Forward MNF—Estimate Noise Statistics from Data进行MNF变换,并生成MNF影像以及特征值曲线。
1.2.9PPI算法提取终端单元
运用PPI(Pixel Purity Index)算法在高光谱遥感数据中更好地寻找高纯度像元[13]。在Envi5.1中,运用MNF变换后的3个波段上进行PPI处理,并选择光谱像素纯度指数[FAST]新的输出频带。阈值因子设置为2.5,迭代次数设置为1400次。选择变换后的前两个波段计算像素的纯度指数,得到纯像素指数[14]。PPI分布图,如下图5所示。得到的PPI图像中的每个像元的DN值,DN值越高代表该像元的纯净度越高,在PPI图像中表现为高亮度的区域[15]。这样除了原始图像中大部分不纯净的点,从而缩小了终端单元的选取范围。通过在ENVI5.1菜单下Region of interest—Band threshold to ROI,阈值设定为10,提取纯净像元。
经过PPI算法处理之后,得出了终端单元在遥感影像中的位置如图7,确定终端单元的类型还需通过N维可视化的方法。ENVI5.1软件中的N维可视化工具是一个交叉式的N维散点图绘制工具,能把N维散点图转换到2维空间中进行简化分析,因此能够使用N维可视化工具对图像中所有波段进行交互式分析。
1.2.10利用端元进行分类
在分解求取混合像元的端元时,少数情况下端元矩阵是可以从光谱库中挑选的端元光谱组成的。而在大多数的情况下,端元矩阵是一个未知变量。可以选用盲元分解的方法,通过光谱间的内在联系,根据影像来求解端元矩阵。在ENVI5.1中,Spectral—Mapping Method—Liner Spectral Unmixing打开分类图像,在端元中选择器中打开光谱库,参数设定为0.1,得出分类的结果图7。
2结果与分析
树种组成分析。树种组成是描述植被群落分布以及生态系统组成的重要参数,在森林资源管理、生物多样性的研究中以及实际生产应用都有十分重要的意义。由塔河地县的植被分布图可以看出,白桦和落叶松数量居多,大部分分布在塔河县的中部以及西北部;樟子松大部分分布在塔河县的西南角;山杨则是主要分布在东北角;柞树、云杉、杨树、黑桦、柳树的数量较少,零星地分布在塔河县。通过像元统计可以得出各树种所占森林的面积比例,各树种在塔河地区森林中各植被所占比例如下表1所示。落叶松的面积比例最大,其次是白桦,而黑桦数量极少。由此得出白桦、落叶松、樟子松和山杨研究是区域的主要树种,组成了塔河县的优势树种群。
精度检验及对比。本文基于HSI高光谱遥感数据,利用非监督分类法和混合像元分解来定量解算塔河县的森林类型,并分别做精度检验,对比两者分类的优势。对于非监督分类法采用混淆矩阵来检验分类精度。本实验运用ENVI5.1软件输出评价的混淆矩阵图,计算得出本次分类精度为70.87%,Kappa = 0.742,分类结果基本符合要求。
对于混合像元的精度检验,以二类调查数据为基础,找出均匀分布在研究区域内的50个样本数据与分类坐标匹配,用分类正确的像元除以总的样本计算分类精度,得出精度为76.87%,明显高于非监督分类法分类结果精度。
运用混合像元分解的方法进行森林类型分类定量解算,取得了较好的效果。对研究区进行混合像元分解得到落叶松、樟子松、白桦和山杨等树种的分布图以及各树种所占比例表,通过与森林资源二类调查数据各植被面积比相比较,得出落叶松、樟子松、白桦和山杨的分类面积大于实际面积,而其他的都比实际面积偏小。
3结论与讨论
通过对大兴安岭地区塔河县的树种在空间上进行定量的分析和估算。得出基于100 m×100 m分辨率的HSI高光谱遥感影像,利用监督分类法和混合像元线性模型分解提取塔河地县植被分布图,并针对两种不同的方法进行精度检验,分析混合像元线性模型提取植被类型的优点与不足。
从植被分布图和面积比例可以得出研究区域内优势树种为落叶松、白桦和樟子松,主要分布在西北部和中部;从树种的种类可以得出塔河县的树种类型多样,树种分布以某种类型集中分布,分布不均匀,有利于树种的优势性发展,但不利于树种的多样性发展。
通过对分监督分类法与混合像元线性模型分解法进行精度检验,结果表明利用混合像元线性模型分解的方法进行植被类型提取精度更高,分类结果更有效,证明本次研究是有意义的。
端元的选择和反射率的求解是混合像元分解的关键所在,本文利用PPI算法对纯净像元进行筛选,将PPI值较大的像元视为终端单元,并对终端单元提取其光谱特征值。这种利用影像自身来提取树种的光谱特征,提取植被类型,减小了野外工作量。但是通过对混合像元线性模型分解后的每一植被类型的分类面积进行统计并与实际数据对比得出:像元比例大的树种如落叶松、樟子松、白桦和山杨分类面积大于实际树种。而其他的都比实际面积偏小。这是因为像元比例大的树种在研究区域内分布广,像元比例大的植被对周围植被的光谱特征值影响大,在进行纯净像元提取和端元分类时会把周围植被归为同一类,致使分类结果失真。
综上所述,混合像元线性分解的方法简单可行,能保证一定的精度,在高光谱、低分辨率的遥感影像分类研究方面具有一定的意义。但由于存在同物异谱、同谱异物现象,光谱的混合过程可能不止存在简单线性组合关系,也可能存在复杂的线性模型在做线性模型分解时可能会产生遗漏现象;另一方面遥感图像某些地方可能被云、雾覆盖,无法提取像元值,对分类的结果产生了影响;在端元的选择上,选取端元的类型和数量具有一定的主观性,可能有的树种类型端元多选、有的少选;按PPI计算提取的像元中包含混合像元,影响终端单元的选取,影响分类精度。针对以上不足之处,有待深入研究。
参考文献:
[1]许菡.遥感影像混合像元分解新方法及应用研究[D].北京:首都师范大学,2013.
[2]聂明钰.高光谱图像线性解混算法研究[D].烟台:山东大学,2016.
[3]鈕立明,蒙继华,吴炳方,等. HJ-1A星HSI数据2级产品处理流程研究[J].国土资源遥感,2011 (1):77-82.
[4]隋堃.大兴安岭塔河县森林火灾面积演变特征研究[D].哈尔滨:东北林业大学,2014.
[5]顾晓鹤,王堃,潘瑜春,等.基于HJ1A-HSI超光谱影像的耕地有机质遥感定量反演[J].地理与地理信息科学,2011,27(6):69-73.
[6]郭芬芬,范建容,汤旭光,等.基于HJ-1A高光谱数据的藏北高原草地分类方法对比[J].遥感信息,2013(1):56-57.
[7]钮立明,蒙继华,吴炳方,等. HJ-1A星HSI数据2级产品处理流程研究[J].国土资源遥感,2011 (1):77-82.
[8]李俊明.基于HJ-1A高光谱遥感树种识别研究[J].东北林业大学学报,2013,23(5):113-117.
[9]惠巍巍.高光谱混合像元的分解及地物分类的研究[D].哈尔滨:东北林业大学,2007.
[10]耿修瑞,赵永超,周冠华.一种利用单形体体积自动提取高光谱图像端元的算法[J].自然科学进展,2006(9):1196-1200.
[11]郭山,袁路,孙卫东.基于特征端元提取的像元分解方法[J].高技术通讯,2008(10):89-91.
[12]汪重午.基于高光谱线性混合模型的地质勘查研究[D].成都:成都理工大学,2015.
[13]刘翔,张兵,陈冬梅.一种改进高光谱图像噪声评估的MNF变换算法[J].中国科学,2009,39(12):1305-1313.
[14]李二森.高光谱遥感图像混合像元分解的理论与算法研究[D].郑州:解放军信息工程大学,2011.
[15]周昕.高光谱遥感图像混合像元分解算法研究[D].杭州:浙江大学,2015.