张富华,黄明祥,张 晶,包 钢,包玉海
(1.首都师范大学,北京 100048;2.内蒙古师范大学,内蒙古呼和浩特 010022)
利用高光谱识别草地种类的研究
——以锡林郭勒草原为例
张富华1,黄明祥2,张 晶1,包 钢2,包玉海2
(1.首都师范大学,北京 100048;2.内蒙古师范大学,内蒙古呼和浩特 010022)
以锡林郭勒草原典型的羊草、针茅、日阴菅、隐子草为研究对象,测量4种草地光谱,利用光谱微分法对原始光谱数据进行处理,在提取草地光谱7个特征参数的基础上,采用相关性分析和主成分分析方法精选红边斜率、绿峰位置、绿峰值和红谷位置4个参数。基于所选的4个光谱特征参数,采用多层感知神经网络模型对草地种类进行识别,精度达到80.3%,同时对比7个特征参数与4个特征参数对草地种类识别精度的影响,发现草地种类识别精度从69.0%提高到80.3%。本研究可为大面积草地物种资源的遥感调查和监测提供科学依据。
高光谱;草地;种类;识别;神经网络模型
草地是我国陆地上最大的生态系统,对发展畜牧业、保护生物多样性、保持水土和维护生态平衡有着重大的作用和价值。正确地识别草地植被种类是草地资源利用保护和区域生物多样性的研究的基础和依据,现行的草地识别方法主要是依靠一些成本高、费时、费力的野外调查方法或利用大比例尺的航片来进行判读。近年来高光谱遥感发展迅速,成为当前遥感技术的前沿领域。高光谱遥感可用于草地分类和生物量估测等研究[1],传统的草地高光谱研究停留在对光谱反射特征的分析和比较[2],此统计分类方法缺乏伸缩性,难以处理大训练集。近年来,神经网络模型作为一种基于模式识别的数据挖掘技术,适宜于高维度的分类问题,具有较好的自适应能力,在多光谱遥感分类中得到广泛应用[3-4]。
本文选取了锡林郭勒草原4种典型草地植被为研究对象,利用光谱微分、相关性分析、主成分分析提取光谱特征,并采用神经网络算法进行草地种类识别。本研究可为航空航天草地类型识别和资源调查提供科学依据。
研究区草地植被采样点选在东乌旗、乌拉盖、苏尼特右旗和锡林浩特市四地,研究对象为锡林郭勒草原的4种典型植被:羊草、针茅、日阴菅、隐子草。样点研究区属锡林郭勒草原,平均海拔1000 m左右,气候呈明显的温带大陆性特征。
1.采样方法和数据处理
本研究采用美国ASD公司的FieldSpec-3便携式光谱仪在研究区内随机测量羊草、针茅、日阴菅、隐子草4种草地植被的高光谱。为去除测量系统误差及不确定性因素的干扰,本研究利用ViewSpec Pro对野外实测的典型草地植物光谱数据进行预处理,包括去除野外获取的有明显错误的数据及反射率大于1和明显低于正常值的数据、清除包含在信号内的少量噪声、剔除水汽吸收波段[5]。经数据预处理后,共得到111个合格的样本,其中羊草24个、针茅42个、日阴菅25个、隐子草20个。本研究仅保留了植物特征明显且噪声较小的350—1300 nm作为后续分析波段,4种草地植被的平均光谱反射率曲线如图1所示。
2.高光谱特征提取与分析
高光谱数据包含的信息丰富,波段数量多,数据量大,如果直接用于分类,不仅会因计算量过大而导致分类过程耗时较长,增加后续分析的难度,也可能因引入噪声而降低分类精度。提取植被频谱波形特征(第一、二导数,峰,谷等)是降低数据维度、保留有用信息、提高分类精度、避免休斯现象的有效方法[6]。本研究首先计算光谱反射率在350—1300 nm内的一阶微分[7-8],然后提取红边位置、红边斜率、红边面积、红谷位置、红谷值、绿峰位置和绿峰值7个光谱特征参数,并以此作为后续分析和应用的基础。
图1 锡林郭勒草原典型植被的反射光谱曲线
3.多层感知神经网络模型
人工神经网络是20世纪80年代中后期迅速发展起来的一个前沿领域,因其良好的预测性和实用性被广泛应用于各个领域[9-10]。本研究采用SPSS Statistics 17.0的Neural Networks模块构建了多层感知神经网络分类模型,以4类草地植被类型为输出,以提取的光谱特征参数为输入,神经网络模型的隐藏层数为1,隐藏层的节点个数为7,且其激活函数为双曲正切函数,优化算法采用调整的共轭梯度法,输出层的激活函数为Softmax,误差函数为交叉熵。将111个光谱样本分为2部分,81个作为训练样本,剩下30个作为测试样本。
1.草地光谱特征分析
从4种草地光谱曲线(如图1所示)可以看出,羊草的光谱反射率总体上高于其他3类植被光谱,尤其是在800—1300 nm和350—500 nm之间,羊草的反射率都明显其他3类草地。针茅、日阴菅和隐子草光谱反射率较为一致,但日阴菅光谱在350—500 nm之间光谱反射率最低,而在1100—1300 nm之间,其反射率最高,日阴菅这一波谱特征较为明显。而针茅和隐子草的光谱较为接近,尤其是在可见光范围内,光谱差别较少,仅在近红外隐子草较针茅光谱反射率大,但差距也不大。
为了进一步分析4类草地光谱的特征,对光谱数据进行一阶微分处理后,分别提起了所选的7个特征参数,各特征参数的平均值、标准差和变异系数见表1。总体来看,红边、绿峰和红谷位置变异系数小,而红边斜率、红边面积、绿峰值和红谷值变异系数相对较大,其中红谷值的变异系数总体来说最大,针茅的红谷值变异系数达35.98%。尽管红边位置、绿峰位置和红谷位置的变异系数总体不大,这也从侧面印证了3个特征参数的波段值较为稳定,是植被光谱的特征性波段,同时也可以看出4种草地光谱之间对应的红边、绿峰和红谷位置较为接近,其中就红边位置来看,羊草>针茅>隐子草>日阴菅,而针茅和日阴菅相差1 nm,差距最小。此外,羊草的红边斜率和绿峰值高于其他3种草地植被,日阴菅的红边斜率、绿峰值和红谷值最低。
表1 特征参数的平均值、标准差、变异系数
2.草地光谱特征参量提取
为了进一步提取特征参数,降低用于草地种类光谱分类的维度,本研究对7个特征参数进行了相关分析和主成分分析,分析结果见表2、表3和表4。从相关系数矩阵(表2)可以看出,红边斜率与红边面积、绿峰值与红谷值具有加强的相关性,其他变量间相关性不强,其中红边斜率与红边面积的相关系数达0.978,绿峰值与红谷值的相关系数为0.802,都呈正相关。从主成分分析(表3)可以看出,前3个主分量累计贡献就达85.13%,表4是提取的前3个主分的因素矩阵,从中可以看出红边斜率、红边面积和绿峰值主要构成了主成分1,绿峰值和红谷值主要构成了主成分2,而成分3主要是由红谷位置构成的,而红边位置对3个主分的贡献率较低,分别只有0.434、-0.239和0.644。因此,通过相关性和主成分分析可以看出,所提取的7个特征参量中,红边斜率与红边面积、绿峰值与红谷值之间的相关性较大,并且从构成前3个主分的特征变量来看,红边位置特征贡献较小,为了降低应用光谱进行草地类别识别的维度,后续利用神经网络进行草地种类光谱划分时不再考虑红边面积、红谷值和红边位置3个特征参量。
表2 相关系数矩阵
表3 方差分解主成分提取分析
表4 主成分矩阵
3.草地种类识别
根据草地光谱特征参量提取结果,以红边斜率、绿峰值、绿峰位置和红谷位置4个变量为神经网络的输入,其分类结果见表5。从表中可以看出,训练总体精度为80.20%,测试的总体精度达83.30%,测试和训练精度较高、且较为平稳。在4种草地种类中,日阴菅的精度最高,测试样本没有错分情况;羊草的训练精度较低,而测试精度较高,精度较不稳定,主要错分到针茅和日阴菅两类;隐子草主要错分到羊草和针茅;针茅主要错分到了羊草。以上4类草地种类的识别精度分析可以看出,尽管特征参量的变异系数大,造成类间不易划分,但由于神经网络在自学习、自组织和自适应的优势,基于神经网络的草地种类识别总体精度较高。
同时,为了比较特征变量筛选对草地种类识别的影响,以最初所选的7个特征变量为输入,神经网络参数设置相同,训练和测试样本不变,其草地种类识别结果见表6。从表中可以看出,相比筛选后的4变量草地种类识别精度,训练和测试精度都有所降低,其中训练精度下降不多,测试精度从83.3%下降到69%,除了日阴菅的4变量训练分类精度从80%升高到90%外,其他草地种类识别精度基本都是降低,而针茅识别精度相对稳定,精度降低很小,羊草和隐子草分类精度降低较大。从以上分析可以得出,总体来看,经过特征变量筛选后,通过去除变量间冗余信息量,能够提高草种类识别精度,说明特征变量的筛选很重要,对后续分析和应用能产生影响,并不是变量越多越好。
表5 4个特征变量神经网络分类结果
表6 7个特征变量神经网络分类结果
本研究采集并分析了锡林郭勒草原羊草、针茅、日阴菅、隐子草的光谱特征,研究发现4种草地的光谱较为相似,其中羊草在800—1300 nm和350—500 nm间的光谱反射率高于其他3种草地光谱,日阴菅光谱在350—500 nm之间光谱反射率最低,在1100—1300 nm之间反射率最高。通过一阶微分光谱提取了红边位置、红边斜率、红边面积、红谷位置、红谷值、绿峰位置和绿峰值7个草地特征参数,采用相关分析和主成分分析发现,红边斜率与红边面积、绿峰值与红谷值之间的相关性较大,构成前3个主分量的特征变量来看,红边位置特征贡献较小。根据光谱特征提取结果,以红边斜率、绿峰值、绿峰位置和红谷位置作为神经网络的输入进行草地种类的识别,草地种类识别精度达83.30%,神经网络作为数据挖掘的有效手段,能较好识别不同草地光谱,进而划分出不同草地种类。本研究可为基于遥感技术开展锡林郭勒草原草地资源的植被分类、调查与动态监测等提供技术支撑。
[1] 吴建付,陈功,杨红丽,等.利用高光谱技术进行草地地上生物量估测[J].草业与畜牧,2009(4):1-3.
[2] 杨红飞,李建龙,穆少杰,等.新疆三种主要草地植被类型的高光谱反射特征研究[J].草业学报,2012,21 (6):258-266.
[3] 张友水,冯学智,阮仁宗,等.基于GIS的BP神经网络遥感影像分类研究[J].南京大学学报:自然科学版,2003,39(6):806-813.
[4] 杨国鹏,余旭初,冯伍法,等.高光谱遥感技术的发展与应用现状[J].测绘通报,2008(10):1-4.
[5] 龙娟.基于光谱特征分析的野鸭湖湿地典型植物信息提取方法研究[D].北京:首都师范大学,2011.
[6] 盖颖颖,范闻捷,徐希孺,等.基于高光谱数据的呼伦贝尔草原花期物种识别和覆盖度估算[J].光谱学与光谱分析,2011,31(10):2778-2783.
[7] 林文鹏,赵敏,张翼飞,等.基于SPOT遥感影像的城市森林叶面积指数反演[J].测绘科学,2008,33 (2):57-60.
[8] 方红亮,田庆久.高光谱遥感在植被监测中的研究综述[J].遥感技术与应用,1998,13(1):62-69.
[9] 王三明,蒋军成,姜慧.基于人工神经网络理论的系统安全评价[J].工业安全与防尘,2001,27(2):27-30.
[10] 钱育蓉,贾振红,于炯,等.BP-ANN在荒漠草地高光谱分类研究中的应用[J].计算机工程与应用,2011,47(12):225-228.
Identification of Grass Species Based on Hyperspectrum——A Case Study of Xilin Gol Grassland
ZHANG Fuhua,HUANG Mingxiang,ZHANG Jing,BAO Gang,BAO Yuhai
P237
B
0494-0911(2014)07-0066-04
2014-03-03
内蒙古自然科学基金(2011BS0609;2012MS0607);内蒙古自治区科技计划(20110524);国家自然科学基金(40901233)
张富华(1987—),女,山东日照人,硕士生,研究方向为遥感与GIS应用。
黄明祥
张富华,黄明祥,张晶,等.利用高光谱识别草地种类的研究——以锡林郭勒草原为例[J].测绘通报,2014(7):66-69.
10.13474/ j.cnki.11-2246.2014.0228