臧 卓 ,林 辉 ,杨敏华
(1. 中南林业科技大学 林业遥感信息工程研究中心,湖南 长沙 410004;2. 中南大学 信息物理工程学院,湖南 长沙 410083)
基于色素含量的针叶树种敏感波段提取研究
臧 卓1,2,林 辉1,杨敏华2
(1. 中南林业科技大学 林业遥感信息工程研究中心,湖南 长沙 410004;2. 中南大学 信息物理工程学院,湖南 长沙 410083)
通过分析马尾松、杉木主要色素和冠层光谱数据的相关关系提取敏感波段,然后利用7种分类算法对所提取波段进行分类,最后对高斯合并后的光谱数据进行分类,用以测试提取波段的可推广性。结果表明:马尾松和杉木的差异主要是受叶绿素的影响,并且2种针叶树种的敏感波段位于401~504 nm和659~686 nm;用于区分2种针叶树种高光谱数据的最佳分类方法为Fisher分类法,最高分类精度达到了100%;模拟成像光谱数据的高斯合并数据抑制了高频噪声,但也过滤掉了2种针叶树种光谱数据的细微差异,分类精度降低,为70%~80%,而叶绿素所提取波段仍然优于其它色素提取的波段,这说明401~504 nm和659~686 nm波段具有可推广和进一步研究的价值。
高光谱;色素含量;波段提取;针叶树种;黄丰桥林场
植被的遥感监测往往是基于其反射光谱特性。由于植被在可见光区域的光谱特征主要是受植被色素(叶绿素和类胡萝卜素)的影响,在近红外区域的光谱特征则主要受叶子内部结构、生物量、蛋白质、纤维素等的影响[1-2],因此,可以利用植被冠层和叶片的反射光谱来估算其生化参数,特别是色素含量[3-6]。高光谱遥感技术,由于其具有波段多且窄的特点,能直接对植被进行微弱光谱差异的定量分析,使植被精准化监测成为可能。
以往的研究主要采用多元统计回归分析方法、植被指数法等方法,利用光谱特征,采用不同波段组合或波段位置等与植被生化组分之间建立相关关系,进而反演植被生化组分[7-9]。1998年Blackburn提出的特定色素简单比值指数和特定色素归一化差值指数在利用光谱测量值评价4种阔叶树种的色素浓度时,精度明显优于常规的比值植被指数和归一化差值植被指数,显示了高光谱数据在测定生化参数方面的巨大潜力[10-11]。刘秀英等[12-13]通过分析樟树幼林生化成分与光谱特征的关系,结果表明各种色素含量与高光谱特征参数之间的相关性较好,对叶绿素含量敏感的光谱波段为400、556、621 nm,而纤维素含量、总氮含量与高光谱特征参数之间的相关性比较弱。万玲凤等[14]研究樟树幼林生物化学参数与高光谱特征参数间的相关系数达到了0.01极显著性检验水平,可以建立高光谱生化成分遥感估算模型。林辉等[15]通过对高光谱遥感特征参数与樟树幼林叶绿素a含量间统计相关分析,建立了高精度的樟树幼林叶绿素a含量估算模型。这些研究虽然提取了较好的敏感波段用于生化成分的反演,但是至今鲜有人研究是否能用于针叶树种间的差异波段的提取。本研究通过分析植被色素与高光谱数据的相关关系,提取敏感波段,再利用常用的7种分类方法(SVM-RBF、BP神经网络、马氏距离、Bayes、Fisher判别法、SAM、SVM-Linear)对所提取波段进行分类,最后对高斯合并后的光谱数据进行分类,用以测试提取波段的可推广性。
试验地点:株洲市攸县黄丰桥国有林场,位于湖南省中东部。
观测内容:选取当地的主要用材林树种——杉木Cunninghamia lanceolata、马尾松Pinus massoniana为对象进行冠层高光谱反射率测定,同时采集部分样本,带回实验室进行叶片的生化参数测定。
使用美国ASD公司(Analytical Spectral Devices Inc)制造的ASD FieldSpec HandHeldTM地物光谱仪对杉木、马尾松冠层叶片光谱进行测定。测量时为减小太阳高度角变化对光谱测量结果的影响,外业测量时间选择在中午10:00~14:00。测量时每隔15 min左右进行一次标准板(标准白板)的校正,并且测量时仪器探头保持垂直向下,每个采样点测量光谱30次。
光谱测定周期为1 a,分别于2010年3月、4月、6月、8月、9月、10月、12月及2011年3月,分8次(每季度2次),共采集数据257条。
从以上257条数据中随机选取200条作为训练集,57条作为测试集。
利用野外光谱辐射仪对光谱数据测定之后,采集仪器现场范围内5~8个营养小枝样本,置于保鲜袋中,并及时进行色素含量提取。叶绿素及类胡萝卜素的含量采用分光光度法测定,叶黄素的含量根据标准曲线回归方程求得。对于所有的化学分析,浓度可表示成每单位样品干重之重量(mg/g)。有关实验室这些化学成分的详细过程参见文献[12-13]。
高光谱数据的平滑去噪采用的是常用的S.Golay方法。光谱仪对原始数据在700 nm处的光谱分辨率为3.5 nm,实际获得的数据是通过ASD ViewSpecPro软件导出的1 nm间隔的采样数据。由于光谱在400 nm以前和925 nm以后噪声较大,因此本研究选用400~925 nm范围的反射光谱波段作为有效光谱数据进行分析。
利用测得的马尾松和杉木主要色素含量与对应的高光谱反射数据进行相关分析,提取置信度达到90%以上的相关波段。
为了了解所提取的波段对2种树种的区分是否具有推广价值,可假设在这些提取的波段范围内设置一个成像遥感的传感器,此时传感器所接收到的辐射能量可以用公式(1)[16]表示:
式(1)中:F(λ)是辐射能量;Γ(λ)为光谱响应函数。
为模拟成像光谱传感器所获取的树种反射率数据,将式(1)的辐射能量用反射率代替,光谱响应函数用高斯曲线来代替,因此将公式(1)可变换成式(2):
式(2)中:s和e分别为被合并波段的起始和结束波长;R0(λ)是光谱反射率;G(λ)为高斯曲线;Δλ代表高光谱数据间隔,本研究中为1 nm。
采用SVM-RBF、BP神经网络、马氏距离、Bayes、Fisher判别法、SAM、SVM-Linear对所提取的高光谱敏感波段数据及高斯合并后的数据进行分类,测试选择的波段是否具有代表性,是否为有效区分树种的差异波段。
由图1可知,2种针叶树种(马尾松和杉木)的反射率极为相似(这里的“反射率”是指经滤波之后的ASD采集的反射率),2种针叶树种的反射光谱都具有明显的“峰”和“谷”的特征,在近红外波段光谱反射率值随波长的增加而急剧升高,形成一高的反射平台。在绿光波段有一个小反射峰,位于550 nm附近;在反射峰前后有2个叶绿素吸收谷。
图1 平滑去噪后杉木和马尾松光谱反射率Fig.1 Spectral ref l ection rate of C. lanceolata and P.massoniana after noise smoothing
3.2.1 叶绿素总含量与反射率的相关分析
叶绿素总含量与光谱反射率之间的相关系数如图2所示。在400~510 nm和630~700 nm范围,叶绿素总含量与光谱反射率之间存在显著的正相关关系,这是叶绿素在400~500 nm、630~680 nm这2个波段的强烈吸收造成的。在401~504和659~686 nm这2个波段范围内,叶绿素总含量与光谱反射率之间的相关系数达到了0.01极显著检验水平。
图2 叶绿素总含量与反射率的相关系数Fig.2 Correlation coeff i cients between total chlorophyll content and ref l ection rate
3.2.2 叶绿素a含量与反射率的相关分析
叶绿素a含量与光谱反射率之间的相关系数如图3所示。波长在400~510 nm和630~700 nm范围,叶绿素a含量与光谱反射率之间存在显著的正相关关系。在401~506和655~687 nm这2个波段范围内,叶绿素a含量与光谱反射率之间的相关系数达到了0.01极显著检验水平。
图3 叶绿素a含量与反射率的相关系数Fig.3 Correlation coeff i cients between chlorophyll (a)content and ref l ection rate
3.2.3 叶绿素b含量与反射率的相关分析
叶绿素b含量与光谱反射率之间的相关系数如图4所示。在400~510 nm和650~700 nm范围内,叶绿素b含量与光谱反射率之间存在显著的正相关关系。在401~501 nm和674 nm这2个波段范围内,叶绿素b含量与光谱反射率之间的相关系数达到了0.01极显著检验水平。
图4 叶绿素b含量与反射率的相关系数Fig.4 Correlation coeff i cients between chlorophyll (b)content and ref l ection rate
3.2.4 类胡萝卜素含量与反射率的相关分析
类胡萝卜素含量与光谱反射率之间的相关系数如图5所示。在530~559 nm范围内,类胡萝卜素与光谱反射率的相关系数达到0.01显著检验水平,在550 nm左右出现一个反射谷。在700~900 nm红外光范围内,类胡萝卜素含量与光谱反射率之间存在显著的负相关关系。在739~758 nm和761~797 nm这2个波段范围内,类胡萝卜素含量与光谱反射率之间的相关系数达到了0.01极显著检验水平。与叶绿素含量相比,类胡萝卜素含量与光谱反射率之间的相关系数均较小。
图5 类胡萝卜素含量与反射率的相关系数Fig.5 Correlation coeff i cients between carotenoid content and ref l ection rate
3.2.5 叶黄素含量与反射率的相关分析
叶黄素含量与光谱反射率之间的相关系数如图6所示。叶黄素与光谱反射率之间存在负相关关系;在535~562 nm和700~925 nm 2个波段范围内,叶黄素含量与光谱反射率之间的相关系数达到了0.1显著检验水平;在706~756 nm和766~785 nm 2个波段范围内,叶黄素含量与光谱反射率之间的相关系数达到了0.05较显著检验水平。与叶绿素含量相比,叶黄素含量与光谱反射率之间的相关系数也较小。
图6 叶黄素含量与反射率的相关系数Fig.6 Correlation coeff i cients between xanthin content and ref l ection rate
通过对分类结果的对比分析(见表1)发现,通过对叶绿素含量与植被反射光谱进行相关分析所提取的波段要优于利用类胡萝卜素和叶黄素进行相关分析所提取的波段。这说明2种针叶树种的光谱差异主要受叶绿素的影响,结合3.2节的波段提取结果,可以发现2种针叶树种的差异波段主要集中在401~504 nm和659~686 nm范围。这个结果显示用来区分2种针叶树种的主要波段集中在可见光部分,并不是植被反射率较高的近红外波段,近红外波段和红光波段的巨大差异是植被与其它地物区别的主要特征,但不同植被之间的差异还是主要集中在叶绿素吸收比较强的可见光波段,这与宫鹏等人[10-11]的研究结果“利用对数变换后的针叶树种反射率数据分类精度明显优于其它变换方法”有一定的印证作用,因为经过对数变换可以放大针叶树种高光谱反射率数据的可见光波段的差异。
比较分析7种分类算法的分类精度,发现SVM-RBF、BP神经网络、Fisher分类法要明显优于其它4种分类算法,尤其是Fisher分类算法在某些情况下分类精度甚至达到了100%。通过对上述分类结果的对比发现,虽然对利用叶绿素所提取的波段的分类结果令人满意,但仍然很难将其推广,因为在所提取的波段范围内仍然有非常多的数据。因此,本研究将所提取的波段利用高斯函数进行合并,将所提取的每个波段合并成一个值,然后再利用7种分类算法进行分类,测试是否能够获取可推广的结果。
表1 7种分类结果对比Table 1 Comparisons among 7 classification results
表2中的分类结果与表1中的类似,利用叶绿素所提取的波段要明显优于利用类胡萝卜素和叶黄素所提取的结果,说明所提取的波段具有可推广和进一步研究的价值。但是分类结果并不像波段合并前那么理想,除Bayes和SVM-Linear算法外,其它5种分类算法的分类结果没有明显差异,对叶绿素提取波段最优分类精度维持在70%至80%之间。这说明虽然区分2种针叶树种的敏感波段在401~504 nm和659~686 nm范围,但它们的区分非常细微,通过模拟成像光谱数据的高斯合并方式已经将这种细微的差异给过滤掉了,因此分类精度明显地降低了。通过高光谱仪测得的数据,可以把它看作是成像光谱数据上的纯净像元,如果纯净象元的分类精度都只有80%左右的时候,那么成像光谱数据中的其它混合像元的分类精度会进一步降低,这也正是Spot、TM、Quick bird等多光谱数据很难将针叶树种有效区分的主要原因。
表2 高斯合并后7种分类结果对比Table 2 Comparisons among 7 classification results after combined by Gaussian method
通过对2种针叶树种的主要色素含量与其相对应的光谱反射率的相关分析,得出以下结论:
(1)用于区分马尾松和杉木的波段集中在401~504 nm和659~686 nm范围,主要是叶绿素的吸收波段。
(2)7种分类算法中,最适合区分2种针叶树种高光谱数据的算法是Fisher算法,SVM-RBF和BP神经网络也可以获取较理想的结果。
(3)高斯合并后数据的分类精度中,叶绿素所提取的波段401~504 nm和659~686 nm仍然明显优于其它波段,这说明此波段具有可推广和进一步研究的价值。
此次研究分析了2种针叶树种主要色素与相对应反射率的关系,并通过相关分析方法,大大降低了数据的维度,将用于区分2种针叶树种的原有高光谱数据的波段限定在了401~504 nm和659~686 nm之间,这对于利用遥感技术准确提取地物具有重要意义。但本研究所提取的波段仍然比较宽,通过高斯合并后树种分类精度可达80%,这说明用于区分2种树种的最敏感波段还可以进一步通过分析Fisher和SVM-RBF 2种算法的判别式来获取,这也是敏感波段进一步提取的方向。
[1] Gausman H W, Allen W A, Cardenas R. Relation of light ref l ectance to histological and physical evaluations of cotton leaf maturity [J] . Applied Optics, 1970,9: 545-552.
[2] Sims D A, Gamon J A. Relationships between leaf pigment content and spectral ref l ectance across a wide range of species,leaf structures and developmental stages[J]. Remote Sensing of Environment, 2002, 81: 337-354.
[3] Card D H, Peterson D L, Matson P A. Prediction of leaf chemistry by the use of visible and near infrared reflectance spectroscopy[J]. Remote Sensing of Environment, 1988, 26: 123-147.
[4] Thomas J R, Gausman H W. Leaf ref l ectance vs leaf chlorophyll and carotenoid concentrations for eight crops[J]. Agron. J., 1977,60: 799-802.
[5] Datt B. Remote sensing of chlorophyll a, chlorophyll b,chlorophyll a + b, and total carotenoid content in eucalyptus leaves[J]. Remote Sensing of Environment, 1998, 66: 111-121.
[6] Blackburn G A. Relationships between spectral ref l ectance and pigment concentrations in stacks of deciduous broadleaves[J].Remote Sensing of Environment, 1999,70: 224-237.
[7] 浦瑞良,宫 鹏.森林生物化学与CASI高光谱分辩率遥感数据的相关分析[J].遥感学报, 1997, (2):115-123.
[8] Gitelson A A, Merzlyak M N. Signature analysis of leaf ref l ectance spectra: algorithm development for remote sensing of chlorophyll[J]. J. Plant Physicalogy, 1996,148:494-500.
[9] Gitelson A A, Merzlyak M N. Remote estimation of chlorophyll content in higher plant leaves[J]. International Journal of Remote Sensing, 1997,18:2697-2697.
[10] 宫 鹏,浦瑞良,郁 彬.不同季相针叶树种高光谱数据识别分析[J].遥感学报, 1998, (3): 212-217.
[11] 浦瑞良,宫 鹏 .高光谱遥感及其应用[M].北京:高等教育出版社, 2000:82-98.
[12] 刘秀英,林 辉. 森林树种高光谱波段的选择[J].遥感信息,2005,(4):32-37.
[13] 刘秀英,林 辉,万玲凤,等. 樟树幼林叶绿素含量的高光谱遥感估算模型[J].中南林业科技大学学报, 2007,27(4):49-56.
[14] 万玲凤,林 辉,刘秀英.樟树幼林生物化学参数与高光谱遥感特征参数相关关系[J].中南林业科技大学学报,2007,27(4): 44-48.
[15] 林 辉,刘秀英.基于高光谱特征参数的樟树幼林叶绿素a含量估算模型[J].绵阳师范学院学报, 2008,27(8):1-5.
[16] 沈 宏,沈 芳.光谱响应函数和带宽对光学复杂Ⅱ类水体离水辐射反射率的影响[J].红外,2012,33(4):31-37.
Sensitive band range extraction research for coniferous species based on plant pigment content
ZANG Zhuo1,2, LIN Hui1, YANG Min-hua2
(1. Research Center of Forestry Remote Sensing & Information Engineering, Central South University of Forestry & Technology, Changsha 410004, Hunan, China; 2.School of Info-Physics and Geomatics Engineering, Central South University, Changsha 410083, Hunan, China)
Through analyzing the relation between the spectral ref l ectance of canopy and the pigment content, the sensitive band ranges of Cunninghamia lanceolata and Pinus massoniana were extracted. Then the data of band ranges selected were classif i ed by seven classification algorithms including Support Vector Machine (SVM)-Radial Basis Function (RBF), BP neural network, Mahalanobis Distance, Bayes, Fisher, Support Vector Machine (SVM)-Linear, and Spectral Angle Mapping (SAM). In order to test the dependability and popularization of bands selected, the data after Gauss merge process were classif i ed. The results show that the difference of C.lanceolata and P. massoniana was largely inf l uenced by chlorophyll. The sensitive band ranges for two conifers situated at 401~504 nm and 659~686 nm. By comparing seven methods, Fisher classif i cation method have best performance, their maximum precision of classif i cation were 100%. The data after Gauss merge process that modeled the imaging spectrometer data suppressed the high-frequency noise impact, but the subtle differences of two conifers were fi ltered out, so the precision of classif i cation came down to 70% ~ 80%. The performance of chlorophyll could be better than other pigment. It is proved that the band ranges of 401~504 nm and 659~686 nm had good generalizability and further research value.
hyper-spectral; pigment content; band range extraction; conifer; Huangfengqiao forest farm
S771.8
A
1673-923X(2013)01-0035-06
2012-10-21
国家自然科学基金资助项目(30871962);国家重大专项项目(E0305/1112/02);“十二五”国家高技术研究发展计划(863计划)课题(2012AA102001):“数字化森林资源监测关键技术研究”;林业公益性行业科研专项(201104028):“林分结构与生长模拟技术研究”;湖南省高校科技成果产业化培育项目(11CY019)
臧 卓 (1978-),男,辽宁锦州人,讲师,博士研究生,研究方向:高光谱遥感;E-mail: zangzhuo@hotmail.com
[本文编校:谢荣秀]