孙 梅, 黄 宇 , 陈兴海, 刘业林, 苏秋城
(北京工商大学人工智能学院1,北京 100048) (北京卓立汉光仪器有限公司2,北京 101102) (四川双利合谱科技有限公司3,成都 610016)
小麦是世界分布范围最广的粮食作物之一,据中华人民共和国统计局统计,2011年我国冬小麦播种面积达2.46亿公顷,冬小麦产量128 188万t,在我国小麦的种植面积和产量仅次于水稻。小麦种子的发芽率对小麦的增产增收至关重要,而小麦种子的发芽率与小麦种子的储藏年份有着密切关系,一般而言,随着储藏年份的增加,小麦种子的发芽率降低,因此小麦种子的储藏年份的鉴别研究具有重要意义。传统鉴别小麦种子储藏年份的方法靠经验丰富的农艺家闻种子的味道,看种子的成色,这样的方法费时费力,而且误差较大[1,2]。成像高光谱技术融合了图形技术和光谱技术的优势,能够同时获取反映待测样本外部特征、内部物理结构及化学成分的图像信息和光谱信息,已经被广泛应用到农产品无损检测领域,比如农作物信息诊断[3]、农药残留检测[4]、内外部品质预测等[5-7],在种子检测方面,Zhu等[8]利用高光谱成像技术采集单粒小麦种子平均光谱信息,结合 SIMCA 方法建立6个品种的鉴别模型,识别率能达到 93%,吴静珠等[9]研究也表明高光谱成像技术在小麦籽粒蛋白的预测建模中有比较好的效果。本研究以小麦种子为例,利用成像高光谱技术鉴定小麦种子的年份,为农产品时间鉴定提供一种新的技术参考。
本实验以四川粮食所提供的小麦种子为研究对象,利用高光谱分选仪(光谱范围400~1 000 nm)采集测试对象的高光谱数据,以鉴别不同年份的小麦种子。
高光谱成像数据采集采用Gaia Sorter高光谱分选仪系统。该系统主要由高光谱成像仪(V10E)、CCD 相机、光源、暗箱、计算机组成,结构图与实景图如图1。实验仪器参数设置如表1。
表1 GaiaSorter 高光谱分选仪系统参数
图1 GaiaSorter 高光谱分选仪结构图与实景图
对成像高光谱分选仪采集的小麦原始影像数据进行数据的预处理,预处理过程主要包括两部分:第一部分是辐射定标;第二部分为噪声去除。
首先进行辐射定标。辐射定标的计算公式如式(1)所示。
(1)
式中:Reftarget为目标物的反射率;Refpanel为标准参考板的反射率;DNtarget为原始影像中目标物的数值;DNpanel为原始影像中标准参考板的数值;DNdark为成像光谱仪系统误差。
其次是噪声去除,运用国外较为常用的最小噪声分离方法(Minimum Noise Fraction Rotation, MNF)进行噪声去除。最小噪声分离工具用于判定图像数据内在的维数(即波段数),分离数据中的噪声,减少随后处理中的计算需求量。MNF本质上是两次层叠的主成分变换。第一次变换(基于估计的噪声协方差矩阵)用于分离和重新调节数据中的噪声,这步操作使变换后的噪声数据只有最小的方差且没有波段间的相关。第二步是对噪声白化数据(Noise-whitened)的标准主成分变换。为了进一步进行波谱处理,通过检查最终特征值和相关图像来判定数据的内在维数。数据空间可被分为两部分:一部分与较大特征值和相对应的特征图像相关,其余部分与近似相同的特征值以及噪声占主导地位的图像相关。本研究的高光谱影像数据经过MNF变换后,各波段光谱噪声显著降低,光谱曲线更加平滑。
图2为不同年份的小麦种子的高光谱图像RGB合成图。图2a为1995、2008、2009、2010、2011、2012、2013、2014年共8年的小麦种子,图2b为2010、2011、2012、2013、2014年共5年的小麦种子。
图2 小麦种子的RGB图像
根据数据分析的需要,分别截图含小麦区域的高光谱影像数据,并利用小麦种子与背景的光谱差异性,提取纯小麦种子,如图3所示。
图3 纯小麦种子的RGB图像
为了更为客观地分析不同年份的小麦种子的内部信息,对经预处理后的高光谱数据进行主成分分析(Principal Component Analysis, PCA),去除波段之间的多余信息、将多波段的图像信息压缩到比原波段更有效的少数几个转换波段下。一般情况下,第一主成分包含波段中的80%的方差信息,前三个主成分包含了所有波段的中95%以上的信息量。由于各波段之间的不相关,主成分波段可以生成更多颜色、饱和度更好的彩色合成图像。图3为不同年份小麦种子高光谱影像PCA的合成彩色图。从图3a可知,除2011年外,其他年份的小麦种子总体颜色呈规律变化;从图3b可知,除2012年外,其他年份的小麦种子总体颜色也呈规律变化。
PCA变换的RGB彩色合成,可以更客观地看到不同年份小麦种子在图像显示上的差别,为了进一步分析不同年份小麦种子的差别,分别提取不同年份的小麦种子,在提取不同年份小麦种子的基础上分别提取其均值、标准差等特征,不同年份的小麦种子的均值、标准差变化如图4所示。
图4 小麦种子的PCA合成图(前三主成分)
无论是小麦种子的均值或标准差,其不同年份的小麦种子光谱曲线非常一致。从均值来看,在500 nm处不同年份的小麦种子区分相对明显;从标准差来看,700 nm处不同年份的小麦种子区分相对明显。因此本研究利用这两波段分别构建NDVI和EVI光谱指数,NDVI和EVI的计算公式如式(2)、式(3)所示。
(2)
(3)
通过分析NDVI、EVI两个光谱指数与其相对应年份的曲线变化可知,除去异常年份2011年的小麦种子外,无论是NDVI还是EVI光谱指数,随着小麦种子收藏年份的增加,从总体变化趋势来看,其NDVI和EVI值增加。
以NDVI光谱指数为例,分析不同年份小麦种子之间的图像显示差异。从图5可知,图5a除2011年,图5b除2012年,其他年份的小麦种子图像显示颜色呈规律变化。以NDVI图为例,年份越久的小麦种子呈蓝色,年份处于中间年份为绿色,最近年份的呈红色。
综合分析小麦种子的PCA的彩色合成、NDVI密度分割图图和NDVI、EVI与年份之间的变化曲线可知, 2011年和2012年的小麦种子与整体的变化趋势不一样,故在分析NDVI、EVI与年份之间的关系时,删除异常年份数据对数据分析结果的干扰。
图5 不同年份小麦种子的NDVI密度分割图
图5a的1995年、2008年、2009年、2010年、2012年、2013年和2014年共7年的小麦种子为建模数据,图5中2010年、2011年、2013年和2014年共4年的小麦种子为检验数据,利用NDVI和EVI光谱指数构建小麦种子的年份预测模型,并验证模型的可靠性。
本文通过建立NDVI、EVI光谱指数与其相对应年份的散点图及其趋势线可知,NDVI与其对应年份的决定系数为0.762 4,建模模型为y=-118.48x+ 2 051.5(其中y为年份,x为NDVI值);EVI与其对应年份的决定系数为0.858 5,y=-9.312x+2 027.7(其中y为年份,x为EVI值),从预测模型的决定系数看,EVI与其相对应年份构建的模型精度更高。
分别利用NDVI预测小麦种子年份的模型y=-118.48x+2 051.5和EVI预测小麦种子年份的模型y=-9.312x+2 027.7预测图5b的2010年、2011年、2013年和2014年共4年的小麦种子的年份。NDVI光谱指数预测2010年、2011年、2013年和2014年的小麦种子年份决定系数为0.970 2;EVI光谱指数预测2010年、2011年、2013年和2014年的小麦种子年份决定系数为0.983 8。如预测年份取整数部分,无论是NDVI还是EVI,其预测年份与实际年份完全一致,如取四舍五入取整,NDVI构建的模型预测小麦年份分别为2010年、2012年、2013年和2015年,即有两年(2011年和2014年)的预测年份超过实际年份1年;EVI构建的模型预测年份分别为2011年、2011年、2013年和2014年,即有1年(2010年)的预测年份超过实际年份1年。从预测结果看,EVI光谱指数构建的模型预测小麦种子年份精度高于NDVI光谱指数。
对成像高光谱分选仪采集的小麦原始影像数据进行数据的预处理,即辐射定标和噪声去除。其中利用MNF方法进行噪声去除。为了将多波段的图像信息压缩到比原波段更有效的少数几个转换波段下,我们对经预处理后的高光谱数据进行主成分分析(Principal Component Analysis, PCA),根据均值和标准差两个参数的分析,最后选择了可见光波段的500 nm和700 nm分别构建NDVI和EVI光谱指数,随着小麦种子收藏年份的增加,其NDVI和EVI值增加。NDVI与其对应年份的决定系数为0.7624,EVI与其对应年份的决定系数为0.8585,从而可知,EVI与其相对应年份构建的模型的决定系数高于NDVI。所以得到的了NDVI的建模模型y=-118.48x+2 051.5和EVI的建模模型y=-9.312x+2 027.7,利用建模模型来预测2010、2011、2013、2014共4年的小麦种子的年份,无论是NDVI还是EVI,其预测年份与实际年份完全一致,如取四舍五入取整,NDVI构建的模型有两年的预测年份超过实际年份1年,EVI构建的模型则有1年的预测年份超过实际年份1年。