高光谱图像信息检测玉米籽粒胚水分含量

2016-07-12 12:54黄文倩李江波樊书祥张保华
光谱学与光谱分析 2016年10期
关键词:光谱信息波段籽粒

田 喜,黄文倩*,李江波,樊书祥,张保华

1. 北京农业智能装备技术研究中心,北京 100097

2. 国家农业智能装备工程技术研究中心,北京 100097

3. 农业部农业信息技术重点实验室,北京 100097

4. 农业智能装备技术北京市重点实验室,北京 100097

高光谱图像信息检测玉米籽粒胚水分含量

田 喜1,2,3,4,黄文倩1,2,3,4*,李江波1,2,3,4,樊书祥1,2,3,4,张保华1,2,3,4

1. 北京农业智能装备技术研究中心,北京 100097

2. 国家农业智能装备工程技术研究中心,北京 100097

3. 农业部农业信息技术重点实验室,北京 100097

4. 农业智能装备技术北京市重点实验室,北京 100097

通过波段比和阈值相结合的方法,分别提取了玉米籽粒全表面结构和胚结构区域的1 000~2 500 nm近红外高光谱信息,研究了玉米籽粒水分含量与胚结构区域光谱关系,同时采用竞争性自适应重加权变量选择算法(CARS)、遗传算法(GA) 、连续投影算法(SPA)筛选特征波段,建立并比较偏最小二乘回归(PLS)模型对水分含量的预测效果。结果显示,玉米籽粒水分含量与胚结构区域光谱关系显著,随着水分含量的增加,光谱反射值逐渐降低。预测模型结果表明,基于玉米籽粒胚结构区域光谱信息所建立的CARS-PLS,GA-PLS和SPA-PLS回归模型预测相关系数Rp分别为0.931 2,0.917 6和0.922 7,预测均方根误差(RMSEP)分别为0.315 3,0.336 9和0.336 6,所选取的特征波段数量分别为9,14和6,较基于全表面光谱信息所建模型的特征波段数量分别少了49,12和24个,且预测效果与采用全表面光谱信息无显著差别,SPA-PLS算法为基于玉米籽粒胚结构光谱信息的水分含量预测最高效模型。提取胚结构区域所用光谱波段为1 197,1 322和1 495 nm,建立SPA-PLS回归模型所用特征波段为1 322,1 342,1 367,1 949,2 070和2 496 nm。研究结果表明,采用近红外高光谱技术进行玉米籽粒水分含量无损检测时,提取玉米籽粒胚结构的图谱信息较全表面光谱信息更高效。

高光谱成像;玉米籽粒;胚;水分;无损检测

引 言

玉米贮藏和育种等过程中,控制籽粒水分含量至关重要。玉米脱粒后胚结构裸露在外界环境中,使得玉米籽粒易受外界环境干扰,导致贮藏稳定性较低。贮藏时,为了降低玉米籽粒在库中自身代谢速率,防止过多的热量产生引起霉变,保障种子营养含量和种子活力,玉米籽粒中水分含量需要保持在13%以下非常必要[1]。此外,在育种过程中,长期在库中储存的玉米种子对环境的温湿度要求非常高,种子入库时所携带的水分含量高低对将来种子的出芽率有重要影响[2]。因此,在玉米进仓过程中,控制和检测水分含量是保证玉米种子质量的关键环节。

目前,玉米中水分含量的检测通常是采用干燥或者化学方法去除玉米籽粒中的水分,再通过计算检测出样品的含水量。这些方法虽然检测精度高,但是却破坏了种子的活性。如果玉米批量较多,就需要抽检较多样本,耗费时间和人工。近红外高光谱成像技术是传统的成像学与光谱学的巧妙融合,不仅可以获取农产品的空间信息,同时也能获得连续的光谱信息,在农产品品质的无损检测领域受到了国内外学者们的青睐[3-5]。现代高光谱成像仪具有较高的光谱分辨率,在可见近红外波段范围内可获取近千个波段光谱,但是,分辨率的提高也造成了光谱数据量巨大,且存在冗余信息,导致数据运算速度降低。因此,获得稳定且快速的预测模型,在农产品内部品质的定量与定性分析过程中选择有效的变量选择算法非常重要[6-7]。目前,利用高光谱的可见-近红外波段(400~1 000 nm)光谱数据对农产品水分含量的研究较为广泛[8-9],而近红外波段(1 000~2 500 nm)在农产品的定性判别方面研究更多些,迟茜等[10]利用近红外高光谱进行了猕猴桃早期损伤的识别和特征波段筛选,EIMasry等[11]也利用近红外高光谱对苹果的轻微损伤进行研究,谢传奇[12]等利用近红外高光谱成像技术对番茄叶片早疫病进行检测研究,并筛选出最有效果的光谱波段。而采用近红外波段的高光谱成像信息对玉米种子的水分定量分析方面还未见相关研究。

为此采用波段比和阈值结合方法提取玉米全表面区域和胚结构区域的近红外高光谱信息,对玉米籽粒水分含量进行无损检测研究,并通过相关数据处理方法获得最能反映其水分含量特征的最优波短组合,从而为基于多光谱技术在线检测玉米籽粒水分含量提供依据。

1 实验部分

1.1 样本准备

试验所用玉米品种为郑单958,样本总数300粒。为了扩大玉米籽粒样本中水分含量范围,提高预测模型的适用能力,随机选取150粒玉米放于润湿的纱布中包裹24 h,以提高样本的水分含量,此后取下纱布,将玉米粒放于室内通风环境中24 h,备用。

1.2 高光谱采集

近红外高光谱成像系统由成像光谱仪(ImSpector N25E, Spectral Imaging Ltd., Oulu, Finland)、近红外面阵CCD相机(Xeva-FPA-2.5-320(100 Hz), Xenics Ltd., Leuven, Belgium),镜头(OLES30 f-2.0/30 mm, Spectral Imaging Ltd., Oulu, Finland),面光源(一对150 W卤钨灯面光源,AT-500WB, Antefore International CO., LTD., 台湾)、移动平台、控制器和台式电脑等构成。高光谱图像数据采集参数:物距为400 mm,平台移动速度为43 mm·s-1,曝光时间为2 ms,光谱范围930~2 548 nm,入射狭缝宽度30 μm,光谱分辨率8 nm,共256个波段。为了提高采集效率,在高光谱采集前将玉米样本(具有胚结构的一侧朝上)整齐的摆放于黑色卡纸的背景板上,每块卡纸50个样本,采集6次,共300个样本。

1.3 光谱数据校正

1.4 样本水分含量测定

依据我国2008年制定的GB/T 10362—2008《粮油检验 玉米水分测定》方法中整粒玉米水分测定方法(130 ℃,38 h)测定[13]。

1.5 关键变量提取方法和模型评价

分别选用竞争性自适应重加权算法(competitive adaptive reweighted sampling, CARS)[15],遗传算法(genetic algorithm, GA)[16],连续投影算法(successive projection algorithm, SPA)[17-18]消除光谱中存在的共线性信息,减少变量数量,对筛选后的变量建立偏最小二乘回归(partial least squares regression)模型,采用校正集相关系数(Rc) 、预测集相关系数(Rp)、交叉验证均方根误差(root mean square error of cross validation,RMSECV)和预测均方根误差(root mean square error of prediction,RMSEP)等指数来比对分析与评价模型的优劣[15-16]。

2 结果与讨论

2.1 玉米籽粒全表面光谱获取

人为提取30个玉米籽粒全表面光谱和背景板光谱,分析玉米籽粒的表面和背景板光谱曲线特征发现,玉米表面光谱在1 000~2 500nm范围内光谱反射值呈现下降趋势,在1 322,1 650,1 875和2 010 nm处具有明显的反射峰值,在1 190,1 455和1 950 nm处光谱有显著吸收。为了能够快速完整地提取玉米粒的全表面光谱,研究发现1 322~1 455 nm范围内,背景板的反射光谱逐渐提升,而玉米粒表面反射光谱急速降低,因此,1 322~1 455 nm的波段比图像可以很好地解决这一问题,当λ1 322/λ1 455大于1,则为玉米光谱,λ1 322/λ1 455小于1则为背景光谱。以λ1 322/λ1 455比值是否大于1为临界值,提取所有玉米粒的表面图像,计算每个样本256个波段下所有像素的光谱平均值。

由于1 000 nm以下和2 500 nm以上波段信噪比较低,所以选取1 000~2 500 nm范围内光谱信息。图2为300个样本全表面区域1 000~2 500 nm波长范围下的光谱变化曲线。每条光谱包含237个变量,所有样本光谱曲线趋势类似,无异常样本。不同样品对近红外光的反射和吸收存在差异,1 000~2 200 nm区域存在较多的吸收和反射峰,并且这些吸收和反射峰通常为较宽的光谱带,无法直接获得与玉米水分含量相关的关键变量,必须利用有效的算法进行关键变量提取。从图中也可以看出,可能由于玉米表面或内部结构不均一等原因导致光谱区域存在较大的散射和极限漂移。因此,在对光谱进一步分析前先对原始光谱进行了中心化变换,将变换后的光谱用于随后的变量提取和建模分析。

图1 玉米籽粒全表面和黑色背景板光谱

图2 玉米籽粒全表面近红外光谱曲线

2.2 玉米籽粒全表面光谱建模

300个玉米样本的真实水分含量统计结果如表1所示。由表1可知,样本水分含量在7%~15%之间。随机选取220粒玉米作为校正集,另外80粒作为预测集。由统计结果可见,校正集范围较好的涵盖了预测集,这些特征有助于建立一个较好的预测模型。

表1 玉米籽粒样本校正集和预测集水分含量统计

将玉米全表面近红外光谱237个波段作为CARS,GA和SPA三种变量选择算法的输入变量,然后将筛选所得的波长作为PLS回归模型的输入变量,建立水分含量的预测模型。由表2的建模结果可见,利用CARS,GA和SPA三种变量选择算法分别选取了237个变量中的58,26和30个变量,其预测相关系数Rp分别为0.935 9,0.909 9和0.941 2,RMSEP分别为0.329 4,0.347 1和0.293 9,预测结果都达到了0.90以上的精度。但是,三种变量算法所选择的特征波段较多,不仅增加了运算的速度,也不利于研制在线的快速检测分析设备。这可能是由于玉米籽粒表面结构包含胚和种皮,纹理较多,信息复杂导致。此外,玉米籽粒种皮结构坚硬,反射强度大,不利于籽粒内部水分信息的提取。因此,在能够保证预测精度的前提下,为了减少特征波段的数量,又尝试对玉米籽粒表面的胚结构区域的光谱信息进行提取,建立基于玉米籽粒的胚结构区域光谱信息的水分含量预测模型。

表2 基于玉米籽粒全表面光谱信息的水分含量预测模型

Table 2 The prediction model of moisture content based on the spectra of full surface of maize kernels

建模算法变量数校正集预测集RcRMSECVRpRMSEPCARS⁃PLS580 93570 26460 93590 3294GA⁃PLS260 96310 20560 90990 3471SPA⁃PLS300 92570 27020 94120 2939

2.3 玉米籽粒胚的光谱信息提取

图3 玉米籽粒Fig.3 RGB image of maize kernel

图4 玉米籽粒胚、种皮区域和背景光谱Fig.4 Reflection spectra of maize kernel embryo,kernel peel and background

图5 玉米籽粒胚结构区域的近红外光谱曲线Fig.5 Near-infrared spectra ofmaize kernel embryo

图6 玉米籽粒胚结构区域提取过程Fig.6 Flowchart of extracting the maize kernel embryo

2.4 玉米籽粒不同水分含量下胚结构光谱响应特征

将玉米样本的水分含量按照规定排序,统计7%~9%,9%~11%,11%~13%和13%~15%区间玉米样本胚结构区域的光谱反射率,计算平均光谱。结果如图7所示,不同水分含量情况下,玉米籽粒胚结构的光谱曲线趋势相同,1 000~2 500nm范围内的近红外光谱的反射率随着水分含量的降低而升高。图8为玉米籽粒水分含量与胚结构区域光谱相关关系图,在1 000和2 500nm处具有最大负相关,在1 170,1 245,1 330,1 420和1 950nm处相关系数的绝对值具有明显峰值,前人研究表明,960,1 190和1 450nm是O—H键倍频振动吸收谱带,1 940nm表现O—H键的合频特性,都是水分含量的特征吸收波段,本研究玉米籽粒水分含量与胚结构区域光谱相关关系与前人研究较为吻合。

图7 不同水分含量的玉米籽粒其胚结构光谱曲线Fig.7 Average reflection spectra of maize kernelembryo at different moisture content levels

图8 玉米籽粒胚结构光谱与水分含量的相关性Fig.8 Correlation between reflection spectralof maize kernel embryo and moisture

这一结果表明水分对近红外光具有较强的吸收作用,近红外波段的光量子与水分中的O—H键发生作用,导致其被强烈吸收,光谱反射率减小,即水分含量越高,光谱吸收越多,反射率越低。虽然只提取了胚结构区域的光谱代表整个玉米籽粒的光谱信息,但从图7和图8结果可以说明胚结构区域的近红外光谱与水分有着较为明显的关系,可能是因为玉米籽粒中,除去胚以外的结构大部分是厚而光滑的种皮,对光谱反射较为强烈,所携带水分含量信息较少,胚结构相对较松软,有利于内部信息的提取。虽然不同水分含量使得光谱反射率有差别,但是光谱反射率差别较小,无法通过单一波段较好地判断出玉米籽粒水分含量的所属范围。

2.5 玉米籽粒胚结构光谱信息建模

将玉米胚结构区域的近红外光谱237个波段作为CARS,GA和SPA三种变量选择算法的输入变量,然后将筛选所得的波长作为PLS回归模型的输入变量,建立水分含量的预测模型。由表3的建模结果可见,利用CARS,GA和SPA三种变量选择算法分别选取了237个变量中的9,14和6个变量,其预测相关系数Rp分别为0.931 2,0.917 6和0.922 7,RMSEP分别为0.315 3, 0.336 9和0.336 6。与玉米籽粒全表面光谱相比,预测相关系数Rp无较大差别,均在0.90以上,但是CARS,GA和SPA三种变量选择算法所选取的特征变量数却较玉米籽粒全表面光谱分别减少49,12和24个。三种算法中,虽然CARS-PLS的预测结果最好,Rp=0.931 2,RMSEP=0.315 3,但是特征波段数量却比SPA算法多选用了三个,结果仅仅提高了0.009 5。对于在线设备的研制而言,较少的波段能提高运算速度,同时减少设备成本。因此,选择SPA-PLS算法为基于玉米籽粒胚结构光谱信息的水分含量预测最佳模型,所选波段如图9所示,为1 322,1 342,1 367,1 949,2 070和2 496nm,胚结构区域提取所用到的波段为1 197,1 322和1 495nm。SPA-PLS变量选择算法所得预测相关系数Rp为0.922 7,RMSEP为0.336 6(图10)。

表3 基于玉米籽粒胚结构光谱信息的水分含量预测模型

Table3Thepredictionmodelofmoisturecontentbasedonthespectraofmaizekernelembryo

建模算法变量数校正集预测集RcRMSECVRpRMSEPCARS⁃PLS90 93790 25760 93120 3153GA⁃PLS140 91370 29170 91770 3369SPA⁃PLS60 92300 28430 92270 3366

图9 SPA算法所选特征波段分布

Fig.9 Distribution of variables selected by SPA for prediction of moisture content on the spectra of kernel embryo

3 结 论

采用波段比和阈值结合的方法提取出玉米全表面结构和胚结构近红外高光谱信息,结合竞争性自适应重加权变量选择算法、连续投影算法、遗传算法应用于玉米籽粒的水分含量预测。主要结论有:

图10 基于SPA-PLS的水分含量预测结果散点图

(1)胚结构区域的光谱与水分含量具有较强的相关性,近红外波段的光量子与水分中的O—H键发生作用,导致被强烈吸收,光谱反射率减小,即水分含量越高,光谱吸收越多,反射率越低。

(2)基于玉米籽粒胚结构区域的光谱信息所建立的CARS,GA和SPA三种变量选择模型预测结果Rp分别为0.931 2,0.917 6和0.922 7,RMSEP分别为0.315 3,0.336 9和0.336 6,所选取的特征波段数量分别为9,14和6。

(3)选择SPA-PLS算法为基于玉米籽粒胚结构光谱信息的水分含量预测最高效模型,建模所用特征波段为1 322,1 342,1 367,1 949,2 070和2 496 nm,胚结构区域光谱提取所用波段为1 197,1 322和1 495 nm。

结果表明玉米籽粒胚结构的近红外(1 000~2 500 nm)光谱信息用于检测玉米水分含量较全表面光谱信息更高效,对在线式玉米水分含量筛选设备研制更为优越,为设备研制提供了理论依据。

[1] LI Ping(李 萍). The Technology of Corn Storage(玉米贮藏技术),2012,(7):45.

[2] LIU Guo-liang,ZHU Chen(刘国良,祝 臣). Agricultural Science & Technology and Equipment(农业科技与装备),2009,(3):120.

[3] Ariana D,Lu R,Guyer D E. Computers and Electronics in Agriculture,2006,53(1):60.

[4] Qiao J,Ngadi M,Wang N,et al. International Journal of Food Engineering,2007,3(1):1.

[5] Huang Wen-qian,Li Jiang-bo,Zhang Chi,et al. Transactions of the Chinese Society of Agricultural Engineering,2012,28(Supp. 2):243.

[6] WANG Yu-liang,LIU Xian-xi,SU Qing-tang,et al(王玉亮,刘贤喜,苏庆堂,等). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报),2010,26(6):199.

[7] HUANG Min,ZHU Xiao,ZHU Qi-bing,et al(黄 敏,朱 晓,朱启兵,等). Acta Photonica Sinica(光子学报),2012,41(7):868.

[8] LI Jing-bo,SU Yi-nan,RAO Xiu-qin(李江波,苏忆楠,饶秀勤). Packaging and Food Machinery(包装与食品机械),2008,28(6):1.

[9] JI Rong-hua,ZHENG Li-hua,DENG Xiao-lei,et al(冀荣华,郑立华,邓小蕾,等). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报),2014,45(8):269.

[10] CHI Qian,WANG Zhuan-wei,YANG Ting-ting,et al(迟 茜,王转卫,杨婷婷,等). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报),2015,46(3):235.

[11] ElMasry G,Wang N,Vigneault C,et al. LWT-Food Science and Technology,2008,41(2):337.

[12] XIE Chuan-qi,FANG Xiao-rong,SHAO Yong-ni,et al(谢传奇,方孝荣,邵咏妮,等). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报),2015,46(3):315.

[13] GB/T10362—2008,粮油检测 玉米水分测定.

[14] SHAN Jia-jia,PENG Yan-kun,WANG Wei,et al(单佳佳,彭彦昆,王 伟,等). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报),2011,42(3):140.

[15] FAN Shu-xiang,HUANG Wen-qian,LI Jiang-bo,et al(樊书祥,黄文倩,李江波,等). Spectroscopy and Spectral Analysis(光谱学与光谱分析),2014,34(10):2707.

[16] ZOU Xiao-bo,ZHAO Jie-wen(邹小波,赵杰文). Acta Optica Sinica(光学学报),2007,27(7):1316.

[17] WU Di,NING Ji-feng,LIU Xu,et al(吴 迪,宁纪锋,刘 旭,等). Food Science(食品科学),2014,35(8):57.

[18] Li Jiangbo,Huang Wenqian,Chen Liping,et al. Food Analytical Methods,2014,7(9):1891.

(Received Dec. 1, 2015; accepted Mar. 17, 2016)

*Corresponding author

Measuring the Moisture Content in Maize Kernel Based on Hyperspctral Image of Embryo Region

TIAN Xi1,2,3,4,HUANG Wen-qian1,2,3,4*,LI Jiang-bo1,2,3,4,FAN Shu-xiang1,2,3,4,ZHANG Bao-hua1,2,3,4

1. Beijing Research Center of Intelligent Equipment for Agriculture, Beijing 100097, China

2. National Research Center of Intelligent Equipment for Agriculture, Beijing 100097, China

3. Key Laboratory of Agri-informatics, Ministry of Agriculture, Beijing 100097, China

4. Beijing Key Laboratory of Intelligent Equipment Technology for Agriculture, Beijing 100097, China

Maize is among the most important economic corps in China while moisture content is a critical parameterin the process of storage and breeding. To measure the moisture content in maize kernel, a near-infrared hyperspectral imaging system has been built to acquire reflectance images from maize kernel samples in the spectral region between 1 000 and 2 500 nm. Near-infrared hyperspectral information of full surface and embryo of maize kernel were firstly extracted based on band ratio coupled with a simple thresholding method and the spectra analysis between moisture content in maize kernel and embryo was performed. The characteristic bands were then selected with the help of Competitive Adaptive Reweighted Sampling (CARS), Genetic Algorithm (GA) and Successive Projection Algorithm (SPA). Finally, these selected variables were used as the inputs to build Partial Least Square (PLS) models for determining the moisture content of maize kernel. In this study, a significant relation, which the spectral reflectance decreases as moisture content increase, between moisture content and spectral of embryo in maize kernel was observed. For the investigated independent test samples, all the proposed regression models, namely CARS-PLS, GA-PLS and SPA-PLS, achieved a good performance by using the information of embryo region. The correlation coefficient (Rp) and Root Mean Squared Error of Prediction (RMSEP) and number of characteristic wavelength for the prediction set were 0.931 2, 0.315 3, 9 and 0.917 6, 0.336 9, 14 and 0.922 7, 0.336 6, 16 for CARS-PLS, GA-PLS and SPA-PLS models, respectively. And, compared with models obtained by full surface spectral information, less characteristic wavelengths is used for development of CARS-PLS, GA-PLS and SPA-PLS models, while similar results were obtained. Comprehensively analyzing to both model accuracy and model complexity, SPA-PLS model by using embryo region information achieved the best result. Wavelengths at 1 197,1 322 and 1 495 nm were applied to extracted the information of embryo region, and the bands at 1 322, 1 342, 1 367, 1 949, 2 070 and 2 496 nm were used to establish the SPA-PLS model. These results demonstrated that near-infrared hyperspectral information from embryo region is more effective for determination of moisture nondestructive in maize kernel.

Hyperspectral imaging;Maize kernel;Embryo;Moisture content;Nondestructive determination

2015-12-01,

2016-03-17

北京市自然科学基金青年基金项目(6144024),北京市农林科学院青年科研基金项目(QNJJ201528)资助

田 喜,1988年生,北京农业智能装备技术研究中心硕士研究生 e-mail:tianx@nercita.org.cn *通讯联系人 e-mail: huangwq@nercita.org.cn

S123

A

10.3964/j.issn.1000-0593(2016)10-3237-06

猜你喜欢
光谱信息波段籽粒
最佳波段组合的典型地物信息提取
籽粒苋的饲用价值和高产栽培技术
籽粒苋产量低的原因及高产方法
基于光谱和Gabor纹理信息融合的油桃品种识别
玉米机械脱粒籽粒含水量与破碎率的相关研究
基于PLL的Ku波段频率源设计与测试
基于植被光谱信息的龟裂碱土碱化程度预测研究
小型化Ka波段65W脉冲功放模块
傅立叶变换光谱仪的研究现状与光谱信息分析原理
牡丹籽粒发育特性与营养成分动态变化的研究