基于高光谱图像的玉米种子产地与年份鉴别

2014-12-25 02:27王庆国朱启兵
食品与生物技术学报 2014年2期
关键词:玉米种子年份产地

王庆国, 黄 敏*, 朱启兵, 孙 群

(1.江南大学 轻工过程先进控制教育部重点实验室,江苏 无锡214122;2.中国农业大学 农学与生物技术学院,北京 100193)

玉米(Zea mays L.)是世界总产量最高的粮食作物和主要的畜牧业饲料来源,也是粮食作物中用途最广、可开发产品最多和用量最大的工业原料,因此确保玉米的质量安全显得尤为重要[1]。在玉米等农产品的质量与安全监督方面,包括中国在内的许多国家和国际组织要求对进口的玉米等农产品必须标明原产地,并相继间建立了完整的质量追溯体系及相关立法。例如,欧盟自1997的疯牛病事件起便开始建立食品质量安全追溯体系,世界卫生组织与联合国粮食及农业组织在2004年合作建立了国际食品安全当局网络,美国也要求所有与食品生产有关的企业在2006年必须建立食品质量安全可追溯制度[2-3],以便在发生食品安全事故时迅速确定事故源头并及时进行召回。因此,对农产品源产地的鉴别研究具有重要的实际意义。同时,为了保障粮食消费需求、维护粮食市场稳定以及应对重大自然灾害等突发事件,世界各国也都制定了健全的粮食储备计划。我国要求每年按储备规模的1/3进行轮换,即市场上流通的粮食是来自于不同年份的,因此,对农产品年份的鉴别研究也具有重要的意义。

在产地鉴别领域中,矿物元素分析和同位素指纹图谱技术是两种比较传统的技术[4-5],它们在鉴别过程需要结合化学计量学方法,准确性和灵敏度较高,但费用高且鉴别速度慢;近红外光谱技术是近几年发展起来的一种快速、无损、应用广泛的鉴别技术[6-8],但用来进行产地鉴别研究时,其鉴别结果易受样本状态和测定条件的影响,灵敏度较低。高光谱图像技术融合了图像技术和光谱技术的优势,能够同时获取反映待测样本外部特征、内部物理结构及化学成分的图像信息和光谱信息,已经被广泛应用到农产品无损检测领域,在农药残留检测[9]、内外部品质预测[10-13]、农产品信息诊断[14]等应用领域涌现了大量研究成果,但利用高光谱图像技术对农产品进行产地及年份鉴别的研究却鲜有报道。作者以玉米种子为研究对象,利用高光谱图像技术结合偏最小二乘判别分析,采用不同的光谱特征及预处理方式建立了玉米种子的产地与年份鉴别模型,探究了高光谱图像技术在产地鉴别中可行性,为农产品产地鉴别提供了一种新的技术参考。

1 材料与方法

1.1 实验材料

玉米种子样本:由中国农业大学农学与生物技术学院植物遗传育种学系提供,分别来自3个不同产地和年份,包括先玉335甘肃2010年(XYGS2010)、先玉 335 甘肃 2011 年(XYGS2011)、先玉335海南2012年(XYHN2012)、郑单958北京2011年 (ZDBJ2011)、 郑 单 958北 京 2012年(ZDBJ2012)、 郑单 958 甘肃 2010 年(ZDGS2010)、郑单958甘肃2011年 (ZDGS2011)。其中每类80粒,共560粒玉米种子样本。

1.2 高光谱成像系统

实验所用高光谱成像系统由硬件和软件两部分组成。硬件部分由光源模块、样本输送平台、图像采集模块和计算机构成,系统结构见图1。其中光源模块包括150 W可调功率光纤卤素灯 (150 W EKE,3250K(#20094145),Techniquip,USA)、光纤和线光装置;图像采集模块包括镜头(10004A-21226 Lens,F/1.4 FL23mm,Standard Barrel,C -Mount,USA)、光谱仪(1003A-10140 HyperspcTM VNIR CSeries,Headwall Photonics Inc.,USA)、CCD 相 机(pixelfly qe IC*285AL,Cooke,USA)和 CCD 控制器,其中光谱仪的狭缝宽度为25 um,光谱范围为400~1 000 nm,光谱分辨率为1.29 nm,采样波段间隔为0.64 nm/pixel,空间分辨率为0.15mm。图像采集软件为Hyperspectral Scanning and Image Rendering Software,Rev A.2.1.3 (Headwall Photonics Inc.,USA),曝光时间、扫描步长、扫描宽带和光谱压缩倍数(binning)由采集软件控制。

图1 高光谱成像系统Fig.1 Hyperspectral imaging system

1.3 高光谱图像采集与校正

为了在图像不失真的前提下获得最佳的图像采集效果,在图像采集之前需要对高光谱成像系统进行校正和调试,确定出最佳系统参数如下:曝光时间250 ms,物距25 cm,线扫描步长80 um,扫描宽度30 mm,binning设置为4,即实际波段间隔为2.56 nm,在400~1 000 nm波长范围内共获得233个波段。采集结束时得到大小为375×1 392×233的图像立方体。图像采集时将玉米样本放置在黑色载物板上,整个采集过程在密闭黑箱中进行以减弱外部光源的干扰。为降低光源变化及系统噪声的影响,每隔4幅图像采集一次标准白板和全黑标定图像对原始图像进行校正,校正公式为

式中,Rc为校正图像;Rs为原始图像;Rw和Rb分别为标准白板和黑板图像。后续图像处理与分析均在Rc上进行。

1.4 图像分割与特征提取

高光谱图像中包含了二维的空间信息(x×y)和一维的光谱信息(λ),通常包含数百个波段的光谱信息,直接对如此庞大的数据进行处理是非常繁琐和费时的,因此作者通过特征提取的方式来降低数据维度及处理复杂度。首先利用主动轮廓模型(Active Contour Model,ACM)对高光谱图像进行分割,确定玉米种子目标区域,然后对目标区域进行特征提取。

1.4.1 ACM图像分割 ACM是Kass等提出的一种经典图像分割算法,Caselles等将水平集方法应用到主动轮廓描述和模型求解中[15-17]。结合水平集方法的ACM图像分割算法,具有较强的抗噪性能,对弱边界条件下的多目标轮廓提取效果显著[18-19],该模型的能量泛函为:

式中,c1和c2分别为轮廓线C内部区域和外部区域的平均灰度;μ,v≥0,λ1、λ2为正的权重因子。长度项Length(C)用于控制轮廓线的光滑度,面积项Area(C)用于控制轮廓线的规则度。

对玉米种子高光谱图像进行轮廓提取时,首先在待分割玉米种子图像上定义初始演化曲线,通过最小化能量泛函的方式,驱动演化曲线不断向玉米种子轮廓边缘逼近,直到演化曲线收敛到玉米种子轮廓边缘或者达到预先设定的迭代次数,并以最终演化曲线内部区域为玉米种子目标区域。图2为对XYGS2011在707 nm波段下的分割结果,演化曲线最终精确的收敛到玉米种子轮廓边缘上。

图2 XYGS2011在707 nm波段下的分割结果Fig.2 Results of XYGS2011 in wavelength 707 nm

1.4.2 特征提取 在农产品无损检测和品质预测中,特征的选择是影响最终检测或预测结果的关键因素之一[20-21]。基于统计学的均值和标准差是对原始光谱信息的最直观反映,在变化趋势上与原始信息具有较好的一致性。基于灰度直方图的熵和能量特征主要反映了被测目标的纹理变化,与颜色和大小特征相比,纹理特征中关于被测物体的化学和物理属性信息更为丰富[20]。熵E和能量P的定义分别为:

式中,M、N分别为玉米种子在水平和垂直方向上的像素数目。在400~1 000 nm波长范围内共233个波段下,共提取了玉米种子目标区域的均值、标准差、熵和能量4个特征,对不同特征在产地和年份的鉴别能力上做了比较研究,并从实际应用的角度出发,选出了更适合实际应用的特征用于最优模型的建立。

1.5 光谱预处理

光谱预处理的目的是降低原始光谱中基线漂移、光线散射及样本不均匀等环境和仪器噪声的影响,以增强模型的预测能力,在用于对农产品和食品化学成分含量及品质预测的偏最小二乘回归(Partial Least Squares Regression,PLSR)、 多元线性回归(Multiple Linear Regression,MLR)、偏最小二乘支持向量机 (Partial Least Squares Support Vector Machine,LSSVM)中应用广泛[22-23]。探究了不同的预处理方式对偏最小二乘判别分析 (Partial Least Squares Discriminant Analysis,PLSDA)模型的影响,分别使用了基线补偿(Baseline Offset,BOS)、去趋势(Detrending,DET)、 多 元 散 射 校 正 (Multiplicative Scatter Correction,MSC)、标准正态变量(Standard Normal Variate,SNV)、SG 导 数 (Savitzky-Golay Derivative,SG Der)对光谱数据进行预处理。

1.6 PLSDA

PLSDA是一种基于PLSR的多变量鉴别分析方法,在光谱数据的分类和判别问题中有广泛的应用。作为一种有监督分类方法,PLSDA利用PLSR建立自变量(样本光谱特征)和因变量(类别属性)间的关系模型,通过比较预测值的大小来确定样本的所属类别。在先前的多类别分类研究中,PLSDA模型表现出了优异的鉴别性能[18-19]。在建立PLSDA模型之前,使用四选一随机划分方式将所有样本分为训练集和测试集两部分,其中全部样本的3/4为训练集样本,剩余的1/4为测试集样本。为了降低样本集划分对鉴别结果的影响,分别使用4次不同的四选一样本划分集建立模型,并取4次结果的平均值作为最终鉴别结果。

2 结果与分析

2.1 不同特征下的产地与年份鉴别

由图3可以看出,经过ACM图像分割之后,每一粒玉米种子被精确的从背景中分离出来,相比手动选取感兴趣区域的方式,很大程度上避免了人为因素对实验结果的影响。在分割出的玉米种子目标区域上分别提取均值、标准差、熵和能量特征,不同产地和年份的玉米种子在各特征下的类内均值曲线见图3a~d所示。可以看出,熵特征的类间离散度最为明显,即熵特征能更好的表征玉米种子的产地和年份差异。而均值、标准差和能量特征曲线中,个别几类的分布较为集中,从视觉上无法直接看出它们对玉米种子表达能力的不同,因此,需要通过进一步的建模分析来确定不同特征鉴别能力的差别。

图3 光谱特征曲线Fig.3 Spectral characteristic curves

分别将4个特征做为模型的输入建立PLSDA模型,鉴别结果见表1。分析表1可知,不同特征对玉米籽粒的描述能力存在差异性。在本研究中,基于均值和熵特征的模型精度要高于能量特征,方差模型的鉴别精度最低(90.36%)。熵模型的训练精度最高(99.82%),但对未知样本的预测能力却低于均值模型。原因可能在于熵特征反映的是玉米种子纹理的变化,而纹理变化是玉米种子内部物理化学成分变化的间接体现,与对原始光谱信息的直接统计平均相比,在对不同类别间玉米种子物理化学差异的敏感性上熵要低于均值特征[20]。综合以上分析,同时考虑到在实际应用中的计算复杂度,作者选取均值为最佳鉴别特征。

表1 不同特征的PLSDA模型精度Table 1 PLSDA model accuracy of different features

2.2 预处理方法对模型的影响

图 4(a)~(f)为从预测集中随机选取的 20 粒玉米种子的原始光谱(RAW)和不同预处理方式下的光谱曲线。可以看出,DET、MSC、SG导数和SNV有效减弱了散射的影响,同时,经过MSC和SNV处理后的数据与RAW在变化趋势上保持了较好的一致性,而经过非线性趋势消除(DET)和二阶SG导数处理后的光谱与RAW差异性较大。基线补偿是对样本光谱值做减去最小值处理,因此,这种预处理方式的光谱在曲线变化趋势及分布上都与原始光谱较为接近。为了探究不同预处理方式对模型的影响,利用不同预处理后的光谱数据,分别建立PLSDA模型,最终结果见表2。

图4 原始光谱与不同预处理方式的光谱曲线Fig.4 Curve for RAW and different preprocessing methods

从表2可以看出,对于不同的特征,不同的预处理方式对模型的影响也存在差异。在最佳鉴别特征均值模型中,除了基线补偿外,其他预处理方式的模型精度都等于或高于未做预处理的模型,但只有基于SNV模型的预测能力有所提高。在其他特征模型中,只有基于SNV处理的熵特征模型和基线补偿处理的能量特征模型的预测能力高于原始特征模型。原因可能是不同的预处理方式对不同的特征在消除随机噪声和仪器影响的同时,一部分有用信息也被滤除了[22]。因此综合考虑将SNV做为最佳预处理方式。

表2 不同预处理方式的模型精度Table 2 Model accuracy of different preprocessing method

2.3 最优模型建立

将经过SNV处理的最佳鉴别特征作为PLSDA模型的输入,建立产地与年份鉴别模型,训练集和测试集精度分别达到了99.11%和98.39%,各类的判别结果见表3。其中ZDBJ2012等5类的鉴别精度接近或达到了100%,只有XYGS2010和XYGS2011的精度相对较低。通过对表3的进一步分析发现,错误判别集中出现在XYGS2010和XYGS2011两类之间。这两类只有在年份上存在差异,造成误判的主要原因可能是同一产地的土壤和气候条件相同,不同年份间的光照、积温及降水等条件较为接近,反映到玉米种子高光谱图像中的特征差异性较小,在鉴别过程中两者相互干扰从而发生误判[24]。这说明年份信息在一定程度上会对总体鉴别结果产生干扰,为了探究年份信息对模型的影响,作者又对在不考虑年份特征下的玉米种子产地鉴别做了研究。

表3 产地与年份鉴别模型判别结果Table 3 Discriminant result for geographical origin and years identification

2.4 产地鉴别

首先将相同产地不同年份的同种玉米种子归为一类,即XYGS2010和XYGS2011、ZDGS2010和ZDGS2011、ZDBJ2011和 ZDBJ2012组合为一类,XYHN2012看作一类,同样利用经过SNV预处理的最佳特征建立PLSDA模型。结果显示,训练集和测试集精度分别达到了100.00%和99.64%,高于产地与年份鉴别模型。因此,忽略年份特征时,在一定程度上有助于提高产地鉴别的模型精度。

3 结语

不同生态区的玉米种子因土壤、地形、光照和积温等条件的不同,其内部有机组成和矿质元素含量等存在一定的差异性。作者利用这种差异性特征信息,结合高光谱图像技术建立了玉米种子的产地和年份鉴别模型,并对不同的特征和光谱预处理方式做了研究。结果表明,产地和年份鉴别的训练集和测试集精度分别达到了99.11%和98.39%,在忽略年份信息时鉴别效果更佳。但限于样本种类及数量,模型的有效性和稳健性还有待验证。同时为了适应工业化应用需求,在特征提取方法、数据处理与分析及波段选择等方面还需要做进一步的研究。

[1]樊智翔,郭玉宏,安伟,等.玉米综合利用的现状及发展前景[J].山西农业大学学报:自然科学版,2003,23(2):182-184.FAN Zhixiang,GUO Yuhong,AN Wei,et al.The current situation and development prospect of utilizing maize comprehensively[J].Journal of Shanxi Agricultural University,2003,23(2):182-184.(in Chinese)

[2]吴迪,鲁成银,成浩.食品质量安全追溯系统研究进展及在茶叶行业应用展望[J].中国农学通报,2009,25(1):251-255.WU Di,LU Chengyin,CHENG Hao,et al.Recent developments of food safety traceability system and its perspective on tea[J].Chinese Agricultural Science Bulletin,2009,25(1):251-255.(in Chinese)

[3]Opara L U.Traceability in agriculture and food supply chain:A review of basic concepts,technological implications,and future prospects[J].Journal of Food Agriculture and Environment,2003,1(1):101-106.(in Chinese)

[4]Gonzálvez A,Armenta S,de la Guardia M.Geographical traceability of “Arròs de Valencia” rice grain based on mineral element composition[J].Food Chemistry,2011,126(3):1254-1260.

[5]Suzzki Y,Chikaraishi Y,ogawa N O,et al.Geographical origin of polished rice based on multiple element and stable isotope analyses[J].Food Chemistry,2008,109(2):470-475.

[6]Liu L,Cozzolino D,Cynkar W U,et al.Geographic classification of Spanish and Australian tempranillo red wines by visible and near-infrared spectroscopy combined with multivariate analysis[J].Journal of Agricultural and Food Chemistry,2006,54(18):6754-6759.

[7]Zhao H Y,Guo B Li,Wei Y M,et al.Near infrared reflectance spectroscopy for determination of the geographical origin of wheat[J].Food Chemistry,2013,138(2-3):1902-1907.

[8]Wang W B,Paliwal J.Near-infrared spectroscopy and imaging in food quality and safety[J].Sensing and Instrumentation for Food Quality and Safety,2007,1(4):193-207.

[9]陈菁菁,彭彦昆,李永玉,等.基于高光谱荧光技术的叶菜农药残留快速检测[J].农业工程学报,2010,26(S2):1-4.CHENG Jingjing,PENG Yankun,LI Yongyu,et al.Rapid detection of vegetable pesticide residue based on hyperspectral fluorescence imaging technology[J].Transactions of the CSAE,2010,26(S2):1-4.(in Chinese)

[10]Rajkumar P,Wang N,EImasry G,et al.Studies on banana fruit quality and maturity stages using hyperspectral imaging[J].Journal of Food Engineering,2012,108(1):194-200.

[11]Del Fiore A,Reverberi M,Ricelli A,et al.Early detection of toxigenic fungi on maize by hyperspectral imaging analysis[J].International Journal of Food Microbiology,2010,144(1):64-71.

[12]Ariana D P,Lu R F.Evaluation of internal defect and surface color of whole pickles using hyperspectral imaging[J].Journal of Food Engineering,2010,96(4):583-590.

[13]Gowen A A,O'Donnell C P,Cullen P J,et al.Hyperspectral imaging-an emerging process analytical tool for food quality and safety control[J].Trends in Food Science and Technology,2007,18(12):590-598.

[14]Delalieux S,Aardt J van,Keulemans W,et al.Detection of biotic stress (Venturia inaequalis) in apple trees using hyperspectral data_Non-parametric statistical approaches and physiological implications[J].European Journal of Agronomy,2007,27(1):130-143.

[15]Chan T F,Vese L A.Active contours without edges[J].IEEE Transactions on Image Processing,2001,10(2):266-277.

[16]Zhang K H,Zhang L,Song H H,et al.Active contours with selective local or global segmentation:A new formulation and level set method[J].Image and Vision Computing,2010,28(4):668-676.

[17]Li C M,Xu C Y,Gui C F,et al.Level set evolution without re-initialization:a new variational formulation[A].IEEE Computer Society Conference on Computer Vision and Pattern Recognition[C].California:San Diego,2005,1:430-436.

[18]黄敏,朱晓,朱启兵,等.基于高光谱图像的玉米种子特征提取与识别[J].光子学报,2012,41(7):868-873.HUANG Min,ZHU Xiao,ZHU Qibing,et al.Morphological characteristics of maize seed extraction and identification based on the hyperspectral image[J].Acta Photonica Sinica,2012,41(7):868-873.(in Chinese)

[19]黄敏,朱晓,朱启兵,等.基于主动轮廓模型的玉米种子高光谱图像分类[J].数据采集与处理,2013,28(3):289-293.HUANG Min,ZHU Xiao,ZHU Qibing,et al.Hyperspectral image classification of maize seeds based on active contour model[J].Journal of Data Acquisition and Processing,2013,28(3):289-293.(in Chinese)

[20]Zheng C X,Sun D W,Zheng L Y.Recent developments and applications of image features for food quality evaluation and inspection-a review[J].Trends in Food Science and Technology,2006,17(12):642-655.

[21]Wu D,Yang H Q,Chen X J,et al.Application of image texture for the sorting of tea categories using multi-spectral imagin g technique and support vector machine[J].Journal of Food Engineering,2008,88(4):474-483.

[22]Feng Y Z,Sun D W.Near-infrared hyperspectral imaging in tandem with partial least squares regression and genetic algorithm for non-destructive determination and visualization of Pseudomonas loads in chicken fillets[J].Talanta,2013,109:74-83.

[23]黄敏,万相梅,朱启兵,等.基于高光谱图像技术的菜用大豆厚度检测[J].食品与生物技术学报,2012,31(11):1142-1147.HUANG Min,WAN Xiangmei,ZHU Qibing,et al.Thickness measurement of green soybean using hyperspectral imaging technology[J].Journal of Food Science and Biotechnology,2012,31(11):1142-1147.(in Chinese)

[24]崔丽娜,张新,高荣岐,等.不同生态区玉米种子品质的比较研究[J].玉米科学,2012,20(4):26-31.CUI Lina,ZHANG Xin,GAO Rongqi,et al.Effects of different ecological areas on maize seed quality[J].Journal of Maize Sciences,2012,20(4):26-31.(in Chinese)

猜你喜欢
玉米种子年份产地
不同条件下对济宁地区玉米种子萌发特性的研究
影响玉米种子发芽率的因素及对策
特殊的一年
警惕“洗产地”暗礁
食物离产地越远越好
测定不同产地宽筋藤中5种重金属
什么是闰年?
加强产地检疫实现以检促防
一样的年份
玉米种子生产存在的问题及管理办法