基于支持向量机的大枣内部虫害无损检测

2014-01-14 02:38陈红光王健中野和弘敖长林
东北农业大学学报 2014年2期
关键词:大枣虫害波长

陈红光,王健,中野和弘,敖长林

(1.东北农业大学水利与建筑学院,哈尔滨 150030;2.中国食品发酵工业研究院,北京 100015;3.日本新潟大学农学部,日本新潟 950-2181;4.东北农业大学理学院,哈尔滨 150030)

基于支持向量机的大枣内部虫害无损检测

陈红光1,王健2,中野和弘3,敖长林4*

(1.东北农业大学水利与建筑学院,哈尔滨 150030;2.中国食品发酵工业研究院,北京 100015;3.日本新潟大学农学部,日本新潟 950-2181;4.东北农业大学理学院,哈尔滨 150030)

大枣内部虫害的光谱检测是利用大枣本身的光特性,获取与大枣内部虫害有关的物理化学信息,并利用NIR光谱与化学计量学方法建立定量模型来准确测定物质某些成分的含量。文章对160个大枣样品的近红外光谱测量数据进行二阶导数处理,找出测量波长范围内具有最大样本识别能力的有效波长,再用主成分分析进行降维处理,最后通过支持向量机算法对预测集大枣样本有无虫害进行判别,平均判别正确率为93.5%,并且算法比较稳定。综上,所测样品保持完整,不被破坏;仅通过对样品的一次NIR光谱的简单测量,就能同时测定物质的多种成分数据;可对复杂体系进行多组分同时测定,在短时间内获得分析结果,有利于工业化生产的实时、在线检测,自动化分级。

支持向量机;可见/近红外光谱;无损检测;导数光谱;主成分分析

内部虫害是大枣内在品质评价的主要问题之一,内部虫害难以被快速察觉或利用可见光准确检测[1]。目前我国水果质量主要靠目测和品尝方法[2]进行,而内部组成成分则依靠破坏性检验方法,这将导致水果分析难以实现快速、准确和无损化[3-10]。

本文利用透反射模式、漫反射模式和透过模式下的可见光/近红外大枣光谱数据,对3种模式下光谱数据进行二阶导数处理,通过衡量各波长分类贡献度大小,找到对判别大枣品质最有效的关键波长,通过主成分分析进行降维处理,并将提取的主成分数据输入支持向量机模型训练学习,实现对大枣样本的有效分类。模型通过稳定性检验测试,证明支持向量机分类器是用于大枣内部品质检测的有效方法,可为实现大枣内部品质自动化检测奠定理论基础。

1 材料与方法

1.1 材料

使用人工采摘的成熟期大枣作为样本,每个样本都贴上带有编号的标签,所有的大枣样品在测量之前3 d都处在20℃,相对湿度70%条件下贮存。在光谱测量后所有大枣样品通过人工检测方法分类并标明完好或者有内部虫害。本文选择80颗完好的大枣和另外80颗有内部虫害的大枣作为样本进行分析。

1.2 检测方法

分别用透反射测量模式、漫反射测量模式、透过测量模式检测大枣样本光谱数据,所有透反射模式、漫反射模式、透过模式用的光波均由两个分光光度计分别以3.3 nm为步长波长在310~1 000 nm范围内及以6.2 nm为步长波长在1 000~2 150 nm范围内获得。用于透反射测量模式的光源(MHAA-100 w,Moritex Co.,Ltd.,Japan)和漫反射模式与透过模式的光源(HR-k2150 N,Hiroshi indus⁃try Co.,Ltd.,Japan)均包含两个100瓦的可同时用于可见光和近红外区域的白炽/卤素灯。在透反射模式下,光从位于距离样品6 mm与垂直线成0°角的下面的一个纤维束(纤维受体)传送(捕获)。在漫反射(透射)模式下,光从位于距离样品160 mm的下面(上面)与垂直线成30°角的两个卤素灯传送。利用波动软件进行收集和转化可见/近红外光谱光波(Spectra Co.,Ltd.,Japan)。当周围的灯光都关闭时,在样品光谱测量之前,光谱测定和贮存都需要使用白板(2.5 mm厚度)消除光源本身的干扰。

大枣样本被集中且有规律地摆放在水平方向的支架上,光从所有大枣中心线的3个120°方向收集。试验装置如图1所示。

2 结果与分析

2.1 试验结果与预处理

通过平均3个测量光谱值,获得漫反射、透射和透反射光谱法下大枣的光谱数据。在测量波长范围内,正常大枣与虫害大枣的平均光谱曲线如图2所示。

由图2原始光谱数据分析表明,由透反射模式、漫反射模式、透射模式下完好和虫害大枣的平均光谱曲线可以看到,在透反射模式得到的两组光谱的差异要比漫反射模式中得到的光谱的差异大。但是,在透过模式中得到的两组光谱的差异主要是在振幅方面,而不是在曲线形状方面。零阶光谱存在相互重叠区域,完好和虫害大枣的平均光滑曲线走势在宏观上大致相似而不容易区分开来,因此有必要对光谱数据进行处理,使之更易于将完好和虫害大枣区别开来。

图1 实验装置Fig.1 Schematic and samples of experiment device

图2 3种模式下的平均光谱Fig.2 Average spectral curves in the three mode

2.2 有效波长识别

用于可见/近红外光谱仪测量的波长范围较大,波长点设置较多,需对建立数学模型的光谱波段范围进行有效选择,才能更容易找出光谱特征与大枣内部品质之间的关系,达到对大枣样本进行有效分类的目的[11-14]。

在可见/近红外光谱仪采集到的原始光谱数据中,一些波长下的光谱值在完好和虫害大枣两种类别中无论均值还是方差均无明显差别,这些波长点与样本类别无关,不能对大枣样本类型的判别提供有用信息,增加搜索具有样本识别能力有效波长的计算复杂度。因此有必要对这些“无关波长”进行剔除。为衡量各个波长点下的光谱数据含有多少样本分类信息,参考朱俊友[15]方法,可定义“分类贡献度”指标:

其中μ1(j),μ2(j)分别表示第j个波长下正常大枣和虫害大枣两类样本的均值;σ1(j),σ2(j)分别表示第j个波长下正常大枣和虫害大枣两类样本的均方差。式(1)的第一部分体现在不同波长下完好和虫害大枣两个类别分布均值差异对样本分类贡献;后一部分体现了在不同波长下光谱值分布的方差的不同对样本分类的贡献。依据该公式,即使同一波长下光谱数据在两类不同样本中分布的均值相同,只要分布的方差出现大的差异,仍可获得较大分类贡献度。依据不同波长下的光谱信息所含大枣样本类别信息的多少,将波长分为“关键波长”和“无关波长”两类。设SI为关键波长集合,SN为无关波长集合,则

其中λ为波长,θ为阈值,θ越大,利用该波长的光谱信息,大枣样本的可分性就越好。基于θ的动态变化,在VSWNIR(300~1 000 nm)和LWNIR(1 000~2 000 nm)分别挑选了对大枣样本分类贡献较大的关键波长。在透反射模式下,利用VSWNIR范围内的原始数据计算得到的分类贡献度如图3a所示,可以看到所形成曲线较光滑,挑选出对大枣分类贡献度较大的关键波长较困难,而经过导数处理的光谱数据的分类贡献度图谱如图3b所示,光谱信息明显,可以清晰地挑选出对大枣分类贡献度较大的关键波长。由此可见对原始光谱数据进行二阶导数处理的必要性。

3种模式下在VSWNIR和LWNIR范围内的导数光谱数据分类贡献度如图3所示。以透反射模式为例,在VSWNIR范围内分类贡献度较大波长点有:673.045,676.384,970.589,693.076,696.413,679.724,669.705,642.97,699.75,964.072 nm。在LWNIR范围内,分类贡献度较大波长点有:1 133.652,1 127.631,1 115.549,1 121.597,1 163.549,1 157.597,1 273.818,1 151.632,1 279.467,1 313.03 nm。

图3 3种模式下导数光谱分类贡献度Fig.3 Category contribution using the derivative spectrum in the three mode

3种模式下筛选出的关键波长如表1所示。

透反射模式、漫反射模式下分别得到20个关键波长,透射模式下得到10个关键波长,对于建立大枣分类模型来说参数数量过多,维数过高,有必要采用一定方法进行降维处理,简化分类模型。

表1 3种模式下分类贡献度较大的关键波长Table 1 Key wavelengths better for Jujube's classification in three modes

2.3 主成分分析降维处理

通过主成分分析,使数目较少的新变量成为高维光谱数据的线性组合,而且,新变量能最大限度表征原来数据的结构特征,并不丢失太多信息,从而达到对数据降维、简化模型的目的。透反射模式、漫反射模式下分别得到20个对大枣样本分类贡献最大的20个关键波长,透射模式下得到对大枣样本分类贡献最大的10个关键波长,对建立大枣分类的模型来说参数数量还是很多,维数过高,可以应用主成分分析进行降维,简化模型。

2.3.1 透反射模式下的主成分提取

透反射模式下的方差累积贡献率和碎石如图4~5所示。第1个主成分的方差已占全部方差的70%,选取前3个主成分,其方差和占全部方差的95%,即基本上保留原来指标信息,这样由原来的20个指标转化为3个新指标,起到降维作用。可用这3个新指标代表原来的20个关键波长光谱数据信息,已经有足够的把握。分别用yI1,yI2,yI3来表示这3个主成分,即可得到3个主成分的线性组合。主成分的系数矩阵如表2所示,用λIi(i=1, 2,…20)表示透反射模式下的20个关键波长变量。

图4 透反射模式下基于协方差阵求得的方差累积贡献率Fig.4 Variance contribution rate based on covariance matrix in interactive mode

图5 透反射模式下的碎石结果Fig.5 Scree plot in interactive mode

表2 透反射模式下的主成分系数矩阵Table 2 Component maxtrix in interactance mode

2.3.2 漫反射模式下的主成分提取

结果如图6,表3所示。

图6 漫反射模式下基于协方差阵求得的方差累积贡献率Fig.6 Variance contribution rate based on covariance matrix in reflectance mode

表3 漫反射模式下的主成分系数矩阵Table 3 Component maxtrix in reflectance mode

2.3.3 透射模式下的主成分提取

结果如图7,表4所示。

通过对3种模式下对大枣内部品质判别贡献较大的关键波长光谱数据进行主成分分析,对样本数据进行降维处理,并将提取的主成分数据输入支持向量机模型训练学习,简化模型的复杂度,实现对大枣样本的有效分类。

图7 透射模式下基于协方差阵求得的方差累积贡献率Fig.7 Variance contribution rate based on covariance matrix in transmission mode

表4 透射模式下的主成分系数矩阵Table 4 Component maxtrix in transmission mode

2.4 支持向量机用于大枣样本分类[13-16]

用于分类的支持向量机可建立一个分类超平面作为决策曲面,使得正例和反例之间的隔离边缘被最大化。为避免高维空间的复杂运算,支持向量机采用1个核函数K(χ,y)来代替高维空间中的内积运算。通过引入拉格朗日函数,最后得到判别函数[16]为:

当f(χ)>0时,输出为一类,当f(χ)<0时,输出为另一类。

在用支持向量机进行大枣样本分类的实验中,将大枣样本数据分成两组数据集:第一组为训练数据集,用以建立校正模型,寻找最优模型参数,样本个数为120个,其中包括60个完好大枣样本和60个虫害大枣样本;第2组为预测数据集,样本个数为40个,其中包括20个完好大枣样本和20个虫害大枣样本。

支持向量机分类效果主要受核函数的选择以及参数选择的影响,支持向量机常用的核函数有线性函数、多项式核函数、高斯径向基核函数等。考虑高斯径向基核函数可实现非线性分类的同时只有1个控制参数,选择高斯径向基核函数:

其中,σ是高斯核函数的参数。

关于SVM参数的优化选取,目前常用方法就是让惩罚参数c和核参数σ在一定范围内取值,对于取定的c和σ,把训练集作为原始数据集利用K-folf Cross Validation(K-CV)方法得到在此组c和σ下训练集验证分类准确率,最终取使得训练集验证分类准确率最高的那组c和σ作为最佳参数。

将选取的相应主成分数据作为支持向量机的输入,以高斯径向基函数作为核函数,样本类别作为输出,以K-CV方法计算最佳参数c和σ,构造支持向量机训练模型。图8是参数优化过程中的等高线图和3D图,从中能直观地看到参数c和σ不同组合对判别准确率的影响。

从上述试验中SVM参数选择最终结果可得到这3种模式下支持向量机的最优参数和判别正确率,如表5所示。采用主成分分析提取的主成分构造分类因素对大枣样本内部品质具有很好的判别效果,判别准确率都在90%以上。透射模式下的判别准确率较其他两种模式高。进行5次模拟试验,其结果如表6所示,得到3种模式下的平均判别正确率。

图8 3种模式下SVM参数选择结果3D效果Fig.8 3D figure of SVM parameter selection result in the three mode

表5 3种模式下的SVM最优参数及判别正确率Table 5 Best parameters and classification accuracies by SVM in three modes

从表6可知,通过5次随机选择样本数据实验得到:利用透反射模式下的光谱数据,对大枣有无虫害平均判别正确率93.91%;漫反射模式下平均判别正确率96.17%;透射模式下平均判别正确率99.04%。透射模式下平均判别准确率较其他两种模式高。从而可知支持向量机根据有限的大枣样本信息在模型复杂性(即对特定训练样本的学习精度)和学习能力(即无错误识别任何样本)之间寻找最佳折衷,获得较好泛化能力。

3 结论

利用310~2 150 nm波段范围内160个大枣样本的可见/近红外漫反射光谱测量数据,通过支持向量机算法得到对预测集大枣样本有无虫害的平均判别正确率为93.5%,算法较稳定。从建模过程中可见具有样本识别能力的有效波长,对有用光谱信息的筛选及建立分类模型很重要,直接影响光谱信息的利用效果和判别模型的准确性,可尝试其他处理方法更高效地利用光谱信息。另外支持向量机算法中,选取不同的核函数对算法的判定效果是否有影响,有待深入研究。

本研究结果表明,将支持向量机算法与近红外光谱检测技术相结合用于大枣内部品质的无损检测取得满意结果,可为今后大枣内部品质快速无损检测提供新方法。

[1]Janie Dubois,Richard Baydack,Eilean McKenzie,et al.Scrapie infection investigated by magnetic resonance imaging and fourier transform infrared microscopy[J].Vibrational Spectroscopy,2003 (32):95-105.

[2]He Y,Li X L,Shao Y N.Quantitative analysis of the varieties spectroscopy by principal component analysis and BP model Lec⁃ture of apple using near infrared[J].Notes in Computer Science, 2005,38(9):1053-1056.

[3]Guthrie J A,Walsh K B,Reid D J,et al.Assessment of internal quality attributes of mandarin fruit NI-R calibration model devel⁃opment[J].Australian Jounal of Agriculture Research,2005,56 (4):405-416.

[4]Alamar M C,Bobelyn E,Lammertyn J,et al.Calibration transfer between NIR diode array and FT-NIR spectrophotometers for measuring the soluble solids contents of apple[J].Postharvest Bi⁃ol.Technol,2007:45,38-45.

[5]Xing J,Bravo C,Jancsók P T,et al.Detecting bruises on'golden delicious'apples using hyperspectral imaging with multiple wave⁃bands[J].Biosyst.Eng,2005:90,27-36.

[6]Blasco J,Aleixos N,Gómez-Sanchís J,et al.Recognition and clas⁃sification of external skin damage incitrus fruits using multispec⁃tral data and morphological features[J].Biosyst.Eng,2009:103, 137-145.

[7]徐宝成,刘建学.红外光谱技术在微生物研究中的应用进展[J].中国酿造,2007(3):8-10.

[8]解立斌,黄建,霍军生.食品快速检测技术应用进展[J].国外医学:卫生学分册,2007,34(3):192-196.

[9]吴迪,曹芳,冯水娟,等.基于支持向量机算法的红外光谱技术在奶粉蛋白质含量快速检测中的应用[J].光谱学与光谱分析, 2008,28(5):1071-1075.

[10]刘建学,赵冰琳,罗登林,等.近红外光谱在食品微生物检测中的应用[J].农产品加工,2009(12):42-44.

[11]黄翼飞,袁庆钊,沈光林.近红外光谱分析技术在烟草研究中的应用进展[C].中国烟草学会工业专业委员会论文集,2011 (4):10-12.

[12]籍保平.外光谱技术在水果加工中的应用[J].粮油加工与食品机械,2000(6):31-33.

[13]李庆波.近红外光谱分析中若干关键技术的研究[D].天津:天津大学,2003:12-16.

[14]毕卫红,付兴虎,王魁荣,等.水果品质近红外检测技术的研究现状与发展[J].激光与光电子学进展,2006,43(4):3-7.

[15]朱俊友,李玉峰.蛋白质芯片技术及其在食品致病菌检测中的应用[J].中国卫生检验杂志,2006(7):780-781.

[16]张宁,张德权.近红外光谱定性分析技术在食品安全中的应用研究进展[J].食品科技,2008(8):218-220.

Noninvasive detection using diffuse reflectance spectrum for monitor⁃ing jujube interior pest based on support vector machine

CHEN Hongguang1, WANG Jian2,Nakano Kazuhiro3,AO Changlin4(1.School of Water Conservancy and Civil Engineering, Northeast Agricultural University,Harbin 150030,China;2.China National Research Institute of Food and Fermentation Industries,Beijing 100015,China;3.School of Agricultural,Niigata University,Niigata 950-2181,Japan;4.School of Science,NortheastAgricultural University,Harbin 150030,China)

Spectrum detection of jujube internal pests is used optical character of jujube,to obtain the physical and chemical information of jujube internal pests,and to establish the quantitative model by using NIR spectroscopy and chemometrics method to accurately determine the content of the material ingredients. The paper carried out second derivative to original sample data of near infrared spectrum measurement of 160 jujube samples,and selected the effective wavelengths that had the big identification capability among the wavelength range,using primary constituent analytical to reduce dimension processing.The last,theaverage right forecasting rate of identifying the intact and infested jujubes was about 93.5%for the predicting set by using the algorithm of SVM,and the algorithm were proved stable.Summing up the above, the test sample could be intact,not destroyed;could determined the variety of material composition data based on simple measurement of NIR spectra for the sample at the same time;could a multi-component simultaneous determination of complex system,and could get the results of the analysis in a short time,was advantageous to the real-time industrialized production and on-line inspection,automatic classification.

SVM,Visible/near-infrared;nondestructive measurement;derivative spectroscopy; principal components analysis

S767.5;X172

A

1005-9369(2014)02-0094-09

2013-04-14

中国博士后科学基金资助项目(2013M531012);东北农业大学科学研究基金资助项目

陈红光(1976-),女,副教授,博士,研究方向为农产品天损检测。E-mail:chg218@126.com

*通讯作者:敖长林,教授,博士,研究方向为农业系统工程。E-mail:aochanglin@yahoo.com.cn

时间2014-1-17 16:37:04[URL]http://www.cnki.net/kcms/detail/23.1391.S.20140117.1637.005.html

陈红光,王健,中野和弘,等.基于支持向量机的大枣内部虫害无损检测[J].东北农业大学学报,2014,45(2):94-102.

Chen Hongguang,Wang Jian,Nakano Kazuhiro,et al.Noninvasive detection using diffuse reflectance spectrum for monitoring jujube interior pest based on support vector machine[J].Journal of Northeast Agricultural University,2014,45(2): 94-102.(in Chinese with English abstract)

猜你喜欢
大枣虫害波长
若要皮肤好 粥里加大枣
桃树主要虫害及防治方法
不用农药也能治虫害
浅析白三叶的虫害防治
行道树香橼主要虫害及其防治
日本研发出可完全覆盖可见光波长的LED光源
大枣化学成分的研究进展
RP—HPLC波长切换法同时测定坤泰胶囊中6个成分的含量
便携式多用途光波波长测量仪
十枣汤中大枣的作用之我见