基于支持向量机的稻谷黄曲霉毒素B1近红外无损检测

2015-11-30 08:56刘成海孙井坤贾富国郑先哲
东北农业大学学报 2015年5期
关键词:标准偏差黄曲霉稻谷

张 强,刘成海,孙井坤,贾富国,郑先哲

(东北农业大学工程学院,哈尔滨 150030)

基于支持向量机的稻谷黄曲霉毒素B1近红外无损检测

张 强,刘成海,孙井坤,贾富国,郑先哲*

(东北农业大学工程学院,哈尔滨 150030)

为提高近红外光谱技术检测贮藏稻谷中黄曲霉毒素B1准确性和精度,文章探讨以RBF径向基函数为核函数的支持向量机参数对建模精度影响。收集80个稻谷样本,应用近红外光谱采集光谱信息,采用化学分析方法测定贮藏稻谷中黄曲霉毒素B1含量,建立稻谷黄曲霉毒素B1支持向量机回归模型。确定基于RBF核函数模型最优参数为c=106,γ=0.0015。该模型校正集决定系数为0.913,校正标准偏差和预测标准偏差分别为1.186和1.267。结果表明,基于支持向量机算法建模可准确检测稻谷中黄曲霉毒素B1。为准确、实时监测贮藏稻谷黄曲霉毒素B1污染提供理论依据。

稻谷;贮藏;黄曲霉毒素B1;支持向量机;近红外光谱

网络出版时间2015-4-30 14:29:00 [URL]http://www.cnki.net/kcms/detail/23.1391.S.20150430.1429.003.html

张强,刘成海,孙井坤,等.基于支持向量机的稻谷黄曲霉毒素B1近红外无损检测[J].东北农业大学学报,2015,46(5):84-88.

Zhang Qiang,Liu Chenghai,Sun Jingkun,et al.Near-infrared spectroscopy nondestructive determination of aflatoxin B1in paddy rice based on support vector machine regression[J].Journal of Northeast Agricultural University,2015,46(5):84-88. (in Chinese with English abstract)

由于贮藏条件影响,稻谷会受黄曲霉毒素侵染[1]。黄曲霉毒素B1是黄曲霉毒素中的代表性类型,污染粮食数量多、毒性大[2]。许多国家都对稻谷中黄曲霉毒素B1含量作出严格限制[3]。余墩年研究表明,粮仓内稻谷黄曲霉毒素B1含量高于中国国家标准规定含量[4]。因此,研究稻谷黄曲霉毒素B1含量无损、及时准确检测方法具有重要理论意义和应用价值。

近红外光谱技术具备无需任何预处理,分析速度快、无污染优势,在农产品品质检测领域得到广泛应用[5-9]。由于光谱仪器和分析环境影响,光谱噪声和非信息因素常影响近红外模型预测精度,寻找合适建模方法对提高模型预测精度十分重要。

支持向量机(SVM)是新型机器学习方法,如果数据服从某个未知但分布固定,要使机器实际输出和理想输出偏差尽可能小,机器应遵循结构风险最小化原理,使错误概率上界最小化。支持向量机结构简单,能较好解决小样本、非线性、高维数和局部极小点等实际问题。SVM逐步在近红外光谱定量分析中应用,其参数选择对SVM方法的预测能力有重要影响[10]。周竹等利用最小二乘支持分类器建立霉变板栗识别模型,结果表明该方法可显著提高霉变板栗检测精度[11]。陈红光等应用近红外光谱结合支持向量机检测大枣内部虫害,结论是支持向量机回归算法可实现大枣内部虫害无损、准确检测[12]。国内外关于将支持向量机算法用于稻谷黄曲霉毒素B1近红外建模研究鲜见报道。

本文以贮藏稻谷为研究对象,利用支持向量机算法建立稻谷黄曲霉毒素B1近红外光谱预测模型。以RBF径向基函数为核函数,分析其参数对建模精度的影响,对参数进行优化,确定基于RBF核函数模型最优参数。使用外部样品对建立校正模型预测精度和稳定性进行验证。

1 材料与方法

1.1 材料

稻谷样品取自东北农业大学稻谷加工实验室,2013年10月收获,并在(25±3)℃环境下贮存约10个月。其中,60个样本为校正集,用于建立近红外光谱校正模型,20个样本为预测集,用于检验校正模型预测性能和稳定性,校正集和预测集比例为3∶1。

1.2 仪器设备

ANTARISⅡ型傅立叶变换近红外分析仪(美国Thermo Nicolet公司);恒温恒湿箱[CTHI-150(A)B型,上海施都凯仪器设备有限公司];砻谷机(日本FC2K型,日本株式会社佐竹制作所);微型植物试样粉碎机(FZ102型,天津泰斯特仪器有限公司);电子分析天平(精度为0.0001 g,梅特勒-托利多公司);离心机(LDZ5-2型,北京京立离心机有限公司);黄曲霉毒素B1酶联免疫试剂盒(北京安美生医药科技有限公司);微孔酶标仪(EL301型,美国Bio-Tek仪器有限公司)。

1.3 方法

1.3.1 光谱扫描

光谱扫描前将稻谷样品置于室温(25±3)℃下使样品温度回升且均匀。光谱采集主要参数设定为:光谱采集为10 000~4 000 cm-1,扫描次数64次,分辨率8 cm-1,稻谷光谱数据以log(1/R)形式记录。试验采用美国Thermo Nicolet公司生产的ANTARISⅡ型傅立叶变换近红外分析仪进行光谱扫描。光谱扫描试验开始前,仪器预热60 min,每次扫描时将45 g稻谷样品置于旋转样品台,开始扫描时光谱仪自动去除背景干扰,样品每次扫描时间约90 s,每个样品扫描3次,取3次光谱平均值作为原始光谱数据。光谱扫描结束后,对稻谷样品化学值进行测定。

1.3.2 参考值测定

采用酶联免疫法测定稻谷中黄曲霉毒素B1含量[13-15],每个样本取20 g粉末加入100 mL甲醇/水(1∶1,V/V),混合液剧烈震荡3 min,在5 000 r·min-1条件下离心10 min;取400 μL上清液和600 μL样品稀释液充分混匀;使用酶联免疫试剂盒进行检测,加标准品/样本50 μL至对应微孔中,再加入酶标物50 μL·孔-1,轻轻振荡混匀,用盖板膜盖板后置室温避光环境中反应15 min;用洗涤工作液300 μL·孔-1进行洗涤,充分洗涤5次后加入显色液100 μL,在避光环境下反应15 min;加入终止液50 μL·孔-1,应用美国Bio-Tek公司生产的酶标仪在450 nm下测定稻谷黄曲霉毒素B1含量。

1.3.3 试验设计

本试验调用SVM模式识别与回归软件包LIBSVM实现SVM模型的建立和预测过程。选择试验参数为:核函数确定为RBF径向基函数,SVM类型采用e-SVR,损失函数ε取默认值为0.1。本试验直接将提供的校正集样品原始光谱数据归一化后作为SVM的输入,采用网络搜索法找出最佳惩罚参数c和RBF核参数γ组合。初步设定搜索参数如下:c取1、10、102、103、104、105、106、107时,γ取0.01、0.05、0.10、0.15、0.20。通过建立SVM模型比较参数对建模精度影响,进一步缩小最优参数搜索范围,以获得更佳支持向量机回归模型。

1.3.4 近红外光谱校正模型评价方法

采用SVM算法建立校正模型,通过校正模型检验预测集稻谷样品,对模型预测精度和稳定性进行验证。用校正集决定系数和预测集决定系数R2、校正标准偏差(SEC)和预测标准偏差(SEP)评价模型优劣[16]。决定系数R2越大说明光谱信息和参考值含量相关性越好,校正标准偏差(SEC)和预测标准偏差(SEP)越小,说明模型预测性能越好。

2 结果与分析

2.1 黄曲霉毒素B1含量参考值结果

采用标准方法测定得到80个稻谷样品黄曲霉毒素B1化学值如表1和图1所示。由表1和图1可知,所收集稻谷样本黄曲霉毒素B1含量范围覆盖广,梯度分布较均匀,表明样本具有良好代表性,以此为基础建立的近红外校正模型将有较好适应性。

2.2 稻谷样本近红外光谱特征

由图2可知,在全波长范围内,感染黄曲霉毒素B1稻谷样品大部分图谱结构相似,在8 300~4 000 cm-1波数范围内存在多个吸收峰,有强烈的光谱吸收,含较丰富光谱信息。8 304 cm-1处为对应CH2和CH3基团C-H伸缩振动一级倍频[17]。6 838 和4 022 cm-1为脂肪酸和糖类C-H伸缩振动组合频。5 665 cm-1为对应CH2基团C-H伸缩振动二级倍频。5 222~5 102 cm-1谱区为水和葡萄糖O-H伸缩振动一级倍频[18]。4 747 cm-1处为酯化分子C=O伸缩振动二级倍频和氨基酸N-H伸缩振动组合频[19]。

表1 稻谷中黄曲霉毒素B1含量Table 1 Aflatoxin B1content in samples of paddy rice

图1 贮藏稻谷中黄曲霉毒素B1频率分布和正态分布Fig.1 Frequency distribution and normal curve of aflatoxin B1content

图2 感染黄曲霉毒素B1稻谷样本近红外光谱Fig.2 NIR raw spectra of samples of paddy rice,based on the aflatoxin B1infection in the sample

2.3 支持向量机回归结果

在搜索范围内得到支持向量机回归结果见表2。

表2 γ=0.01、0.05、0.10、0.15、0.20对应回归结果Table 2 Regression results of support vector machine at γ=0.01、0.05、0.10、0.15、0.20

由表2可知,除γ=0.10外,其余γ对应的支持向量机回归模型决定系数均可达到0.905。随γ增加,惩罚参数c在较小值时可使回归模型决定系数达到最大值。

2.4 lgc、γ和预测标准偏差关系

图3和图4给出lgc、γ和校正标准偏差(SEC)、预测标准偏差(SEP)间关系。由图3可知,除γ= 0.10对应曲线外,其他4条曲线SEC均随c增大而减小,而图4中,SEP和c无必然联系。因此,惩罚参数c主要影响SVM自预测能力,在γ为固定值条件下,c越大,SVM模型SEC越小,模型自预测能力提高。在图4中,几乎所有曲线SEP都随γ增大而增大,而SEC和γ无必然联系。因此,RBF核参数主要影响SVM实际预测能力,在固定惩罚参数c的情况下,γ越大,SVM的SEP越大,模型实际预测能力越差。

图3 lgc、γ和校正标准偏差(SEC)的关系Fig. 3 Relationship between SEC and lgc, γ

图4 lgc、γ和预测标准偏差(SEP)的关系Fig.4 Relationship betweenSEPand lgc,γ

2.5 SVM检测模型优化

综合考虑SVM模型校正标准偏差和预测标准偏差,可确定在该搜索范围内支持向量机最优参数为c=105,γ=0.01,此时校正标准偏差SEC= 1.589,预测标准偏差SEP=2.276,决定系数R2= 0.905。为寻找最优SVM模型,进一步缩小最优参数搜索范围,设定搜索参数为:c分别取105、106、107,γ分别取0.001、0.0015、0.002、0.005。表3中列出SVM模型评价结果。通过进一步小范围搜索,从表3中可得到更佳支持向量机模型,校正标准偏差SEC=1.186,预测标准偏差SEP=1.267,决定系数R2=0.913,得到基于RBF核函数SVM模型最优参数为c=106,γ=0.0015。该SVM模型可取得较好预测结果。

表3 小范围内搜索得到的SVM回归结果Table 3 Regression results of SVM at a small range

3 结 论

利用10 000~4 000 cm-1波段范围内80个稻谷样本近红外光谱测量数据,通过支持向量机算法建立稻谷黄曲霉毒素B1近红外预测数学模型,确定基于RBF核函数模型最优参数为c=106,γ= 0.0015,该模型校正集决定系数为0.913。

本研究结果表明,基于支持向量机算法建模可准确检测稻谷中黄曲霉毒素B1含量。可为实时、准确监控贮藏稻谷黄曲霉毒素B1污染提供理论依据,为今后稻谷毒素快速无损检测提供新方法。

[1]Ni X Z,Wilson J P,Buntin G D,et al.Spatial pattern s of aflatoxin levels in relation to ear-feeding insect damage in pre-harvest corn [J].Toxins,2011(3):920-931.

[2] 庄振宏,郑传琦,汪世华.黄曲霉培养条件的优化及黄曲霉毒素B1的提取[J].应用与环境生物学报,2010,16(5):724-729.

[3] 中华人民共和国卫生部.GB 2761-2011,食品安全国家标准食品中真菌毒素限量[S].北京:中国标准出版社,2011.

[4]余墩年,刘勇,刘坚,等.粮仓内稻谷及稻谷籽粒中黄曲霉毒素B1分布情况研究[J].粮食储藏,2008(6):42-44.

[5] 谭克竹,张长利,柴玉华.基于遗传多层前馈神经网络的大豆脂肪酸含量近红外光谱检测[J].东北农业大学学报,2008,39 (7):112-117.

[6]李娟,李忠海,付湘晋.稻谷新陈度近红外快速无损检测的研究[J].光谱学与光谱分析,2012,32(8):2126-2130.

[7] Sirisomboon C D,Putthang R,Sirisomboon P.Application of near infrared spectroscopy to detect aflatoxigenic fungal contamination in rice[J].Food Control,2013,33:207-214.

[8]宁井铭,宛晓春,张正竹,等.近红外光谱技术结合人工神经网络判别普洱茶发酵程度[J].农业工程学报,2013,29(11):255-260.

[9]徐文杰,刘茹,洪响声,等.基于近红外光谱技术的淡水鱼品种快速鉴别[J].农业工程学报,2014,30(1):253-261.

[10] 张小超,吴静珠,徐云.近红外光谱分析技术及其在现代农业中的应用[M].北京:电子工业出版社,2010.

[11]周竹,李小昱,李培武,等.基于GA-LSSVM和近红外傅里叶变换的霉变板栗识别[J].农业工程学报,2011,27(3):331-335.

[12] 陈红光,王健,中野和弘,等.基于支持向量机的大枣内部虫害无损检测[J].东北农业大学学报,2014,45(2):94-102.

[13] 中华人民共和国卫生部.GB/T 5009.22-2003,食品中黄曲霉毒素B1的测定[S].北京:中国标准出版社,2003.

[14] Zheng Z M,Humphrey C W,King R S,et al.Validation of an ELI⁃SA test kit for the detection of aflatoxin B1in grain and grain prod⁃ucts by comparison with HPLC[J].Mycopathologia,2005,159: 255-263.

[15] Zhang Q,Jia F G,Liu C H,et al.Rapid detection of aflatoxin B1in paddy rice as analytical quality assessment by near infrared spectroscopy[J].Int J Agric Biol Eng,2014,7(4):127-133.

[16] 陆婉珍,袁洪福,徐广通,等.现代近红外光谱分析技术[M].北京:化学工业出版社,2007:170.

[17] Gaspardo B,Zotto S D,Torelli E.A rapid method for detection of fumonisins B1and B2in corn meal using fourier transform near infrared(FT-NIR)spectroscopy implemented with integrating sphere[J].Food Chem,2012,135:1608-1612.

[18] Berardo N,Pisacane V,Battilani P,et al.Rapid detection of ker⁃nel rots and mycotoxins in maize by near-infrared reflectance spectroscopy[J].J Agr Food Chem,2005,53:8128-8134.

[19] Osboneb G,Fearn T.Near infrared spectroscopy in food analysis [M].London:Longman Scientific and Technical,1986:36-39.

Near-infrared spectroscopy nondestructive determination of aflatoxin B1in paddy rice based on support vector machine regression

ZHANG Qiang,LIU Chenghai,SUN Jingkun,JIA Fuguo,ZHENG Xianzhe(School of Engineering,Northeast Agricultural University,Harbin 150030,China)

In order to improve the accuracy and the precision of the near infrared spectroscopy technical detection for the aflatoxin B1in the paddy rice,this paper discussed the effects of the parameters of support vector machine on the modeling precision.The parameters took the RBF radial basis function as the kernel function.And 80 paddy rice samples were collected.The near infrared spectroscopy was used to collect spectral information.Then chemical analysis method was used to determine the content of aflatoxin B1in the paddy rice.The regression model of support vector machine for aflatoxin B1in the paddy rice was established.The optimal parameters based on the RBF radial basis function model were determined asc= 106andγ=0.0015.The correlation of calibration sets of this model was 0.913.The standard error of calibration sets and standard error of prediction were 1.186 and 1.267,respectively.The results showed that modeling based on the support vector machine algorithm could accurately detect aflatoxin B1in the paddy rice.The research results could provide theoretical basis for accurate and real-time monitoring of aflatoxin B1contamination in the storage paddy rice.

paddy rice;storage;aflatoxin B1;support vector machine regression;near-infrared spectroscopy

TS207.3

A

1005-9369(2015)05-0084-05

2015-01-24

国家科技支撑计划项目(2012BAK08B04-02);公益性行业(农业)科研专项(201403063-4);黑龙江省科技攻关项目(GC12B404)

张强(1986-),男,博士研究生,研究方向为农产品无损检测。E-mail:13945142945@163.com

郑先哲,教授,博士生导师,研究方向为农产品加工技术。E-mail:zhengxz@neau.edu.cn

猜你喜欢
标准偏差黄曲霉稻谷
谦卑的稻谷
倾斜改正在连续重力数据预处理中的应用
鸡黄曲霉毒素中毒的临床表现、实验室诊断与防治
玉米价疯涨 稻谷也凑热闹
孜然精油对产毒黄曲霉的抑制活性研究
田野稻谷香
平滑与褶皱表面目标的散射光谱的研究
互感器检定装置切换方式研究
江汉平原辞
WLR—60D温度表检定装置不确定度的评定