钱丽丽,冷候喜,张爱武,宋雪健,曹冬梅,汤华成,张东杰*
1 (黑龙江八一农垦大学食品学院,黑龙江 大庆,163319)2(杜尔伯特伊利乳业有限责任公司,黑龙江 大庆,166200)3(杜尔伯特金山乳品有限责任公司,黑龙江 大庆,166200 )
基于Fisher判别法对黑龙江大米产地溯源
钱丽丽1,冷候喜2,3,张爱武1,宋雪健1,曹冬梅1,汤华成1,张东杰1*
1 (黑龙江八一农垦大学食品学院,黑龙江 大庆,163319)2(杜尔伯特伊利乳业有限责任公司,黑龙江 大庆,166200)3(杜尔伯特金山乳品有限责任公司,黑龙江 大庆,166200 )
为了探索大米产地鉴别可行性,维护市场秩序和消费者的合法权益,该研究采用Fisher判别法(Fisher discriminant method,费希尔判别法)进行建模并结合近红外光谱技术,对2015年黑龙江5 个水稻主产区(五常、佳木斯、齐齐哈尔、双鸭山、牡丹江)的118份大米粉末样品进行近红外光谱的扫描,光谱预处理方法为9点二阶求导结合5点平滑,建模波长为全波长。对模型采用留一交叉验证和预测样本集进行验证,5 个地域的验证结果分别为94.4%、94.4%、91.7%、91.7%、94.4%和87.5%、87.5%、87.5%、100%、100%。预测结果达到80%以上,初步认定近红外光谱指纹分析技术可用于黑龙江大米产地溯源。
大米;产地溯源;近红外光谱;Fisher判别法
黑龙江省自然条件优越,种植的水稻米粒通透,口感良好,受到广大消费者和厂商的青睐,尤以黑龙江地理标志大米品质更佳,市场需求量大且价格较普通大米高出3倍以上。正因为这一利益的驱使,不法商贩将普通大米冒充地理标志大米,破坏了企业和消费者的利益,扰乱市场秩序。目前矿物元素指纹分析技术[1]、有机成分指纹分析技术[2]、近红外光谱技术[3]等已被用于农产品产地溯源的研究,但仍处于初级阶段,前两者具有判别结果准确度高等优点,但存在着检测周期长,成本高等缺点,相比较而言近红外技术在产地溯源的研究中有着快速、高效、无损等优点,近红外光谱分析主要用于有机物质定性和定量的一种分析技术,易受到加工方式、贮藏时间和条件等影响,故在产地溯源研究中存在一定的局限性。Fisher判别法是先对样本进行方差分析,将样本的种类区分出,然后依据方差分析的结果进行线性判别分析,区分不同个体。Fisher线性识别作为一种分类方法已经被成功的广泛使用在食品、农业等各个领域[4~7],同时将Fisher判别法与近红外光谱结合在茶叶、葡萄酒的品种和产地的鉴别中已见报道。周健等[8]将不同品种的茶叶样本作为试验样本,对试验样本进行了近红外光谱的采集,运用主成分分析(PCA)筛选出8个主成分,结合Fisher判别法建立的品种判别模型对茶叶样本进行识别,识别准确率为96.8%。刘巍等[9]以我国不同地域产的3 种葡萄酒为试验样本,对试验样本进行近红外光谱的扫描,采用Fisher判别法对试验样本进行产地溯源的鉴别,结果达到定性分析的要求。但应用近红外光谱结合Fisher判别法在大米产地溯源中的应用还鲜有报道,本研究采用近红外光谱技术结合Fisher判别方法建立黑龙江大米产地溯源模型,为近红外光谱分析技术在黑龙江大米产地溯源的研究提供理论依据。
1.1 试验材料
为确保试验样品真实性与代表性,试验样品的采集选择在水稻田中直接代表性取样,采样时间选择在水稻成熟期后、农户收割水稻前完成,每个采样点的每个品种采集2 kg,记录采样地点、品种等信息。地点选择2015年黑龙江5 个水稻主产区包括五常、佳木斯、齐齐哈尔、双鸭山、牡丹江,分别选择其主产县、主产乡(镇或农场)、主产村(屯)的大面积种植地块,采样品种选择5 个主产区的主栽品种。所有试验品种均为粳米,共118 份试验样品,如表1所示。将水稻样品经过晾晒、挑选、砻谷和碾米等统一加工过程,超微粉碎成米粉,过100目筛,待测。
表1 样品信息来源表
1.2 试验仪器
FC2K砻谷机,日本大竹制作所;VP-32实验碾米机,日本山本公司;FW100高速万能粉碎机, 天津泰斯特仪器有限公司;DA7200型固定光栅连续光谱近红外分析仪,瑞典波通仪器公司
1.3 材料的选取
试验材料的选择参照表1。随机选择全部样本量的2/3作为建模样本用于建立模型,1/3作为预测样本集用于验证模型。各地用于建模和预测的样本数见表2。
表2 建模与预测样品表
1.4 实验方法
采用Unscrambler 9.7光谱分析软件对进行光谱扫描,得到近红外原始光谱见图1。
图1 大米样品近红外原始光谱图Fig.1 Near infrared original spectra of rice samples
将原始光谱转化为TCAMP-DX格式,采用Unscrambler 9.7光谱分析软件选择原始光谱的预处理方法与建模波长范围;然后将样本光谱除去水分峰,采用主成分分析给数据降维,筛选Fisher自变量;用SPSS 18.0软件分析数据,建立Fisher判别模型;用建模样本集建立Fisher判别模型,用预测样本集对模型进行验证,计算模型的产地判别正确率。
2.1 光谱预处理方法的选择对建模效果的影响
试验选择MSC、SNV、平滑、求导4 种常用的光谱预处理方法,分别对全部样本的近红外原始光谱进行预处理后,将样本近红外光谱图中的水分峰扣除,消除水分对建模结果的影响。对表2中的建模样本集在全波长范围采用Fisher判别法建立判别模型,用预测样本集对模型的正确度进行验证,选择高预测正确率对应的预处理方式为本试验的近红外原始光谱预处理方式。对于平滑和求导预处理来说,选择的点数过少对光谱预处理的效果并不明显,过多会造成光谱的失真。故试验选择范围为5点、7点、9点、11点,即对5点、7点、9点、11点进行平滑处理、一阶求导处理和二阶求导处理。
不同预处理建模的效果见表3。将预处理后建模预测的结果与原始光谱建模预测的结果对比,发现原始光谱与经过不同预处理后的近红外光谱建立的Fisher判别模型对预测样本集的识别率均为100%,但是预测正确率大不相同。经过一阶和二阶求导预处理建模的预测正确率比经过原始光谱、MSC、SNV、平滑预处理建模的预测正确率高。说明近红外原始光谱经过预处理后,是可以提高模型对预测集的正确率。经过9点二阶求导预处理后建立模型的预测正确率最高,5 个地域的预测正确率分别为75%、75%、75%、87.5%、75%。与苏学素等[10]在对脐橙产地溯源研究中选出的最优对光谱预处理的方法基本一致。
试验选择在9点二阶求导的基础上,分别结合MSC、SNV、5点平滑、7点平滑、9点平滑、11点平滑对样本的近红外原始光谱进行预处理后,用表2中的建模样本集在全波长范围采用Fisher判别法建立判别模型,用预测样本集对模型的正确度进行验证,并选择高预测正确率对应的预处理方式为本试验的近红外原始光谱预处理方式,验证结果见表4,可以看出2种预处理后的近红外光谱建立的Fisher判别模型对预测样本集的识别率均为100%,但是预测正确率大不相同,但总体上比表3中的预测正确率高。说明本试验中将2 种预处理方法结合可以提高模型的正确度比一种的效果好。由表4可以看出经过9点二阶求导和5点平滑预处理后建立模型的预测正确率最高,所以本研究最终选择9点二阶求导和5点平滑对近红外原始光谱进行预处理,预处理后的近红外光谱图如图2。与王亚鸽[11]在对枸杞产地鉴别及品质快速检测研究中采用对全光谱进行SNV+S-G D(2st,3th,5)预处理的方法基本一致。
表3 预处理对建模效果的影响
以上样品识别率均为100%。
表4 预处理对建模效果的影响
以上样品模型识别率均为100%
图2 预处理后的大米近红外光谱图Fig.2 Rice near infrared spectra after pretreatment
2.2 波长范围的选择对建模效果的影响
谱区范围的选择是建模过程中一个重要环节,近些年来,对建模波长范围的选择并无统一标准,学者的研究还处在规律的发现阶段,试验根据一些学者[12~17]的研究方式进行波长范围的选择对建模效果进行研究。对所有样本进行9点二阶求导结合5点平滑预处理后,对全光谱范围进行分段。对建模样本集采用Fisher判别法在全波长范围和分段光谱范围分别建立Fisher判别模型,用预测样本集对Fisher判别模型的正确度进行验证,选择高预测正确率对应的波长范围为本试验建立的Fisher判别模型选择的波长范围,不同波长范围建立Fisher判别模型的识别率和预测正确率见表5。比较各个波段的样本建模的结果,发现不同波段建立Fisher判别模型的识别率均为100%,但是预测正确率各不相同,但均为50%以上,其中分段波长建立模型的预测正确率最高的为1 150~1 250 nm波长。全波长建立模型的预测正确率总体比1 150~1 250 nm波段建立模型的预测正确率高,所以本试验选择全波长范围950~1 650 nm进行Fisher判别模型的建立。试验与NIU等[12]采用近红外光谱技术在800~2 500 nm的全波长范围内对来自不同酒厂的绍兴黄酒进行判别和周子立等[13]在全波长为325~1 075 nm处利用近红外光谱技术进行大米品种鉴别在波长范围的选取上存在一定的交集;NILSEN等[14]应用近红外反射仪器对传送带上的绞细牛肉成分进行在线检测所选取的全波长为950~1 700 nm试验效果较好;与赵海燕等[15]利用近红外光谱技术在全波长为950~1 650 nm处对不同地域来源的小麦进行地理标志性识别效果好与分段扫描,且试验结果与本试验相一致。选择全波长要优于分段波长的原因可能是由于全波长涵盖的指纹信息更充分能较为全面的表征样品特征,所以全波长范围的判别率要高于分段波长。
表5 不同波长范围对建模效果的影响
注:以上样品模型识别率均为100%。
2.3 模型的验证
为了全面的检测模型的预测能力,本研究选择了留一交叉验证法对建立的模型进行验证,即从78 个样本中随机抽取1 个进行判别,用剩下的77 个样本建模型后对其产地进行鉴别,鉴别结果见表6。结果表明,5 个地域的留一交叉验证和预测集校验对全光谱建立模型的检测结果分别为94.4%、94.4%、91.7%、91.7%、94.4%和87.5%、87.5%、87.5%、100%、100%。预测结果均为80%以上,均达到了定性判别的要求,初步说明Fisher判别可以用于黑龙江不同产地大米溯源。
表6 Fisher判别函数鉴别5个地域大米样品的结果
本试验选择五常、佳木斯、齐齐哈尔、双鸭山、牡丹江的118 份大米粉末样品进行近红外光谱的扫描,得到原始近红外光谱图。确定近红外原始光谱图的预处理方法为9点二阶求导结合5点平滑,最佳波长范围为全波长。在建立模型前对预处理后的近红外光谱进行主成分分析证明本试验可以采用Fisher判别法进行产地溯源判别模型。对模型的Fisher自变量进行选择,对建模样本集采用Fisher判别法进行产地溯源判别模型后,采用建模样本集采用留一交叉验证和预测样本集的验证,模型识别率为100%,5个地域的验证结果正确率均在80%以上,达到定性分析的要求,说明近红外光谱分析技术可用于黑龙江大米产地判别,为地理标志大米的产地保护具有重要的理论价值。为研究不同产地及品种之间的差异性对建模效果的影响,已在部分地区建立了试验田,对影响模型稳定性的相关因素展开系统研究是下一步的研究主要方向。
[1] GONZALVEZ A, LLORENS A, CERVERA M L, et al. Elemental fingerprint of wines from the protected designation of origin valencia[J]. Food Chemistry, 2009, 112(1): 26-34.
[2] HERBERGER K, CSOMOS E, SIMON-SARKADI L. Principal component and linear discriminant analyses of free amino acids and biogenic amines in hungarian wines[J]. Journal of Agricultural and Food Chemistry, 2003, 51(27): 8 055-8 060.
[3] 马冬红,王锡昌,刘利平,等. 近红外光谱技术在食品产地溯源中的研究进展[J]. 光谱学与光谱分析,2011,131(14):877-881.
[4] QU Y, ADAM B L, THORNQUIST M, et al. Data reduction using a discrete wavelet transform in discriminant analysis of very high dimensionality data[J]. Biometrics, 2003, 59(1):143-51.
[5] BILLINGS S A, LEE K L. Nonlinear fisherdiscriminant analysis using a minimum squared error cost function and the orthogonal least squares algorithm.[J]. Neural Networks the Official Journal of the International Neural Network Society, 2002, 15(2):263-270.
[6] Cawley G C, Talbot N L C. Efficient leave-one-out cross-validation of kernel fisher discriminant classifiers[J]. Pattern Recognition, 2003, 36(11):2 585-2 592.
[7] GESTEL T, SUYKENS J, LANCKRIET G, et al. Bayesian framework for least-squares support vector machine classifiers, gaussian processes, and kernel fisher discriminant analysis[J]. Neural Computation, 2002, 14(5):1 115-1 147.
[8] 周健,成浩,叶阳,等. 基于近红外的Fisher分类法识别茶叶原料品种的研究[J]. 光学学报,2009,29(1):1 117-1 121.
[9] 刘巍,李德美,刘国杰,等. 利用近红外光谱技术对葡萄酒原产地进行Fisher判别[J]. 酿酒科技,2010(7):65-69.
[10] 苏学素, 张晓焱, 焦必宁,等. 基于近红外光谱的脐橙产地溯源研究[J]. 农业工程学报, 2012(15):240-245.
[11] 王亚鸽. 基于近红外光谱技术的枸杞产地鉴别及品质快速检测研究[D].杨凌:西北农林科技大学, 2015.
[12] NIU X Y, YU H Y, YING Y B. YTransactions of the ASABE, 2008, 51(4): 1 371.
[13] 周子立, 张瑜, 何勇,等. 基于近红外光谱技术的大米品种快速鉴别方法[J]. 农业工程学报, 2009, 25(8):131-135.
[14] HILDRUM K I, NILSEN B N, WESTAD F, et al. In-line analysis of ground beef using a diode arrag near infrared instrument on a conveyor belt[J].Journal of Near Infrared Spectroscopy, 2004,12:367.
[15] 赵海燕, 郭波莉, 魏益民,等. 近红外光谱对小麦产地来源的判别分析[J]. 中国农业科学, 2011, 44(7):1 451-1 456.
[16] 段焰青, 陶鹰, 者为,等. 近红外光谱分析技术在烟叶产地鉴别中的应用[J]. 云南大学学报:自然科学版, 2011, 33(1):77-82.
[17] 陈全胜, 赵杰文, 张海东,等. SIMCA模式识别方法在近红外光谱识别茶叶中的应用[J]. 食品科学, 2006, 27(4):186-189.
Study on the origins of Heilongjiang rice based on Fisher discriminate method
QIAN Li-li1,LENG Hou-xi2,3,ZHANG Ai-wu1,SONG Xue-jian1,CAO Dong-mei1,TANG Hua-cheng1,ZHANG Dong-jie1*
1(Heilongjiang Bayi Agricultural University, College of Food Science,Daqing 163319,China)2(Duerbote Yili Dairy Limited Liability Company,Daqing 166200, China)3(Durbate Jinshan Dairy Limited Liability Company,Daqing 166200, China)
In order to explore the feasibility of identification of the origins of Heiloingjiang rice to protect consumer’s rights, food safety issue and legitimate issues, the study used Fisher discrimination method combined with near infrared spectroscopy to build a model. There were 118 rice powder samples from different varieties in five areas (Wuchang、Jiamusi、Qiqihaer、 Shuangyashan) were scanned by near infrared spectroscopy in 2015. Pretreatment method of spectroscopy data is based on “9-point derivative combined with 5-point smoothing”. The wavelength is the whole spectrum. The cross validation and the predicting samples were used to verified the accuracy of the model. The verification results of five areas were 94.4%, 94.4%, 91.7%, 91.7%, 94.4% and 87.5%, 87.5%, 87.5%, 100%, 100%. Predicting accuracy was more than 80%, and Fisher discrimination method was primarily assigned to use in heilongjiang rice origin trace identification.
rice; roots; near infrared spectrum; Fisher discriminant method
10.13995/j.cnki.11-1802/ts.201705033
博士,副教授(张东杰教授为通讯作者,E-mail:byndzdj@126.com)。
黑龙江省教育厅科学技术研究项目(12541576);黑龙江省垦区科研项目(HKN125B-13-02);黑龙江省高等学校科技创新团队建设计划项目(2014TD006);黑龙江省应用技术研究与开发计划项目(GA14B104)
2016-07-07,改回日期:2016-08-29