谌蓓,夏立娅,窦玉蕾,马泽洋,熊娜
(1.东方汇理银行(中国)有限公司北京分行,北京 100020;2.河北大学化学与环境科学学院,河北保定 071002;3.河北大学质量技术监督学院,河北保定 071002)
地理标志产品是指产自特定地域,所具有的质量、声誉或其他特性本质上取决于该产地的自然因素和人文因素,经审核批准以地理名称进行命名的产品.目前中国已经对近千个地理标志产品实施了专门保护,产地范围涵盖全国30个省、自治区、直辖市.地理标志产品的品质和特征体现了其原产地的自然因素和人文因素,具有良好的口碑和知名度,赢得了消费者的认可,其价格也远高于市场中同类普通产品.在经济利益的驱动下,假冒伪劣的地理标志产品广泛存在于市场中.甚至一些像响水大米、涪陵榨菜、武昌鱼等知名地理标志产品,因没有得到有效的保护,地理标志被滥用,导致正宗产品被假冒伪劣产品屡屡围攻.消费者和正规企业的合法权益被侵犯,严重败坏了地理标志产品的信誉.为整顿市场秩序,迫切需要发展地理标志产品的有效鉴别技术和方法.
目前,地理标志产品的鉴别方法主要集中于稳定性同位素、矿物元素指纹、有机组分特征含量、近红外光谱等方面[1-9].其中近红外光谱由于其快速、无损、成本低廉等特点受到广泛关注.由于不同产地食品中化学成分差异较小,各成分间存在很强的协同效应,利用多元统计学方法对数据进行分析成为有效的技术手段.本课题组分别利用无监督模式的聚类分析法和监督模式的判别分析方法建立了地理标志产品响水大米的近红外光谱鉴别方法,结果表明监督模式的分析方法在产地鉴别中准确性更高[10].本文拟在此基础上,对比另外2种同属于监督模式分析方法的多元线性回归和BP人工神经网络算法在产地鉴别中的应用效果.
从响水大米的主产地共采集119个响水大米样本,从天津、湖南等大米主产区采集对比样本90个,所有样本均为粳米.
采用德国BRUKER公司MPA型傅里叶近红外光谱仪,OPUS光谱采集软件.
将大米样品在30℃干燥48h后,采用四分法取50g置于旋转非透射样品杯中,在室温25℃,空气湿度50%的条件下扫描近红外吸收光谱.扫描波数为4 000~10 000cm-1,分辨率为8cm-1.每个样本扫描32次,以其平均光谱作为最终的透射光谱.采用仪器自带的OPUS光谱分析软件对原始光谱进行一阶导数及平滑处理.
利用SPSS19.0软件进行主成分和多元线性回归判别分析,利用Matlab7.0进行BP人工神经网络分析.
从不同产地大米近红外光谱图(图1)可见,不同的大米样本近红外光谱图稍有差异,但总体上比较相近,难以通过肉眼识别.对原始光谱进行一阶求导后,不同产地大米的近红外光谱差异稍加显著,可以更加细致地反映样品的光谱特征.
由于样本的光谱数据庞大,数据间存在一定关联性,不利于多元统计学分析,因此采用主成分分析对数据进行降维处理.由于PCA分析的前3个主成分已包含了绝大部分的分类信息,因此,可根据前3个主成分的载荷值分析大米产地分类的特征波段.不同产地大米的光谱进行PCA分析后,以波谱区域对PC1的贡献值为主要参考指标,并综合考虑对PC2与PC3的贡献值,得出7 700~6 700cm-1与5 700~4 300cm-12个波段为大米产地鉴别的特征波段.
对不同产地大米的全光谱与特征光谱分别进行PCA分析,前22个主成分的累积可信度如图2所示.全波段方法前22个主成分的累积可信度在97.11%以上,特征波段前22个主成分的累积可信度在98.43%,包含了光谱数据绝大部分的特征信息,因此可以选用主成分得分进行后续的多元统计学分析.
图2 全波段和特征波段前22个主成分累积可信度Fig.2 Accumulative reliabilities plot of the top 22principal components of whole wave band and characteristic wave band
多元线性回归(MLR)研究一个因变量和多个自变量之间数量上相互依存的线性关系.在该部分分析中,响水大米的产地变量值为1,非响水大米的产地变量值为2,所有样本的主成分数据导入SPSS软件中,作为自变量的数据采用逐步进入的方式,自变量的选择依据是F值小于0.05进入,大于0.10将被弃去.逐步分析终止的时候,筛选了10个变量(表1).利用这些变量建立的多元线性方程计算大米样本的产地,判断依据是:数值大于1.5为非响水大米,小于1.5为响水大米.分析结果(图3)可知,响水大米样本的预测结果为0.960~1.188,非响水大米的预测结果为1.834~2.116,产地判别正确率为100%,标准残差为0.539.其中主成分1、主成分2、主成分3和主成分6对于回归方程的影响最大(图4),进一步说明主成分分析后,前3个主成分保留了更多的原有数据的信息,对后续多元统计学分析的影响较大.
表1 DMLR分析判别函数系数Tab.1 Standardized canonical discriminant function coefficients of stepwise DLMR
图3 多元判别大米产地结果Fig.3 Standardized predicted geographical origin of rice by stepwise DMLR
图4 主成分与预测结果的相关性Fig.4 Correlation diagram of principal components and predictions
若把全部光谱数据作为BP人工神经网络的输入,不仅加大了计算量,而且某些区域的光谱信息与样品的组成或性质缺乏一定的相关性.在本文分析中,将提取的前9个独立主成分作为BP神经网络的输入,建立人工神经网络结构.使用1和2的分别代表响水大米样品和非响水大米样品.隐层传递函数设为logsig,输出层传递函数设为线性函数.输入层、隐含层和输出层节点分别为9,10和1个.目标方差为2.0×e-3,最大训练次数为20 000次.对于每一类样本,均采用一半作为网络训练,另一半作为测试.通过网络训练,网络达到要求,网络误差收敛曲线较为理想(图5).测试结果表明:分类的正确率能保持在100%.
比较分析结果表明,对于响水大米和非响水大米的分类,多元线性回归判别和BP人工神经网络算法都能达到100%正确.也说明了同属于有监督模式的多元线性回归判别和BP人工神经网络算法都适用于地理标志产品的鉴别分析,由于多元线性回归判别算法简单,易于实现,更具有推广性.该方法将为响水大米地理标志产品及相关产品的保护提供技术支撑.
图5 Sigmoid函数误差迭代收敛曲线Fig.5 Sigmoid function error iteration convergence curve
[1] KELLY S,BAXTER M,CHAPMAN S.The Application of isotopic and elemental analysis to determine the geographical origin of premium long grain rice[J].Eur Food Res Techno l,2002,214(1):72-78.
[2] KAWASAKI A,ODA H,HIRATA T.Determination of strontium isotope ratio of brown rice for estimating its provenance[J].Jap Soc SoilSci Plant Nutri,2002,48(5):635-640.
[3] MONTALVAN R,ANDO A,ECHEVERRIGARAY S.Use of seed protein polymorphism for discrimination of improvement level and geographic origin of upland rice cultivars[J].Genetics and Molecular Biology,1998,21:531-535.
[4] RHYU M R,KIM E Y,KIM S S,et al.Regional differences of four major rice cultivars in Korea by capillary electrophoresis[J].Food Science &Biotechnology,2001,10(3):299-304.
[5] CASALE M,CASOLINO C,OLIVERI P,et al.The potential of coupling information using three analytical techniques for identifying the geographical origin of Liguria extra virgin olive oil[J].Food Chemistry,2010,118:163-170.
[6] WOODCOCK T,DOWNEY G,O'DONNELLl C P.Near infrared spectral fingerprinting for confirmation of claimed PDO provenance of honey[J].Food Chemistry,2009,114:742-746.
[7] 李勇,魏益民,潘家荣,等.基于FTIR指纹光谱的牛肉产地溯源技术研究[J].光谱学与光谱分析,2009,29(3):647-651 LI Yong,WEI Yimin,PAN Jiarong,et al.Determination of geographical origin of beef based on FTIR spectroscopy analysis[J].Spectroscopy and Spectral Analysis,2009,29(3):647-651.
[8] YU Haiyan,ZHOU Ying,FU Xiaping,et al.Discrimination between Chinese rice wines of different geographical origins by NIRS and AAS[J].European Food Research and Technology,2007,225:313-320.
[9] 陈永明,林萍,何勇.基于遗传算法的近红外光谱橄榄油产地鉴别方法研究[J].光谱学与光谱分析,2009,29(3):671-674.CHEN Yongming,LIN Ping,HE Yong.Study on discrimination of producing area of olive oil using near infrared spectra based on genetic algorithms[J].Spectroscopy and Spectral Analysis,2009,29(3):671-674.
[10] 夏立娅,申世刚,刘峥颢,等.基于近红外光谱和模式识别技术鉴别大米产地的研究[J].光谱学与光谱分析,2013,33(1):102-105.XIA Liya,SHEN Shigang,LIU Zhenhao,et al.Identification of geographical origins of rice with pattern recognition technique by near infrared spectroscopy[J].Spectroscopy and Spectral Analysis,2013,33(1):102-105.