古方青,管 骁,刘 静,杨永健,张仲源
(1.上海理工大学医疗器械与食品学院,上海200093;2.上海海事大学信息工程学院,上海200135;3.上海市食品药品检验所,上海201203)
近红外光谱技术快速检测原料乳中掺杂物
古方青1,管 骁1,刘 静2,杨永健3,张仲源1
(1.上海理工大学医疗器械与食品学院,上海200093;2.上海海事大学信息工程学院,上海200135;3.上海市食品药品检验所,上海201203)
采用近红外光谱技术结合化学计量学方法,对原料乳中常见的2种掺杂物——大豆分离蛋白与植脂末进行定量分析研究。先通过不同光谱预处理方法结合偏最小二乘法(PLS)建模评价不同预处理方法的效果,结果表明通过平滑处理结合多元散射校正(MSC)进行光谱预处理效果最佳,大豆分离蛋白PLS定量模型相关系数(R2)与交叉验证均方差(RMSECV)分别为0.980 9、0.127 5,植脂末PLS模型分别为0.972 2、0.130 8。随后比较了不同建模方法的效果,结果发现:采用径向基神经网络(RBF)对大豆分离蛋白的建模效果最佳,R2为0.999 4,测试集均方根误差为0.003 1;采用广义回归神经网络(GRNN)方法对植脂末建模效果最佳,R2为0.998 9,测试集均方根误差为0.004 5。因此,合理结合近红外光谱技术与化学计量学方法可快速、准确检测原料乳中大豆分离蛋白和植脂末这2种掺杂物含量。
化学计量学;植脂末;近红外光谱;原料乳;大豆分离蛋白
近年来,不断出现的原料乳质量问题日益引起人们对乳制品质量安全的重视。目前,原料乳出现的主要质量问题为掺杂使假,掺杂物主要包括水、蛋白粉、植脂末等[1-2]。传统的原料乳质量分析方法通常需要利用不同手段对乳中不同组分分别进行测定,例如用凯氏定氮法测定蛋白质含量,用盖勃法或罗兹法等方法测定脂肪含量等,这些方法耗时费力,不利于原料乳品质的在线监控。因此,如何快速有效检测出原料乳中蛋白、植脂末这两类掺杂物是乳品企业及相关质检单位亟待解决的问题[1,3]。
随着光学仪器设计、制造水平的提高、计算机技术的发展和化学计量学方法研究的深入,近红外光谱分析技术在过程分析和工业控制领域应用越来越广,它具备无损、高效、快速、成本低、绿色环保和易于实现自动化等优点[4],特别是试样一般无需化学前处理,更加便于实现在线分析,同时依靠化学计量学方法,可实现物质的定性与定量研究[5-6]。
笔者通过分析掺入大豆分离蛋白以及植脂末的原料乳的近红外漫反射光谱,结合多种光谱预处理以及建模方法,建立定量模型,以期为快速检测原料乳中的蛋白或脂肪掺假物含量提供新的思路。
1.1 仪器设备
MPA型傅里叶变换近红外光谱仪(德国Bruker),谱区范围4 000~12 501 cm-1,扫描次数为64次,分辨率为8 cm-1。
1.2 试样准备
新鲜正常原料乳,取自上海金山奶牛场,用蒸馏水稀释至蛋白质质量分数为1.5%作为基底乳备用。在基底乳中分别掺入不等量的大豆分离蛋白或植脂末模拟掺假试样,大豆分离蛋白掺入量控制在0.1%~5.0%(质量分数),植脂末掺入量控制在0.1%~3.0%(质量分数),浓度梯度均匀分布,共制备61组样本。建模过程中在61组样本中随机选取45组作为训练集,剩余16组为测试集。
1.3 光谱采集与数据处理
在环境温度25℃、相对湿度45%条件下,近红外光谱仪开机预热10 min。采集光谱前,将试样均质60 s。利用光纤探头采集试样漫反射近红外光谱,每个试样采集光谱10次。将61×10组光谱数据图导入OPUS 6.5软件进行处理,即对每一个试样的10组图谱取平均值作为该样本的代表性光谱,共获得61组光谱图,并将光谱图以.CSV格式进行保存以备后续数据分析。
1.4 数据分析
数据处理分析在Math works公司提供的Matlab 2009b环境下进行。
2.1 光谱预处理及特征信息提取
图1显示了正常原料乳、基底乳、61组掺入不同浓度大豆分离蛋白或植脂末的掺伪乳漫反射图谱。由图1可知:稀释处理的基底乳图谱与原料乳未见明显差异,均在波数5 106和6 800 cm-1附近有较强特征吸收。但掺入大豆分离蛋白或植脂末后,光谱在部分波数处出现较大幅度扰动,如植脂末组在4 200~5 200 cm-1与6 700~6 900 cm-1区间内随着植脂末掺入量的提高光谱吸收增强。由于大豆分离蛋白与植脂末本身在近红外区间各处均有吸收,故选取全谱建立模型。光谱信号中除包括试样成分信息外,还包含高频噪声、基线漂移和试样背景等,因此建模前需对光谱进行预处理以过滤干扰信号,提高模型准确度。常用的光谱预处理方法包括平滑处理、多元散射校正、小波变换、一阶导数、二阶导数等[7]。同时,对光谱进行主成分分析可以避免建模中的信息冗余,在分析中起到简化数据的目的。本实验中笔者首先采取了平滑处理、多元散射校正以及小波变换等不同组合对光谱进行预处理,并通过主成分分析提取出特征变量,进一步通过偏最小二乘法建立定量模型,根据模型的相关系数R2、交叉验证均方差RMSECV和相对误差Σσ评价模型效果[8](表1)。。
表1为大豆分离蛋白试样组5种不同的光谱预处理方法效果。由表1可知:通过光谱平滑处理结合多元散射校正预处理后,应用主成分分析,前4个主成分累积可解释原光谱信息的90.1%,PLS模型相关系数R2可达0.980 9,RMSECV为0.127 5,建模效果最好;相反,尽管通过平滑处理结合小波变换预处理后,提取前3个主成分可解释原光谱99.8%的信息,但最终建模效果不理想(R2为0.926 8,RMSECV为0.232 6),可能的原因是建模效果并非完全取决于预处理方法的有用信息提取量,也与冗余信息剔除效果有关,同时全波段光谱与特征光谱段的选择也会影响建模效果。因此,平滑处理结合多元散射校正光谱预处理方法在综合平衡以上两方面关系的效果最佳。同样,通过对植脂末试样组光谱预处理效果比较可知,采用平滑处理结合多元散射校正预处理后,提取前4个主成分可解释原始光谱的88.8%信息,PLS模型R2为0.972 2,RMSECV为0.130 8,建模效果最好。由此可见,对本实验中的掺伪乳试样而言,平滑处理结合多元散射校正光谱预处理方法最能有效降低原始光谱的噪音,对提高建模性能有较大的帮助。
表1 不同光谱预处理方法对PLS建模效果的影响Table 1 Effects of different spectrum pretreatments on performances of PLSmodels
2.2 建模方法的比较
建模方法的选择同样对最终模型效果有重要影响。除偏最小二乘建模方法外,其他常用建模方法还包括多元线性回归、人工神经网络等。近年来,人工神经网络方法得到了飞速发展[9-10]。神经网络是一种新的智能学习方法,它通过模拟动物神经网络行为特征,进行分布式并行信息处理得到数学模型。该网络还可根据系统的复杂程度,通过自行调整内部大量节点之间相互连接的关系,进而达到高效处理信息的目的[11]。本文将原始光谱通过平滑处理结合多元散射校正预处理后,对主成分系数拟通过分别采用线性神经网络(linear neural network,LNN)、反向传播神经网络(Back propagation neural network,BP)、径向基函数神经网络(RBF)和广义回归神经网络(GRNN)建立模型。
由于不同神经网络方法模型系数各有不同,例如BP网络中节点层数、节点个数以及训练函数不同,对模型建立效果影响很大[12]。因此笔者比较了不同神经网络中不同系数设置对模型性能的影响,评价指标通过模型R2、训练集均方根误差σ1以及测试集均方根误差σ2来衡量。表2为不同的神经网络建模方法对大豆分离蛋白及植脂末含量预测能力的比较结果。
表2 不同建模方法的效果比较Table 2 Com parison of perform ancse of differentm odeling m ethods
由表2可知:LNN建模效果较差,这是由于该建模方法只能较好表征线性关系的输入与输出,而在本实验中由于建模输入的自变量较多,与输出结果线性关系不明显,由此导致模型预测能力不佳;BP神经网络建模相关系数较高,2种掺杂物的定量预测模型R2均大于0.97,但预测效果不理想,测试集均方根误差σ2较大,这是由于BP神经网络构建中间层节点数量较多,模型样本数量偏少,建模随机性大而不具代表性所导致;而RBF和GRNN模型拟合度以及预测准确程度均较高,其中对大豆分离蛋白含量的预测,通过GRNN网络建模,SPREAD为0.1时,R2为0.999 4,测试集均方根误差σ2仅为0.003 1,而对植脂末建模效果分析中,RBF建立模型可以取得最佳效果,模型R2为0.998 9,测试集均方根误差σ2为0.004 5。
总体看来,通过神经网络方法建立模型,对大豆分离蛋白以及植脂末含量的预测均能达到很好的效果,具有应用价值,但由于各种神经网络中参数变量复杂,且有不同组合,而不同取值均能对模型预测能力产生不同影响,因此在实际应用中需不断探讨参数变量以及最优组合的选择。本文中笔者仅讨论了部分通用参数设置条件下建立模型的结果,而对模型的全面优化仍有待进一步研究。
通过实验研究表明:利用近红外光谱分析可以快速检测原料乳中常见掺杂物——大豆分离蛋白和植脂末的含量。通过选择平滑处理结合多元散射校正光谱预处理方法结合GRNN建模方法,大豆分离蛋白组模型R2可达到0.999 4,测试集均方根误差为0.003 1;通过平滑处理结合多元散射校正预处理结合RBF建模,植脂末组模型R2达0.998 9,测试集均方根误差为0.004 5,说明建立的模型稳定性很高,且预测能力较强,可为研究原料乳中其他掺杂物的近红外定量分析提供参考。此外,进一步优化近红外光谱的建模参数设置,将有利于推广近红外光谱分析技术在原料乳质量监控实际工作中的应用。
[1] 郭朔.近红外光谱分析技术快速检测液态乳制品品质的研究[D].长春:吉林大学,2008.
[2] 王多加,周向阳,金同铭,等.近红外光谱检测技术在农业和食品分析上的应用[J].光谱学与光谱分析,2004,24(4):447⁃450.
[3] 王田子,邓丽敏,田立军,等.近红外在乳及乳制品质量检测中的研究进展[J].光谱学与光谱分析,2010,30(12):3208⁃3212.
[4] Balabin R M,Smirnov SV.Melamine detection bymid,and near⁃infrared(MIR/NIR)spectroscopy:a quick and sensitivemethod for dairy products analysis including liquid milk,infant formula,and milk powder[J].Talanta,2011,85(1):562⁃568.
[5] 徐广通,袁洪福,陆婉珍.现代近红外光谱技术及应用进展[J].光谱学与光谱分析,2000,20(2):134⁃142.
[6] 张晓慧,刘建学.近红外光谱技术在牛奶及其制品质量检测中的应用[J].红外,2007,28(6):38⁃41.
[7] 褚小立,袁洪福,陆婉珍.近红外分析中光谱预处理及波长选择方法进展与应用[J].化学进展,2004,16(4):528⁃542.
[8] 何勇,李晓丽,邵咏妮.基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究[J].光谱学与光谱分析,2006,26(5):850⁃853.
[9] Dowman R,Ben⁃Avraham D.An artifical neural network model of orienting attention towards threatening somatosensory stimuli[J]. Psychophysiology,2007,44(2):229⁃239.
[10] Robinson C J,Johnson D O,Almeida J S.Second trimester prediction of preeclampsia using an artifical neural network[J].J Soc Gynecol Invest,2006,13(2):126A.
[11] Liu X Z,Kang SZ,Li F S.Simulation of artificial neural network model for trunk sap flow of Pyruspyrifolia and its comparison with multiple⁃linear regression[J].Agric Water Manage,2009,96:939⁃945
[12] 齐俊.BP神经网络在牛乳检测中的应用[D].哈尔滨:哈尔滨理工大学,2009.
Rapid determ ination of adulteration in raw m ilk by near⁃infrared spectroscopy analysis
GU Fangqing1,GUAN Xiao1,LIU Jing2,YANG Yongjian3,ZHANG Zhongyuan1
(1.School of Medical Instruments and Food Engineering,University of Shanghai for Science and Technology,Shanghai200093,China;2.College of Information Engineering,ShanghaiMaritime University,Shanghai200135,China;3.Shanghai Institute for Food and Drug Control,Shanghai201203,China)
Quantitative determination of two kinds of common adulterants in raw milk,namely soy protein isolates and creamer,was performed by combining near⁃infrared spectroscopy with chemometrics analysis. Firstly,the effects of different spectrum pretreatment methods were evaluated by combining different spectrum pretreatment methods with partial least squares model.The results showed that smoothing algorithm combined with multiple scattering corrections had best performance.R2and RMSECV of PLS model for soy protein isolateswere 0.980 9 and 0.127 5,and that of creamerwere 0.972 2 and 0.130 8,respectively.Then,the performances of different modeling methods were compared.The results demonstrated that the bestmodelingmethods for soy protein isolates and creamer were RBF and GRNN methods.R2and RMSE testof the RBFmodel for soy protein isolateswere 0.999 4 and 0.003 1,and that of the GRNN model for creamer were 0.998 9 and 0.004 5,respectively.Therefore,NIRS combined reasonably with chemometric methods could be used to determine the contents of soy protein isolates andcreamer in raw milk with high speed and accuracy.
chemometrics;creamer;near⁃infrared spectroscopy;raw milk;soy protein isolates
TS252.7;O657.33
A
1672-3678(2013)06-0073-05
10.3969/j.issn.1672-3678.2013.06.015
2013-01-15
国家自然科学基金(31101348);上海市教委科研创新项目(10YZ113)
古方青(1988—),女,安徽无为人,硕士研究生,研究方向:食品安全监控技术;管 骁(联系人),副教授,E⁃mail:gnxo@163.com