钟方平,李张赟,韦尚锋,胡佳欣,王永波
贵州大学林学院(贵阳 550025)
核桃仁中含有较多的蛋白质和人体必需的不饱和脂肪酸,对人体具有重要的营养、药用和保健价值,是一种老幼皆宜的坚果食品[1]。由核桃仁精制而成的核桃粉被越来越多地应用于蛋白饮料行业,满足消费者的新需求[2]。核桃粉与花生粉或葵花籽粉比较相似,直观上很难辨别,且两者的价格相差较大,一些不法商贩为谋取暴利制造伪劣食品,导致市场上售卖的核桃粉掺假掺杂现象与日俱增,严重侵害消费者权益。食品质量安全问题日益突出,食品掺杂掺假、添加剂滥用、微生物超标等问题不断曝光,促使人们对食品质量要求越来越高[3-5]。为此,建立快速鉴别掺杂核桃粉有一定现实意义。中红外光谱(mid-infrared spectroscopy,MIR)是物质在中红外区的吸收光谱,它可将物质分子基团的振动和转动信息转化为可视化的波数、峰高和峰性[6]。利用中红外光谱的定性和定量分析技术在各个领域得到较为广泛的推广和应用。孙燕等[7]利用中红外图谱分析仪并结合化学计量学,判别饶河当地的蜂蜜样品和其他地区蜂蜜样品,准确率为90.3%;徐一茹等[8]利用近红外光谱和中红外光谱法建立的基于偏最小二乘法的校正模型,实现对小麦粉中的灰分、水分、面筋品质指标的检测分析;赵琦等[9]阐述了中红外光谱在食用油、肉食品、糖类食品等的掺假检测中的应用。与传统的理化分析方法存在耗时长、不环保、花费高等缺点相比,中红外光谱法具有检测速度快、样品用量少、经济环保等优点。鉴于此,试验分析核桃粉掺杂花生粉和葵花籽粉的红外光谱信息,并评价PLS-DA和SIMCA这2种分类器用于核桃粉掺杂的模型鉴别效果。
核桃(贵州赫章)、花生及葵花籽干果样本均采自贵州本地市场。用物理冷轧法除去材料油脂后,用粉碎机粉碎,过0.075 0 mm(200目)孔径筛,得到自制的脱脂核桃粉、花生粉和葵花籽粉。将制作好的样本烘干后,用自封袋进行分装,放入干燥器待用。
KBr(光谱纯,Macklin)。
压片机(配有压片磨具,DF-4B,天津港东科技);傅里叶变换红外光谱仪(美国PerkinElmer);电子分析天平(JF2004,余姚市金诺天平仪器有限公司)。
用Spectrum 10进行光谱预处理;用The Unscrambler X进行光谱预处理和建模;用Origin 2021进行作图。
1.3.1 样品准备
以脱脂核桃粉为研究对象,分别掺入1%,5%,10%,20%和40%(W/W)的脱脂花生粉、脱脂葵花籽粉。掺杂样品制备参考Karunathilaka等[10]描述的几何稀释法。即:(1)准确称取60 g脱脂核桃粉和40 g脱脂花生粉(脱脂葵花籽粉),放入直壁玻璃瓶中,通过15次倒置进行混匀;(2)称取50 g步骤1中初始混合物,按照1∶1(W/W)的比例加入脱脂核桃粉稀释,依然通过15次倒置混匀。重复此过程,多次加入脱脂核桃粉稀释,直至得到试验所需掺杂10%,5%和1%的脱脂核桃粉混合物。
1.3.2 中红外光谱数据采集
使用KBr压片法制作扫描样品,样品与溴化钾混合质量百分比为1%[11-12]。利用傅里叶变换红外光谱扫描仪采集每个掺杂百分比样品的光谱信息。每次使用仪器之前预热30 min,扫描范围设定为4 000~400 cm-1,扫描次数4次,分辨率4 cm-1。扫描前扣除H2O和CO2的干扰。每一掺杂水平重复20个样本,共收集220个样本光谱数据。
1.3.3 光谱数据预处理
为去除试验过程中环境、仪器及操作引起的系统误差的影响,用Spectrum 10和The Unscrambler X软件对原始光谱数据进行基线校正、Savitsky-Golay(SG)7点平滑、多元散射校正(MSC)预处理[13]。由图1(a)可知平滑处理可以明显减小光谱的噪声。SG+MSC处理后的图如图1(b)所示。
图1 随机样本原始光谱与经预处理光谱图
1.3.4 模型评价
主成分分析(principal component analysis,PCA)是将多个重要指标转化为少数信息不重叠的综合指标的多元统计方法,利用方差最大原则,对扫描的光谱数据信息中包含的自变量进行归一化预处理,并且能够在信息丢失、损耗最小的前提下,通过排除它们相互重叠部分的信息来达到降维的目的,常用于红外光谱分析方法的数据处理中[14-15]。
簇类独立软模式分类(soft independent modeling of class analogy,SIMCA)用于建立主成分回归模型,模型需要采用交叉验证的预测残差平方,为训练集每个类建立PCA模型。将训练集模型与测试集样本进行拟合,根据训练集与测试集的相似程度分类。
判别偏最小二乘法(partial least squares-discriminant analysis,PLS-DA)是基于判别分析基础上的PLS算法,是以Y变量为二进制变量来取代浓度变量。这种分类方法不仅可将混合的训练集样品根据主要成分进行分类,在此基础上还可以确定未知训练集的归属。
判别过程:(1)创建训练集样品的定义分类变量(分类变量用数值变量赋值);(2)用训练集的样品变量(Y)和中红外光谱数据(X)进行PLSR建模;(3)用建立的PLS模型,对测试集样品进行判别分析。
分类判别标准(阈值0.5):(1)当测试集分类变量预测值的偏差<0.5时,说明判定样品属于该训练集;(2)当测试集分类变量预测值的偏差≥0.5时,说明判定样品不确定。
由图2可以看出,不同掺杂物和掺杂质量比的脱脂核桃粉的中红外光谱图存在一定区别,主要表现在3 414 cm-1附近有1个很强的吸收峰,这与O—H键的伸缩振动有关,2 926 cm-1附近的峰为—CH2的反对称伸缩振动,1 746 cm-1附近峰为油脂的C=O伸缩振动,1 639 cm-1附近为蛋白质酰胺Ⅰ带的C=O伸缩振动吸收峰,1 537 cm-1附近为酰胺Ⅱ带中N—H弯曲振动和C—N的伸缩振动吸收峰,1 162 cm-1附近为酯基C—O伸缩振动吸收峰[16-17],669 cm-1附近的峰为C—S—C对称伸缩振动吸收峰,618 cm-1附近的峰与硫酸盐SO42-不对称变角振动有关[18]。
图2 不同掺杂质量比的脱脂核桃粉中红外光谱图
PCA是模式识别中使用最基础、广泛的统计分析法[19],图3为11类不同掺杂比核桃粉的主成分2D椭圆置信区间图。PC1解释了98.3%方差,PC2为0.8%,前2个主成分解释方差达到99.1%,各类样品之间无重叠。不同样品之间的品质差异可以通过主成分得分图上的间隔距离反映,样品间距越大代表其特性差异越明显。由图3可知,各样品间特征差异明显。
图3 不同掺杂质量比核桃粉的PCA分析
试验根据脱脂核桃粉中掺杂物不同,分为掺杂脱脂葵花籽粉和掺杂脱脂花生粉,掺杂比率分别为0,1%,5%,10%,20%和40%,共11类样品。各类样品按3∶1的比例随机选取15个作为训练集,5个作为测试集。选择最大主成分数5,对每一类样品的训练集进分别进行PCA[20],建立SIMCA模型。
在用SIMCA进行PCA聚类分析中,一般采用聚类中心之间的距离(类间距)评价聚类的效果,而聚类结果好坏的关键是合适特征的选取[21]。类与类之间差异越明显,类间距则越大。试验中不同掺杂质量比样品模型类间距见表1。明显看出纯核桃粉与不同掺杂质量比的葵花籽粉以及花生粉之间类间距大。
表1 不同掺杂质量比样本类间距
用建立的SIMCA模型对测试集样本进行检验,结果见表2。掺杂不同质量比葵花籽粉样品的训练集和测试集模型的识别率均为100%。掺杂花生粉的训练集识别率都为100%,测试集都在80%以上。
表2 SIMCA模型在显著性水平α=0.1%条件下最佳训练和测试结果
PLS-DA训练集和测试集的建立方法同2.2。选择最佳主成分:掺杂葵花籽粉为5,掺杂花生粉为7。采用完全交叉验证策略[22]。用决定系数R2值,RMSEC值和RMSECV值对模型进行评价。从表3可知,掺入葵花籽粉和花生粉分类变量间的相关性较好,其模型的训练集和测试集的R2大于0.93,RMSE值均小于0.5,且训练集和测试集的RMSE差值未超过0.2,训练集样品的识别率大于70%。测试集建模的结果表明,该模型有着良好的自我分类能力。
表3 PLS-DA建模结果
利用PLS-DA模型对测试集样本进行验证,图4(a)是模型对在核桃粉中掺杂不同质量比的葵花籽粉样本进行判别分析。可以看出:测试集中不同样本分类变量的预测值分别不同,纯的脱脂核桃粉分类变量的预测值接近0.5,在0~1范围之内;另外掺杂1%葵花籽粉、5%葵花籽粉、10%葵花籽粉、20%葵花籽粉和40%葵花籽粉分类变量的预测值分别接近1,1.5,3,3.5和5,且偏差均小于0.5。测试集中大部分样本被正确识别,识别率为77%。
图4 PLS-DA模型预测值
图4(b)是测试集样本中花生粉样本的结果。测试集纯脱脂核桃粉的分类变量预测值小于0.5,且偏差均小于0.5;测试集除纯脱脂核桃粉的分类变量预测值其余都大于0.5,偏差小于0.5。根据PLS-DA法的判别准则,识别率为83%。不同质量比花生粉可以明显地分开判别。
对采集的原始红外光谱数据进行基线校正、Savitsky-Golay(SG)7点平滑、多元散射校正(MSC)预处理,可以有效去除试验过程中环境、仪器及操作引起的系统误差的影响,这与张朱珊莹等[23]研究结果相同。直观上不同掺杂质量比样品的中红外光谱图特征有一定区别,却不能直接精确判别掺杂其他物质,还需要通过其他的方法进行进一步区分。
在不同掺杂比核桃粉的PCA定性分析中,前2个主成分解释方差达到99.1%。主要差异表现在纵坐标PC1上达到98.3%,在王晓玲等[24]低场核磁共振结合化学计量学方法快速检测掺假核桃油中,PC1和PC2共保留99%的原始数据信息,可将纯核桃油与掺入葵籽花油的核桃油样品明显区分。此次试验PC2的贡献率与之相比较小,但已达到使用要求,分类样品很明显,间距距离长、差异大,可有效证明掺杂不同百分比的样品与脱脂纯核桃间存在明显的品质差异。
SIMCA方法可以明确判断出错误分类样本的归属,并找到误分样品的去处。用SIMCA进行PCA聚类分析,明显得到纯脱脂核桃粉与不同掺杂质量比的葵花籽粉及花生粉之间类间距大,且模型识别率为80%以上、训练集识别率均为100%。说明中红外光谱结合SIMCA法能有效、快速地识别脱脂核桃粉中掺杂脱脂葵花籽粉和脱脂花生粉。PLS-DA的判断结果只是比较浅层次的判断正误,不能从中观察到错误的源头,因为该模型中的类别值只是一个假设值[25]。在建立的PLS-DA模型中,模型分类识别的正确率要求在60%以上[26],试验结果达到标准(71%~87%),说明该法用于掺入葵花籽粉和花生粉的核桃粉样品分类鉴别可行。但因样品选择的最佳主成分数较高,模型数据会出现过拟合现象,使RMSEC值过低,测试误差偏高,导致试验PLS-DA法测试集识别率低于SIMCA法测试集识别率。
运用PCA从定性的角度对掺杂脱脂核桃粉样品进行分析,整体掺杂样品无重叠,特征差异明显。用SIMCA进行PCA聚类分析,明显看出纯脱脂核桃粉与不同掺杂质量比的葵花籽粉以及花生粉之间类间距大,且SIMCA模型对未知测试集样本的识别率为80%~ 100%、训练集识别率均为100%。说明中红外光谱结合SIMCA法能有效、快速地识别脱脂核桃粉中掺杂不同比例的脱脂葵花籽粉和脱脂花生粉。另外PLS-DA建立模型,各样本训练集和测试集的R2超过0.932 6,RMSE值小于0.5,训练集和测试集样品的识别率在71%~87%。说明在严格的试验条件下,PLS-DA法是可行的。试验运用中红外光谱法结合3种化学计量学方法(PCA、SIMCA、PLS-DA)鉴别核桃粉中掺杂花生粉和葵花籽粉都获得满意的结果。经比较采用中红外光谱结合SIMCA法鉴别效果最佳,可以实现对核桃粉中掺杂不同比例脱脂花生粉和脱脂葵花籽粉的快速鉴别。