梁 楷,闫裕峰*,郎繁繁,周景丽,夏瑶瑶,张旭姣,丁 伟,武耀文
(山西紫林醋业股份有限公司,山西 太原 030400)
我国是世界上谷物酿醋最早的国家[1],北魏贾思勰所著的《齐民要术》总结了当时生产食醋的技术方法多达24种,每一种都各有特点[2]。谷物酿造食醋含有丰富的有机酸、糖类、游离氨基酸和香气成分[3],具有调节血脂、降低甘油三酯等独特功效[4]。谷物酿造食醋总酸包括挥发酸和不挥发酸两大类,其中挥发酸是食醋酸味的主要来源,其主要成分是乙酸;另外,食醋中还包含乳酸、苹果酸和酒石酸等不挥发酸,能够对食醋酸味进行调和,增加食醋的柔和感[5],因此食醋总酸含量是评价食醋品质的重要指标之一[6],目前生产上主要采用电位滴定法测定[7],该法受人为因素影响较大,不能满足现代食醋企业快速、在线检测的生产需求,同时为了满足生产检测任务,企业需要配备多个检测人员[8],无形中增加企业检测费用。如何在食醋生产过程中,快速、准确、稳定的检测食醋总酸含量,降低生产成本,对规模化食醋生产企业具有重要的意义。
近红外光谱(near-infrared spectroscopy,NIRS)分析技术依靠模型库对被分析样品进行判别分析,建模时所需代表性的样品数量少,不但分析快速、测样时无损、还能在线及时反馈,国内外研究学者在此方面开展了一些研究工作,被广泛用于食品、农产品品质的定性和定量检测[9-12]。近红外光谱分析方法主要应用于含氢基团(X-H)有机物质的检测[13],食醋中有机酸含量丰富,均有大量含氢基团,可使用近红外方法进行定量分析,故近红外技术是食醋总酸快速检测的一种理想分析技术。
本研究以紫林食醋作为实验材料,采用傅立叶变换近红外光谱分析技术结合电位滴定法检测食醋总酸含量,用偏最小二乘法(partial least-square,PLS)选择最优光谱模型[14-15],预测未知食醋样品的总酸。该方法极大的提高了检测效率,为食醋工业生产的可持续发展与形成食醋生产的在线快速检测技术提供依据,对于食醋生产技术进步和产品质量升级具有重大现实意义。
食醋:山西紫林醋业股份有限公司;氢氧化钠、酚酞(均为分析纯):天津欧博凯化工有限公司。
78-1型磁力加热搅拌器:江苏省金坛市荣华仪器制造有限公司;AR124CN电子分析天平:奥豪斯科技有限公司;QuasIR3000傅里叶变换近红外光谱仪:四川威斯派克科技有限公司(VSPEC);实验室ST3100 pH计:常州荣华仪器制造有限公司。
1.3.1 样本的收集
本研究实验过程所用的食醋样品均由工作人员从不同库房随机抽取不同酸度的样品作为待测样,其中总酸含量介于3.5~4.5 g/100 mL的样品有21个,介于4.5~5.0 g/100 mL的样品有71个,大于5.0 g/100 mL的样品有14个,共计106个样品,其中91个用于食醋总酸近红外光谱采集和模型建立,剩余15个作为外部验证预测样不参与建模。食醋总酸的测定参照GB/T 5009.41—2003《食醋卫生标准的分析方法》采用电位滴定法,每个样品进行3组平行测定,3组平行测定的相对误差控制在1.0%以内。
1.3.2 近红外光谱采集
样本近红外光谱的采集,以蒸馏水为参比,将食醋样品注入直径为5 cm的石英玻璃样品杯内进行数据采集。为避免样品间交叉污染,保证样品光谱质量,每次将食醋样品倒入样品杯前使用清水冲洗样品杯,并在润洗后将样品杯中的水擦拭干净,保持环境温度为20 ℃,选择漫反射积分球,测定样品漫反射吸收光谱,扫描光谱范围10 000~4 000 cm-1,光谱采集分辨率8 cm-1,扫描次数64次,用NirNet软件对食醋样品进行光谱采集及分析,且每个样品平行测定两次,采集两张平行光谱,最终取平均光谱图作为最终分析图谱。
1.3.3 近红外模型建立
(1)光谱数据处理
利用VSPEC公司开发的VModel近红外建模软件,采用多元散射校正对食醋总酸光谱进行处理,消除由于应用漫反射光谱采集时,带来的光程无法保持恒定、样品均匀性不一致等因素带来的干扰[16],同时应用平滑、一阶导数、二阶导数等预处理方法处理样品的光谱数据,从而消除光谱采集时可能产生的噪声影响[17]。另外,通过VModel近红外建模软件根据光谱的分布差异鉴别问题样品,直接剔除异常样品,从而提高校正模型的适应性和稳定性[18]。
(2)建立模型及预测评估
为了科学而合理地对建立食醋总酸的近红外模型的预测精度和模型稳定性进行评价,本次试验利用VSPEC公司开发的VModel近红外建模软件,将食醋总酸作为近红外定量模型参考值,采用偏最小二乘算法,结合不同光谱预处理方法和近红外谱区,建立食醋总酸近红外定量模型,采用决定系数R2、交互验证均方根误差(root mean square error ofcrossvalidation,RMSECV)和预测集均方根误差(root mean square error of prediction,RMSEP)3个指标进行评价,对模型进行综合评价分析,指标计算公式如(1)~(3)。在样品化学成分范围相同的前提下,R2越接近1,交互验证均方根误差和预测集均方根误差越小时,模型的预测能力越强[19]。
式中:n为校正集样品总数;m为验证集样品总数;yi为第i个样品的实测值为第i个样品的预测值为第i个样品的实测值的平均值。
1.3.4 数据统计分析
获得最佳模型后,得出模型预测值,利用EXCEL对模型预测值和经典滴定法实测值进行双样本方差分析。
图1 紫林食醋样品原始近红外图谱Fig.1 Original near infrared spectra of Zilin vinegar samples
图1所示为QuasIR3000傅里叶变换近红外光谱仪直接导出的106种食醋样品原始近红外图谱,图谱重叠度大,表明所抽取的样品理化成分均一,且在波数为10 000~4 000 cm-1光谱扫描范围内样品具有较强的噪音,谱图平滑,均在近红外谱区的合频区域和倍频区域[20],即波数为5 500~4 000 cm-1和7 500~6 000 cm-1都有明显的特征吸收峰,对近红外图谱进行二阶导数处理之后,光谱图的吸收峰较为整齐、圆滑,表明试验中对食醋样品所采用的光谱采集方式可行且有效。
本试验定量预测建模数据分别采用适量归一化、多元散射校正(multiple scatter correction,MSC)、一阶导数、二阶导数、平滑数等方法相互结合,得到最优光谱区间,利用偏最小二乘法(PLS)建立食醋总酸含量的校正数学模型。从已扫描的106个图谱及对应实测数据中,随机抽取其中91个作为建模数据库,并在建模过程中,每次从校正集中取出1个或多个样品作为临时验证样品,以其余的样品进行建模,然后对这1个或多个样品进行预测,如此循坏,得到每个样品的模型交叉预测值,最后,以交叉预测值与实测值误差平方和的均方根值(RMSECV)、预测集均方根误差(RMSEP)和决定系数R23个指标进行评价模型的精确度。本试验挑选了10个结果理想的预处理方法进行对比,结果见表1。
表1 不同预处理方法下食醋总酸含量的偏最小二乘法建模Table 1 Partial least squares model of total acid content of vinegar under different pretreatment
由表1可知,第1种组合预处理方法的最优谱区范围是4 594.42~5 195.35 cm-1、5 796.28~6 998.14 cm-1、8 800.94~9 401.87 cm-1,交叉验证决定系数R2是0.971 1,交叉验证均方差(RMSECV)是0.062 1,在所有预处理方法中R2为最大,RMSECV为最小,模型主成分因子数为10,模型拟合充分,且最稳健、预测可靠性最好。因此,选择第1种预方法(适量归一化+一阶导数的光谱预处理方法)的模型作为预测食醋总酸的模型。
图2 校正集样品中食醋总酸含量实测值与预测值的相关性Fig.2 Correlation between measured values and predicted values of total acid contents of vinegar in calibration set samples
依据第1种预处理方法,利用VModel近红外建模软件得到校正模型-偏最小二乘(PLS)模型。食醋总酸PLS法所建模型的实测值与预测值的相关性散点分布图见图2,食醋总酸校正模型的相关系数R2为0.990 2。校正集样品中食醋总酸交互验证偏差相关性图见图3,散点分布均匀,表明食醋总酸预测值与实测值的相关性良好,该模型具有预测可行性。
图3 校正集样品中食醋总酸含量交互验证偏差相关性Fig.3 Correlation of cross-validation bias of total acid contents of vinegar in calibration set samples
为了进一步验证模型的准确性和稳定性,试验过程同时采用外部验证方式验证模型效果,即将未参与建模的15个预测样组成的预测集代入模型进行预测,同时与经典电位滴定法测得的实际值进行比较,每次试验进行3组平行测定,对比结果见表2。由表2可知,模型预测集的总酸结果与经典电位滴定法测得的实际值相比,最大相对误差为1.383%。
表2 偏最小二乘法模型的食醋总酸含量预测值与实测值比较Table 2 Comparison between predicted values and measured values of total acid content of vinegar in partial least squares model
为了检验所建模型得预测值与实测值是否有显著性差异,运用EXCEL软件对两组数据进行双样本方差分析,结果见表3。由表3可知,检验统计量F<临界值Fcrit,表示两组数据(实测值与模型预测值)在α=0.05的水平上无显著性差异[21],且两组数据间相关性系数为0.995,说明使用“矢量归一化+一阶导数”光谱预处理方法得到的食醋近红外总酸模型得出的预测值和滴定法实测值没有显著性差异,该模型可以对食醋总酸进行预测。
表3 双样本方差分析Table 3 Variance analysis of two-sample
实验结果表明,食醋总酸实测值与对应采集的近红外漫反射光谱相关联建立快速检测模型后,近红外食醋总酸模型的交叉验证决定系数(R2)为0.972 3,交叉验证均方差(RMSECV)为0.062 1。经外部模型验证后,该模型食醋总酸预测值和国标法实测值的平均绝对偏差为0.035,最大相对误差为1.383%,两者间相关性系数达0.995。该方法能够准确预测工业生产上食醋总酸的定量检测,为建立食醋生产在线、无损、快速检测方法提供了理论依据,对于食醋生产过程中需要频繁测定总酸来控制生产进程的企业提供了一种更加方便、快捷和绿色的方法。