段 学,赵小波,2,邹胜琼,田 敏,邓 波,2,周 军,2,张宿义,2,3
(1.泸州老窖股份有限公司,四川泸州 646000;2.国家固态酿造工程技术研究中心,四川泸州 646000;3.酿酒生物技术及应用四川省重点实验室,四川泸州 646000)
我国从20 世纪80 年代开始进行近红外(NIR)技术的研究,主要侧重于农产品[1-2]的分析研究,发展至今,此项技术已经应用于石化[3-4]、制药[5-6]、食品[7-8]、纺织品[9-10]等领域。近红外光谱分析方法是指通过分析待测样品近红外光谱中所呈现出的官能团信息,比较待测样品与已知或标准样品的近红外光谱从而确定待测样品含量的一种方法,该方法属于二次检测方法。
白酒基酒即基础酒,是粮食发酵后的酒糟经蒸馏后得到的未经勾兑的原酒,白酒基酒精度一般在60%vol~70%vol之间[11]。不同的基酒除酒精度不同之外,影响口味的其他成分如总酯、总酸、乙酸乙酯、乳酸乙酯、己酸乙酯等都不同[12]。现阶段酒精度常规采用酒精计进行测定,相对简单;总酸、总酯采用指示剂法,相对复杂;其他含量较低的成分采用气相色谱进行测定,检测时间长[13]。近红外分析方法作为一种快速、高效、无损和现场分析的方法,具有检测方便,样品无需预处理,适合在线分析等特点,因此非常适合白酒快速定性、定量分析。陈林等[14]建立了基酒中甲酸的近红外预测模型,验证集样品的决定系数为0.98,校正集样品的决定系数为0.99,所建的模型效果良好,能满足白酒生产中甲酸的快速检测需求。刘建学等[15]建立了基酒中己酸、乙酸的快速检测方法,预处理方法与波段分别采用:一阶导数+减去一条直线、一阶导数+矢量归一化预处理光谱;谱区选择6101.7~5446 cm-1和11998.9~7501.7 cm-1,6101.7~5449.8 cm-1和11998.9~7497.9 cm-1;己酸、乙酸校正集样品的决定系数分别为0.997、0.97;己酸和乙酸模型验证集的决定系数分别为0.994、0.96,检测效果较好。
本项目以泸州老窖基酒为研究对象,采用近红外分析技术对其进行快速检测,采用不同的预处理方法,比较全波段和特征波段对建模效果的影响,不断优化模型,建立基酒总酯的近红外检测模型,为基酒实现在线检测提供技术支持。
基酒样品:基酒样由泸州老窖股份有限公司提供。采集了酿酒生产基酒样,选择一部分为校正集,剩余为验证集,校正集中的基酒样品必须包含验证集样品检测项目所有可能测定范围,并且尽可能均匀分布。此外再随机抽取未知基酒样进行外部验证,以最终评价所建模型的稳定性、准确度。
仪器设备:BUCHI 公司的近红外NIR Master。光谱仪光源为高强度卤钨灯,配有玻璃样品检测皿,光谱范围为4000~10000 cm-1,扫描次数为32次,分辨率为8 cm-1。利用近红外光谱仪采集基酒光谱,利用BUCHI 公司自带建模软件建立定量基酒总酯模型,最后再用NIR Ware Management Console操作软件测定未知基酒样。
理化检测设备与试剂:水浴锅(温控100 ℃),全玻璃回流装置,全玻璃蒸馏器,50 mL 碱式滴定管,50 mL 酸式滴定管。酚酞指示剂(10 g/L):按GB/T 603—2002 配制;氢氧化钠标准滴定溶液(c(NaOH)=0.1 mol/L):按GB/T 601—2016 配制与标定;硫酸标准滴定溶液(c(1/2H2SO4)=0.1 mol/L):按GB/T 601—2016 配制与标定;体积分数为40 %乙醇溶液:量取95%乙醇600 mL 于1000 mL 回流瓶中,加入3.5 mol/L 氢氧化钠标准溶液5 mL,加热回流皂化1 h。然后移入蒸馏器中重蒸,再配成40%乙醇溶液[13]。
数据采集:采用透反射方式扫描采集基酒样品,扫描32次取平均,每个基酒样做2个平行样,对获得基酒样光谱进行预处理,舍去异常光谱,最终获得建模用的光谱。建模酒样总酯实测值测定:采用GB/T 10345—2007[13]《白酒分析方法》中的指示剂法。
样品集划分方法有择3留1、Random Sam-pling(RS)、Kennard-Stone(KS)[16-17]等方法,本实验采用择2 留1 方法来进行样本集划分,去除异常样,最终得到样品光谱,其中一部分基酒样品为校正集作为建模使用,另一部分为验证集以最终评价模型的稳定性和准确度,并调整模型,消除常规化学分析法测量的误差。之后抽取50 个白酒样品不参与建模分析,作为预测集样品,用于预测模型效果。
为提高模型的准确性,需对所采集的光谱进行预处理,以选择合适的谱区来建立模型。本实验通过BUCHI 自带NIR Cal 建模软件对光谱经Ncl(趋近归一化)、Mma(最大归一化)、N01(0~1 间归一化)、Nle(单位长度归一化)、Db1(一阶导数)、Db2(二阶导数)、Snv(标准归一化)、Msc(多元散射校正)等光谱预处理后,选出最佳预处理方法,利用PLS 偏最小二乘法建立基酒总酯模型,探讨全波段和特征波段所建模型的预测效果,所建模型用决定系数R2、交叉验证误差均方根RMSECV 评价。R2越大,RMSECV 越小,模型预测性能越好。其计算公式如下:
式中:yi为实测数据,fi为预测数据,fp为实测平均值,N为样品个数。
在原定的测定条件下,扫描采集到492 个基酒光谱。同时采用GB/T 10345—2007 中规定的方法测量基酒总酯的含量为输入的手工值,为建立定标模型提供手工标准值。对基酒样品按择2 留1 方法来进行样本集划分,最终得到352 个基酒样本为校正集,140个验证集样品集。其校正集、验证集样品基本信息见表1,校正集样品完全包含了验证集,且校正集的偏差比验证集的偏差相差较小,符合近红外光谱检测要求。
表1 校正集、验证集样品基本信息
对所采集的原始光谱进行数学处理后,各个样品的原始光谱图和处理光谱图见图1、图2。由图1、图2 可知,通过预处理方法处理后,光谱更加光滑,样品之间的差异性更加明显,Q 值有较为明显的改善,这样处理有利于定标过程中对光谱信息的进一步选择。
图1 基酒样品原始光谱图
在原始光谱4000~10000 cm-1共采集到1501个光谱点,因为间隔数量会对模型有影响,通过MATLAB 软件Si-PLS 组合间隔偏最小二乘法[18]将原始光谱分割为均匀等份,得到区间组合为(2,6,10,12),对应的波段为(4300~4600,5500~5800,6700~7000,7300~7600)。将此特征波段与全波段进行比较,结果见表2。由表2 可知,在特征波段条件下所建立的总酯模型校正集的决定系数R2C为0.95,校正集的均方根误差RMSEC 为0.17%;预测集的决定系数R2P为0.93、预测集的均方根误差RMSEP 为0.19%,特征波段的模型的校正集、验证集精度高,RMSEC 和RMSEP 都比全波段小,R2C、R2P都比全波段高,模型预测精度显著提高,因此本文选择特征波段进行建模。
为验证基酒样品总酯模型的准确性,另取50个基酒样品,利用特征波段所建模型对样品中总酯含量进行两次预测,将两次预测结果取平均值后与手工值进行比较,结果见图3。
从图3 可看出,基酒总酯含量的实测值与预测值线性相关较好,都在y=x 直线附近,通过计算得出R2为0.97,其中相对误差小于5%高达90.12%,说明总酯模型的预测效果较好。由此可见,所建模型可适用于基酒总酯的实际检测。
表2 特征波段与全波段模型比较
图3 外部验证样品的线性回归
随着白酒生产过程对先进检测技术要求的不断提高,而利用近红外光谱技术建立基酒总酯检测方法是一种无需制样,只用基酒润洗检测皿极大的简化了分析流程的方法。本文分析比较了全波段和特征波段建立的基酒总酯模型效果,发现特征波段的模型的校正集、验证集精度高,RMSEC 和RMSEP 都比全波段小,模型预测精度显著提高,因此选择特征波段进行建模。之后,通过外部验证,得到基酒总酯含量的实测值与预测值线性相关较好。由此可见,所建模型可以用于快速检测基酒总酯的含量,为更好的揭示总酯与白酒风味的关系提供了数据支持,对推动白酒行业实现智能化摘酒具有重要意义。