白酒糟醅中酸度值的高光谱检测方法

2022-02-25 08:24鞠杰田建平胡新军黄丹黄浩平彭兴辉罗惠波
食品与发酵工业 2022年4期
关键词:酸度反射率波段

鞠杰,田建平*,胡新军,黄丹,黄浩平,彭兴辉,罗惠波

1(四川轻化工大学 机械工程学院,四川 宜宾,644000)2(四川轻化工大学 生物工程学院,四川 宜宾,644000) 3(酿酒生物技术及应用四川省重点实验室,四川 宜宾,644000)

白酒糟醅作为大曲和窖泥中微生物代谢的基质,其成分含量对于白酒产量和品质有着重要的影响。因此在糟醅入窖和出窖时均需对其主要成分含量(酸度、还原糖、水分、pH值)进行检测,为下一批次糟醅的配料和入窖条件提供参考依据。其中酸度是糟醅质量评价的重要检测指标之一,检测糟醅中酸度含量可以充分了解发酵池中微生物的代谢和生长情况。当前,糟醅理化指标的检测方法主要包括高效液相色谱(HPLC)、气相色谱(GC)、质谱(MS)以及这些技术的组合[1-2]。然而上述检测方法具有操作过程繁琐和检测周期长的特点,无法实现糟醅理化指标的快速检测,具有滞后性。尽管已有采用近红外光谱(near infrared spectroscopy,NIR)检测糟醅中水分、酸度、淀粉等的研究[3],但NIR技术只能进行单点检测[4-5],不能获取被检测成分的分布情况。因此,急需一种快速无损的方法检测糟醅中的酸度。

高光谱技术是一种将成像技术和光谱技术相结合的多维信息获取技术,具有数据量大、光谱分辨率高、波段多等特点,近年来已广泛应用于食品、农产品等领域的成分检测。陈彩虹等[6]使用高光谱技术建立核桃壳、核桃仁、分心木的最小二乘支持向量机(least squares-support vector machine,LS-SVM)判别模型,其准确率分别达到了100%、100%、99%。吴龙国等[7]使用高光谱技术建立的多元回归(multiple linear regression,MLR)模型检测土壤含水率,其决定系数和均方根误差分别为0.979和0.763%。韩仲志等[8]使用高光谱技术对花生中黄曲霉素B1的含量进行建模和分析,建立的支持向量机回归(support vector regression,SVR)模型训练集误差只有0.89%。陈李品等[9]使用高光谱技术结合化学计量学检测牡蛎干制加工过程中的水分含量,建立的BP神经网络模型得到较好的预测结果,其预测集决定系数达到0.981 7,预测集均方根误差(root mean square error prediction,RMSEP)达到3.006 3%。上述研究表明高光谱技术适合于食品和农产品的质量检测和安全性研究,但结合高光谱成像技术对糟醅酸度值的检测却鲜有报道。

本研究为实现糟醅发酵过程中酸度值的快速、高精度检测。本文基于不同的预处理算法建立偏最小二乘回归(partial least-squares regression,PLSR)模型,确定最优的预处理方法。同时为了提高模型的运算速度,采用竞争自适应加权抽样(competitive adaptive reweight sampling,CARS)算法提取特征波段对模型进行了必要的简化。基于全波长和特征波长分别建立PLSR和LS-SVM模型进行酸度值的预测,并得出最优的模型。

1 材料与方法

1.1 样本准备

糟醅样本,四川宜宾某酒厂,该批样本出窖时间为3月15日,窖内发酵30 d左右。由于酸度含量在不同窖池及其不同位置均存在较大的差异性,故随机选取了14个不同窖池,以及同一窖池的不同位置进行取样。采用旋转式取样器采集不同窖池的上、中、下层糟醅样品(分别距窖池平窖处的高度0.6、1.1、2 m)。每一层随机采集3个样本点,并标注采集的窖池号和采集样本层号放入无菌密封袋中,共采集126个样本。

1.2 糟醅酸度含量测定

糟醅酸度值根据GB/T 12456—2008中的pH电位来测定,其方法是根据酸碱中和原理,用碱液滴定试管中的酸,以酚酞为指示剂滴定终点。式样的酸度值计算如公式(1)所示:

(1)

式中:X,酸度值,g/kg;c,NaOH浓度,mol/L;V,NaOH滴定体积,mL;K,酸的换算系数;F,试液的稀释倍数;m,式样的质量数值,g。

1.3 仪器设置与光谱采集

高光谱采集系统由FX17e型高光谱(Specim,芬兰)、一组功率为150 W的卤素灯光源、装有专用软件(Lumo-scanner,芬兰)的计算机、载物台以及辅助支架等组成。相机参数:光谱采集范围900~1 700 nm,光谱波段为224个,波段间隔为3.5 nm。参数设置:曝光时间为4.02 ms,数据采集频率为50 Hz,平台移动速度为16.57 mm/s。

为获得稳定光谱数据,预热采集系统10 min,并调整系统参数。将糟醅均匀填充至与培养皿边缘齐平,放置在采集系统的载物台上开始光谱数据采集,得到126组糟醅原始光谱数据。

为消除镜头中暗电流、光强度变化等对采集数据的影响,在采集数据前进行黑白校正以提高信噪比。先采集标准白色聚四氟乙烯(反射率为99%)校正板作为白板,再采集镜头关闭图像(反射率为0%)作为黑板,光谱反射率计算如公式(2)所示:

(2)

式中:I,校正后光谱反射率;I0,原始高光谱图像;B,全黑的标定图像;W,全白的标定图像。

校正后选取糟醅样本的感兴趣区域(region of interest,ROI),将ROI中的光谱进行平均处理后作为糟醅样本的原始光谱数据,得到126组光谱数。

1.4 数据分析方法

1.4.1 光谱数据预处理

由于暗电流、环境光等因素的影响,采集的原始光谱中掺杂了与样本无关的信息。采用合适的光谱预处理算法可以有效减弱各种因素对酸度原始光谱数据的影响,提高预测模型的稳定性和预测能力。本文采用3种预处理算法:多元散射校正(multiplicative scatter correction,MSC)[10]、卷积平滑(savitzky-golay,SG)[11]、标准正态变换(standard normal distribution,SNV)[12]分别对原始光谱数据进行预处理。

1.4.2 特征波长筛选

获取的高光谱数据量大,各个波段的相关性大,其中包含很多冗余信息和干扰信息,影响建模的效率。因此采用合适的方法筛选与表征指标相关的特征波长,提高建模效率。相比于迭代保留信息变量 (iteratively retain information variables,IRIV) 算法和连续投影算法(successive projections algorithm,SPA),CARS算法[13]具有更好的效果,该算法可以去除无关变量并降低变量的共线性,因此将CARS作为优化算法提取特征波长。

1.4.3 数学模型的建立与评价

LS-SVM[14]是在支持向量机的基础上进行了优化,以减少计算量提升建模的效率,可以解决小样本、局部最小点、非线性等问题。PLSR[15-16]是一种多对多的线性回归建模方法,可以有效简化数据结构,解决多个变量间高度线性相关的问题。

1.4.4 酸度值可视化

糟醅酸度值的可视化彩色分布图直观地显示出酸度值的二维分布情况,可以更好观察不同层糟醅酸度值的含量及其分布情况[17],掌握糟醅酸度分布及其差异性的均一性。

2 结果与分析

2.1 糟醅酸度值变化

采用光谱-理化共生距离(sample set partitioning based on joint x-y distance,SPXY)分类算法将采用pH电位法测定的糟醅酸度值按约5∶1的比例将样本划分为训练集和预测集,见表1。

2.2 糟醅样本的光谱特征

高光谱具有丰富的信息,实验中高光谱的采集范围为900~1 700 nm,共有224个波段。图1显示了糟醅样本的原始光谱,可以看出随着波长的增加,反射率呈下降趋势。不同层糟醅样本的酸度值不同,因此光谱的吸收存在差异,这主要由于有机酸中羧基团在此处产生较强的吸收。反射率曲线的吸收峰大约在1 200、1 430 nm,这表明有机酸中的羧基团的吸收带主要存在于1 200、1 430 nm附近[18]。

表1 糟醅酸度值训练集和预测集的真实分布Table 1 True distribution of acidity training set and prediction set of grains

图1 原始光谱图Fig.1 Original spectrogram

2.3 光谱预处理

表2 不同预处理下的PLSR建模效果Table 2 PLSR modeling effect under different pretreatments

图2 MSC预处理效果Fig.2 Pretreatment effect of MSC

2.4 模型优化

光谱数据信息量大且数据冗余,全波段建模效率较低。在保证建模精度的基础上简化模型;降低计算复杂度;提升建模效率。采用CARS作为优化方法提取特征波段,设定蒙特卡罗采样次数N=50,随机选取80%的样本作为校准集,其与不同算法的建模效果见表3。

表3 不同波段数建模效果Table 3 modeling effect of different band numbers

图3 CARS提取特征波段分布Fig.3 Distribution of characteristic bands extracted by CARS

a-采样变量数;b-交叉验证均方根;c-回归系数路径图4 CARS特征波段筛选过程Fig.4 Selection process of CARS characteristic bands

图3中蓝色光谱曲线为126个糟醅样本的平均光谱反射率曲线,红色标记点对应选择的波段位置。糟醅酸度值含量的特征波长主要分布在光谱曲线的波峰波谷附近。从图4-a可以看出,随着采样次数的增加,保留波长的数量会快速地减少,而后减少得较慢,最后不发生变化,这表明CARS对波长变量的选择是一个从粗略选择到精细选择的过程。从图4-b中可以看出,当采样次数为1~16次时,RMSECV的值逐渐变小;当采样次数为16次时,RMSECV的值最小为0.163 4;当采样次数>16次后,RMSEC的值逐渐增加。上述过程表明,当采样次数<16次时,CARS算法滤除与糟醅酸度无关的光谱信息。图4-c中“*”所示位置是当采样次数为16次时RMSECV的值最小,在该采样次数保留下的变量即为所提取的特征波长,共38个。

将21个未参与建模的样本导入MSC-CARS-LS-SVM预测模型中进行模型验证,其预测集建模效果见图5。真实值与预测值无明显差异,说明模型的预测结果较为准确。

图5 样本预测集建模效果Fig.5 Modeling effect of sample prediction set

2.5 糟醅酸度值可视化

提取糟醅样本高光谱图像每个像元的光谱反射率,依据预测模型计算酸度值的形成灰度图像,最后对灰度图像进行伪彩色处理,得到酸度值的可视化彩色分布图。选择同一发酵池中下层、中层、上层相同取样点的糟醅样本高光谱图像,提取每个像素的光谱反射率导入到LS-SVM模型中,计算每个像素点的酸度值形成灰度图像,然后进行伪彩色处理得到酸度值的可视化云图,如图6所示。

a-下层糟醅;b-中层糟醅;c-上层糟醅图6 糟醅酸度值可视化云图Fig.6 Visible cloud diagram of acidity value of fermented grains

由图6可知,下层糟醅酸度值主要在12.256 3~13.435 6 g/kg,中层糟醅酸度值主要在11.077 0~12.256 3 g/kg,上层糟醅酸度只要在9.897 7~11.077 0 g/kg。由此可见不同层糟醅的酸度含量是不同的,其中下层酸度含量最大,上层含量最小,这是因为不同层次糟醅的配料(大曲、原料等)的配比不同造成上、中、下层糟醅的酸度值差异较大[19]。同时在酸度值高的地方不利于微生物的生长与繁殖,不利于糟醅的发酵。因此可以调整不同层糟醅的配料配比减少不同层糟醅的差异性从而减少其酸度值的含量,使微生物的生长环境得到改善,有利发酵的进行[20]。

3 讨论

4 结论

猜你喜欢
酸度反射率波段
利用镜质组反射率鉴定兰炭与煤粉互混样的方法解析
商品条码印制质量检测参数
——缺陷度的算法研究
车灯反射腔真空镀铝反射率研究
最佳波段组合的典型地物信息提取
浅谈电位滴定方法在柴油酸度分析中的应用
基于地面边缘反射率网格地图的自动驾驶车辆定位技术
一种固态发酵窖池酸度在线监测系统的设计与实现
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术