王昆,庹先国,*,张贵宇,,3,罗林,罗琪,刘杰
1(人工智能四川省重点实验室(四川轻化工大学),四川 宜宾,644000)2(四川轻化工大学 自动化与信息工程学院,四川 宜宾,644000)3(西南科技大学 信息工程学院,四川 绵阳,621010)
白酒文化深深地根植于民族文化的沃土之中,在世界酒文化的长河里,展现着自己独特的芬芳[1-3]。及时地了解发酵过程中酒醅物质的变化是极其重要的,传统方法主要是通过取样后运用化学方法来了解酒醅中物质成分的变化,此方法费时费力且不能在线监测,实时为人们提供发酵情况[4-6]。通过现代工业物联网技术对窖池环境中参数进行在线监测,再通过化学方法化验得到酒醅理化性质变化,以此建立回归方程来预测发酵参数是发酵智能化监测的发展趋势[7-9]。当前对白酒发酵优化控制方面的研究较为落后,根本原因在于发酵过程极其复杂,期间涉及的微生物和物质数量极为庞大,且发酵过程具有滞后性和时变性,难以建立准确的数学模型[10-13]。对于目前白酒发酵模型的研究,张方等[14]对浓香型白酒中有机酸的种类和作用、白酒发酵过程中主要有机酸的形成途径及其监测方法和宏观调控进行了阐述。贾丽艳等[15]以清香型白酒酒醅为研究对象,追踪了不同阶段酒醅中理化指标数据,得出了温度、pH值、酒精含量、淀粉含量以及水分含量的变化情况,为清香型白酒发酵可调控化提供了理论依据。叶建秋等[16]通过高光谱成像技术建立了大曲发酵过程水分含量及分布情况的反向传播(back propagation,BP)神经网络数学模型,并使用主成分分析和实验分析对比提取了大曲发酵过程中水分特征光谱所对应的各波段图像,实现了对大曲发酵水分的快速检测。
虽然在发酵智能化上取得了一定的进展,但还存在较多问题需要解决,如动力学模型不太能适应发酵环境的改变、代谢网络建模难度较大、神经网络容易出现过拟合的情况尚需大量训练样本数据[17-19]。本研究利用获取的发酵过程中O2、CO2和温湿度数据,同时结合化学方法检测得到的酒醅水分、酸度和淀粉含量建立快速预测数学模型[20]。首先对原始样本数据进行归一化和剔除异常值处理,选定训练集和预测集,然后对两两变量之间进行相关性分析,最后结合偏最小二乘回归(partial least squares regression,PLSR)建立O2、CO2和温湿度与酒醅水酸淀的快速预测模型,并从多个方面对模型进行分析和评价,以期为白酒生产过程的智能化监测提供指导[21]。
330份酒醅样品,宜宾市某清香型酒厂。
OS50-O2便携式氧气检测仪,深圳市欧森杰科技有限公司;GW2000-CO2-SC二氧化碳气体探测仪,北京金龙昶泰科技发展有限公司;DS18B20温度传感器,美国达拉斯(Dallas)半导体有限公司;DHT90湿度传感器,大连风华传感科技有限公司。
1.3.1 O2、CO2、温湿度获取
在为期10 d的发酵过程中,使用传感器对发酵环境的温度、湿度、CO2和O2参数进行采集(图1),同时每隔8 h进行1次样品采集后放入冷藏柜。
图1 发酵参数采集方案Fig.1 Fermentation parameter collecting plan
1.3.2 酒醅水分含量测定
依据食品安全国家标准GB 5009.3—2016《食品中水分的测定》方法检测。
1.3.3 酒醅酸度值测定
依据食品安全国家标准GB 12456—2021《食品中总酸的测定》中酸碱滴定法检测。
1.3.4 酒醅淀粉含量测定
依据食品安全国家标准GB 5009.9—2016《食品中淀粉的测定》方法检测。
1.3.5 数据样本
利用传感器技术采集到窖池的环境中的O2、CO2和湿度值,同时测得了酒醅中部的温度值,每天采集3组数据,采集数据的同时采集酒醅样品,1个周期为10 d,总共循环10个发酵周期,一共测得样本数据330组。
1.3.6 建立模型
1.3.6.1 样本数据划分
为使得模型训练效果更快,精度更好,对数据进行归一化处理统一量纲,同时选取264组样本作为训练集,66组作为测试集,以下是训练集样本总体情况。
1.3.6.2 建立回归模型
依据变量之间的多重相关性选择PLSR作为建模算法[22]。PLSR主要适用于变量多且变量之间两两存在多重相关性,PLSR分析着重于建模过程中主成分分析,典型相关分析和线性回归分析[23-24]。
表1 训练集样本总体情况Table 1 The overall situation of the training set samples
自变量有4个X=(x1,x2,x3,x4),因变量3个Y=(y1,y2,y3),其中x1,x2,x3,x4和y1,y2,y3,y4分别代表着O2、CO2、湿度、温度和酒醅水酸淀。分别提取出X和Y中的主成分t1和u1并使他们之间相关性达到最大,然后建立t1与X和u1与Y的回归方程,同时检验模型是否达到精度要求,若未达到精度要求则使用X和Y被t1和u1解释后的参与信息再次进行主成分提取,循环迭代至满足精度要求为止。
1.3.6.3 模型评价指标
为了验证模型的泛化能力和预测精度,使用均方根误差(root-mean-square error,RMSE)进行评价,在相同的样本数据下,RMSE越接近0时说明模型精度越高,预测能力越强。RMSE计算如公式(1)所示[25]:
(1)
通过图2观察到O2含量在整个发酵过程中呈现下降趋势,O2的消耗主要由于葡萄糖在水和酶的作用下生成大量的水、CO2和大量的能量,有氧呼吸将化学能源快速转换为自身生物能源,促使酵母菌大量繁殖。所以在O2含量充足的情况下,反应速率较快,当O2含量变低时,酵母菌进行无氧呼吸,无氧情况下酵母菌繁殖相对较慢,代谢也相对较慢。
CO2是发酵过程中主要的产物,从图3可以看出整个发酵过程中,CO2的体积分数一直在上升,入窖时体积分数为0.7%,前2 d上升幅度较快,后期增长幅度有所放缓,最后趋于稳定在43%左右。
图2 氧气浓度随时间变化曲线Fig.2 Change of oxygen concentration during fermentation
图3 二氧化碳浓度随时间变化曲线Fig.3 Change of carbon dioxide concentration during fermentation
刚开始由于入窖温度较高而且又是密闭环境导致水汽蒸发,从而湿度较高,待温度降低之后,水蒸气冷凝导致环境湿度开始下降,在第2天中午降到最低点,之后发酵开始,酵母菌的有氧呼吸产生大量的水和能量,致使环境湿度开始较快增加,第9天左右时湿度达到峰值(图4)。
图4 相对湿度随时间变化曲线Fig.4 Change of relative humidity during fermentation
蒸完粮食后开始摊凉,在摊凉温度为40 ℃时撒曲,待温度降到22 ℃左右时开始入窖,入窖后温度有1个短暂的下降,在12 h后酵母菌和多种微生物开始分解有机物释放出热量,导致温度开始缓慢上升,总体来看符合白酒发酵的“前缓”、“中挺”、“后缓落”的发酵经验,总体过程见图5。
图5 温度随时间变化曲线Fig.5 Change of temperature during fermentation
水是良好的化学反应溶剂,同时也是酵母菌及微生物群有氧呼吸的产物,它的变化趋势总的来说和CO2含量保持一致,O2充足的情况下,呼吸作用速率较快导致前期增长迅速,待到无氧呼吸后代谢速率降低,水分增加速度明显放缓(图6)。
图6 酒醅水分含量随时间变化曲线Fig.6 Change of water content in fermented grains during fermentation
正常的发酵过程并不会生成乙酸,乙酸生成的主要原因为粮食入窖前不可避免的被空气中的醋酸菌污染,将发酵生成的乙醇转换成了乙酸,或是酵母菌的不正常发酵产物,乙酸的含量会造成pH值的变化从而影响微生物和酵母菌的生物活性,同时也会造成酒的口感苦涩,整个过程乙酸的含量都呈现出上升的态势(图7)。
图7 酒醅酸度值随时间变化曲线Fig.7 Change of acidity value in fermented grains during fermentation
发酵的本质就是酵母菌将淀粉转化为葡萄糖,再经过一系列反应后生成酒精的过程,淀粉作为反应原材料含量一直减少,减少速率随着发酵进行逐渐减缓。
图8 酒醅淀粉含量随时间变化曲线Fig.8 Change of starch content in fermented grains during fermentation
从相关性系数来看各个成分之间都有较为显著的相关性(表2),发酵环境本身就是一个高度复杂的系统,温度影响化学反应的速率,进而改变了O2、CO2和湿度值,同时O2和CO2又是酵母菌呼吸作用的消耗物,决定着酒醅水酸淀的生成,研究O2、CO2、温湿度与水酸淀之间具体的数学关系,为白酒发酵的实时调控提供理论依据。
表2 相关系数表Table 2 Correlation coefficient table
根据PLSR建立的水酸淀回归方程如公式(2)(3)和(4)所示:
y1=48.037-0.418 7x1+0.332 7x2+0.020 7x3+0.024 6x4
(2)
y2=-0.899 8-0.044 6x1+0.028 3x2+0.019 5x3-0.008 7x4
(3)
y3=62.607 1+0.457 3x1-0.265 2x2-0.272 6x3+0.071 3x4
(4)
分别对训练集和预测集样本数据进行RMSE值计算,训练集RMSE表示的是模型的精确度,预测集的RMSE则表示模型的泛化能力。
图9和图10中对角线为零误差线,如果所有的点在这个预测图上都能在对角线附近均匀分布,则拟合值与原值差异很小,模型的拟合效果满意。通过公式(1)计算出预测模型水酸淀的验证RMSE分别为y1=1.89、y2=0.12、y3=1.93,应该来说总体误差偏小,模型效果较为满意。
a-发酵水分;b-发酵酸度;c-发酵淀粉图9 酒醅理化性质训练模型预测图Fig.9 Prediction diagram of the physical and chemical properties training model of fermented grain
a-发酵水分;b-发酵酸度;c-发酵淀粉图10 酒醅理化性质验证模型预测图Fig.10 Prediction diagram of physical and chemical properties verification model for fermented grain
通过建立普通多元线性回归模型进行对比,进一步验证模型的可靠性。选取同样的自变量、因变量和样本数据,通过SPSS软件输出回归参数指标。y1、y2、y3对应的多元线性回归参数指标和回归方程如公式(5)(6)和(7)所示:
y1=24.807-0.202x1+0.396x2+0.221x3-0.014x4
(5)
y2=-1.659-0.038x1+0.03x2+0.026x3-0.01x4
(6)
y3=55.035+0.528x1-0.245x2-0.207x3+0.059x4
(7)
将剩余预测集数据代入模型进行预测值和真实值比较,根据公式(1)算得水酸淀RMSE分别为y1=2.51、y2=0.23、y3=2.61(表3)。
表3 模型误差对比Table 3 Model error comparison
从RMSE来看多元线性回归的预测值和真实值的误差相比于PLSR明显偏高,说明PLSR在预测能力和预测精度上都优于普通多元线性回归。
小曲清香发酵过程中温度的变化对其他参数有很大的影响。温度对CO2和湿度呈正相关性,对氧气则是呈负相关,主要原因是因为温度能加快化学反应的速率,发酵的过程本质就是酵母菌在酶的作用下的复杂化学反应,温度的变化会导致其他指标的改变。CO2和O2作为化学反应原材料对于发酵产物的影响起到了决定性的作用,这对参数呈负相关性;酒醅水分随着O2的减少逐渐增加,酵母菌的有氧呼吸消耗O2产生水,O2越少说明反应越彻底,生成的水分越多;酸度值也是随着O2的减少逐渐增加,发酵过程中酸的产生主要是因为酵母菌的无氧呼吸产生了乳酸,乳酸再在一系列反应下生成了乙酸;淀粉含量和O2浓度呈正相关性,淀粉属于消耗物,氧气越多反应越不彻底,淀粉含量越多,温度主要通过影响O2和CO2的浓度来间接影响水酸淀的变化。通过常理推断和模型结论对比侧面反映了模型的可靠性,进一步通过计算RMSE和用普通多元线性回归模型作为对比验证了模型的可靠性和精确性。本研究通过对清香型白酒发酵过程进行数学建模,找到了发酵产物之间的数学关系,也为其他类型白酒发酵产物预测提供了一种方法和思路,同时为发酵调控优化与自动化控制系统的发展提供了理论支撑。