许锡飚,蒋国庆,刘登峰,3*
(1.绍兴女儿红酿酒有限公司,浙江上虞 312352;2.江南大学人工智能与计算机学院,江苏无锡 214129;3.江南大学轻工过程先进控制教育部重点实验室,江苏无锡 214129)
我国传统发酵食品如黄酒、食醋、酱油等市场巨大,2020 年,国内传统发酵食品产业总产值达万亿元以上[1]。但是,目前这些传统食品发酵过程的控制大部分仍以传统手工操作为主,造成企业生产效率低下、工人劳动强度大以及产品质量批次稳定性差等问题。如何通过实现发酵过程的自动控制,减轻工人劳动强度、提升发酵食品品质、保持质量稳定性,已成为我国传统发酵食品产业必须面对的问题。
黄酒是我国的特有酒种,不仅广受人民群众喜爱,而且具有民族文化特色。主要是以谷物(南方主要是糯米,北方是黍米和玉米)为原料,以麦曲为糖化剂,以黄酒酵母为发酵剂,经浸米、蒸煮、糖化、发酵、压榨、过滤、煎酒、贮存而成的一种低酒精度发酵酒。其发酵工艺特点是基于复杂的发酵微生物群落代谢,发酵周期较长,代谢产物组成复杂且风味独特。截至目前,主流的生产方式是采用陶缸、陶坛作为发酵容器,依靠酿酒师的人工经验进行手工操作。一方面,不同酒厂、不同师傅酿造出的黄酒为消费者提供了个性化的选择;另一方面,不同师傅、不同批次的黄酒品质参差不一,稳定性较差。近15 年来,我们团队先后与无锡锡山、古越龙山、女儿红等知名黄酒企业进行了产学研合作,在机械化黄酒酿造领域进行深耕,初步实现了小规模黄酒发酵过程的机械化酿造[2-3],但其中关键工艺技术和生产控制点仍依赖于酿酒师的经验。
针对这一问题,一些学者对黄酒发酵过程的自动化控制进行了研究,自动控制系统的基础是能够准确描述黄酒发酵过程特点的数学模型。包括黄酒在内的我国大部分传统发酵食品生产过程属于典型的多变量输入/输出、非线性、时变的复杂系统。目前针对该类过程建立的过程模型和参数辨识方法尚不能达到控制模型的要求,主要存在以下问题:
一是模型建立方面,黄酒发酵的生产过程是一个多变量输入/输出的交互过程,因此其过程控制应是一个多目标优化问题,而目前建立的发酵过程模型大多以单目标优化为主,且只是生化工程宏观动力学概念在发酵工程上的延伸,造成已有的发酵模型结构不能准确描述发酵过程。
二是模型参数辨识方面,在发酵过程中,一些关键生物变量的不可在线测量,例如酒精度、糖类、酸类等物质,一般只能离线测量,造成建立的模型因输入刷新/输出采样呈现稀疏且不规则而产生非均匀采样问题,导致参数辨识困难,目前仍缺乏有效的处理算法。
因此,如何开发出包含多输入/多输出变量的控制模型结构和针对发酵过程非均匀采样问题的参数辨识处理算法,是成功实现黄酒发酵过程自动化的核心与关键。
本文针对我国黄酒发酵过程控制的现状和难点,总结了黄酒发酵过程自动化的数字建模以及其模型优化的研究现状,提出了未来的发展趋势,以期为黄酒产业的健康发展提供参考。
黄酒发酵的实质是复杂的生物化学反应过程,可以看作是底物各组分浓度、起始细胞浓度、通气时间(开耙操作)等为输入变量,温度、pH 值、产物各组分浓度、菌体浓度等为输出变量的多变量输入/输出系统。
徐国强等[2]结合LabVIEW、S7-300 PLC 以及相关传感器提出了黄酒前酵过程的控制系统,该系统可以实现对温度、溶氧两个参数的采集和监控;马明等[3]对此系统进行了完善,远程用户可以通过该系统查询历史数据、制定实时控制任务。在国内首次实现了计算机控制黄酒整个生产过程,改变了黄酒千百年的生产模式,用机器代替手工,大大减轻了工人劳动负担。该系统主要是针对发酵过程的温度和溶氧进行监控,发酵过程的控制仍主要依赖于工作人员。可见,黄酒发酵自动化控制目前属于起步阶段,尚需要进一步的深入研究,其中的难点在于:
(1)黄酒发酵酒醪中最主要的参数如基质细胞浓度、总糖度、酒精度目前尚无传感器能够在线实时测量,致使计算机控制的大罐黄酒发酵数据缺失,导致计算机不能进行更精准的控制。
(2)要实现发酵过程的计算机实时精准控制,必须要建立相适应的发酵动力学模型,由于发酵过程重要工艺参数间互相耦合、关联,建立其准确的模型尚有很多难点,虽然可以用软测量推断并建立模型,但是理论研究和实际情况有一定的差距,尚需创新研究。
(3)缺少针对黄酒发酵特征控制算法的研究,黄酒发酵是一种典型的间歇分阶段、大滞后、非线性、时变的复杂生物变化过程,所以一些其他行业非线性模型的控制算法研究成果无法借鉴应用。
(4)非均匀采样的数据特征给孪生建模造成挑战。发酵过程的温度、溶解氧和pH 值可以在线测量,但酒醪中的主要产物(乙醇、葡萄糖、麦芽糖、麦芽三糖等)浓度,目前尚无合适传感器,不能实现在线监测,只能通过人工采样、实验室离线分析才能获得,造成了采样点的不规则性,且相对于可以方便地在线测量的温度、冷凝水流量、尾气流量等常规过程变量,这类采样点比较稀疏,造成不规则损失输出数据,是输出非均匀采样系统的一个典型特征。
因此,如何尽可能多的获得黄酒发酵过程可靠数据,解决非均匀采样数据问题,并建立基于数据驱动的软测量数字孪生模型及基于该模型适应于黄酒酿造体系的控制算法,成为实现黄酒发酵过程计算机精准控制与优化的关键。
在黄酒的酿制过程中,在温度和开耙的控制下(控制变量),底物如酒曲、酵母、大米(输入变量)之间相互作用,产生了多种风味物质,其中糖类、有机酸和乙醇等(输出变量)的适当比例构成了黄酒鲜美的风味和口感[4]。各厂家越来越重视在黄酒酿造过程中控制高级醇的含量及各组分的比例,以此达到提高黄酒质量、改善风味的目的。但是长期以来传统食品发酵的建模研究多局限在实验室静态操作的方法,只是生化工程宏观动力学概念在发酵工程上的延伸,这类机理分析和定性优化方法采用单目标优化策略,难以实现整个发酵过程最优[5]。
建立合理的数学建模是实现发酵过程优化的基础。一般来说,数学模型描述了发酵过程中重要输入变量(菌种浓度、培养基组成及浓度、环境条件等)与输出变量(生物量、产物浓度、pH 值、温度等)之间的关联,揭示了发酵状态变量的特性。通过模型可以改进过程的控制以达到增产增效目的。目前根据建立模型的方法不同可将数学模型分为三种类型:
2.1.1 机理模型
即完全知道内部动力学变化的白箱模型,它是从过程机理出发,基于酶动力学、发酵动力学、生化反应工程和基于代谢网络的物质平衡原理所建立的模型。代表性的建模方法如代谢流分析(MFA)[6],流量平衡分析(FΒA)[7]以及生化系统理论方法[8]。其中MFA 和FΒA 模型可以用于对细胞内的代谢进行模拟分析[9]。这种模型能够真实可靠的反映发酵过程,但会带来状态方程和参数过多的缺陷,目前这类模型难以直接应用于发酵过程的控制与优化。
2.1.2 数据驱动模型
数据驱动模型是依据大量生产批次的发酵数据,利用统计学等知识寻找发酵规律所建立的数学模型。这种模型反眏的是模型输入变量和输出变量之间的函数关系,不具有明确的生物意义,属于黑箱模型。
代表性的建模方法如人工神经网络(Artificial Neural Net,ANN)[10-11],ANN 是模拟人脑神经网络而设计的一种计算模型,是由大量神经元连接而成的非线性动态系统。理论上,只要有足够的训练数据和神经元数量,ANN 就可以学习很多复杂的函数。Willis 等[12]讨论了神经网络在复杂工业系统的应用,并且通过工业数据的应用证明了该技术对难以测量的质量变量提供估计的适用性。该建模方法最大的优点是比较简单,不需要考虑发酵期间的生化反应;缺点是数据需求量较大,且模型通用性较有限。现实中,由于一些发酵数据需要用到昂贵的仪器设备,或者出于企业对数据隐私性的考虑,获得海量数据对食品发酵行业来说困难重重。目前该方法较少用于实际食品发酵过程的建模。
2.1.3 混合模型
即机理和数据驱动混合的“灰箱”模型,介于机理模型与数据驱动模型之间。该模型建立的两大基础是发酵过程的主要生化反应以及过程中采集的适量数据。该模型在学术科研及实际应用中都很常见[13-18]。在发酵过程中应用比较成功的有Monod 模型[19-20],Leudeking-Piret 模型[21-22],Logistic模型[23],Levenspicl 模型[24],Hinshwood 模型[25],Michaelis-Menten 模型[26]和Cybernetic 模型[27-28]等。它们通过研究生物反应过程中菌体生长、底物消耗、产物合成之间的动态变化,将各种参数变化与发酵代谢规律联系起来,模拟最合适的工艺流程和发酵工艺参数,既能反映出生化过程,又可以利用发酵过程中获得的数据进行模型中参数的辨识。该类模型综合了机理模型和数据模型的优点,同时又避开了数据模型需要大数据驱动的缺陷,已成为目前生物发酵系统中较为常用的建模方法。
在黄酒发酵过程的研究中发现,发酵中的主要生物变量如还原糖、有机酸、乙醇、高级醇、pH 值等因素在发酵前期变化剧烈,发酵后期参数变化缓慢。由此得出黄酒发酵的主要过程在前酵阶段,关键变量是葡萄糖、麦芽糖、有机酸和乙醇等,它们也是影响黄酒品质的关键因素[29-30]。对于黄酒的前酵过程,其发酵时间一般为3~5 d,主要的机理反应较为清晰,因此采用灰箱模型较为合适。
刘登峰等[31]采用4 种酶源和3 种发酵温度对黄酒发酵状态的影响因素进行了研究,结果表明酶源和温度对主要风味物质均有显著影响,特别是有机酸、乳酸和乙酸的生产,主要取决于发酵温度,从发酵过程的环境变量探讨了对于建立黄酒发酵模型的重要影响;刘登峰等[32]根据黄酒发酵中糯米的糖化反应过程,建立了低阶动力学模型结构(反应速率可调的模型),对黄酒的糖化反应建立良好的数学模型;在此基础上,刘登峰等[33-34]首次对黄酒实际生产前酵过程进行了全程跟踪监测,分别对发酵过程中的总糖、酒精、总酸及pH 值进行了离线测量,基于发酵动力学建立了黄酒前酵过程的双边发酵模型;宗原[35]考虑黄酒发酵过程中酸败的问题,建立了前酵过程同时糖化、发酵和酸化的三边发酵模型。
在灰箱模型基础上,如何从众多的变量中选择关键的输入、输出和控制变量,实现不可测量变量的软测量建模,建立黄酒发酵过程的系统控制模型仍是进一步研究的方向。
近几年,随着高斯过程回归能够基于相似准则建立局部模型,作为一种非参数概率模型,该模型不仅可以给出预测值,还可以得到预测值对模型的信任度,因此也被用于一些复杂工业过程的建模中[24-28]。针对工业过程产生的数据中常包含不同的随机分布特点,熊伟丽等[36]提出了一种基于高斯混合模型的建模策略来提取模型预测误差中的重要信息,一次提高模型的预测精度;赵帅等[37]针对生物发酵过程中存在的非线性、多阶段的特点,提出了分层集成高斯过程回归的建模方法。采用高斯混合模型将过程数据划分为不同的阶段,以此建立相应的高斯回归模型,最后对各阶段的局部预测结果进行融合。因此,将基于高斯回归过程的数据驱动软测量建模思想,用于黄酒发酵过程的不可在线测量数据的建模研究是值得尝试的方向。
黄酒发酵过程是典型的时滞非线性系统,因此建立的模型具有典型的非线性特征。在非线性模型参数辨识领域,对于非均匀采样系统,Gopaluni等[38]建立了基于粒子滤波算法和最大期望辨识算法来对非线性损失数据系统进行辨识的方法,并通过利用径向基函数对模型结构进行近似,实现了将最大期望算法应用于模型结构未知的非线性非均匀采样数据损失的辨识。但是,以上算法的缺陷是只能对参数进行离线估计。针对该缺陷,Tulsyan 等[39]提出了贝叶斯方法,来实现非线性损失数据系统状态和参数联合的在线估计。丁锋等[40]专门针对采样特别稀少的非均匀采样系统,提出了辅助模型随机梯度辨识算法。李大海等[5]针对非均匀采样系统,基于提升技术获得了每一个非均匀采样点上子系统的输入输出表达形式,然后利用支持向量方法实现模型参数的在线辨识,同时提出了这类非均匀采样系统的模型预测控制方法。
刘登峰等[31,33]考虑到黄酒酿造过程中初始条件对发酵状态有着很大影响,基于广义预测控制思想,利用Levenberg-Marquardt 算法对建立的模型中的参数进行了优化研究;宗原等[41]针对基于Levenberg-Marquardt 方法辨识黄酒发酵过程模型参数时易陷入局部最优、收敛速度慢的问题,提出了一种具有莱维飞行机制和柯西变异的蚁狮优化算法。
目前针对非线性、非均匀采样系统的参数辨识方法主要通过提升技术进行模型转化再利用传统的参数辨识来实现模型的参数辨识,随之而来的是提升模型存在因果约束等问题。因此,如何以黄酒发酵过程控制模型为对象分别从数据处理和辨识算法角度,建立更加完善的发酵过程非均匀采样系统模型数据处理方法,提出计算量较小、精度较高的辨识算法仍有待进一步研究。
黄酒发酵是一种典型的间歇分阶段、大滞后、非线性、时变的复杂生化过程,所以非线性建模方法的研究成果无法直接应用。为了提高发酵过程控制的性能,必须针对黄酒大罐发酵进行深入分析,研究发酵动力学模型、基于数据和知识的软测量模型是实现黄酒发酵过程控制与优化的关键。因此,未来黄酒发酵过程的数字孪生建模可以从以下几个方面来实现:
(1)面向黄酒酿造工业的具体需求,针对黄酒酿造和发酵过程控制中的问题,利用已经研究完成的黄酒发酵计算机控制系统结合目前成熟的传感器,针对黄酒酿造工艺中的发酵特点,建立在物料平衡和能量平衡等的发酵动力学模型。
(2)综合运用大数据、物联网等新一代信息技术,基于高斯过程回归、高斯混合模型、实时学习思想和贝叶斯推断理论,结合多模型技术,建立黄酒发酵关键变量的自适应在线软测量模型。
(3)结合黄酒发酵间歇控制的特点,通过构建改进的复合型迭代学习算法,逐渐跟踪设定的工艺轨线,建立批次方向上的控制量迭代学习率,通过对黄酒建立发酵动力学模型及发酵机理的研究更加准确和定量的认识其过程中复杂的生化反应、微生物的平衡生长与新陈代谢机理,进一步实现发酵过程优化控制。
目前,基于大数据和人工智能实现工业生产的浪潮已经席卷整个中国工业界,在此背景下,在我国黄酒产业界,开展传统黄酒酿造过程的数字孪生建模用于实现黄酒发酵过程的优化控制研究显得尤为急迫与重要,不仅可对其他发酵产品实现自动化发酵生产提供可借鉴的思路与方法,而且将对酿造过程新的发酵工艺和发酵自动化控制装备的升级起到积极的示范和推动作用。