范 磊,艾昌文
(1.云南大学信息学院,云南 昆明 650504;2.云南大学省电子计算中心,云南 昆明 650223)
工业领域中常会遇到具有时滞特性的过程控制问题,滞后时间越长,控制难度越大。当滞后时间与过程时间的比值超过某一限度,控制难度急剧增加[1]。通常,如滞后时间与过程时间之比大于0.5,则认为该过程具有大时滞特性。
酸碱中和反应过程中,由于受传输管道、反应容器容积、反应方式以及检测点位置等因素的影响,输入与输出之间存在明显的滞后。因此,将pH值的过程控制作为时滞对象进行研究具有典型意义[2-3]。
在pH值的控制过程中,需要动态地向被测液体中添加酸碱溶液,以保持pH值始终趋于稳定。根据生产工艺的要求,有时要对添加剂流量作大幅调节,有时仅需对添加剂流量作微小调节。加之酸碱中和反应具有的时滞及非线性特性,要达到良好的控制效果,对pH值的控制策略和方法有很高的要求。
以工业污水处理过程中的pH 值控制为例,其控制工艺流程如图1所示。
图1 控制工艺流程图Fig.1 Flow chart of control process
图1中,工业污水与酸碱添加剂在混合器中进行混合,由pH控制器实时采集pH传感器的测量值,并通过调节中和剂的添加量实现pH值的控制目标。
控制系统的执行器采用位置反馈型高精度、小口径电动球阀。这种阀门的全行程时间通常在5~60 s。实际应用中,选用行程时间在20 s左右的电动执行器较为合适。其可同时满足pH控制过程的大幅快速调节和微量精确调节要求。
按照污水处理的工艺流程和控制系统构成,pH控制器通过控制添加剂的单位流量来消除污水的单位流量V、污水的酸碱度H1以及添加剂的酸碱度H2等因素可能产生的扰动。阀门开度U与V、H1、H2可以用以下关系式表示:
U=f(V,H1,H2)
(1)
式中:U为变量;V、H1、H2为因变量。
正常情况下,作为每个具体的应用对象:当工艺流程确定后,V、H1、H2总是相对稳定的,因此U也就相对稳定;当V、H1、H2之中的一项或多项发生变化时,U也随之发生变化。
根据以上分析可以认定,在特定的应用场合,按照既定的生产工艺流程,阀门开度总是相对固定的。当扰动因素出现后,调节添加剂流量的阀门开度随之发生变化。当扰动因素消失后,阀门开度最终要回到初始位置附近。该位置信息即为阀门开度的经验值U0。在智能控制过程中,阀门开度经验值能够对实现系统的快速、稳定控制起到关键作用。
酸碱中和反应过程可以用一阶惯性环节加纯滞后传递函数表示:
(2)
式中:K为对象的静态增益;T为对象的时间常数;τ为对象的纯滞后常数。
由于中和反应的严重非线性特征,在不同的pH控制点,其放大作用和惯性作用是不同的。因此,式(2)中的参数K和T是一个变量。不同的K值和T值构成了一个模型集。实际应用中,只能使用有限的模型集来近似反映这一非线性过程,如常见的三区段变增益控制[3-4]。这种方法减少了非线性的负面作用。但模型的精确性是有限的,区段的划分也比较困难,并没有理论分析结果能保证其稳定性。其次,对于纯滞后系统,由于比例积分微分(proportion integration differentiation,PID)控制是按偏差进行调节的,调节器的作用要经过滞后时间才能反映出来,极易导致调节过度的问题[5]。
对于大时滞系统,Smith预估补偿控制通过对对象模型的预测,用预估器补偿纯滞后τ对系统控制品质和稳定性的影响,将纯滞后环节从闭环回路传递函数的特征方程中移出。这样不仅可以加大调节器的放大系数,而且将纯滞后系统的设计问题转换成了无滞后系统的设计问题。
Smith预估补偿器的鲁棒性差,对被控对象的数学模型依赖性很强,对对象参数的不确定性、时变性以及扰动的不确定性都很敏感,不具有良好的干扰抑制特性的能力[6]。对一个不精确的数学模型,如果采用固定的控制算法,本身就缺乏灵活性和应变能力。而过于复杂的数学模型求解又对设备的性能要求很高。因此,Smith预估补偿器对于具有时滞特性的非线性过程控制并不适用。
通过大量的试验发现,对一些难以建立数学模型的复杂系统,相关训练结果表明,由人工实现的控制方法是最优的[1]。人在控制过程中,一方面表现出很强的观察能力、判断能力和逻辑推理能力;另一方面还表现出很强的学习能力,特别是在学习过程中能够不断优化控制策略。
采用智能控制技术,从宏观结构上和行为功能上对人的控制过程进行模拟。这种方法不需要具体了解对象的结构、参数,也不需要建立精确的数学模型,而是最大限度地识别和利用控制系统动态过程中所提供的特征信息。根据积累的经验和知识进行在线推理,合理确定或变换控制规则。在同等条件下,这种方法所获得有关动态过程的各种信息,要比传统控制方式丰富的多。它不仅知道当前系统输出的误差、误差变化以及误差变化趋势,还知道前期控制效果和识别前期控制决策的有效性。人工智能控制通过定性决策和定量控制相结合的多模态组合控制方法,能对复杂系统(如大时滞、非线性、时变、复杂多变量、环境扰动等)进行有效的全局控制,并具有较强的容错能力和学习能力[7-8]。
本文把控制理论的方法和人工智能的框架相结合,通过改变控制策略去适应对象的复杂性和不确定性。这种基于“控制论”的方法恰好能够弥补Smith预估补偿等“模型论”方法存在的缺陷和不足。
根据在工业现场的长期观察,人工控制pH值的过程围绕阀门开度经验值展开。人工控制的优化过程即现场学习和经验积累的过程。其中,阀门开度经验值是操作人员在现场需要获取的主要控制参数之一。
阀门开度经验值能够在大时滞pH过程控制中起关键作用。在设备从停止状态(或暂停状态)切换到运行状态过程中,系统出现扰动到扰动消除等常见情况。人工操作的第一步就是将阀门开度调节到经验值(如果pH值明显偏低,也可以先调节到一个比经验值更大的开度值,一段时间后再回到经验值,这样可以加快调节进程),经过一定的时延后(时延长短与滞后时间和过程时间相关联)进行特征辨识,再根据特征辨识结果采取相应的控制策略。此外,人工还能够根据当前阀门开度值与经验值的偏差情况,对干扰源的性质和设备运行故障情况进行分析和判断,及时采取有针对性的处置方法。由此可见,阀门开度经验值是人工控制过程中的重要依据。这种调节方式的过程虽然简单,但针对性很强。它能够避免大时滞过程中容易发生的、由过度调节导致的系统剧烈振荡,而且能使被控参数以较快的速度逼近目标值。
从人工控制过程的分析可以看出,阀门开度经验值是控制算法的核心。自动控制系统首先需要模仿人的逻辑思维和决策过程,根据阀门开度的运行轨迹,自动完成阀门开度经验值的学习和优化。
pH控制系统在一定的时间周期内运行,如果将阀门每次运行的轨迹跟踪并记录下来,形成阀门在0~100%区间运行轨迹的数据集,则该数据集中出现最频繁的值,就是集合中的众数,即可认定为是阀门开度的经验值。
有两类基于数据驱动的传统学习方法可供借鉴,即数据累积方法和集成学习方法[7-9]。数据累积方法在接收到新的数据块Dj时,丢弃之前的学习结果hj-1,利用到当前为止所有的累计数据(D1,D2,…,Dj-1,Dj)重新获得学习结果。集成学习则是基于每个独立的数据块分别进行学习,用投票机制融合不同数据块所获得的学习结果,从而得到最终预测。
数据累积方法非常直观,但没有利用之前的学习结果hj-1来帮助新数据块的学习。集成学习方法则认为每个数据块是独立的知识表示,因此不存在从旧知识到新知识的经验累积和知识转化。
为弥补这两种学习方法的不足,阀门开度经验值将采用一种自适应增量(adaptive boosting,AdaBoost)学习方法。在学习过程中,利用已经学到的经验和知识作为下次学习的基础数据。具体而言,当接收到新的数据块Dj时,以上次的阀门开度hj-1经验值为初值,在此基础上对新的数据块Dj进行重新学习,并获得下一次的阀门开度经验值hj。
具体算法设计步骤如下。
①阀门的0~100%开度区间内按0,1,…,100等刻度设置离散观测点,并由这些观测点组成一维数组。该数组由101项数据元素构成(a0~a100),所有数据元素的初值均为0,表示第一次学习之前阀门运行轨迹的数据为空。
②阀门第一次调节时,取阀门开度的中位数,使阀门开关到50%位置,相当于首次开机阀门开度经验值的缺省值为50%。
③以后每次阀门开关调节后,阀门的运行轨迹经过的区间的数组元素值+1。例如,阀门开度从50%调节到55%,那么a50=a50+1、a51=a51+1、a52=a52+1、a53=a53+1、a54=a54+1、a55=a55+1,以此类推。
④重复步骤③,直至满足(“阀门调节次数”≥“设定的学习次数”)∩“设备停止运行”后,结束本次阀门开度轨迹数据的采集工作。
⑤判断数组中的最大值是否唯一。如不唯一,对该数组进行数据整形。具体整形方法如下:将每一数据元素与相邻的两项数据元素相加后,重新对该数据元素赋值(a0=a0+a1,a1=a0+a1+a2,a2=a1+a2+a3,…,a99=a98+a99+a100,a100=a99+a100),然后再进行最大值的唯一性判断,直至数组中只有唯一的最大值为止。
⑥数组中最大元素的序号即为下一次的阀门开度的经验值。
如果以各观测点为横坐标、数组的元素值为纵坐标绘制直方图,通常会呈正倾斜数据分布(众数<50时)或负倾斜分布(众数>50时)。峰值越突出,阀门动作幅度越小,说明控制平稳,控制效果就越好。
为便于分析,取100个阀门调节过程中的开度数据进行测试,P(100) = [50,53.4,58.5,63.3,65.4,66.8,65.9,63.8,64.6,65.2,65.9,65,65.6,64.8,58.6,52.6,43.6,33.2,38.5,41.4,43.3,42.3,43.6,42.5,41.8,43.4,46.6,0,50,57.6,62.2,64.5,65.5,64.7,65.3,64.8,65.4,64.6,66.1,72.2,75.5,78.8,81.4,83.3,82.4,79.4,75.3,68.2,66.5,62.2,59.7,57.9,58.5,60,61.2,60.3,61.5,62.4,63.2,64,63.3,64.2,63.5,64.5,67.7,70.1,73.3,72.4,70.2,68.5,66.9,67.8,68.3,67.7,68.2,67,1,62.5,56.5,49.3,43.1,34.5,36.4,42.6,48.8,53.2,58.7,63.4,64.2,62.7,58.4,56.6,57.5,58.6,57.7,58.2,57.6,58.1,57.5,58.3,57.6]。
通过上述算法完成自适应增量学习后,得到下一次的阀门开度经验值h1为63%。试验结果如图2所示。
图2 试验结果Fig.2 Experimental result
AdaBoost是由Freund和Schapire提出的一种具备自适应调节能力的集成算法[10]。目前,将该算法用于解决分类问题的研究成果较多。在工业领域,汪森辉和李海峰等将改进的AdaBoost.RS算法用于烧结终点的预报分析[11]。在pH值的控制过程中,将改进的自适应增量学习方法应用于阀门的开度调节,使阀门初始开度能够适应控制对象的动态变化。基于机器学习的控制方式简化了模型结构,避开了次要因素的影响,把模型逼近于实际对象的问题转化成为主要参数的学习与选择问题,使系统的智能化程度得到了提高。