吕宁 姜怀斌
摘 要:在啤酒发酵过程中,为了建立精准的传感器温度故障诊断模型,在标准支持向量机(SVM)的基础上提出了分段最小二乘支持向量机的方法,该方法首先利用模糊C聚类(FCM)对样本进行聚类分析,达到划分发酵阶段和建立局部模型的目的,然后采用最小二乘支持向量机(LS-SVM)的方法对各类样本进行建模。实验结果表明,使用该方法建立的啤酒发酵过程温度故障诊断模型具有较高的准确性。经过比较,该方法建立的模型的泛化能力要强于其他SVM方法建立的模型。
关键词:支持向量机;模糊C均值聚类;最小二乘支持向量机;啤酒发酵;建模
DOI:10.15938/j.jhust.2018.06.017
中图分类号: TP206.3
文献标志码: A
文章编号: 1007-2683(2018)06-0094-06
Abstract:In the process of beer fermentation in order to establish the precise temperature sensor fault diagnosis model on the basis of standard support vector machineSVM) We proposed piecewise least square support vector machine method first using fuzzy c-means clusteringFCM) of the sample of poly class analysis to divide fermentation stage and the establishment of local model. Then the least square support vector machineLS-SVM) method is used for modeling of various types of samples. The experimental results show that the model has a high accuracy in the process of temperature fault diagnosis of beer fermentation process. After comparison the proposed method establishes the model's generalization ability better than other SVM methods to build the model.
Keywords:support vector machine;fuzzy C mean clustering;least squares support vector machine; beer fermentation;modeling
0 引 言
对于间歇过程,多操作阶段是其一个固有特性,过程中的非线性与过程的各阶段往往是密不可分的。这就导致了一个问题,我们通过对过程整体的运行状况进行建模分析,不能够准确的进行判断运行情况,由于过程分为多个阶段,每一个阶段,它的主导变量与过程特征都会不同,由于操作过程的变化,过程之间一些变量的相互关系也无法判断是否随时间不断变化,它呈现一定的分阶段性。所以,对于它的统计建模与在线监控,我们要整体进行建模分析还要对每一阶段进行细致分析[1-3]。
啤酒发酵过程一般分为四个阶段:主酵阶段,后酵阶段、还原阶段、贮酒阶段,每一个阶段对温度控制的要求都很严格,直接关系到啤酒发酵的质量。想要建立局部模型,我们就需要对发酵阶段进行划分,由于过程的阶段性密不可分,直接进行阶段划分,难度很大,聚类分析是将数据进行分类,将相似性大的数据归为一类,而类别之间数据的差异较大,这一特性满足啤酒发酵过程阶段划分的要求,所以本文通過对样本数据进行聚类分析,将发酵过程划分为几个不同的阶段。聚类分析分为两种,硬聚类、模糊聚类,由于硬聚类直接将各类别的隶属度规定为0跟1两个值,这就使得样本与样本之间的关系被割裂,因此,这种方法不能得到理想的聚类结果,Ruspini将Zadeh模糊数学理论引入聚类分析,提出模糊划分的概念,模糊聚类表现了样本与样本之间的联系,建立了数据样本对类别的不确定性描述,可对类别间有交叉的数据集进行有效的聚类[4-7]。
由于间歇过程自身复杂的特点,人们对该过程的监测进行了长期的研究,主成分回归(PCR),主成分分析(PCA) ,支持向量机(SVM),偏最小二乘(PLS)和独立分量分析(ICA)等一系列多元统计分析建模方法已经成为间歇过程和连续化工过程的常用的建模与监测方法,并且取得了很多成功的案例。支持向量机(Support Vector Machine,SVM)方法是Vapnik等提出的,采用结构风险最小化原则代替经验风险最小化原则,对小样本、非线性、高维数、局部极小等问题给了很好的处理方法,泛化能力很强。SVM方法也为发酵过程故障诊断提供了一个崭新的途径[8-10]。
大量的矩阵运算是SVM学习过程的一个特点,这也导致了一个问题,训练速度缓慢且训练时间长,这势必会使SVM泛化能力受到影响,针对此种情况,基于本文研究的实际情况,在这里采用最小二乘支持向量机(LS-SVM),它将SVM中的二次规划问题转换成求解线性方程的问题,这样使得计算复杂度降低,计算速度也加快[11]。
本文提出将FCM聚类和LS-SVM相结合的建模方法。该方法首先利用FCM对样本进行聚类分段,然后对各段样本建立LS-SVM模型。在MATLAB2009Ra软件中,使用现场数据建立了啤酒发酵过程的分段故障诊断模型,经过与其他SVM建模方法比较,此方法建立的模型具有较高的泛化能力[12]。
1 模糊C均值聚类算法
啤酒的酿制,就是控制各种参数使其达到某种发酵的效果,发酵的过程被划分为很多阶段,在每个阶段一些生物量的值都有不同的变化,所以可以根据生物量的不同变化来划分发酵的阶段,但这种划分由于每次試验的相同阶段过程会随时间发生变化而显得极其复杂,而且同一试验的相邻阶段之间也没有明确划分原理,这就要求试验人员有扎实的实验基础,否则划分不精确会对建模精度产生极大影响。聚类分析的方法在上述划分的问题上有其独特的优势,它能使相同阶段中的对象显示出最大的相似度,而使不同阶段中的对象显示出最大的差异性,从而能完全显示出不同阶段的数据分布特性,利用聚类算法的原理去分析啤酒发酵的过程,提取发酵过程中每个阶段的数据信息,完全能够实现发酵阶段的自动划分[13-15]。
FCM算法首先由Dunn提出,经过Bezdek等完善和推广,其用于发酵过程数据分类的基本思想是,根据发酵过程数据与C个聚类中心间的加权相似性测度,对目标函数进行迭代最小化,以确定其最佳的类别。其目标函数如下:
3 基于FCM和LS-SVM的建模方法
基于FCM和LS-SVM的建模过程可以划分成两个过程进行分析,结构如图1所示。阶段一,FCM把整个输入样本空间划分为若干个互相分离的区域,区域数量根据具体研究对象决定,每个独立的阶段拥有不同特征。阶段二,对不同阶段应用相异的LS-SVM进行建模。上述方法与全局LS-SVM模型方法有很大差异。全局LS-SVM模型虽然也是在整个研究样本空间中操作,但是能在每个阶段都能得到充分训练还不能保证,该过程的操作步骤为:
1)将采集的训练样本进行[0,1]归一化处理,目的是避免各种不同特征数据之间的数量级相差太大以至于造成误差;
2)将样本数据输入到FCM聚类算法中,输出为每个样本对每个阶段的隶属度的值,将样本数据划分为几类;
3)基于第2步中已按照阶段划分的几类训练样本,分别采用LS-SVM对模型进行训练,分别得到每个阶段的估计函数f(x),模型训练结束;
4)将训练结果应用于LS-SVM模型中,根据整个过程阶段的划分原则,将不同阶段的测试数据输
入,得到预测样本的输出量;
5)模型的泛化能力使用测试样本进行测试。
建立LS-SVM分类器模型,在分类问题上,支持向量机通常只考虑两类,yi=1表示该样本属于一类,yi=-1表示该样本属于第二类,处理多类分类问题时,需要将多类分类问题转换为两类分类问题,本文采用“一对多”方法,该方法用一个LS-SVM分类器将每一类与剩下的所有类别作区分,因此需建立的LS-SVM分类器与故障类型的数目相一致[19~22]。
4 啤酒温度故障诊断仿真实验
啤酒发酵是一个对温度控制相当严格的过程,对于温度传感器的准确性有较高的要求,啤酒发酵温度控制采用PID控制,准确的温度状态反馈将直接影响到PID控制的运行,所以能够及时的检测出温度传感器的故障,并且迅速的确定问题的原因就显得尤为重要,温度传感器通常有如表1常见的故障现象。
使用基于FCM和LS-SVM的方法,建立啤酒发酵过程温度故障诊断模型。采用5批生产数据,每一小时采样一次数据,每一批次共360个温度数据,代表一个完整的发酵过程,数据被分成两部分:4批次数据用于建立模型,1批数据用于测试,故障数据为实验过程中曾出现的数据,建模中采用RBF核函数,RBF核函数即K(x,y)=exp[-‖x-y‖2/2σ2],能够更好地反映发酵过程的非线性特点。
啤酒发酵过程一般分为四个阶段:主酵阶段,后酵阶段、还原阶段、贮酒阶段,所以根据实际情况,使用FCM将整个样本空间划分为四个区域,如图2,由图可以看出,0h~140h为主酵阶段,140h~270h为后酵阶段,270h~310h为还原阶段,310h~360h为贮酒阶段。
实验仿真采用Matlab2009Ra软件,FCM的参数为:聚类数目C=4,加权指数m=2,迭代终止参数ε=0.001,对大迭代次数t=100。经过多次实验,对LS-SVM模型,主酵阶段的参数选择为σ=211和C=4500,后酵阶段的参数选择为σ=124和C=3200,还原阶段的参数选择为σ=148和C=5500,贮酒阶段的参数选择为σ=34和C=5000。鉴于故障类型,每一个阶段需要构建2个分类器,每一个故障对应一个分类器,故障数据逐一输入到2个分类器中,直到将故障数据正确分类。
图3和图4是按表1的故障类型采用LS-SVM对故障的分类,其中标签号1代表故障属于该类别,-1代表故障不属于该类别,横坐标为采样点数,纵坐标为故障标号。
图3为在主酵阶段(阶段一)人为引进故障,在0~100h引入故障二,图a表示全局LS-SVM对故障的诊断,图b为分段LS-SVM对故障的诊断。
图4为在后酵阶段(阶段二)人为引进故障,在140~220h引入故障一,图c表示全局LS-SVM对故障的诊断,图d为分段LS-SVM对故障的诊断。
由图3、图4可以看出,全局LS-SVM对于发酵过程的故障诊断,存在比较严重的误报与漏报现象,对发酵过程进行分段,针对每一段进行故障诊断,大大提高了诊断的准确率。
表2为以故障一为故障数据,得出的诊断结果时间,从中可以得出结论,对发酵过程分段处理,使得模型的运算复杂度降低,诊断的速度也得到了提高。
5 结 论
本文首先阐述了啤酒发酵过程的阶段性,指出对其分段处理的必要性,之后对每个阶段进行建模处理,聚类算法FCM因其有更独特的优势而被采用;在此基础上,又详细阐述对啤酒发酵每阶段的建模过程和方法,应用FCM和LS-SVM相结合的方式,利用在现场采集到的数据,建立了整个啤酒发酵过程的模型,通过这个模型对出现的故障进行诊断处理,该模型保证了诊断结果的准确性,与全局建模方式比较,具有更强的泛化能力,此方法建立的故障诊断模型,对故障的诊断与分类更加准确,进而可以根据故障诊断的结构精准迅速的去断定故障原因,加以排除。
参 考 文 献:
[1] 张旭. 青霉素间歇过程故障诊断方法研究[D].沈阳:沈阳理工大学,2012.
[2] 熊伟丽,王肖,陈敏芳,徐保国. 基于加权LS-SVM的青霉素发酵过程建模[J]. 化工学报,2012(9):2913-2919.
[3] CHIANG L H,RUSSELL F L,BRAATZ R D.Fault detection and diagnosis in industrial systems[J].Springer,2001(9):317-335.
[4] L.in C T,Juang C F,LiCP.Temperature Control with a Neural Fuzzy Inference Network [J].IEEE Trans.Stst.Man,Cybern.1999,C(29):440-451.
[5] 刘树启,徐光宪,刘建辉.啤酒发酵过程监控系统研究[J],辽宁工程技术大学学报,2002,21(2):224-226.
[6] 阳同光,桂卫华.基于 KPCA 与 RVM 感应电机故障诊断研究[J].电机与控制学报,2016,20(9):89-95.
[7] 张志艳,马宏忠,杨存祥,等. 小波包与样本熵相融合的PMSM失磁故障诊断[J].电机与控制学报,2015,19(02):26-32.
[8] VAAG P.et al.Charaeterization of a Beer Foam Protein Originating From Barley[J].EBC Congress,1999,25:157-166.
[9] 杨奎河,单甘霖,赵玲玲.基于最小二乘支持向量机的故障诊断方法[J].计算机应用研究,2007(7):99-101.
[10]边莉,邊晨源. 采用交叉熵支持向量机和模糊积分的电网故障诊断[J].电机与控制学报,2016,20(2):112-120.
[11]MARCU T KOPPEN-SELIGER B STUCHER R. Design of Fault Detection for a Hydraulic Looper Using Dynamic Neural Networks[M]. 16.OXFORD 2008,192-213.
[12]VAAG P.et al.Charaeterization of a Beer Foam Protein Originating From Barley[J].EBC Congress,1999,25:157-166.
[13]蔡艳宁,胡昌华,汪洪桥,等.基于自适应动态无偏 LSSVM 的故障在线监测[J].机电工程,2013(1):56-57.
[14]高学金,王普,孙崇正,易建强,张亚庭,张会清. 分阶段建立发酵过程模型的方法的研究和应用[J]. 系统仿真学报,2007,11:2574-2577.
[15]杨小梅,刘文琦,杨俊. 基于分阶段的LSSVM发酵过程建模[J]. 化工学报,2013,09:3262-3269.
[16]EL-TAWEEL Gh S,HELMY A K.An Edge Detection Scheme Based on Least Squares Support Vector Machine in a Contourlet HMT Domain[J].Applied Soft Computing Journal,2014,32(6):211-223.
[17]王强,陈欢欢,王珽.一种基于多类支持向量机的故障诊断算法[J].电机与控制学报,2009,02:302-306.
[18]张继军,马登武,邓力,范庚. LS-SVM参数估计与稀疏化方法研究及应用[J]. 系统仿真学报,2014,05:1113-1117.
[19]HIROFUMI Osada,HIDEKI Tanemura.Strong Markov Property of Determinantal Processes with Extended Kernels[J].Stochastic Processes and their Applications,2016,41:686-702.
[20]公彦杰. 基于LS-SVM建立发酵过程动态模型的研究及软件实现[D].北京工业大学,2010.
[21]刘斌,苏宏业,王强.一种基于最小二乘支持向量机的预测控制算法[J].控制与决策,2010(8):173-177.
[22]武俊峰,艾岭.一种基于改进聚类算法的模糊识别辨识[J].哈尔滨理工大学学报,2010(3):1-5.
(编辑:王 萍)