张华
(吉林建筑大学城建学院,长春 130011)
两相流是一种广泛存在于自然界和工业生产过程中的混合流动模式,特别在化工、石油、电力、核能及冶金等行业普遍存在。近年来,两相流的研究逐步发展成为国际上研究的热点,其主要原因在于两相流不仅在一系列现代工程中得到广泛应用,而且对促进这些设备的发展和创新也起到了重要作用。因此两相流的参数测量和流型识别具有重要的理论和工程意义[1]。小波包分析是在小波分析基础上发展起来的更加精密的时频分析方法,它在信号去噪、滤波、压缩、非平稳机械振动信号的分析与故障诊断、非平稳信号的特征提取等方面具有重要应用。支持向量机是统计学习理论中最年轻实用的内容,是为适用于小样本学习而提出的通用学习算法。本文以ERT系统和油/水两相流的流型为研究基础,首先采用小波包分析对ERT系统测量的压差波动信号进行特征提取,然后通过计算类间不可分离程度为每个节点选取最易分的两类构造DDAG支持向量机多类分模型,最后将提取的特征数据输入构造好的分类模型进行流型识别。
电阻层析成像系统主要由电阻传感器阵列、数据采集系统、图像重建计算机三部分组成[2]。系统结构如图1所示。ERT系统的工作原理通常是电流激励、电压测量。本文是基于12电极ERT系统采集的到电导率波动信号进行处理,由于采用相邻的激励模式,所以一幅图像共采集到N(N-3)个测量数据,即12×9=108个。系统工作原理图如图2所示。
图1 电阻层析成像系统结构图
图2 系统工作原理图
小波包分析是对非平稳信号进行特征提取的较好工具,它能够为信号提供一种更加精密的分解方法。它在小波分析的基础上将频带进行多层次划分,对多分辨率分析没有细分的高频部分进一步分解,并能够根据被分析信号的特征,自适应地选择相应的频带,使之与信号频谱相匹配,进一步提高时频分辨率[3]。
(1)对输入信号S,采用db6小波滤波器,shanon熵值进行三层小波包分解,从第三层中提取低频到高频8个频率成分的信号特征[4]。
(3)利用公式
其中E满足公式:
对所求得能量值做归一化处理。
(4)用各频段能量作为特征值,构造特征向量,即
支持向量机是为适用于小样本学习而提出的通用学习算法。它根据VC(Vapnik-Chervonenkis)理论[5],基于结构风险最小化原理,从而能兼顾训练错误和泛化性能,开辟了机器学习算法的新天地。目前这种新的学习算法被建议用以代替多种传统的神经网络方法,已经成为机器学习研究的热点,并在很多领域得到了成功的应用。
由支持向量机定义,构造非线性最优超平面的问题转化为一个较简单的二次规划:
训练完成后,计算下列函数的符号即可:
支持向量机最初是针对二类分类问题提出的,上述支持向量机原理只能解决两个类别的分类问题。而实际应用中常常是多个类别的分类问题[6]。常见的多类分类策略有一对一、一对多和DDAG[7],前两种方法存在不可分区域。传统的DDAGSVM在训练阶段构造K(K-1)/2个两类分类器,在分类阶段,将K(K-1)/2个两类分类器构造成一个二叉树有向无环图。对待分类样本X,从树型拓扑结构根节点开始,根据支持向量机决策函数的值决定走左节点或者是右节点。以此类推,直到达到叶结点,此叶节点的类别就是待分类样本X的类别。但是DDAG模型存在误差累积的问题[8],即当根节点产生分类错误时将会直接影响下层各节点的分类结果。解决误差累积问题的一般方法是用马氏距离或类中心间距离作为类间分离程度的度量,但是这两种方法没有考虑样本空间分布的几何状况。要想正确的进行类间分离程度度量还需要考虑样本在空间的类内分散度[9]。
首先,第i类和第 j类样本的中心距离用
其次,第i类样本的类内分散度表示为:
由以上两类样本中心距离和两类类内分散度,得到两类间不可分程度计算公式:
对ERT系统中的四种流型:点滴流、核心流、层流、环状流进行识别,采用改进的DDAG方法构造支持向量机多类分类模型。根据流型个数4,需要构造4*(4-1)/2=6个SVM两类分类器,如图3所示。步骤如下(以判别1类为例):
第一步:设给定的训练集为{(x1,y1),(x2,y2),...,(xl,yl)},l代表用l组样本数据进行训练。
其中 xi∈Rn,yi∈{1,2,3,4},i=1,2,...,l。
第二步:根据以上得到的两类间不可分离程度公式计算每两种流型的不可分离值。选择最小的值(可分离性最高)所对应的两种流型(假设为1和2)作为树型拓扑结构根节点支持向量机要区分的两类。
第四步:在某个节点的剩余类别中,重复第二步和第三步,直到达到叶子节点,此节点所对应的类别就是待分样本X所属的类别。
图3 DDAGSVM多类分类模型
本实验采用MATLAB编程,在小波包工具箱和LS支持向量机工具箱基础上修改得到。首先为每种流型随机选取30个样本进行训练。由ERT系统工作原理可知每种流型由108个数据表示,经过小波包分解变为8维数据,将特征提取后的数据输入DDAG支持向量机多类分类模型。在本实验中,支持向量机采用最小二乘支持向量机算法[10],对训练结果影响不大的核函数随机选择径向基核函数。对训练结果影响较大的两个参数,一是控制对错分样本惩罚程度的可调参数gam,二是径向基核函数的参数sig2,它们的选取采用代价较小的网格搜索法,即多次调整两个参数的范围和采样间隔,找到最优的组合。训练完成后,再为每种流型随机选取30个样本进行测试。通过与以往基于其他策略的支持向量机多类分类模型比较,可得出DDAG支持向量机多类分类模型在ERT系统流型识别中具有较高的识别精度。实验结果统计分析如表1所示。
表1 实验结果统计分析
本文提出在ERT系统流型识别中采用小波包和改进的DDAG支持向量机多类分类模型相结合方法进行识别。实验结果证明在特征提取方式一样的情况下,改进的DDAG支持向量机多类分类模型在识别样本时相比于其他多类分类模型的识别准确率都要高,说明此种方法适用于两相流流型识别的领域。
[1]王金龙,孙福龙,杜新.质子交换膜燃料电池阴极气液两相流模型的建模及仿真[J].长春理工大学学报:自然科学版,2014,37(3):83-86.
[2]Dickin F J,Wang M.Electrical resistance tomography for process application[J].Measurement Science and Technology,1996,7(3):247-260.
[3]Elperin T,Klochko M.Flow regime identification in a two-phase flow using wavelet transform[J].Springer-Verlag,2002(32):674-682.
[4]周明月,杜丽敏,姜文龙.基于高阶统计量的小波变换去噪算法[J].长春理工大学学报:自然科学版,2009,32(2):251-253.
[5]张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42.
[6]Qi Guohua,Dong Feng,Xu Yanbin,et al.Gas/Liquid two-phase flow regime identification in horizontal pipe using support vector machines[A].Proceedings of the Fourth International Conference on Machine Learing and Cybernetics,2005:1746-1751.
[7]余辉,赵辉.支持向量机多类分类算法新研究[J].计算机工程与应用,2008,44(7):185-189.
[8]赵亮.一种改进的基于支持向量机的多类分类方法[J].计算机应用与软件,2014,31(12):233-236.
[9]熊忠阳,陈玲,张玉芳.一种改进的DDAGSVM多类分类方法[J].计算机系统应用,2010,19(12):219-222.
[10]Peng Zhenrui,Mi Gensuo.Voidage measurement of two-phase flow based on least squares support vectormachine[A].Proceedingofthe 6thWorld Congress on Intelligent Control and Automation,2006:4900-4903.