基于CEEMD与BP_AdaBoost的排水管道堵塞辨识

2018-07-23 02:15吴建德
电子科技 2018年8期
关键词:区分度排水管道特征提取

闫 菁,冯 早,吴建德,马 军

(1.昆明理工大学 信息工程与自动化学院,云南 昆明 650500;2.云南省矿物管道输送工程技术研究中心,云南 昆明 650500;3.昆明理工大学 机电工程学院,云南 昆明 650500)

城市排水管道运行过程易出现堵塞故障,堵塞早期表现为不同程度的部分堵塞。对排水管道的早期部分堵塞辨识方法进行研究,对于维护城市管道安全运营具有重要意义。在各类管道无损检测技术中,声导波检测方法具有独特的优势,导波检测中波速、波形等指标会随着波的频率和构件几何尺寸变化发生显著变化[1],检测方法简单且成本低廉。声信号的故障特征提取,是管道故障诊断的关键。目前的特征提取方法,波形特征[2],信息熵[3]、能量占比[4]等已经被广泛应用。但是现行的声信号特征提取方式,存在提取特征单一、特征信息冗余等问题。此外,目前常用于故障识别的分类器,多是诸如SVM、BP神经网络等单分类器,此类分类器可以很好地识别不同类别的故障,但对于同一故障的不同程度进行识别效果并不理想。

基于以上问题,本文提出一种基于CEEMD(Complete Ensemble Empirical Mode Decomposition)与BP_AdaBoost算法的排水管道堵塞故障识别方法。首先对管道声响应信号进行CEEMD分解,对各个IMF分量提取其近似熵和能量占比作为特征集合。为了提高特征集合区分度并且降低维度,使用距离可分性判据剔除低区分度的特征分量。最后使用BP_Adaboost模型对特征集合进行识别。实验证明,本方法不仅可以有效识别包括正常、大堵塞、小堵塞、重复堵塞4种管道工况,还可以识别管道重要部件三通件,具有一定的工程意义。

1 基本理论和方法

1.1 完全经验模态分解(CEEMD)

Yeh等[5]提出了完全经验模态分解(CEEMD)方法,该方法利用添加一对幅值相同、相位相反的高斯白噪声来降低噪声残留。其算法流程如下:

步骤1将幅值相等、相位相反的n对辅助白噪声加入到原始信号中,从而生成两套集合IMF

(1)

其中,S代表原始故障信号;N代表辅助白噪声;M1,M2依次代表加入正负成对噪声后的信号。此时能够获取2n个集合信号;

步骤2对集合里面的所有信号展开CEEMD分解处理,获取IMF分量,并用cij代表编号为i的信号分解出来的编号为j的IMF分量;

步骤3利用多组分量组合方式获取分解结果

(2)

其中,cj代表由CEEMD分解而来的第j个IMF分量。

1.2 BP_Adaboost强分类器

Adaboost[6](Adaptive Boosting)算法的目标为针对样本集合训练若干不同的“弱分类器”,然后根据弱分类器各自的识别率给予不同的权重,将其融合为一个“强分类器”,其本质运用了集成学习的思想[7]。

Adaboost具体步骤如下:

步骤1数据选择和网络初始化。从样本中选择a组训练数据,初始化测试数据的分布权重为Dt(i)=1/m,根据特征集合输入输出维数确定网络结构,初始化BP神经网络权值和阈值;

步骤2单分类器预测。训练第t个弱分类器时,用训练数据训练BP神经网络并且预测其输出,得到预测序列g(t)的预测误差和et,其计算公式为

(3)

其中,g(t)为预测分类值;y为目标值;

步骤3计算预测序列权重。根据预测序列g(t)的误差et计算序列的权重at,权重计算公式为

(4)

步骤4测试数据权重调整。根据预测序列权重at调整下一轮训练样本的权重,调整公式为

(5)

式中i=1,2,…,m,Bt是归一化因子;

步骤5强分类函数。训练T轮后得到T组弱分类函数f(gt,at),由T组弱分类函数f(gt,at)组合得到了强分类函数h(x)。

(6)

2 排水管道堵塞故障识别方法

针对排水管道堵塞程度的故障辨识问题,本文提出一种基于CEEMD与BP_AdaBoost算法的排水管道堵塞故障识别研究。

本文方法具体步骤如下:(1)对原始声学响应信号进行CEEMD分解,获得各个IMF信号,建立信号分量集合;(2)对各个信号分量分别提取近似熵和能量占比两种特征,构成初始特征向量集合D1;(3)使用距离可分性判据计算特征集合D1中各个IMF分量的区分度指标,剔除低区分度信号分量,建立D2特征向量集合;(4)对D2划分为训练集和测试集之后,训练10个BP神经网络弱分类器,最后将10个弱分类器的正确率化为识别权重构成强分类器进行故障识别。本文方法流程如图1所示。

图1 方法流程图

3 实验数据

英国布拉德福德大学管道实验室[8]搭建了如图2所示的实验平台。实验采用一段长为15.4 m,直径为150 mm的黏土管道,筛网作用为保证水流正常通过并且产生能量聚集方便接收信号。检测时控制声卡产生频率范围为100~6 000 Hz的正弦扫频信号。当声波遇到障碍物时,反射回的声信号由水下听音器接收,经由滤波范围为100~4 000 Hz的滤波器输入到计算机中。

图2 实验设计简图

堵塞程度的实验室定义为:若堵塞物所占高度超过了直径的1/3则为中重度堵塞,反之,则为轻微堵塞。为模拟实际工况,采集正常、中重度堵塞、轻微堵塞、重复堵塞和管道内有三通件5种工况下的声信号。管道内分别放置55 mm、20 mm高度的堵塞物模拟管道中重度堵塞和轻微堵塞工况,放置两个堵塞物模拟重复堵塞工况。

实验数据共有192组样本,其中正常52组,中重度堵塞38组,轻微堵塞24组、重复堵塞38组、三通件管道40组。数据分析的采样频率为44 100 Hz。

4 实验结果及分析

4.1 预处理

由实验获得各个工况下的管道声学响应信号,一组正常、大堵塞、小堵塞、三通件、重复堵塞管道的声响应信号的时域波形如图3所示。

由图3可看出,几种工况下的信号都存在强衰减且无周期性等特征。为了更好的提取信号特征,对声响应信号进行CEEMD分解。以大堵塞管道为例,一组分解结果如图4所示。

图3 5种工况管道时域波形

图4 CEEMD分解结果

通过CEEMD的原理可知,声响应信号经分解后能够得到5个不同特征尺度的IMF分量和一个残余分量,而且这些IMF分量表现了声信号不同的特性。由于信号本身的复杂性及其他条件的影响,有必要对信号进行进一步的特征提取一边以便进行故障判别。

4.2 特征提取

当排水管道内部出现不同程度的堵塞时,信号的声波特性会发生变化。

近似熵是一种反映信号时间序列复杂度的指标[9]。对于一个序列而言,近似熵的值越大,表明这个序列的越复杂越无序;反之,这个序列之间相似度越高[10-11]。基于近似熵的这个特点,本文提取除残余分量外的各个IMF分量的近似熵来表征其序列复杂度特性。此外,IMF分量之间的能量占比情况表征了信号的能量特性[12],基于此本文也提取各个IMF分量的能量占比作为其特征集合。

经过特征提取,得到10维的特征集合D1。一组特征集合如表1所示,使用标号1~5分别表示正常、大堵塞、小堵塞、重复堵塞、三通件5种工况。

如表1所示,两种特征提取方式得到的特征集合存在区分度不明显且维数多的特点,此种情况会导致识别效果不理想。因此,对于特征集合中区分度不明显的分量剔除是十分必要的。

4.3 特征选择

为了提高样本区分度,使用距离可分性判据[13-14]对其进行降维。计算方式为:设样本集合中有c类共M个样本,表示为xi,每类有Ni个样本,则类内散布矩阵SW和类间散布矩阵Sb分别表示为

(7)

(8)

式中,mj为类内的样本均值;m表示为总体样本值。

表1 特征提取结果

对特征集合D1的所有分量计算区分度指标,得到的区分度结果如图5所示,可以看出IMF1~IMF3分量有较为明显的区分度。基于此,仅使用前3个IMF分量所构成的6维特征集合D2输入到识别模型中进行故障判别。

图5 区分度指标

4.4 故障识别

本实验从192组数据样本中随机挑选100组数据作为训练样本,92组作为测试数据。根据特征集合特点随机初始化神经网络的权值和阈值,共训练生成10个 BP神经网络弱分类器,最后由10个弱分类器组成强分类器,实现对排水管道的故障诊断。

为了验证本文特征选择方法的有效性,也将未经选择的D1特征集合输入分类器进行实验对比。此外,也与传统的SVM分类器进行识别对比。实验选取径向和函数,基核g与惩罚因子c均取2.0[15],识别得到结果如表2所示。

表2 识别正确率

由表可知,提取两个特征可以明显提高识别准确率。经过特征选择之后,降低了特征维数,提高了样本区分度可以进一步提高准确率并且缩短识别时间。另外,与传统的SVM分类器相比,BP_Adaboost经过弱分类器融合可以有更好的识别效果。

5 结束语

为了解决排水管道堵塞故障程度的识别问题,采用有声导波方法,使用声学响应信号进行信号分析。在对原始信号采用CEEMD分解的基础上,提取各个分量的近似熵和能量占比指标,并使用距离可分性判据进行特征选择,用BP_Adaboost模型进行故障识别。实验证明,多特征提取相对单一特征,可以更好的表征信号特性。此外,BP_Adaboost强分类器相对单一分类器也可以进一步提高识别准确率。

猜你喜欢
区分度排水管道特征提取
探讨市政工程给排水管道施工中质量控制
探讨市政给排水管道施工的加强措施
市政工程给排水管道施工质量控制
给排水管道试压技术在市政工程项目中的应用
浅谈试卷分析常用的几个参数及其应用
基于Daubechies(dbN)的飞行器音频特征提取
图形推理测量指标相关性考察*
Bagging RCSP脑电特征提取算法
浅观一道题的“区分度”
单维参数型与非参数型项目反应理论项目参数的比较研究*