庞聪, 马武刚, 李查玮,4*, 江勇, 王磊, 廖成旺
(1.中国地震局地震研究所, 武汉 430071; 2.地震预警湖北省重点实验室, 武汉 430071; 3.湖北省地震局, 武汉 430071; 4.河北省地震动力学重点实验室, 三河 065201; 5.航天工程大学电子与光学工程系, 北京 101416)
VP型宽频带垂直摆倾斜仪是一种由中国地震局地震研究所在VS型倾斜仪基础上自主研制改进,并已广泛应用于中国多个地震台站的新型固体潮形变观测装置,主要由数据采集模块、电源、信号处理模块、垂直摆装置等部分构成,其分辨力、位移传感器精度、采样率分别可达0.001 arc sec(角秒)、0.000 1μm、1 Hz[1-3]。由于该仪器属于新研制初代机电设备,其电容位移传感元件对外界环境变换较敏感,应用场地多在复杂山洞环境中,在实际前兆观测中不可避免地会出现各种故障,并以输出异常波形数据的方式显现。
以往的倾斜仪故障辨识基本是通过人工经验判断仪器异常信号的故障原因,这对倾斜仪维护人员的技术水平要求较高,同时存在主观判断错误的风险,不利于地震前兆观测的有效数据收集与高效率统计管理。例如,李晓东等[4]将故障类型分为设备供电故障、信号电路故障、标定故障、仪器调零故障及数据特殊畸变故障等,并通过直观查看振荡信号与前置放大信号等数据是否异常,结合调零、更换电源芯片与检波芯片以及检查线路连接等手动操作,人工判断VP型倾斜仪故障原因,程序较为烦琐;赵黎明等[5]针对VP倾斜仪故障诊断研究的实验案例极少,仅仅采用天津蓟县地震台的3条仪器故障波形进行分析,分析结果缺乏足够的数据支撑且诊断手段依然基于人工检测;马援等[6]认为VP倾斜仪故障或信号异常原因分别来源于雷暴天气、异常温度与大气压、校准与标定、设备元器件损坏等,该研究更加关注外部环境干扰造成的倾斜仪异常波形识别工作,且存在研究样本较少,主观进行仪器异常波形辨识的不足。
故障信号特征提取一直是影响故障诊断精确度的重要因素,基于经验模态分解(empirical mode decomposition,EMD)和集成经验模态分解(ensemble EMD,EEMD)而来的自适应噪声完备集成经验模态分解(complete EEMD with adaptive noise,CEEMDAN)具有有效分离信号高低频成分、降低模态混叠影响以及自适应参数设置等优势,能够更加精准地提取故障信号的多尺度时频特征,依靠分解升维思想克服故障波形可靠特征难以获取的问题[7]。
利用机器学习算法或神经网络模型进行故障识别[8-10]是当下机电设备异常状态辨识与故障智能诊断研究的重要方向,可有效增强仪器监测运维中的自动化程度,提高故障诊断精度。同时,考虑到部分倾斜仪故障波形特征存在较为相似的情况,结合基于经验模态分解技术改进的互补集总经验模态分解方法,有利于充分挖掘倾斜仪故障数据的多尺度特征,改善故障诊断与异常信号识别的效果。
基于该方法首先将故障数据归一化,利用CEEMDAN分解信号得到本征模态函数(intrinsic mode function,IMF)的多尺度模糊熵,结合NULL(无效输出)标识位构建复合特征判据组合,然后基于麻雀搜索算法(sparrow search algorithm,SSA)优化反向传播(back propagation,BP)分类器的关键性能参数,得到最佳初始权值和初始阈值,最后应用SSA-BP网络模型对倾斜仪故障特征数据进行辨识。
BP神经网络(back propagation neural network,BPNN)作为一种常用的故障诊断模型,具有结构简单、采用梯度下降法迭代、可非线性映射以及对多参数敏感等特点,但其网络输出结果受网络初始阈值和初始权值的影响较大,容易陷入局部极小的情况,常常需要借助其他优化方法对其进行改进,以构建诊断效果更加可靠、准确的模型。
SSA[10-11]是一种群体智能优化算法,其通过模拟麻雀群的跟随觅食现象与反偷袭预警行为,将搜索到较好食物的个体视作麻雀群的领头鸟,其他麻雀个体视作追随领头鸟的随从鸟,且为了保证整个麻雀群的整体安全,也会有少量的麻雀个体充当侦查鸟,直接决定整个麻雀群体是否放弃当前觅食对象,进而移动到更加安全的区域进行觅食。应用SSA算法优化BP神经网络的初始权值和阈值,是故障诊断领域中的一种新尝试,可避免BP神经网络陷入极小值,提高故障诊断的准确率和稳定性。
图1 VP型倾斜仪故障智能辨识流程Fig.1 Flow of determination of Troubles for VP Vertical Pendulum Inclinometer
基于CEEMDAN多尺度模糊熵和SSA-BP神经网络模型的VP型垂直摆倾斜仪故障诊断流程如图1所示,首先利用CEEMDAN处理故障数据,计算多个IMF的多尺度模糊熵,按固定比例划分为训练集和测试集,然后使用麻雀搜索算法在训练集基础上优化BP神经网络的初始权值和初始阈值,满足迭代停止条件后,将得到的最优参数值与标准BP模型重组构成SSA-BP辨识模型,结合测试集进行VP倾斜仪故障智能辨识。
VP型倾斜仪的故障特性与以往的轴承、齿轮等机械性永久故障有较大区别,主要为可恢复的功能性故障或单纯的波形异常,故障来源多是供电不足和天气干扰,其在波形特性上面的体现多是大量缺值或不规则突跳现象,在供电恢复或天气恢复正常后异常现象就会消失,整段波形的周期性或重复性较低,利用波形峭度和循环平稳性来描述VP型倾斜仪故障信号特征的手段就不可取。
基于CEEMDAN方法,将提取故障信号特征的流程分为信号分解与多尺度模糊熵(multi-scale fuzzy entropy,MFE)计算等2部分,具体步骤如下。
步骤1采用EEMD法,在原始信号x中加入若干不同的白噪声,并分别进行EMD分解,求取每一个含噪信号的第一阶IMF分量后加权平均,得到CEEMDAN第一阶分量IMF1,以及从原始信号x中减去IMF1后得到CEEMDAN第一阶剩余分量R1,表达式为
x=IMF1+R1
(1)
步骤2与步骤1类似,针对R1添加若干个白噪声信号,分别进行EMD分解提取第一个IMF分量,并对上述IMF进行加权平均,得到第二阶IMF2和第二阶剩余分量R2。
步骤3重复上述流程,直到剩余分量Ri不能再进行EMD分解为止,结束CEEMDAN分解,累计得到n个IMF分量,表达式为
(2)
步骤4计算式(2)中各个IMF分量的模糊熵值[12],模糊熵计算公式为
(3)
选取河北省地震局易县地震台(北纬39.358°,东经115.373°)在2016年02月28 日5:51—2021年11月20日23:59期间记录的VP型宽频带垂直摆倾斜仪设备故障与波形异常数据,这些故障数据类型包括数采故障、电源与供电故障、雷电干扰、人工检修干扰、气压与降雨影响等几大类,其中数采故障和天气干扰等异常类型在仪器运行中较为常见,采集到的相关数据量占比较大。
为了保障实验数据选取的合理性和实验条件的稳定性,按照采样率为1 Hz、室温日变化≤5 ℃、湿度≤90%以及洞内无明显震动等要求,由台站固定技术人员记录150条数采故障(由数采电源短路或采集器电源板供电不足产生的数采缺测现象)波形数据和112条天气干扰(受到气压突降、空气湿度大幅增加、洞内气流扰动等影响)异常波形原始数据,每条原始波形长度为86 400,将NULL点处理成零值,在异常点位附近截取长度为6 400的波形数据进行仿真实验,并统一对故障数据归一化至[-1,1]内,共计262条。
易县地震台位于紫荆关大断裂与太行山山前大断裂中间,被监测山洞的最大深度可达200 m,监测区域是中国地震前兆观测的重点地区,旨在保障京津冀地区的地震精准预警与地质活动丰富性研究,仪器的运转状态直接关系到前兆特征的辨识工作,选择该台站所布设倾斜仪信号进行故障辨识研究是有重要现实意义的。
典型的数采故障信号与天气干扰信号如图2所示,VP型倾斜仪较易受到各种天气因素的干扰,如受到气压突降、空气湿度增加、洞内气流扰动等影响,倾斜仪EW向分量波形会出现剧烈抖动、快速下滑等现象;此外,在发生数采电源短路或采集器电源板供电不足时,就会产生数采缺测现象,即出现一系列连续的NULL点,其在波形变化规律上较为简单。
经过CEEMDAN信号分解和多尺度模糊熵计算的VP倾斜仪故障波形特征值如图3所示,可以看出除了IMF9、IMF10外,序列为1~150的数采故障IMF分量模糊熵特征值上下振荡程度更大,波形复杂性更高,而序列为151~262的天气干扰IMF分量模糊熵特征值整体起伏变化幅度较小,毛刺也较少,且IMF9、IMF10的模糊熵值在故障波形区分效果明显,其波形上下振荡的基线显著不同。
图2 典型数采故障信号与天气干扰信号Fig.2 Typical data acquisition fault signal and weather interference signal
图3 CEEMDAN-MFE计算结果Fig.3 Results for CEEMDAN-MFE method
为验证CEEMDAN-MFE判据和SSA-BP模型的有效性,应用多个机器学习模型(如朴素贝叶斯、支持向量机、BP神经网络等)进行故障辨识效果对比,模型性能评价指标采用准确率和召回率,循环辨识20次并取实验结果的均值和标准差来描述,结果如图4、图5和表1。
经过SSA算法优化的BP神经网络模型在准确率与召回率上都有了显著提升,分别提高4.758 1、6.321 6个百分点,达到了93.145 2%和91.186 5%;并且从标准差指标上可看出,其模型稳健性较好,辨识准确率保持在小幅范围内波动,综合性能优于朴素贝叶斯、SVM、BPNN等模型。
图4 SSA-BP模型与BP模型的辨识准确率对比Fig.4 Comparison of identification accuracy between SSA-BP model and BP model
图5 SSA-BP模型与BP模型的辨识召回率对比Fig.5 Comparison of identification recall between SSA-BP model and BP model
表1 常见辨识模型效果对比Table 1 Comparison of identification effects of machine learning methods
针对VP型宽频带垂直摆式倾斜仪故障辨识过度依赖人工检测的问题,为了提高故障辨识准确率,提出一种CEEMDAN多尺度模糊熵结合SSA-BP模型的倾斜仪故障智能辨识新方法,并得到以下结论。
(1)对故障源不同的倾斜仪输出信号进行互补集总经验模态分解,在若干个本征模态函数基础上计算模糊熵,得到CEEMDAN多尺度模糊熵判据组,该特征具有较好的信号区分效果。
(2)基于麻雀搜索算法优化BP神经网络的初始阈值和初始权值,得到最优权值与阈值,构建SSA-BP神经网络模型。
(3)实验结果表明:SSA-BP模型具有较高的识别准确率和召回率,并优于原本的BP神经网络以及机器学习中的朴素贝叶斯、支持向量机等模型。
本文方法为VP型倾斜仪在地震前兆观测中的故障辨识与异常波形辨识提供了新思路与新方法,一定程度上弥补了VP型倾斜仪在该领域的空白。