苗长云,邵 琦
(天津工业大学电子与信息工程学院,天津300387)
在现代化工业生产中,带式输送机在产品运输方面扮演着不可或缺的角色,具有负载量大、运输距离远、性价比高的优势,已被广泛应用于工矿、运输等领域[1-2]。作为带式输送机的核心部件,输送带承担着运载产品的关键性任务。在使用过程中,输送带可能会遭受到煤矸石或废钢铁等异物的冲击,亦或者物料运输造成的压力不均,致使输送带长期处于恶劣环境下,纵向撕裂时有发生。若在纵向撕裂发生时没有得到及时的反馈和处理,会为企业的生产留下巨大的安全隐患,增加发生重大安全事故的风险,不仅危害了企业生产效益,更严重时甚至会威胁到人员的生命安全[3-4]。
输送带纵向撕裂的主要检测方法是通过压力、电磁、激光、红外温度等传感器检测输送带的物料泄露和钢丝绳或橡胶脱落等状态[5],判断纵向撕裂故障,其主要检测设备包括漏料检测装置、渔线式检测装置、测振式检测装置、金属线圈检测器、磁性橡胶检测器、压辊式检测器、激光光幕检测器、红外测温仪等,存在准确性和可靠性差、易损坏等缺点,并且在纵向撕裂发生后,如果无物料泄漏是不能检测到纵向撕裂故障的[6]。另外,还有基于激光、红外线的机器视觉技术,在检测输送带的纵向撕裂时,在输送带表面有水的情况下,输送带表面图像模糊,无法检测到纵向撕裂故障,也存在准确性和可靠性差的缺点[7-8]。因此,带式输送机输送带的纵向撕裂检测是业界公认的难题。
声音,作为一种重要的信息传递方式,相较于图像,声音的采集不仅便捷,而且蕴含着大量的现场环境信息,能够很好地反映出环境中的事件是否存在异常,通过声音来检测故障的方法已经被广泛应用于工业领域。文献[9]提出一种利用机械内部(包括电机)声音的方法,检测机械设备是否存在异常故障;文献[10]利用敲击的声音来检测铝锭铸造的故障;文献[11]通过声音检测带式输送机托辊的故障。在实际工作现场中,带式输送机输送带的纵向撕裂往往是通过附近工人听到异常声音发现的。因此,通过声音来检测输送带纵向撕裂的思路是可行的。基于此,本文提出了一种基于声音的带式输送机输送带纵向撕裂检测方法,以期提高输送带纵向撕裂检测的精确度和实时性,并将其应用于工矿、运输等领域。
基于声音的带式输送机输送带纵向撕裂检测流程如图1 所示。
图1 输送带纵向撕裂声音检测流程图Fig.1 Flow chart of sound detection for longitudinal tear of conveyor belt
利用树莓派3B 开发板设计带式输送机声音采集系统,采集声音信号;经过预处理,提取由梅尔频率倒谱系数和短时能量参数组成的复合特征参数;利用期望最大化算法(expectation maximization,EM)对复合特征参数进行处理,经过高斯混合模型(GMM)形成声音特征数据;再采用支持向量机(SVM)分类识别器完成带式输送机声音信号的分类,形成声音样本,作为声音数据的训练样本;最后利用判别函数识别输送带纵向撕裂声音样本,从而实现带式输送机输送带的纵向撕裂声音的检测。
带式输送机声音采集系统由全向拾音器、USB 声卡和树莓派3B 开发板等组成,其组成框图如图2 所示。首先将全向拾音器、USB 声卡和树莓派开发板连接,再在树莓派开发板上搭建Linux 操作系统,安装基于Linux 系统下的录音工具,设定采样频率和采集时间,进行带式输送机声音信号的采集,采集结束后会自动生成相应的音频文件。
图2 带式输送机声音采集系统的组成框图Fig.2 Block diagram of sound acquisition system of belt conveyor
GMM 不适合处理短时间的声音数据,对长时间的声音分类识别效果更好[9-10];而SVM 对短时间的声音数据识别率更高,但算法复杂,处理大量声音数据时会导致收敛速度变慢,实时性降低[11-12]。因此,本文提出了一种基于GMM-SVM 的带式输送机声音检测算法,该算法结合了GMM 处理大规模数据的优势和SVM 快速区分同类数据差异的特性,提高了算法的运行速度和准确性。本文带式输送机声音检测算法分为4 部分:声音信号的预处理、复合特征参数提取、GMM形成特征数据和SVM 分类识别。
本文将带式输送机声音采集系统采集到的声音信号经过预加重、端点检测、分帧加窗等算法实现声音的预处理,得到符合系统标准要求的声音信号。
(1)预加重。将采集到的带式输送机声音信号高频部分预加重,使其更有区分度。一般通过一阶数字滤波器实现,如式(1)所示:
式中:α 为预加重系数,0.9<α<1.0,本文取α=0.98。
(2)端点检测。利用双门限算法,对预加重后的声音进行端点检测,确定声音的起始点和结束点的位置。
(3)分帧加窗。声音信号是非稳态、时变的,但在短时范围内变化很小,即具有短时平稳的特性。本文帧长设置为256,帧移为128,将声音信号进行分帧处理。由于汉明窗主瓣相对较窄且可以有效地抑制旁瓣,能够在更高程度上反映短时信号的频率特性[13],因此,本文采用汉明窗。汉明窗的窗函数如式(2)所示:
在输送带纵向撕裂声音检测过程中,单一特征参数不能非常准确地识别纵向撕裂的声音,因此,将特征参数组合,提高对声音的识别效果。本文采用短时能量(E)和梅尔频率倒谱系数(MFCC)结合,作为复合特征参数进行提取。
带式输送机的声音信号能量随着时间变化明显,因此,利用短时能量分析能很好地反映幅度的变化。不同类型的声音具有不同的能量,因此,本文用短时能量可以区分出不同的声段。第i 帧声音信号x(n)的短时能量如式(3)所示:
MFCC 是从声音数据中获得用于声音识别和说话人识别的特征,常运用于声音和语音识别领域,梅尔频率能够很好地反映人耳的非线性频率特性,充分反映信号的非稳态特性[14],如式(4)所示:
式中:fm为Mel 频率;f 为实际频率。从带式输送机的声音信号中提取MFCC 特征参数的流程如图3 所示。具体步骤如下。
图3 带式输送机声音提取MFCC 流程Fig.3 Flow chart of extraction MFCC from sound of belt conveyor
(1)预处理。带式输送机声音信号x(n)经过预加重、分帧和加窗后为xi(m),其中下标i 表示分帧后的第i 帧。
(2)快速傅里叶变换(FFT)。对每一帧声音信号进行FFT 变换,从时域数据转变成频域数据:
(3)计算谱线能量。对每一帧FFT 后的数据计算谱线的能量:
式中:L 为MFCC 的阶数,在本文中,L=12,即提取12维特征向量;m 指第m 个Mel 滤波器(共M 个);i 指第i 帧;n 为DCT 后的谱线。
GMM 是一种概率统计模型,利用若干高斯概率密度函数的加权和来表示特征向量在概率空间的分布。N 阶GMM 的概率密度函数是N 个单高斯分布的线性组合,用来描述框架特征在特征空间中的分布[15],如式(10)所示:
式中:μi为均值向量,完整的GMM 由混合权重和均值向量协方差矩阵组成[16],如式(12)所示:
式中:Pi为协方差矩阵。
GMM 参数表征带式输送机声音信号的个性特征,用EM 算法不断地进行迭代,完成对GMM 参数的估计,直到似然函数值达到最大,迭代结束,得到均值向量,作为声音信号的特征数据[17]。
在有带式输送机的工业现场中,声音主要由带式输送机自身运行的声音、带式输送机电机产生的声音、背景工人说话的声音、工业现场产生的噪声和输送带纵向撕裂声音组成,每种声音通过人耳就能听出明显的差别,并且具有明显不同的波形特征和短时能量。因此,将这5 种类型的声音作为本文带式输送机声音,从中提取MFCC 和短时能量复合特征参数,利用EM 算法对复合特征参数进行处理,再经过GMM进行均值估计,形成输送带声音的特征数据,记为纵向撕裂声音u1、电机声音u2、输送带运行声音u3、背景工人说话声音u4和工业现场其他噪声u5,从而作为SVM 训练和测试的样本。
支持向量机(SVM)主要用来解决二分类问题,对于多分类的问题,必须对SVM 模型的构造进行调整,本文使用一对多区分的方法进行分类和识别。对于给定的样本x,支持向量机分类器的分类函数一般形式为
式中:sign{}为符号函数。由分类函数f(x)的正负即可判定x 所属的分类[18]。
对于N 分类问题,需构造N 个SVM 分类器,将需要识别类别的样本数据标记为正类“+1”,其他不属于该类的样本标记为负类“-1”,依次对N 个SVM 训练,最后通过计算出各个分类器的判别函数值,输出结果,完成识别[19]。本文带式输送机的声音由带式输送机运行的声音、电机的声音、人说话的声音、工业现场产生的噪声和纵向撕裂的声音组成,因此,N=5;再将输送带纵向撕裂的声音特征数据u1标记为正类“+1”,而将其他4 种声音特征数据u2、u3、u4、u5标记为负类“-1”,依次对5 个SVM 进行训练,形成5 个SVM 识别模型,最后将测试样本输入,与各SVM 模型进行对比,从而完成对带式输送机输送带纵向撕裂的声音检测。
搭建带式输送机实验环境,在输送带之间安装铁锉,造成上输送带下表面的纵向撕裂[20],对本文提出的带式输送机声音检测方法进行实验验证。采用带式输送机声音采集系统进行声音的采集,设定声音的采样频率为48 kHz,每段采集时间均为2 s。带式输送机在不同的速度下,所产生的声音会有所不同。根据带宽和输送物料的不同,需要采用合适的带速,目前国标规定带式输送机带速的范围为1.6~5.0 m/s。因此,为了更好地模拟带式输送机在实际场合中的使用,分别采用 1.62、1.94、2.23、2.57、2.81、3.12、3.44、3.68、3.91、4.32、4.66、4.93 m/s 的速率采集带式输送机的声音信号。
输送带发生纵向撕裂故障,人耳就能听出异常,并且经过大量的实验验证,结果表明采集到的输送带运行声音波形和输送带纵向撕裂声音波形有着明显的区别,如图4 和图5 所示。由此说明,本文提出的基于声音的带式输送机输送带纵向撕裂检测的方法是可行的。
图4 输送带运行声音波形图Fig.4 Sound waveform diagram of conveyor belt operation
图5 输送带纵向撕裂声音波形图Fig.5 Sound waveform of longitudinal tear of conveyor belt
带式输送机声音信号经过预加重、端点检测、分帧加窗等预处理,再对预处理后的声音进行短时能量的提取,得到输送带运行声音和输送带撕裂声音的短时能量,如图6 和图7 所示。由图6 和图7 可知,短时能量能更好地区分输送带声音间的差别,进一步提高输送带纵向撕裂检测的准确性。
图6 输送带运行声音短时能量Fig.6 Short-time energy diagram of operation sound of conveyor belt
图7 输送带纵向撕裂声音短时能量Fig.7 Short-time energy diagram of longitudinal tear sound of conveyor belt
本文在各个带速运行的过程中,利用带式输送机声音采集系统采集带式输送机运行的声音,作为带式输送机运行声音库;采集纵向撕裂的声音,作为纵向撕裂声音库;然后单独启动带式输送机电机,作为带式输送机电机声音库;单独采集人说话声音,作为带式输送机人说话声音库;其他噪声由工业现场提供,形成其他噪声库。以此模拟工业现场的实际环境。通过在不同带速下采集到这5 种类型的带式输送机声音信号,可以使得每种类型的声音库更加丰富,根据更加微小的差别,也可以区分出运行、电机、纵向撕裂、人说话和噪声的声音。因此,SVM 分类器数量N 还是为5。每类声音在12 种带速下各采集25 段,共300段,每段2 s。5 类声音共采集1 500 段,每种样本总量的4/5 即1 200 个声音样本用于SVM 的训练,而剩余的1/5 即300 个带式输送机声音样本作为测试样本,以更好地验证本文算法的识别效果,增加测试样本的随机性。每次选取150 个声音样本,将其分为10 组进行实验,分别对比经过GMM、SVM 和本文提出的GMM-SVM 算法对输送带纵向撕裂的识别效果,结果如表1 所示。
由表1 可知,本文提出的带式输送机声音检测算法对输送带纵向撕裂的识别率最低为89.3%,最高为93.5%,平均识别率在91.5%左右,比单独使用GMM和SVM 算法对纵向撕裂的声音识别效果更好。GMMSVM 算法识别纵向撕裂的耗时如表2 所示。
表1 不同算法的识别率对比Tab.1 Comparison of recognition rate of different algorithms %
表2 GMM-SVM 算法识别耗时Tab.2 Identification time of GMM-SVM algorithm
由表2 可知,输送带发生纵向撕裂时,能在短时间内准确地检测出纵向撕裂故障,进行预警,减少输送带纵向撕裂带来的损失,说明本文提出的带式输送机声音检测算法具有很好的实时性。并且输送带纵向撕裂的训练样本数量越大,对纵向撕裂的声音识别效果越好,并渐渐趋于稳定,如图8 所示。
图8 训练样本数量和识别率的关系Fig.8 Relationship between number of training samples and recognition rate
针对带式输送机输送带纵向撕裂的检测准确性差的难题,提出了一种基于声音的带式输送机输送带纵向撕裂检测方法。采用树莓派3B 开发板设计了带式输送机声音采集系统,实现了带式输送机声音信号的采集;提出了一种基于高斯混合模型(GMM)和支持向量机(SVM)的带式输送机声音检测算法,实现了带式输送机声音信号的处理、分类和输送带纵向撕裂声音的检测。实验结果表明,该检测方法利用输送带的纵向撕裂声音的特征,准确检测出带式输送机输送带的纵向撕裂,具有准确性高、速度快等优点,平均检测准确率约为91.5%,算法平均耗时2.85 s,具有很好的实用和推广价值。