张瑜,蓝艳华
(1.日照广播电视大学,山东日照 276800;2.日照市科学技术协会,山东日照 276800)
MISEP盲分离算法在综采煤岩界面识别中的应用
张瑜1,蓝艳华2
(1.日照广播电视大学,山东日照 276800;2.日照市科学技术协会,山东日照 276800)
MISEP算法是一种有效的分离线性和非线性混叠信号的算法。通过MISEP算法对顶煤放落时产生的煤和矸石混合声音信号进行了盲源分离,分离出了煤和矸石信号,根据频谱差异确定出煤和矸石的比例,实现了煤岩界面的识别。
盲源分离;非线性混叠;信息极大化;功率谱
综采放顶煤开采存在的难题是煤岩界面自动识别技术。目前的研究方法有基于煤岩自然Y射线的辐射特性、基于采煤机的截割力响应、利用煤和矸石的振动声波信号等。其中,利用综采工作面上产生的煤和矸石的振动声波来进行煤岩界面自动识别简化了技术难度,降低了使用成本。此方法的关键在于能将矸石和煤在下落时产生的声波信号分离出来,然后再根据频谱特性差异确定出两者的混合程度,从而达到煤岩界面自动识别的目的。而在采煤过程中,煤和矸石声音的混合方法是未知的,因此采用盲源信号分离技术对混合声音信号进行分离。
盲源分离方法是指在混合参数完全不能确定时,如何从线性的或者非线性的混叠信号(观测信号)中分离出各源信号的过程。目前,已有很多高效的分离算法应用于线性的或非线性的信号中[1-4]。Yang和Amari提出了一种信息后向传播的方法,采用了2层传感器网络结构,将最大化熵与最小互信息作为测量独立性的代价函数。Jutten和Table则提出了一种分离方法应用于非线性的混叠信号,实现盲分离后非线性的混叠信号。在采煤的实际情况中,观测的声音信号是线性还是非线性混叠无从得知。而盲分离算法MISEP (mutual information-based separation)是一种既可以分离线性混叠信号也可以分离非线性混叠信号的有效算法,正好适用于煤矸声音信号的分离。
MISEP是一种线性和非线性独立成分分析算法(ICA)[5]。该方法可以看作是Infomax算法的扩展,其将每个成分的最小互信息作为代价函数。算法框图如图1所示。
图1 MISEP算法框图
图1中:x1(t),x2(t)为观测向量;F为分离模块;y1(t),y2(t)为分离向量;ψ1,ψ2用来估算每个分离相量的累计概率函数;z1(t),z2(t)为相应的实际累计概率函数。
通过对INFOMAX算法的分析可以得到:最小化网络的输出熵H(z)将导致分离向量y的互信息最小化。因此,接下来需证明H(z)也将会使每个ψ模块最大概率逼近yi(t)的累计概率函数。首先,z的熵可定义如下:
假设yi的分布保持不变,由于Z各分量依赖于前述ψ模型的一系列分离参数,因此,H(z)将导致最大化每个边界熵H(zi)。假设ψi被约束为[0,1]范围内的单调递增函数,由于均匀分布函数在有限区间内有最大熵,因此,最大化H(zi)将使得zi的分布逼近于[0,1]范围内的均匀分布。同时,ψi将会逼近yi的累积概率函数。因此,解决F模型和ψ模型仅需要优化H(z)。
1.1 代价函数的约束
为了得到一个[0,1]区间内的单调递增函数,实现多层感知器的ψ函数必须有约束。首先,需满足多层感知器的每个单元都应是非线性单调递增函数。其次,每一个权重都应是非负值。因此,隐含层函数使用函数值范围在[0,1]的S函数来实现这个约束。输出单元则使用线性函数。归一化权重向量的欧式范数,每个输出单元变为1/其中h表示隐藏层链接到输出单元的数量。如果整个网络使用非负权重,则得到了一个[0,1]区间的递增函数。因此,训练时初始化所有权重为正值能够保证训练过程中权重为正值,以免输出熵是递减的。
在实际训练中,把区间为[0,1]的S函数作隐含层的驱动函数以确保ψ函数在区间[-1,1]内。在这个区间范围内,可能需再次计算累积概率函数,互信息也可被最小化。
1.2 系统训练
MISEP和INFOMAX都是通过最大化熵来训练系统。实现过程是利用基于梯度的优化算法。输出熵可以表示为
式(2)中:J=∂z/∂x为雅可比行列式,可通过变形由图1的系统得到;〈·〉表示数学期望;H(x)表示观测向量的熵,在优化过程中可被忽略,因为H(x)并不依赖于系统的参数。那么,需要考虑的仅剩下公式(2)的最后一项。因此,优化的目标函数为
其中:Jk表示第k次训练的雅可比行列式的值。由公式(3)可得,E是雅可比行列式Jk的函数,很难直接计算梯度。本文采用了后传播算法(BP)的人工神经网络(ANN),因为使用后向传播计算输出函数的梯度来设置权重更简便和高效。图1所示的系统并不输出雅可比行列式,不能实现对目标函数的优化。这就需要首先设计一个系统来计算Jk,以便对E的梯度进行有效计算。
计算Jk的系统框图如图2所示。为方便描述,先假设图1的F模块和ψ模块具有特定的结构,即F模块具有奇数个S函数隐含层单元,并且有若干个线性输出单元,输入、输出单元没有直接关系。图2中:A代表F模块的隐含层权重矩阵,它的输出是向量Ax;框图左侧的Φ,其输出可以激活F模块的隐含层单元,表示将隐含层的S函数作用于Ax的每一个成员;B表示F模块输出单元的权重矩阵,其输出是y。由C组成的ψ模块,右侧的Φ和D模块都具有与F相同的结构。组合每个ψi单元,成功建立了一个具有奇数隐含层和线性输出单元的多层感知器。
图2 图1的优化框图
图2中,上半部分结构传播的是矩阵而非向量。其输入是一个n×n的单位矩阵I,n是x的数量。左侧的Φ'产生一个对角阵(Φ'l),其成员是上述Φ模块中对应单元的S函数的导数。A,B,C,D模块都是权重矩阵。右侧的Φ'也产生一个对角矩阵(Φ'r),其成员也是上述Φ模块中对应单元的S函数导数。为计算函数S的导数,2个Φ'模块需要被对应的隐含层的输入激活,如图2中箭头所示,这个输入来自系统模块下半部分的信息。通过简化,雅可比行列式的输出表达式为
2.1 初步频段测试
鉴于矿井的特殊环境,顶煤放落时产生的声波信号也是复杂多样的。因此,在进行信号分离前,首先应了解放煤过程中各种混合声音信号的频率成分。本文针对这个问题进行了频段的初步测试工作。
考虑到顶煤放落时信号的复杂性,本文分别模拟了以下信号,并采集了相应的声波信号。模拟的信号包括:矸石、煤分别碰撞铁板的声音,煤和煤之间的碰撞声,煤和矸石之间的碰撞声,矸石和矸石之间的碰撞声。其中,声波信号的采样频率为22.05 kHz。
假定采集到的声波信号在10~30 ms是稳定的,那么,采用20 ms的hanning窗对已采集到的声波信号实施加窗处理,相邻帧信号存在10 ms重叠。连续地对每一个音频帧信号进行频谱分析,经过统计分析后得到:煤在放落时所产生的音频信号频率范围通常在1.8~2 kHz,而矸石放落时所产生的音频信号频率范围则在2 kHz或3 kHz之上。
2.2 多层感知器网络训练
为了使网络有较好的参数,采用煤和矸石撞击铁板的声音信号作为训练样本。如图3所示,共采样1 500个,取500~1 500个样本对网络进行训练,训练的参数效果如图4所示。
2.3 实际混合声音信号分离
使用训练好的感知器网络对实际从矿井下采集的煤矸混合信号进行分离,使用2段声波信号,如图5所示。分离后的声波信号如图6所示,对分离出的信号进行功率谱估计,功率谱如图7所示。
图3 训练数据
图4 训练效果
图5 源声波信号
图6 分离后的声波信号
由图7可知:采用MISEP算法分离出的2个声波信号频谱段分别集中在2~3 kHz和1 kHz左右。这刚好与2.1节所述的频段测试中煤和矸石下落时产生的声波信号频率范围相吻合,实现了对煤和矸石的识别,继而完成了煤岩界面的自动识别。
图7 分离信号的功率谱
本文将MISEP算法应用到了基于声音频谱分析识别的煤矸分界方法研究中。首先,对顶煤放落中存在的混合声音信号进行MISEP信号分离;然后,对分离后的各信号成分进行频谱分析,依据矸石和煤在下落时的声音信号频谱的差异来估算顶煤的含矸率,得到顶煤放落的程度,进而可以对放落实施控制。实验结果表明:该算法收敛速度快且分离效果好。
[1]Yang H H.Information back-propagation for blind separation of sources form non-linear mixture[C]//Proe.ICNN,Houston,1997:2141-2146.
[2]马建仓,牛奕龙,陈海洋.盲信号处理[M].北京:国防工业出版社,2006.
[3]Taleb A.Source separation in post nonlinear mixture:an entropy-based algorithm[C]//Proceedings of ICASSP,Seattle,Washington,1998:2089-2092.
[4]刘琚,聂开宝,何振亚。非线性混叠信号的可分离性及分离方法研究[J].电子与信息学报,2003,25(1): 54-61.
[5]Almeida L B.MISEP——an ICA method for linear and nonlinear mixture,based on mutual information[C]// Proceedings of the 2002 International Joint Conference. Honolulu,Hawaii,2002:442-447.
(责任编辑 何杰玲)
Application of MISEP Algorithm of Blind Source Separation in the Recognition of Fully Mechanized Coal Rock Interface
ZHANG Yu1,LAN Yan-hua2
(1.Rizhao Radio and TV University,Rizhao 276800,China; 2.Rizhao Association for Science and Technology,Rizhao 276800,China)
MISEP is an effective signal separation algorithm with the linear and nonlinear aliasing signal.And this essay adopts this method to conduct a blind source separation of the top coal caving mixed sound signals in the process of coal gangue.This separation gets the signal of coal and gangue,thus their ratio is identified based on the spectrum difference,and as a result,the purpose of recognizing coal rock interface is fulfilled.
blind source separation;nonlinear aliasing;information maximization;power spectrum
TP274
A
1674-8425(2014)08-0102-04
10.3969/j.issn.1674-8425(z).2014.08.021
2014-02-15
山东省教育厅高校科研计划资助项目(J11LG12)
张瑜(1976—),女,山东日照人,讲师,硕士研究生,主要从事电路与系统和控制工程等研究。
张瑜,蓝艳华.MISEP盲分离算法在综采煤岩界面识别中的应用[J].重庆理工大学学报:自然科学版,2014 (8):102-105.
format:ZHANG Yu,LAN Yan-hua.Application of MISEP Algorithm of Blind Source Separation in the Recognition of Fully Mechanized Coal Rock Interface[J].Journal of Chongqing University of Technology:Natural Science,2014(8):102-105.