周海军,陈银燕
天然地震和人工爆破的识别是当今地震研究领域的一个重要方面,及时、方便、快速地识别出天然地震和人工爆破事件对于防震减灾事业和国家安全都具有重要意义。由于地震信号是非平稳的时变信号,但是在充分短的时间内的地震信号可以看成是平稳的,因此可以运用分帧技术来分析地震信号的短时特性[1]。天然地震和人工爆破的识别实际就是地震类型的识别。
天然地震的震源是非对称的剪切源,震源一般位于地底深处,能量衰减较慢,频率成分复杂。人工爆破的震源是对称的膨胀源,发生在地表浅层处,持续时间较短,能量衰减快。爆破波的高频成份一般多于地震波,他们震动频率有较大差异[2]。同时P波和S波的形态也有所差异,爆破的面波表现的比较明显,其信号的谱包络变化也有所差异[3]。
目前,国内外对地震和爆破的识别进行了大量的研究[1-3],提出了很多特征来识别地震和爆破,例如能量比、振幅比、小波变换特征参数、瞬态谱。而在本文中采用LPCC特征参数和GMM模式识别方法来识别天然地震和人工爆破。
复倒谱是信号通过Z变换以后取对数,再求反Z变换得到的。LPCC也是一种复倒谱,是震动信号通过线性预测模型进行同态分析,再通过迭代算法求得的,可以作为识别天然地震和人工爆破的特征参数。
线性预测分析是一种谱分析方法[4-5],本文中系统H(z)频率响应反应信号的频率响应和谱包络,通过线性预测分析得到的系统模型的系统函数为:
其中,p是线性预测的阶数,冲击响应为c(n),根据倒谱的定义可以得到:
将(1)式代入(2),并对z-1求偏导数,得到
令左右两边的相应系数相等,得到cn与ak的关系:
其中ak为LPC系数,p为LPC阶数,ck为LPCC参数,k为LPCC的阶数,本文实验中k取为20。
实现天然地震和人工爆破的识别需要注意几个问题:(a)原始地震信号的滤波和P波初至点的选取,以P波初至点为起始点,面波结束点为终点。(b)LPCC特征的提取,本文的LPCC阶数使用20阶,分帧的帧长64,帧移50,为了保证在训练和识别结果的稳定性,最好所有测试数据和训练数据选取的结构一致,即矩阵的大小一致,否则容易误判实验结果。(c)GMM模型的训练和建立。(d)模型匹配中相似性判断的依据。
本文的实验数据来自于2002年到2008年的首都圈地震带的27个天然地震事件和23个人工爆破事件,根据实际需要选取离他们震中距最近的5个台站记录的垂直方向的波形数据,并人工的从每个事件的5个台站中选择3个最好记录波形数据,然后对每一个选取后的波形数据滤波和P波初至点的判断,再以P波初至点为起始点,截取2640个点的数据作为地震信号。从而得到2640*81个天然地震样本点的波形数据集和2640*69个人工爆破样本点的波形数据集。最后,提取LPCC特征参数,为了消除时间、震级等不利因素的影响,需要对线性预测倒谱系数数据集进行归一化,本文采用极差归一化法,公式如式5所示。
高斯混合模型 (Gaussian Mixture Model,GMM)的训练就是给定一组数据,依据某种准则确定模型的参数,其结构原理如图1所示。
图1 地震和爆破的GMM
训练数据是从实验数据集中随机选取15个地震事件和15个爆破事件的3个台站,即共计90个记录波形为训练数据,剩下的60个记录波形数据为测试数据。震动信号的特征参数采用20阶的LPCC参数。
首先对两种类型数据提取特征参数并归一化,然后建立两个包含期望、方差、权值的震动信号的参考模型,权值的数量与LPCC参数的阶数数量一致。在训练过程中不断修正期望和方差,改变权值,使数据的似然性最大,从而得到图1中的参考模型库(即天然地震和人工爆破的两个模型)。最后用测试数据与两种模型比较,根据Bayes理论[6],最大后验概率可以表示为:
其中P(X|λ)的对数形式是:
测试信号属于哪一类地震模型可以表示为:
其中,自然数i是要识别的地震信号。若i=1,表示该测试信号为天然地震;若i=2,表示该信号为人工爆破。
本文先以单波为单位使用GMM模型来进行判断是天然地震还是人工爆破。对60个待判断的信号波分别进行判断,测试每一个信号波的地震类型。图2和图3是判断60个测试地震波进行100次实验中的一次具体的实验结果。在图2中,蓝色的星号表示测试信号与天然地震模型匹配得到的相似度值r1,红色圆圈表示测试信号与人工爆破模型匹配得到的相似度值r2。在图3中,红色星号表示实际的测试信号类型,蓝色圆圈表示GMM的识别结果,Y轴上的1表示天然地震信号,2表示人工爆破信号。
图2 模型匹配相似性度量值
从图2和图3可以看出,对同一个测试信号,若与天然地震模型匹配得到的相似度值r1大于与人工爆破模型匹配得到的相似度值r2,则该测试信号被识别为天然地震(例如第3个测试信号)。反之,被识别为人工爆破(例如第1个测试信息)。当r1和r2的值越接近时,对单波采用LPCC特征参数来进行判断,其误识别率可能会较高。
图3 震源类型识别结果
从图3中可以看出,对前36个待测试的天然地震波形进行GMM识别,误识别个数为5,则误识别率为13.9%;对后24个待测试的人工爆破波形识别,误识个数为7,则误识别率为29.1%。本次总的误识别率为20%。而对单波进行100次实验的平均识别率为81.5%。说明了LPCC特征参数作为地震特征参数是可行的。
再以事件为单位进行GMM地震类型识别。以同一个事件的3个台站记录波形数据进行判断此次事件的类型。判断的依据是:只要同一事件中有两个或两个以上记录波形识别为同一地震类型的时候,则系统将该震源类型作为此次事件的类型。例如一个事件中有2个记录波形为天然地震,则该事件为天然地震事件。
表1列出了20个地震事件(其中12个天然地震,8个人工爆破)进过100次实验的最后平均实验结果。从表1可看出人工爆破的误识别率高于天然地震,这可能与选取的波形有很大的关系,天然地震事件波形记录比较明显,而由于人工爆破波形容易受到环境的干扰,使得P波初至点判断比较困难,GMM对原始波形起始点和选取长度的要求很高。
从表1中,可知道以事件为单位的总识别率为85%。本文以事件识别率和单波识别率的结果,可以判断该系统是比较稳定,也是可用的。再根据随机实验结果,以事件为单位的识别率高于以单波为单位的识别率。
表1 以事件为单位的识别率
在天然地震和人工爆破识别研究领域中,实际上遇到了很多问题,并且这些问题得不到很好地解决。可以考虑其他学科运用的方法,可能在一定程度上会更好地解决问题。LPCC在语音识别应用中已经很成熟了,它能反映信号的频率与谱包络的关系,天然地震和人工爆破在这方面存在一定的差异,在理论上存在一定的可行性,所以本文将LPCC作为一种新的特征来识别天然地震和人工爆破,并取得了一定的实验成果。由于地震信号的复杂性,单一特征在识别天然地震和人工爆破时还存在识别率不高的缺陷,所以可以考虑将LPCC与其它地震信号特征联合识别天然地震和人工爆破,应该能达到更高的识别率。
[1]卢世军,黄汉明.基于能量比的天然地震与人工爆破自动识别算法研究[J].华南地震,2010,30(1),34-39.
[2]黄汉明,边银菊,卢世军,等.天然地震与人工爆破的波形小波特征研究[J].地震学报,2010,32(3),270-276.
[3]边银菊.遗传BP网络在地震和爆破识别中的应用[J].地震学报,2002,24(5),516-524.
[4]Jifeng Wang,Yantian Zuo,Yichang Huang,et al.Arc Sound Recognizing Penetration State Using LPCC Features [J].Robotic Welding,Intelligence and Automation,2010,229-233.
[5]蔡莲红.现代语音技术基础与应用[M].北京:清华大学出版社,2003,232-242.
[6]刘永红.说话人识别系统的研究[D].成都:西南交通大学,2003.