随机森林在通信干扰效果客观评价中的应用

2016-10-11 09:05张璐琳
无线电通信技术 2016年5期
关键词:测度主观语音

张璐琳

(中国人民解放军91404部队,河北 秦皇岛 066001)



随机森林在通信干扰效果客观评价中的应用

张璐琳

(中国人民解放军91404部队,河北 秦皇岛 066001)

在通信干扰效果客观评价中,一般采用美尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)、线性预测倒谱系数(Linear Predictin Cepstrum Coefficient,LPCC)等客观测度表示通信受干扰程度,但存在各种测度鲁棒性差的问题,即在某些条件下一种客观测度有效,而在某些条件下可能完全失效。针对这一特点,采用随机森林(Random Forest,RF)对性能较好的多种客观测度进行融合,形成新的评价系统,以与主观评价拟合的一致性为标准,衡量评价系统的性能优劣。用超短波语音通信干扰的实测数据对新的评价系统进行验证,结果表明其具有比单一客观测度更好的性能,并可以通过随机选择训练样本以及随机选择每一个样本的特征维,有效避免过拟合现象。

随机森林;通信干扰效果;客观评价

0 引言

多年来,通信干扰效果的评估延用以人为主体的主观评价方式,利用主观感觉的清晰度或可懂度为主要指标给听到的语音打分[1],从而评价语音通信受干扰的程度,形成的军用标准或行业标准包括GJB2763-1996《通信设备话音质量等级标准与评测方法》、SJ 2077l-2000《军用通信系统音质的MOS评价法》和DJBZ2006-9l《电话通信设备话音质量主观测试方法》等。

随着语音信号数字处理技术的发展,以模拟人听觉或发音的数学模型应用于语音通信干扰效果的评价,常用模型有MFCC、LPCC和小波变换等,这些数学模型是否适用取决于其与主观听觉一致的程度[2]。实验表明,每种模型仅对在特定条件下录取的干扰语音表现出优越的性能,特定条件包括通信距离、干扰距离、干扰样式和工作频率等。希望找到提高语音通信干扰效果客观评价顽健性的方法,扩大其适用范围,增强其实用价值。本文首先对在语音通信干扰效果客观评价中性能较好的客观测度模型进行优化,然后通过随机森林将多种客观测度进行融合,建立RF回归模型这一新的评价系统,使得在低信噪比情况下,改善单一模型性能不稳定并且一致性差的问题,提高客观评价的顽健性。

1 系统框架

RF回归模型评价系统框架如图1所示。整体流程如下:标准语音文件(发送端语音文件)和试验语音文件(接收端语音文件)首先进行主观测度标定;同时送入时间同步环节进行时间同步,同步之后的2个信号,用不同的客观测度模型进行客观测度估计,并采用随机森林将客观测度模型进行融合。

图1 RF回归模型评价系统框架

1.1低信噪比下的主观测度

这里采用平均主观误字率作为主观衡量接收端信号质量好坏的标准。其计算公式如下:

(1)

式中,Wij为第i个评测人对第j个文件的主观识别出正确的字数,Hj为第j个文件中包含的字数,而N为参与评测的人数,借鉴语音质量评估中MOS得分的计算要求,这里N的数值取为40。

1.2时间同步处理

由于传输系统的延时以及编解码算法的延时等,发送端的起始点和接收到的信号起始点并不相同,这里需要同步环节对收发两端的信号进行对齐[3]。构建本采集系统的硬件具有GPS模块,这里时间同步处理采用GPS对齐策略,将发送信号和接收信号打上时间戳,根据标定的时间戳进行对齐完成时间同步[4]。

2 客观测度模型

如图1所示,这里客观模型选取MFCC客观测度和LPCC客观测度和小波客观测度,3种方法。其中MFCC客观测度是从听觉角度考虑,LPCC客观测度是从语音产生模型角度考虑。如果把语音通信过程看作一个系统,那LPCC模型就是发送端(声道)的信号建模,而MFCC模型则是接收端(耳朵)的信号建模,另外的小波客观测度是考虑不同频带的统计特征。

2.1MFCC客观测度模型

MFCC特征目前仍然是语音信号处理的主流特征,无论是在语音识别系统还是说话人识别系统中,均有广泛的应用[4]。这里采用标准的MFCC提取流程,即信号经过预加重、分帧、傅里叶变换、Mel滤波器滤波、对数能量获取及DCT变换到倒谱域[2];在标准MFCC基础上,为使客观测度更适合低信噪比条件,在计算出的特征基础上作如下处理:

① 倒谱提升

(2)

② 倒谱均值减

倒谱均值减是最简单有效的去除信道噪声的一种方法,针对低信噪比情况下的语音通信,这里采用倒谱均值减,针对噪声频谱相对独立以及语音信号的随机性的特点,利用长时间内倒谱均值应该为零的特点,对倒谱特征进行补偿,旨在在一定程度上消除信道干扰对信号的影响[5]。具体实现如下:

(3)

式中,T为一个语音文件的帧数。

③ 动态特征

语音的动态特征体现的是特征动态变化特性,其随信号静态大小变化的部分可以忽略,因此在识别系统中加入动态特征可以在一定程度上提高系统识别性能。本文借鉴MFCC动态特征在语音识别中的成功应用,在这里直接刨除静态特征,只采用如下动态特征作为MFCC客观测度特征,其中动态特征计算如下[1]:

(4)

2.2LPCC客观测度模型

LPCC客观测度是利用全极点模型对声道进行建模,用声道的模型参数作为语音的特征[3]。这里类似于MFCC客观测度,在得到传统的12阶LPCC特征基础上,用倒谱提升、倒谱均值[1]减,以及在此基础上的动态特征作为最后的LPCC特征参数计算客观测度。

2.3小波客观测度模型

小波变换在多分辨分析方面具有传统傅里叶变换无法比拟的优点,这里采用DB4小波变换,对语音信号进行多尺度分析,在每一个子带上分别计算如下的统计特性,作为一帧语音信号的特征[6]:

子带能量:

(5)

质心:

(6)

带宽:

(7)

式中,j为子带索引,i为在相应子带中小波系数的索引,I为子带中小波系数的个数。

3 随机森林融合

随机森林最早由Leo Breiman和Adele Cutler提出,随机森林是一个决策树的集合[7]。通过对训练数据的随机采样,随机的构建一片森林,这片森林中的每棵树就是一个决策树。而每一棵决策树都是互相独立的。当森林构建完毕以后,则由每棵树都对进来的一个输入样本进行判断,分析它应该属于哪一类。最终所有的树进行表决,结合所有的结果来预测这个样本属于哪一类。随机森林以其对于实现未知数据的高度准确性而引起研究人员的关注[7]。它将弱分类向强分类转化的能力广泛应用于分类任务,并且在回归领域的表现也有很大的进步,特别是医学图像研究[8],如图2所示。但对客观测度融合中还很少出现,本文将其用于主客观拟合,并实现多客观测度融合[9]。

图2 随机森林里的训练和预测

3.1RF回归模型训练

随机森林训练是一个双随机的过程,即样本点选择是随机,并且样本参与训练的特征维也是一个随机过程。建立森林的过程是独立地建立每一个一颗树,而每一颗树的参数即是在每一个节点的分支选择[10]。每一个节点的训练过程如图2右图所示。数据流Sj经过节点j分成左右两个分支,其节点参数τj的选择依据是使得该节点的信息熵达到最大[11],即:

(8)

其中

(9)

H(S)=-∑c∈Cp(c)log2p(c),

(10)

式中,p(c)表示子集中任意样本属于回归值c的概率。

3.2RF回归模型预测

随机森林回归预测如图2左图所示。根据节点训练阶段得到的参数,依次从根节点开始,判断数据经过每一个中间节点的走向,即走向左分支还是右分支,如式(11)所示,一直到叶子节点为止,叶子节点对应的数值即为预测的主观测度。最后对每一棵树的预测值取平均,作为最后回归模型的预测值[11],如式(12)所示。

h(v,θj):RN×=τ→{0,1},

(11)

(12)

式中,T为随机森林中决策树的个数。

4 试验分析

4.1试验数据

本次试验的数据来源于实际超短波通信干扰系统试验。其中干扰类型为噪声调频,干扰强度按照主观误字率分成5个等级,即平均主观误字率低于30%、平均误字率在30%~50%之间、平均误字率在50%~70%之间,以及平均误字率在70%~90%之间和平均误字率大于90%等几个等级。

采集的数据每个级别包括至少10组数据,其中70%的数据组成训练集,其余30%作为测试集。

4.2试验结果分析

试验结果性能验证采用实际主观测度和预测主观测度之间的Pearson系数表示,其越接近于1,说明其预测性能越好。其中Pearson系数计算公式如下:

(13)

表1 训练集和测试集上各客观测度以及RF融合测度的性能

表1中,每一种单独的客观测度的Pearson系数是在最小二乘方法和主观测度拟合得到的结果。对比3种客观测度,可以看出小波统计特性的客观测度的性能优于MFCC客观测度和LPCC客观测度,这是由于在低信噪比条件下,统计特性的稳定性要优于单纯的特征表示。对比MFCC客观测度和LPCC客观测度,可以发现MFCC客观测度在训练集和测试集性能均优于LPCC客观测度。将3种客观测度进行随机森林融合,并对应主观测度进行回归分析可以发现,其性能最优,在训练集上其Pearson系数可以达到0.91以上,对应测试集,其性能也接近0.90。

进一步对比各种测度在训练集和测试集的性能可以发现,训练集的性能普遍优于测试集的性能。对比3种单独的客观测度在训练集和测试集的性能可以发现,其Pearson系数基本下降4%左右,而对于RF融合回归方法,其性能仅下降1%左右。这说明通过双随机训练得到的随机森林模型,其普适性较强,并且这种双随机选择训练数据的过程可以有效避免过拟合现象。

5 结束语

本文主要将随机森林用于语音通信干扰效果评价系统中。针对各种客观测度在不同干扰条件下的一致性差的问题,通过随机森林模型在完成回归预测的同时,对多种客观测度进行融合。在实际的超短波通信干扰系数数据的基础上,通过试验验证了随机森林在多客观测度融合回归的正确性和有效性。

[1]谭晓衡,许可,秦基伟.基于听觉感知特性的语音质量客观评价方法[J].西南交通大学学报,2013,48(4):756-760.

[2]江亮亮,杨付正,等.利用两级时域联合的包层语音质量评价模型[J].西安电子科技大学学报:自然科学版,2013,40(3):14-19.

[3]刘晓东.基于组合策略的随机森林方法研究[D].辽宁:大连理工大学,2007,38(4):23-28.

[4]Criminisi A,Shotton J.Decision Forests for Computer Vision and Medical Image Analysis[M].London:Springer London Ltd,2013:211-295.

[5]Breiman L.Random forests[J].Machine learning,2001,45(1):5-32.

[6]韩慧,王继祥.一种提高语音干扰效果评估准确度的方法[J].无线电工程,2011,41(3):17-19.

[7]陈兵,尹曼.基于DHMM的语音识别算法及DSP实现[J].无线电工程,2015,45(8):35-38.

[8]刘敏,郎荣玲,曹永斌.随机森林中数的数量[J].计算机工程与应用,2015,41(05):13-16.

[9]刑峰.基于小波变换的音频特征提取与分类研究[D].重庆:重庆邮电大学,2007,38(4):23-28.

[10]Bosch A,Zisserman A,Munoz X.Image Classification using Random Forests and Ferns[C]//IEEE International Conference on Computer Vision,Brazil,2007:4-9.

[11]史明泉.基于DSP的语音录放系统的设计[J].无线电工程,2011,41(12):53-55.

Application of Random Forest on Objective Evaluation of Communication Jamming Effect

ZHANG Lu-lin

(Unit 91404,PLA,Qinhuangdao Hebei 066001,China)

In the objective evaluation of communication jamming effect,the objective measures such as Mel frequency cepstrum coefficient and linear prediction cepstrum coefficient are used to express the interference degree for communications.But there is poor robustness of every measure,that is to say,one kind of objective measurement may fully lose effectiveness in one case while it is with good performance in other cases.In order to address this problem,this paper uses random forest to fuse multiple objective measures to form novel evaluation system and assess the performance of evaluation system based on the consistency with subjective evaluation.The novel evaluation system is demonstrated based on the data from real V/UHF interference system.The results show that this system has better performance compared with single objective measure,and can effectively avoid the over fitting by randomly selecting training samples and dimensions for one sample.

random forest;communication jamming effect;objective evaluation

10.3969/j.issn.1003-3114.2016.05.22

引用格式:张璐琳.随机森林在通信干扰效果客观评价中的应用[J].无线电通信技术,2016,42(5):88-91.

2016-06-16

张璐琳(1972—),女,高级工程师,主要研究方向:通信对抗。

TN978

A

1003-3114(2016)05-88-4

猜你喜欢
测度主观语音
三个数字集生成的自相似测度的乘积谱
R1上莫朗测度关于几何平均误差的最优Vornoi分划
“美好生活”从主观愿望到执政理念的历史性提升
非等熵Chaplygin气体测度值解存在性
Cookie-Cutter集上的Gibbs测度
加一点儿主观感受的调料
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……