语音端点检测算法在猪咳嗽检测中的应用研究

2016-04-04 08:21马辉栋刘振宇

马辉栋,刘振宇

(山西农业大学 信息科学与工程学院,山西 太谷 030801)



语音端点检测算法在猪咳嗽检测中的应用研究

马辉栋*,刘振宇

(山西农业大学 信息科学与工程学院,山西 太谷 030801)

摘要:针对大型养猪场疫病防治工作中人工诊断效率低下的问题,对猪患病时发出的咳嗽声音进行研究,提出了猪咳嗽声自动化检测方案。结合猪咳嗽声音信号的特点,借鉴语音识别中广泛应用的端点检测算法,并加以改进,实现对声音信号中猪咳嗽声音的检测。该方案为猪咳嗽类疾病的人工诊断和自动化诊断提供有效信号。经150段猪咳嗽音验证表明,该检测方案检出率达96%以上,检错率低于4%,说明方法具有有效性和实用性。

关键词:猪咳嗽音检测; 端点检测; 短时能量; 短时过零率

随着数字时代的到来,畜牧数字化成为人们的研究热点。疫病防治是畜牧养殖的重要组成部分,咳嗽声是动物疫病的重要信号。动物咳嗽是一种非常复杂的生理表现,以猪为例,引起猪咳嗽的原因可能是流行性感冒、肺疫、萎缩性鼻炎、喘气病、肺丝虫病、野兔热、链球菌病等等[1],每一种病因都对应不同的临床表现,所发出的咳嗽声音也是千差万别。单纯依靠机器自动化准确识别病因,开发难度非常大[2,3]。目前,国内外主要依靠人工观察的方法完成家畜疾病诊断工作。动物咳嗽声音是不连续的,且不易捕捉,单纯依靠人工观察效率极低。针对该问题,本文对猪咳嗽声音信号进行分析,将语音端点检测技术[4~6]加以改进,运用于猪咳嗽声音的检测中。试验发现,该方案能精准确定猪咳嗽声音信号的起始点和终止点,为人工诊断和机器自动化诊断提供有效信号,对于畜牧养殖中的呼吸道、肺部等疾病的预警防治具有实用价值。

1猪咳嗽声音信号特点分析

猪咳嗽声音诊断的要点在于咳嗽的性质、强度、频率以及时间。根据语音检测方法,将猪咳嗽声语音信号分为无声、清音和浊音[7,8],如图1所示。无声部分指无咳嗽音信号,反映在波形图上显示为背景噪声,能量最低,且在整个频谱范围内分布。浊音是指声带振动发出的声音,对应于猪咳嗽时声门瞬间张开所爆发的咳嗽音,表现在波形图上为能量升高瞬间达到极大值。清音指空气在口腔中摩擦或碰撞而引发的声音信号,该部分对应猪咳嗽时声门持续张开产生的声音,在波形图上具有的能量处于无声和浊音之间,且随着声门的闭合,声音信号能量逐渐降低。

本文从150段猪咳嗽录音样本中选取4个样本(样本信息如表1所示)进行分析,说明语音端点检测算法的应用。该声音样本均采集于山西农业大学牧站猪养殖实验基地,录音设备为索尼ICD-FX88录音笔。

图2所示为猪咳嗽声音时域波形图,由图可知,猪咳嗽音一般持续时间为0.5 s左右,每个咳嗽音都由响度较高的浊音部分和相对平稳的清音部分组成。图3所示为频域波形图,由图可见,猪咳嗽声音的频域范围为300~8 000 Hz,相较于人咳嗽音频域范围350~4 000 Hz[9],猪咳嗽音频率较高。

2信号去噪处理

对带噪声的猪咳嗽原始信号进行去噪处理,提取出相对干净的猪咳嗽声信号是检测猪是否发生咳嗽的重要前提,根据大量猪咳嗽声音样本的频谱分析结果,本文采用频率范围为300~8 000 Hz的150阶FIR滤波器带通滤波,对原信号进行去噪处理。如图4所示为样本(a)滤波前、后功率谱密度对比。通过滤波,有效地去除了猪咳嗽声音频带外的噪声。

3特征参量提取

语音端点检测是指确定信号中语音信号的起始点和终止点,运用到猪咳嗽声音的检测中就是将信号中的咳嗽音提取出来[5]。由图1对猪咳嗽音的特征分析可知:无声部分,信号能量最小;清音部分,信号能量较小,但是语音幅度穿过零电平的次数最多;浊音部分信号能量最高。由此,联合采用短时能量和短时过零率作为猪咳嗽声音检测的特征参量。

3.1分帧

短时能量和短时过零率都是建立在信号短时平稳的基础上的,即在一定时间Δt范围内,信号特征值是稳定的状态。Δt时间内所包含的数据称为“帧”;为了使帧平滑过度,相邻帧之间数据一般有一部分是交叠的,交叠部分称为“帧移”。

本文所用信号采样频率为44 100 Hz,Δt为5.8 ms,帧移为1/4,即每帧包含256个数据,相邻帧交叠64个数据。

3.2短时能量

短时能量即1帧采集到的声音信号内具有的能量大小。设第n帧声音信号的短时能量用En表示,则:

(1)

式中,N为声音信号的帧数据个数,xn(m)为信号归一化幅度。

3.3短时过零率

短时过零率是指在单帧声音信号中,信号波形越过零电平位置的次数。设第n帧声音信号的短时过零率为Zcrn,则:

(2)

式中,N为声音信号的帧数据个数,xn(m)为信号归一化幅值,sgn[]是符号函数,如式(3)所示。

(3)

研究发现猪咳嗽信号无声部分,信号幅值小,越过零电频的次数极高,从而导致无声部分对咳嗽信号的干扰。为了减少这种干扰,本文对短时过零率的计算方法做简单调整,规定相邻数据的差值门限T,如式(4)所示。即信号中相邻数据需满足两个条件:一是差值须越过差值门限T,本文中差值门限T取0.01;二是分布于零电频两侧。

(4)

4双门限检测

本文采用短时能量和短时过零率双门限检测猪咳嗽信号。首先断定猪咳嗽声语音是有声信号还是无声信号,若判断为有声信号,继续判断是否是清音信号、浊音信号,从而有效地完成猪咳嗽声的端点检测。

短时能量的高低两个阈值,分别设为E_lager和E_smaller,短时过零率的高低阈值设为Zcr_lager和Zcr_smaller。根据短时能量E(n)、短时过零率Zcr(n)与对应阈值条件比较,判断该帧信号处于静音、疑似咳嗽、咳嗽三种状态中的哪种。具体实现过程如图5所示。

经实验,本方法阈值设置为:

短时能量阈值:

E_lager=2;E_smaller=1

(5)

短时过零率阈值:

Zcr_lager=5;Zcr_smaller=2

(6)

为了准确地找到咳嗽声音的起始点和终止点,对多帧信号状态进行判断。将帧状态之间的跳转分为A和a两类(如图6所示)。连续发生a类跳转,则发生“咳嗽”;连续发生A类跳转,则是向“静音”状态转变。检测过程如下:

起始帧判断:处于“静音”或“疑似咳嗽”状态的第i帧信号,直到跳转到“咳嗽状态”,数据帧之间发生a类跳转的次数多于15,发生连续A类跳转的次数少于6,则i为咳嗽起始帧。终止帧判断:第j帧信号,位于咳嗽起始帧i之后,且该帧信号之后连续发生6次以上A类跳转,则j为咳嗽终止帧。

5猪咳嗽声检测结果

图2中4个猪咳嗽信号样本,采用双门限算法的检测结果如图7所示。虚线为咳嗽起始点,其后的实线为咳嗽终止点。

本文将语音端点检测法用于猪咳嗽声音的检测中,根据猪咳嗽声音的特点对去噪滤波器带宽范围、短时能量及短时过零率阈值条件等加以调整。经150段猪咳嗽录音检测验证表明,该方法的检出率达96%以上,检错率低于4%,说明方法有效、实用。

参考文献

[1]卢建涛.引起猪咳嗽的几种传染病的诊断[J].养殖技术顾问,2014(12):125-125.

[2]Barry S J, Dane A D, Morice A H, et al. The automatic recognition and counting of cough[J]. Cough, 2006, 2(1): 1-9.

[3]刘振宇,赫晓燕,桑静,等.基于隐马尔可夫模型的猪咳嗽声音识别的研究[C]//中国畜牧兽医学会信息技术分会.中国畜牧兽医学会信息技术分会第十届学术研讨会论文集.中国畜牧兽医学会信息技术分会,2015:6

[4]路青起, 白燕燕. 基于双门限两级判决的语音端点检测方法[J].电子科技, 2012, 25(1): 13-15.

[5]罗雅琴, 吴小培, 吕钊, 等. 滑动窗累积量的递推估计算法及其在语音端点检测中的应用[J].声学学报, 2015, 40(5): 730-738.

[6]薛胜尧. 基于改进型双门限语音端点检测算法的研究[J].电子设计工程, 2015(4): 78-81.

[7]张仁志, 崔慧娟. 基于短时能量的语音端点检测算法研究[J].电声技术, 2005(7): 52-54.

[8]李宁. 咳嗽音识别方法的应用研究[D]. 重庆:重庆大学, 2010.

[9]石锐, 李宁, 何庆华. 咳嗽识别中的端点检测方法[J]. 重庆理工大学学报(自然科学版), 2010 (8): 43-48.

(编辑:李晓斌)

Application of end point detection in pig cough signal detection

Ma Huidong*, Liu Zhenyu

(CollegeofInformationScienceandEngineering,ShanxiAgriculturalUniversity,Taigu030801,China)Abstract:Aiming at the low efficiency artificial diagnosis in large pig farms, we had a study on the pig cough sound signal and proposed an automation detection scheme of the pig cough sound. Considering the characteristics of the pig cough sound signal, we made some improvements of the endpoint detection algorithm which is widely used in speech recognition, and applied it in the pig cough sound signal detection. The scheme provides the effective signal for the artificial and automated diagnosis of the pig cough related diseases. We verified the scheme in 150 pig cough recordings, the detection correct rate was above 96%. The error detection rate was lower than 4%, so the detection scheme is effective and practical.

Key words:Pig cough sound detection; End point detection; Short-term energy; Short-term zero crossing rate

收稿日期:2016-02-28 修回日期:2016-03-16

作者简介:马辉栋(1986-),女(汉),山西大同人,助教,硕士,研究方向:农业物联网

基金项目:国家高技术研究发展计划(863计划)(2013AA102306)、山西农业大学科技创新基金(20142-17)

中图分类号:TN912.34; S858.28

文献标识码:A

文章编号:1671-8151(2016)06-0445-05