母羊发情声音数字化识别模型的建立

2019-12-26 05:01黄福任徐洪东黄娇娇潘庆杰董焕声
中国畜牧杂志 2019年12期
关键词:特征参数频域发情

黄福任,贾 博,徐洪东,李 桢,黄娇娇,潘庆杰*,董焕声*

(1.青岛农业大学动物科技学院,山东青岛 266109;2.平度市东阁动物卫生与产品质量监督站,山东青岛 266700)

羊是重要的农业经济动物,在人们生活和农业生产中具有举足轻重的地位。由于大部分的羊属于季节性发情,繁殖效率不高,致使羊肉供应不足。因此如何提高羊的养殖效率、繁殖性能以及实现福利化养殖成为研究热点。羊的传统发情鉴定方法通常为外部观察、阴道检查和试情[1],均需人工操作,在集约化养殖过程中受到人力、物力、财力等成本限制,进行大规模迅速排查的难度较大。利用高效的智能检测手段代替繁琐的人工操作,是现代互联网技术与畜牧产业结合的重要发展方向之一,而“互联网+”思维对现代化羊产业体系的发展起到了促进作用,带动羊产业体系中智能化程度的深化与改革,进而推动着整个畜牧业迅速发展。从声音识别的角度分析,可以利用数字化语言和声音来反映动物状态的变化。动物声音作为辨别动物行为的主要信息,通过声音表达情绪和状态,与同种群内的其他个体进行声音交流。相对于传统的发情检测方法来说,通过声音检测程序可以极大地提高羊发情鉴定工作的效率,对发情时机的把握更加准确,效率更高、刺激更小。本试验通过Matlab 编写程序,构建模型,利用计算机技术识别母羊发情的叫声,旨在提高母羊发情鉴别的效率。

1 材料与方法

1.1 试验原理 通过Matlab 软件对母羊发情信号的特征参数提取并进行分析,同时利用羔羊寻母、饥饿和饲料刺激的声音进行对照,构造母羊发情识别系统[2]。最大程度保证试验母羊的叫声信号和所要鉴别的行为保持一致。训练样本和识别样本都需要进行频谱分析。通过声音预处理、声音分析、提取特征参数,训练样本提取特征参数进行模型训练,训练好的模型可以通过特征参数的分析对识别样本一一对应[3],从而得出识别结果。识别原理见图1。

图1 识别原理图

1.2 羊声音收集 试验在山东省青岛市崂山奶山羊保育基地进行现场录制。为了模拟现场环境,对40 只经产崂山奶山羊母羊进行自然录制,包含训练样本和识别样本。录取母羊发情、母羊饥饿、母羊受饲料刺激[4]和羔羊寻母[5]的叫声。

1.3 羊声音处理方式

1.3.1 羊声音信号切割处理 将连续的声音样本切割为单独的声音,删掉无用的成分。每个状态随机采用32段单独的音频信号,共计128 段声音进行模型训练。

1.3.2 羊声音预处理 通过3 个步骤对羊声音进行预处理。第1 步为声音去噪:先将其他信噪比[7]的高斯噪音混入,模拟含噪音的羊叫声音的信号,利用小波阈值[6]的方法对声音进行去噪处理,避免识别和分析精度不足。第2 步为端点检测分析:利用双门限端点检测法[8],根据声音信号的过零率和能量确定有效声音在一整段声音内的位置,将每一帧的羊声音信号进行短时平均过零率。标记一段声音的起始点和终止点,提升分析的效率和准确性。第3 步为加窗分帧:通常会利用分帧加窗的方法切取频谱特征相对较平稳的声音段。通过窗函数把声音信号切分,以“帧”为单位。本试验用到的窗函数为汉明窗[9]。

1.3.3 羊声音分析 羊声音信号的时域和频域分析:通过时域和频率[10]的分析对比4 种声音的差异。时域分析是一段时间内声音幅度和时间的变化关系,即以时间为横坐标、幅度为纵坐标的曲线图;频域分析是幅度和频率的变化关系,即以频率为横坐标、幅度为纵坐标。将时域通过傅里叶变换可以得出频域图。

羊声音信号能量对比:声音信号能量[11]取决于录音笔的采样频率。本试验所用录音笔的采样频率为48 000 Hz,也就是每一秒由48 000 个采样点数组成。在同等距离和音高的情况下,可以进行能量分析,由程序计算出4种状态下能量值。

1.3.4 羊声音特征参数提取 特征参数的提取作为声音识别最基本的一个步骤,会直接影响最终结果的精准度[12]。本试验提取频域的特征参数为线性预测倒谱系数(LPCC)和梅尔频率倒谱系数(MFCC)[13],2 种方式都可以针对人耳的听觉特点进行提取,与隐马尔可夫模型[14](HMM)、支持向量机[15](SVM)和迭代算法[16](Adaboost)3 种声音模型结合达到识别状态的目的。无论是训练样本还是识别样本,都需要提取特征参数,训练样本需要提取特征参数进行模型训练,训练好的模型可以通过特征参数的分析对识别样本一一对应,从而得出识别结果。

1.4 羊声音识别模型 HMM 为语音识别领域应用最为广泛的模型。先对HMM 模型初始化处理,将随机从羊声音样本中提取出的特征参数作为观测序列,利用双向计算算出训练得到的HMM 模型。将待识别的羊声音信号输入训练好的模型中,确定检测序列是否与模型参数对应,最后识别并输出结果。

SVM 通常用来对模型进行识别、分类和回归分析。区别于其他的模型,SVM 的优势是在样本较少、非线性分类识别的领域中可以较为准确地进行模式识别。

传统的Adaboost 能够应对简单的二分类算法识别,对若干个弱分类器进行训练,不断纠正识别的错误率,通过训练样本的权重调整训练结果,最终会将每一个弱分类器集合成为一个强分类器,然后进行二分类运算。

1.5 羊声音模型优选识别 为了达到最优结果,将模型融合识别,能够更加有效地提高识别的准确率,将最可靠的识别结果输出定为优选的标准,3 种模型的优选过程见图2。

图2 3 种识别模型优选示意图

将3 种识别模型设为m1、m2、m3,最终识别的结果为r1、r2、r3。如若r1=r2=r3 时,结果被认定为r。若r1、r2、r3 各自识别的结果不统一,需算出双模型识别的可靠性R,然后对比3 个模型可靠性R1、R2、R3的大小,最终选择可靠性大的那个模型作为最终混合识别的结果进行输出。

2 结果

2.1 羊声音去噪效果 为观测和计算去噪效果,插入一定信噪比噪声,噪声相对于信号一样大,信号会被淹没。为了算出去噪效果,引入相对均方根误差(RRMSE)的概念,计算各种噪音环境下去噪的效果[10]。当RRMSE 计算所得值越趋向于0,误差越小,得到的去噪的声音越优质。将分别为-20、-10、0、10、20 dB的信噪比插入一段羊发情的信号做小波阈值的去噪,RRMSE 值分别为0.896 8、0.275 0、0.102 6、0.058 5、0.029 9(图3)。

图3 在不同信噪比下去噪后的RRMSE

2.2 羊声音端点检测效果 图谱(图4)中左边的竖线表示声音的起始点,图谱右边的竖线表示声音的终止点。因此,在2 条竖线中间的信号部分为此段声音中母羊发情的叫声,而前后竖线外的声音为无效的声音,将待识别的有效声音剪切出来。

图4 羊声音端点检测效果图

2.3 羊声音信号的时域和频域分析结果 通过羊4 种状态的声音信号频域分析发现,母羊发情和羔羊寻母信号具有显著差异,但饲料刺激与饥饿刺激差异很小,在录制过程中,也存在2 种声音无法有效分开的情况,所以在分析时,将饲料刺激和饥饿一并分析。从分析结果中可以看出,母羊发情声音信号与其他2 种声音的时域和频域各数值均有显著差异,可用于声音的识别(图5、图6)。

图5 羊不同状态下声音的持续时间对比

图6 羊不同状态下声音的频率对比

2.4 羊声音信号能量对比结果 在同等距离和音高的情况下由程序进行能量分析,发情叫声的能量显著高于羔羊寻母的声音能量,极显著高于饲料刺激、饥饿刺激的声音能量(图7)。

图7 羊不同状态下声音的能量值对比

2.5 羊声音识别的单模型试验结果及优选结果 选取录制的4 种声音信号各120 段进行识别,并通过程序分析统计出准确率。由表1 可见,相较于SVM、Adaboost模型,HMM 模型的准确率更高,母羊发情声音识别的准确率达到了93.34%。在3 模型优选结果中,母羊发情叫声的识别相较于其他声音的准确率更高,达到了96.67%。

表1 母羊发情、羔羊寻母、饲料刺激和饥饿单模型识别精度

3 讨论

本试验利用3 种声音识别模型分析4 种状态下的声音信号,并通过程序对羊叫声进行信号分析和自动识别发情叫声,并优选出结果。编写的程序具备声音识别的可行性,在实验室中测试能够统计出识别效果的准确率,但在声音收集过程中,饲养环境、人为鉴别经验等因素导致误差无法避免,在一定程度上会影响结果的准确率。在录制时声音信号中包含现场产生的不同程度噪音。在声音去噪时能够达到针对不同的干扰源智能选择声音去噪的效果,在声音信号处于叠加状态时能够进行有效分离,在饥饿和饲料刺激的声音收集和分析时寻找区分2 种状态差异的有效方式,仍是需要深入研究和探讨的重点。

本试验主要针对崂山奶山羊进行声音收集,若在扩大识别范围的同时增强声音识别的针对性,提高程序的功能性,还需要利用更多品种的山羊进行程序训练和测试。Matlab 编写好的程序要跨平台运行需要非常苛刻的运行环境,为了便于精准把控发情监测时机,将本试验中编写好的程序完全移植进入更加便携的移动端进行现场检测分析,在程序的操作运行方面还有待改进。

4 结论

从动物行为学的角度分析,可以通过叫声分辨出羊的多种状态。4 种状态下,饥饿和饲料刺激产生的声音未有效分开,发情叫声最显著,释放的信号更大。

在3 种单模型中,HMM 识别效果最稳定,母羊发情的识别准确率最高达到93.34%。Adaboost 在识别样本数较少的模型中效率高,但模型增多会导致识别效率降低等。将3 种模型进行结果优选,母羊发情的识别准确率达到96.67%,在实验室环境下,能够达到预期识别效果。

猜你喜欢
特征参数频域发情
基于视频图像序列的船用雷达目标检测和目标特征参数提取
基于频域的声信号计权改进算法
奶牛产后首次发情行为变化规律及影响因素分析
冕洞特征参数与地磁暴强度及发生时间统计
融合LPCC和MFCC的支持向量机OSAHS鼾声识别
影响氯前列稀醇效果的因素分析
母猪不发情怎么办
基于交通特征参数预测的高速公路新型车检器布设方案研究
频域稀疏毫米波人体安检成像处理和快速成像稀疏阵列设计
网络控制系统有限频域故障检测和容错控制