畜禽声音监测技术研究进展

2024-01-27 17:16卫洁茹朱立学张世昂陈品岚
现代农业装备 2023年6期
关键词:畜禽分类特征

卫洁茹,朱立学,张世昂,陈品岚

(1.仲恺农业工程学院机电工程学院,广东 广州 510225;2.仲恺农业工程学院自动化学院,广东 广州 510225)

0 引言

随着社会经济的提升,人们对肉类食品的需求越来越多,畜禽养殖业逐渐趋向规模化发展,但是畜禽养殖产业发展面临生产效率不高、生产方式落后、产业竞争力不强等问题,与实现高质量发展要求还存在一定差距[1]。国家“十四五”规划指出,要强化质量导向,保障肉蛋奶等重要农产品供给安全,深化农业结构调整,大力发展现代畜牧业,因此,推进畜禽养殖业智能化发展已经成为主流趋势。在畜牧养殖业中,畜禽的行为信息与其生理健康和福利状况密切相关,利用人工观测的方法监测畜禽信息,不但耗费大量的时间和精力,且监测结果受一定主观性影响,还会对动物造成应激反应或者损伤动物身体[2-3]。发声是动物之间沟通信息的主要方式,如何实时监测畜禽信息是制约养殖业智能化发展的一个重点难题。在畜禽信息监测过程中,畜禽的声音信号包含了其内部机体状况和需求的信息反馈,并且畜禽在疾病、饥饿、情绪变化以及受到外部条件影响的状态下都会发出不同的声音信号,通过分析这些声音信号的变化,可以更为精准地获取畜禽信息,以便于研究畜禽的生理、健康、福利状况[4]。

1 畜禽声音信号处理流程

畜禽声音监测技术是一种通过采集畜禽的声音信号,利用计算机技术对声音信号进行分析、处理和识别,实现畜禽健康、生长状态和行为等信息的获取和监测的技术。该技术可以应用于畜禽养殖、动物疾病监测、饲料管理、畜禽行为分析等领域,具有非常广泛的应用前景。众多新兴的方法和技术被应用于畜禽声音监测技术,如深度学习、机器学习等。这些方法可以从大量的声音数据中提取出更为复杂和高级的特征,从而实现更为精准的畜禽行为和健康状态分类识别。通过声音信号监测畜禽信息主要分为以下几步:声音信号采集、预处理、特征提取、分类识别。

1.1 畜禽声音信号的采集与预处理

对于来自嘈杂环境的声音信号进行识别是一项艰巨的任务。声源与麦克风的距离远近不同,规模化养殖场中不同的噪声会干扰畜禽声音的提取,因此,为了提高信号的质量和可靠性,为后续的处理和分析提供准确的输入,在进行声音识别前要将采集到的声音信号进行预处理,其中,对声音信号的去噪处理是尤为重要的一环。赵晓洋[3]使用麦克风与录音笔分别采集了奶牛叫声、仔猪咳嗽声、肉鸡叫声,通过声音编辑软件对采集到的声音信号进行扩音、剪切、滤波等环节的信号预处理,以wav.格式的文件形式进行存储,并在Matlab 中进行预加重、分帧加窗、端点检测等后续处理,可以有效区分畜禽声、风声、门的开关声以及脚步声等背景噪音。杜晓冬等[5]以海兰褐蛋鸡声音信号与风机噪声为研究对象,通过对比IIR 滤波器去噪、小波阈值去噪和谱减法去噪3 种去噪方法在处理蛋鸡声音信号中风机噪声的效果后,得出一种基于改进谱减法的去噪方法,在减少算法耗时以及实际应用中去噪效果较好。闫丽等[6]以小梅山母猪哺乳呼噜声以及其它噪声作为研究目标,采用噪声能量频域分布均匀的方法,利用其具有信息熵值最高这一性质,按噪声的种类,选取不同的小波包层数,并与信息熵计算相结合,去除了环境噪声的混叠影响。常见的声音信号预处理方法包括预加重、去噪、分帧加窗、端点检测等,主要去噪方法包括滤波器去噪、谱减法去噪、小波去噪,目前针对实际情况选择和改进去噪方法,可以得到更好的处理效果。

1.2 畜禽声音信号的特征提取

畜禽声音信号特征提取的选择和设计取决于研究的具体目的和需要,需要结合具体场景和试验数据来选择和优化特征提取方法。目前畜禽声音信号特征提取主要从时域分析和频域分析2 方面出发。时域分析是指对声音信号的振幅、波形、峰值、时域特征、过零率、短时能量等指标进行分析。声音信号的特征提取本质是将声音信号转化为数学特征的过程,以便进行进一步分析和处理。傅里叶变换是数字信号处理中的基本操作。快速傅里叶变换虽然提高了运算速度,但也对参与运算的样本序列有一定限制,即要求样本数为2^N 点,离散傅里叶变换则无上述限制,两者在运算准确度方面相同[7]。FONTANA 等[8-9]对大量离散的肉鸡声音片段进行统计比较,并使用快速傅立叶变换进行频率分析。曹晏飞等[10]在筛选出的蛋鸡声音片段中,使用离散傅里叶变换计算出各个声音片段的功率谱密度进行声音信号的特征提取。频域分析是指对声音信号的频率、谐波、功率谱密度、共振峰、谱带宽频域特征等进行分析。BRIGHT[11]采集了商业自由放养蛋鸡中存在羽毛啄食问题和不存在羽毛啄食问题鸡群的声音,使用软件创建和分析音频频谱图,得出二者之间的发声率差异,为预警鸡群的羽毛啄食问题提供参考。GUARINO 等[12]使用滤波器组方法结合振幅解调提取猪咳嗽声音信号特征,其中对猪咳嗽音的分类正确率达85.5%,对其他音的分类正确率达86.6%。韩国学者SEONG CHAN YEON 等[13]为了分析韩国本土牛的声学特征分别采集了母牛发情和饲料预期状态下的声音,使用采集声音信号的持续时间、强度、音高、第一、第二、第三和第四共振峰变量,通过判别函数分析,在2 个不同的条件组之间得到了良好的分类结果。意大利学者FERRARI 等[14]通过对犊牛的声音记录、标记和分析程序,获得特定的声学特征(振幅、基频和持续时间),与养殖中常见的金属噪音比较分析表明,咳嗽音与金属噪音的振幅、基频和持续时间长度有显著性差异。

适用于人耳听觉系统开发的梅尔频率倒谱系数(Mel-Frequency Cepstrum,MFCC)是基于声音频率的非线性梅尔刻度(Mel Scale)的对数能量频谱的线性变换。近年来逐渐在畜禽声音信号分析方面展开应用。涂鼎[15]通过分析生猪叫声的功率谱密度(PSD)、梅尔频率倒谱系数及其一阶差分系数(MFCC+△MFCC)和语谱图特征,发现生猪咳嗽声与大部分非咳嗽声的PSD 特征参数在一定的频率范围内差异明显。李志忠等[16]在对线性预测倒谱参数(LPCC)和MFCC 进行分析的基础上,结合确定对象,提出一种改进平均梅尔频率倒谱系数法(AMFCC),并且根据3 种不同特征提取算法,利用支持向量机分类模型验证了正确识别效率,结果表明,改进AMFCC 方法在正确识别效率上得到了明显提升。韩鹏飞等[17]将基于Fisher 准则的MFCC 和翻转梅尔倒谱系数(IMFCC)的特征融合后得到新的特征参数MFCC-IMFCC,通过试验证明,在同一条件下,MFCC-IMFCC 与MFCC 相比,识别率有一定的提高。龚永杰等[18]采用改进的MFCC,即标准MFCC 与差分MFCC 组成24 维改进的MFCC,并利用矢量量化(VQ)构建猪咳嗽识别系统,实验得出的综合识别率达到90%。小波分析是指利用小波变换对声音信号进行分解和重构,可以提高畜禽声音信号的分辨率,从而更好地分析和识别畜禽的行为和健康状况。MAHDAVIAN 等[19]使用MFCC 和小波分析2 种方法分析了5 种禽类的声学特征,得出小波分析在检测禽类健康方面准确率较高,而MFCC更适用于检测禽类的情绪状态声音信号。

在对畜禽声音信号的特征处理上,常见方法有基于声音信号时域、频域的特征分析,如波形、振幅、谐波、功率谱密度、共振峰变量、梅尔倒谱系数等。其中将适用于人类声音的MFCC 改进应用于畜禽声音信号的特征提取,不仅可以提高畜禽声音监测技术的准确性和鲁棒性,还可以促进畜禽声音监测技术的发展。

1.3 畜禽声音信号的分类识别

畜禽声音信号的分类识别是根据其声音特征分为不同类别的过程,也是畜禽声音监测中比较重要的一步。常用的畜禽声音信号识别方法有机器学习方法,如隐马尔科夫模型(Hidden Markov Model,HMM)、支持向量机(Support Vector Machine,SVM)、决策树(DT)等,也可以使用深度学习方法,如卷积神经网络(CNN)、循环神经网络(RNN)、长短时记忆网络(LSTM)等。这些方法需要通过大量的数据训练模型,并进行模型优化和调整,以提高识别准确率和稳定性。XIAOSHUAI WANG 等[20]为确定动物声音与它们生活环境的空气质量之间的关系,对84 只断奶猪的咳嗽声进行采集分析,功率谱密度表明,不同空气质量下断奶猪的咳嗽声有显著差异。利用梅尔频率倒谱系数(MFCC)、主成分分析(PCA)和支持向量机(SVM)对不同猪舍采集的声音样本进行识别,平均识别率为95%。MILONE等[21]使用隐马尔可夫模型开发了一个采食声识别系统,能够实现采食声的自动分割和分类,使用复合模型对隐马尔可夫模型进行优化以获得更佳性能。赵建等[22]利用基于小波阈值多窗谱的维纳算法对采集的连续猪声音去噪,并从去噪后的连续猪声音中获得了试验语料。使用机器学习中的K-Fold 交叉验证法将传统高斯混合模型-隐马尔可夫模型(GMMHMM)与深度神经网络-隐马尔科夫模型(DNNHMM)进行对比,试验结果表明,DNN-HMM 中每组的错误率均低于GMM-HMM,且平均错误率降低了3.45%,基于DNN-HMM 声学模型的连续猪咳嗽声识别方法稳定可靠。秦伏亮等[23]将GMM-HMM 引入肉鸡声音识别研究,并通过试验合理降低其计算复杂度,提出一种高效、精准的肉鸡咳嗽声识别算法。韩磊磊等[24]针对生猪的打斗声、咳嗽声、喷嚏声、饥饿声和呛水声这5 种异常声音建立采集识别系统,对每种声音信号提取改进梅尔频率倒谱系数(MFCC_P)、短时能量(E)和短时过零率(ZCR)组成的复合特征参数,然后使用决策树-支持向量机(DT-SVM)的方法对每帧数据进行识别,试验结果表明:复合特征参数识别结果优于传统MFCC,平均识别率可以达到94.4%,满足对生猪异常声音的识别要求。支持向量数据描述(Support Vector Data Description,SVDD)是一种单值分类算法,能够实现目标样本和非目标样本的区分,通常应用于异常检测和故障检测等领域[25]。后期韩磊磊[26]对使用支持向量机模型构造合适的多分类器,结合SVDD 模型的单分类检测能力得到一种SVDD 和SVM 检测识别模型,该模型可以对猪舍内的生猪异常声音进行检测与识别。沈明霞等[27]采集梅山猪咳嗽声、鸣叫声以及喷嚏声,通过传统谱减法进行去噪,利用双门限端点检测法得到有效声音信号后分别提取logFBank 和MFCC 特征,使用卷积神经网络(CNN)和深层前馈序列记忆神经网络(DFSMN)2 种深度学习模型进行识别,结果显示以MFCC 为特征的CNN 咳嗽声识别模型准确率最高,咳嗽声总体识别准确率为 96.71%。黎煊等[28]提出了一种基于双向长短时记忆网络-连接时序(BLSTM-CTC)的分类模型,用于在养殖场中识别连续的猪咳嗽音,使用K-Fold 交叉验证法进行试验验证,总识别率达到93.77%。宗超等[29]采集了笼养和栖架饲养模式下产蛋期和育成期的蛋鸡声音,通过声音预处理、特征提取和决策树分类器识别出了产蛋叫声、鸣唱声、鸣叫声和争斗尖叫声这4 类典型蛋鸡声音,并分析了不同时期的蛋鸡声音差异。

通过提取的畜禽声音信号特征来进行畜禽声音信号的分类识别,早期的分类算法如隐马尔可夫模型、决策树、支持向量机等应用较为成熟。随着深度学习的不断发展,卷积神经网络、循环神经网络、长短时记忆网络也逐渐应用在畜禽声音信号识别中,有效地提高了识别准确率以及效率。

2 患病畜禽声音监测

许多畜禽疾病会导致其鸣叫或者行为声音发生变化,这些变化可能是频率、振幅、持续时间等方面的变化,通过声音监测感知这种变化可以大致判断畜禽病情,使其在早期接受治疗,减少抗生素等药物的使用从而降低抗生素耐药性。例如对畜禽咳嗽声音的检测可以对呼吸道相关的疾病进行初期诊断。FERRARI 等[30]对猪叫声的声学特征进行了研究,发现健康猪的均方根(RMS)、峰值频率(Hz)和咳嗽间隔与病猪有显著差异,说明声学参数会随着猪的健康状况而改变。MITCHELL 等[31]在对猪咳嗽声能量包络的动力学研究中发现,通过雾化柠檬酸产生的诱导咳嗽声与病理性猪咳嗽声之间的短期能量包络的动态变化存在显著差异,表明可以利用猪声音能量的信息特征来反映猪的呼吸健康状况。CHUNG Y 等[32]采集了猪的咳嗽、尖叫、打喷嚏、咕噜声等声音,提取梅尔频率倒谱系数,并采用两级结构支持向量数据描述(SVDD)和稀疏表示分类器(SRC)分别作为早期异常检测器和呼吸系统疾病分类器。试验结果表明,基于94%的检测准确率和91%的分类准确率可以准确地检测猪消瘦病。SONG HANG 等[33]建立了SE-Densenet-121 识别模型,对猪咳嗽音进行识别,具体方法是对13 维MFCC、△MFCC 和△2MFCC 进行横向拼接,得到能反映猪声音信号静态特性、动态特性和混合特性的6组参数,并利用DenseNet-121 识别模型对这6 组参数的性能进行比较,得到最优参数集,利用SENets注意力模块对DenseNet-121 识别模型进行改进,增强识别模型从猪叫声信号中提取有效特征的能力。结果表明最优参数集为26 维MFCC+△MFCC,SEDenseNet-121 猪咳嗽声识别模型的识别正确率为93.8%。VANDERMEULEN 等[34]为开发一种自动化的犊牛咳嗽监测仪,用麦克风连续记录了62 头犊牛的咳嗽声,使用30 ms 的Hamming 窗对声音进行分帧,并结合快速傅里叶变换进行特征计算,采用了一种通过减去平均窗口的降噪方法来区分犊牛咳嗽声和其他声音,同时计算频谱图并分析持续时间以及峰值等特征,实验发现在每一个检测到的咳嗽频率增加的时期,出现呼吸道疾病的犊牛数量都有类似的增加,而咳嗽频率增加的时期总是在犊牛接受治疗之前观察到。因此,犊牛咳嗽监测仪具有识别早发性呼吸道疾病的功能。EXADAKTYLOS 等[35]提出了一种实时识别病猪咳嗽音的方法,使用离散傅里叶变换,根据信号的频域特征功率谱密度与参考数据的比较进行分析和分类,并提出了一种改进的参考信号提取方法,这项技术对训练信号的部分内容进行模糊C-means 聚类评估,并提供反映病猪咳嗽特征的频率内容参考,试验表明总分类正确率达到85%,其中正确识别了82%的病猪咳嗽音。VOLKMANN 等[36]建造了1 个面板来测量奶牛走过它的撞击声,对记录的撞击声进行编辑与分析,利用随机森林算法建立了奶牛跛行声音分类预测模型,试验证明模型分类与蹄部修剪诊断之间有很好的一致性,预测模型能够检测出有爪部病变的奶牛。HUANG 等[37]通过对采集的鸡发声信号进行频域分析和处理,提取声音信号的梅尔频率倒谱系数作为健康鸡和感染鸡的区分标准。利用二值分类支持向量机(SVM)对提取的鸡叫声进行训练和识别,该方法检测禽流感病毒的准确率在84%~90%之间。RIZWAN 等[38]采集疫苗试验期间健康和患病鸡呼噜咳嗽的锣音音频,计算得出Mel-scaled 光谱特征,使用极端学习机(ELM)和支持向量机(SVM)分类器,可以区分病鸡与健康鸡。

猪、牛、鸡等畜禽在患病期间会发出与一般声音有异的声音,可以通过对异常声音的监测来判别畜禽的健康状态。由于声音受环境因素影响较大,故进一步的工作应朝着算法在不同条件下的鲁棒性和适应性方向发展。

3 畜禽进食声音监测

畜禽在进食过程中时常会发出一些特定的声音,如啄食声、啃食声、咀嚼声,这些声音可以通过专门的传感器或麦克风采集,并通过特定的算法和模型进行处理和分析,从而判断动物的进食情况。其主要优点是可以实时进行长期监测。牧草摄入量的估算可以为轮牧方案的设计和实施提供重要数据支持。HANG SHENG 等[39]通过收集8 只2 岁、体重在50±3 kg 的母羊的采食声音,构建了114 条音频数据集。采用基于高斯核的支持向量机(SVM)分类器对绵羊咀嚼声进行分类识别。每个咀嚼音段提取7 个解释变量。利用这些变量建立了基于单变量和多变量的牧草估测模型。分别采用最小二乘回归和弹性网络方法确定单变量和多变量饲料摄入量估计模型的系数,试验表明2 种模型的平均准确率分别为86.13%和89.32%。段光辉[40]将采集到的藏羊进食声音用LSA-MMSE 语音增强算法将每段采食音频进行去噪处理,采用双阈值法的端点检测算法自动截取采食音频中的非静默片段,将梅尔倒谱系数与小波变换相结合进行声音信号特征提取,构建了一种基于长短时记忆模型网络的藏羊食草行为相关声音识别分类器,实现了藏羊咀嚼声监测。LI GUOMING 等[41]对奶牛采食不同高度与品种牧草时的声音进行对比分析,通过傅里叶变换生成功率谱图,将Mel 滤波器组映射到功率谱图,构建Mel 尺度谱图,并将其输入3 种深度学习模型进行行为分类,分别是一维卷积神经网络(CONV1D)、二维卷积神经网络(CONV2D)、长短时记忆网络(LSTM),试验得出使用均衡持续时间和不均衡音频文件的过滤数据集的长短时记忆网络较其他2 种模型性能更好,在不同牧草种类和高度下,最佳分类性能均在0.93 以上,最佳和最差性能差异为0.4~0.5,虽然不能根据某些牧草特征来区分奶牛进食的声音信号,但所开发的工具对奶牛精准养殖提供了一定的技术支持。杨稷等[42]将采集到的肉鸡采食声音经过分帧加窗、端点检测等预处理后,提取出有效声音片段,通过分析声音信号功率谱密度曲线差异,使用单分类支持向量机(OC-SVM)的方法对不同特征的肉鸡采食声音进行分类识别,成功检测出肉鸡进食时的啄食次数,可用于肉鸡采食量的测定。AYDIN 等[43]对单只鸡的啄食声进行了检测,使用开发的声音算法定义肉鸡的采食量。通过喂料器下的接触式麦克风记录每只鸡的啄食声,计算肉鸡的采食量。结果表明,啄食声识别成功率为93%,采食量监测成功率为90%。后期AYDIN 等改进现有的算法,以达到准确和连续地测量1 个喂食器周围多只肉鸡的采食量的目的,主要改变带通滤波器的截止频率和改变自适应阈值的比值,试验得出该算法得到的采食量与体重秤记录的采食量之间的相关性R2达到0.994,除了较高的相关性外,采食量监测成功率为86%[44]。

畜禽进食声音的监测是反映日常中畜禽福利状态的重要手段,用于监测畜禽进食量以及畜禽偏好进食的饲料种类,为智能畜禽养殖提供重要的数据支撑。

4 畜禽情绪状态声音监测

除了患病畜禽声音监测和进食声音监测外,对畜禽在不同情绪状态下所发出的声音进行监测也是一种非常重要的无损化判断其健康以及福利状况的标准。CORDEIRO 等[45]采集记录了20 只雄猪与20只雌猪在产仔期、育仔期、生长期和育成期中不同痛苦状态的个体发声,通过分析所有的声学特征后使用信号的持续时间、最大振幅和第二共振峰3 种声学特征,利用机器学习技术建立了1 个准确率为82%的决策树算法,对采集的声音信号进行分类,声音信号特征的差异表明猪的性别、年龄、痛苦状态是可以通过声音识别的。李博宇等[46]对仔猪饥饿求食哼叫,以及抢食尖叫噪声、机械送料噪声进行采集,通过时域、功率谱密度等分析这3 种声音特征,通过提取Mel 倒谱系数并用矢量量化进行分类识别。针对混有背景噪声的声音识别,提出了一种基于VQ-PSD 的识别方法。试验表明,基于此方法能够有效提高对混有背景噪声的仔猪饥饿求食声音的识别率,平均识别率提高了9.1%。并可拓展到其他动物声音识别应用中。XIAODONG DU 等[47]提出了一种基于母鸡发声信号用来评估其热舒适状况的创新方法,分析了母鸡发声信号中源滤波理论相关的时域和频谱特征,并开发了一个基于支持向量机的分类器。结果表明,分类性能分别为精密度为95.7%~99.5%,灵敏度为90.8%~99.4%。高萌萌[48]采集白羽肉鸡的声音信号,利用维纳滤波方法获取高信噪比声信号,分别在时域和频域、MFCC、稀疏表示3 部分进行声音信号特征提取,采用随机森林分类模型的方法进行分类,并且结合网格搜索算法进行交叉验证,优化了随机森林的固有参数,从而达到对白羽肉鸡异常声音信号进行分类的目的。

畜禽情绪的变化影响畜禽生长速度以及福利状态,通过监测畜禽声音判别畜禽情绪状态,及时处理畜禽饥饿、求偶、争斗以及不适应环境出现的突发状况问题,提高畜禽福利水平,有助于实现更为精准的智能养殖。

5 结语

畜禽声音监测技术在畜禽养殖领域具有广泛的应用前景和研究价值,可以为畜禽养殖行业提供新的监测和管理手段,提高畜禽的福利水平,推动养殖过程的智能化和可持续发展。但是由于畜禽养殖环境因素复杂,畜禽声音信号的采集易受干扰,从而造成识别准确率受到影响,因此后续的畜禽声音监测工作可以因地制宜,选取方法在传统方法上加以改进,结合新兴的深度学习算法,以提高监测的准确率与鲁棒性。

通过分析国内外学者对于畜禽声音监测技术的研究现状发现,畜禽声音监测技术具有非侵入性、简便快速、准确性高等特点,可以通过采集动物发出的声音信号来分析其健康状况、情绪状态、行为特征等。此外,声音监测技术可以与其他技术结合使用,例如生物传感技术、图像识别技术等,同时监测畜禽的行为和声音等数据,从而提高监测的全面性和准确性,更加准确地判断畜禽的状态。随着传感器和人工智能技术的发展,畜禽声音监测技术正逐渐成为畜禽养殖领域的重要研究方向,其主要趋势是将其应用于智能养殖系统。智能养殖系统利用传感器、数据分析和人工智能等技术,对畜禽养殖进行全方位的监测和管理,实现养殖过程的自动化和智能化。在智能养殖系统中,畜禽声音监测技术可以用于动物健康监测、自动化喂食等方面,提高养殖效率和减少成本。同时,智能养殖系统还可以对养殖过程进行优化和调整,使其更加符合动物的生理和行为特征。因此,借助人工智能技术的不断发展,将畜禽声音监测研究融入畜禽养殖生产实践,以提升畜禽生长健康状态和产出率,推动产业高质量发展将成为该领域技术进步的重要方向。

猜你喜欢
畜禽分类特征
畜禽夏季喂野菜 防病快长真不赖
菌株出马让畜禽污染物变废为宝
夏季养畜禽 驱蚊有妙招
分类算一算
如何表达“特征”
不忠诚的四个特征
分类讨论求坐标
数据分析中的分类讨论
教你一招:数的分类
抓住特征巧观察