杜天天,李奇峰,孟 蕊,冯 璐,侯宇婷,高荣华,丁露雨,马为红,刘同海,余礼根*
(1.天津农学院 计算机与信息工程学院,天津 300384;2.北京农业信息技术研究中心,北京 100097;3.国家农业信息化工程技术研究中心,北京 100097)
规模化养殖给畜禽养殖业可持续发展带来较高的健康风险与疫病防控压力,高效的数字化养殖管理手段是实现传统畜牧业向智能型管理升级的有效途径。以生命信息感知、动物生长模型、畜牧生产大数据分析和智能控制为核心的智慧养殖业已成为全球畜牧业发展的必然趋势[1-2]。随着数字语音处理和人工智能等技术的快速发展,基于音频的畜禽非接触式监测、分析方法逐渐受到关注和应用[3]。
发声是畜禽交流的主要方式,在研究福利化养殖的过程中通常将其作为一种辅助判断方法,一直是畜禽养殖研究的热点[4]。自20世纪50年代首次报道鸡的发声特征以来,研究人员发现鸡可以发出30多种声音类型,其中19种发声的语义信息(包括警告、威胁、求偶等)可被理解[5]。目前,对家禽发声的研究逐渐从时域、频域特征参数分析[6],发展到利用深度学习、自适应学习等模型方法,对家禽发声信号进行深入研究[7-8]。本文重点介绍音频分析技术在蛋鸡、肉鸡等家禽生长监测、应激行为分析和疾病监测3个领域的国内外应用现状及存在问题,并展望其发展方向,为家禽实时无应激监测技术研究提供参考。
家禽发声是由发声器官-鸣管内鸣膜振动产生[9]。畜禽发声的持续时间、振幅、频率、能量等音频特征与生长阶段、体重、品种类别等自身生长特性密切相关,同时与养殖模式、应激反应、疾病发生等外部生长环境相互关联[10-11]。将音频信息作为辅助手段可辅助评估畜禽对环境的适应性,并可用于应激行为分析和疾病的监测预警[12-14]。
家禽生产过程中饲料成本约占养殖投入的70%,家禽生长状况是养殖者关心的重要问题。但在规模化养殖舍中,主要依靠人工测量家禽体质,浪费大量人力物力。音频分析技术对家禽的发声行为进行监测,分析不同生长阶段特征参数与生长之间关系,利于合理调控生产管理。
不同生长阶段,声道结构发生一定变化,蛋鸡发声特征参数也会发生改变。李志忠等[15-16]获取了3个日龄阶段(35日龄、95日龄和125日龄)的蛋鸡发声信息,通过分析基音频率、持续时间、频谱质心和共振峰等基本声学参数,发现蛋鸡不同日龄的声学特征参数存在显著差异。在相同生长阶段,不同养殖模式下蛋鸡的声学特征有所不同。余礼根等[17]比较栖架养殖模式与叠层笼养模式下蛋鸡发声行为的差异,发现栖架养殖模式下蛋鸡产蛋后产蛋叫声和愉悦叫声增多,自然的生理活动和生长行为能够有效表达。宗超等[18]比较栖架养殖和笼养两种不同养殖模式在不同养殖阶段典型蛋鸡发声,发现蛋鸡发声的峰值频率和能量值在产蛋期低于育成期,峰值频率和周龄呈负相关关系,栖架养殖模式下蛋鸡的发声次数、持续时间和能量值均高于笼养。不同生长周期或不同体质量情况下,鸡叫声特征不同。Fontana等[19]根据峰值频率与体重之间的关系,建立多项式回归模型用来预测肉鸡体重。Abdel-Kafy等[20]针对火鸡叫声峰值频率、体重以及生长周期的关系建立生长模型,试验验证了模型的可行性。
音频采集技术具有非接触监测的特点,不会对畜禽生产过程产生额外影响,为家禽生长监测提供新的技术手段。但是,不同遗传品系、不同生长阶段和不同养殖模式下的家禽发声差异显著,建立基于音频特征数据库的异常预警系统为健康养殖评价系统提供参考依据。
应激反应是指机体受到外部环境刺激做出防御性行为,应激反应过度可能导致功能紊乱或疾病发生[21]。限制饲喂、热环境、生长环境变化等均对家禽情绪状态产生影响造成应激反应。应激发声是应激行为的一种,是在应激状态下发出的异常叫声[22]。
近年来,研究者对不同应激状态下鸡的发声信息进行了深入探讨,对不同发声特征与外部刺激间的关系进行深入分析,提出将其作为畜禽福利评价的重要指标[23-24]。最初研究者比较正常状况和应激状态下发声的差异,如Fontana等[25]利用隔离箱对幼小雏鸡分群饲养的叫声进行了研究,分析幼鸡叫声峰值频率,发现隔离饲养后幼鸡更容易发出搜寻同伴的声学信号。雏鸡在封闭的环境中容易处于孤独焦虑的状态。余礼根等[26]在消音室可控环境条件下,对产蛋期海兰褐蛋鸡在热应激、限制饲喂和正常饲养下的发声差异进行比较,发现应激状态与正常饲养下发声特征参数变化规律不一致。之后通过对应激发声分析建立异常识别模型,如Pereira等[27]研究了肉鸡在热应激和室温条件下能量、带宽、第一共振峰、第二共振峰等声学特征变化,构建了热应激声学识别模型。目前,随着人工智能技术的发展,通过支持向量机、深度学习等进行应激发声识别的识别效果逐渐体现。如Liu等[28]将外部温度设定为34 ℃的试验组、21 ℃的对照组予以对比分析,以过零率、基频和梅尔频率倒谱系数作为特征参数,采用支持向量机模型进行分类。结果表明火鸡热应激识别准确率达88.75%。Maljkovic等[29]以1~4周龄的肉鸡为研究对象,提取应激条件下肉鸡叫声的梅尔频谱系数进行归一化处理并作为识别特征参数,结果表明应激叫声识别的准确率为68.26%~87.80%。Du等[30]改进了支持向量机模型用于热应激叫声识别,识别模型的灵敏度识别率提高到95.1%±4.3%,识别精度可达97.6%±1.9%。Lee等[31]设计了在线监测系统用于识别鸡的热应激叫声和恐慌叫声。使用支持向量机分类器模型对提取蛋鸡声音的声学特征子集进行分类,分类准确率为96.2%。这说明家禽发声是对其机体状况的直接反馈,利用音频分析可快速识别应激状态。利用家禽发声作为评价指标,通过对声学特征参数的提取、分析,比较家禽在应激与非应激状态下的发声差异,进而实现养殖过程中应激行为监测预警,及时发现引起应激反应的根源,有效避免过度应激。采用模式识别技术实现对家禽应激反应的反馈识别,避免或减少对家禽饲养过程的干扰和影响。
呼吸道疾病主要由病原体感染引起,发病时主要症状为呼吸道内粘液增多,造成呼吸道堵塞,伴随有咳嗽声、喷嚏声、呼噜声和呼吸罗音等异常叫声[32-33]。目前,传统诊断方法主要依靠饲养人员夜间对呼吸道疾病进行人工巡检,实时性和准确性无法得到保障。在规模化养殖中,及时发现禽舍内患有疾病的个体在群体饲养管理中非常重要。声音监测技术可通过持续、在线监测家禽声音,实现疾病判断、状态识别与提前预警[34-36]。
曹晏飞等[37-38]针对蛋鸡声音识别过程中存在噪声干扰的问题,通过分析蛋鸡声音与噪声的功率谱密度等频谱特征差异,提出了蛋鸡声音自动检测与分类识别的方法,开发的蛋鸡声音识别模型可在夜间低噪声环境下检测出蛋鸡呼噜声。Sadeghi等[39]基于23种声学特征,应用人工神经网络识别健康鸡和感染鸡。在鸡患病后的第2天和第8天分类的准确度分别为66.6%和100.0%。Huang等[40]计算梅尔频率倒谱系数作为特征参数用于区别健康鸡和禽流感病鸡,实验室条件下的测试集准确率为84%~90%。此方法为及时监测禽流感传染病提供依据。在此基础上,张铁民等[41]提出以短时过零率、短时能量、短时过零率与短时能量混合的多维特征作为音频特征参数,以模糊神经网络作为分类器识别禽流感病鸡的发声,以隶属度函数为钟形函数、隶属度个数为2时模糊神经网络对3组测试集识别准确率分别为75.47%、80.39%和76.92%。这些研究为规模化家禽养殖场禽流感的识别提供了快速高效检测方法。Banakar等[42]根据数据挖掘方法和Dempster-Shafer证据理论,分析25种频域声学特征和75种时域声学特征,基于支持向量机构建分类器研制了一种监测装置,其用于检测鸡是否感染新城疫、支气管炎、禽流感疾病3种疾病的效果较为理想。但实验不足是没有考虑实际现场环境噪声的影响,距实际应用还有待进一步研究。Rizwan等[43]比较了极限学习机算法和支持向量机分类算法对于分类识别病鸡呼吸罗音的准确性。支持向量机分类算法在鸡健康时显示较少的假阳性状态,而在生病时实验组和对照组识别结果更清晰。规模化养殖舍中,Carpentier等[44]提出一种在多个噪声源的情况下识别打喷嚏声的算法,在763次打喷嚏声音中提取出8个主要的特征参数构建喷嚏声识别模型,准确率达到了88.4%。秦伏亮等[45]提出一种基于小波变换的改进梅尔倒谱系数与高斯混合模型-隐马尔可夫模型的鸡咳嗽声识别系统,肉鸡咳嗽声识别准确率达95%。Mahdavian等[46]使用支持向量机模型对比5种常见的声学特征在鸡患病后的识别效果,在鸡接种病毒的第三天,音频信号的小波熵作为特征参数,鸡的支气管炎识别效果最好,准确度达到83%。
家禽集约化养殖增加了传染病传播的风险,呼吸道疾病是家禽饲养过程中的常见疾病,声学研究中主要表现症状为发出喷嚏、咳嗽等异常叫声。相较于人工观察,利用声音监测进行疾病判别可以提前预警。目前,研究选取呼吸道疾病发声特征参数、建立识别模型,用来识别患病个体,防止疾病蔓延和群体性迸发,对于减少生产损失、提高家禽福利化水平具有一定的实现意义。对于音频监测识别技术在家禽养殖上应用情况做出以下分析,如表1所示。
表1 家禽音频分析监测技术应用情况对比
尽管国内外学者对家禽养殖过程中发声特征规律及音频监测技术开展了大量研究,但音频分析效果受特征参数和识别模型选择的影响[47-51]。音频特征参数研究方面,最初计算家禽发声的时域特征参数和频域特征参数构造数据库。在匹配阶段将待确定声音类型的特征参数与数据库匹配,找到与数据库相对应的声音类型。近年来,深度学习模型使用卷积核对语音局部特征加权求和,这样的操作使网络对出现的相同特征进行提取,识别效果有了显著提高。但是,特征参数的选取较为分散,没有统一的标准,导致畜禽语音特征库匮乏,方法复用性差。建立多种养殖模式、多品种、多环境变化下的家禽统一标准音频特征数据库,以提高识别效果的准确性和鲁棒性。音频识别模型方面,已从最初的标准统计模型、复杂统计模型,到人工神经网络模型、支持向量机模型、隐马尔可夫模型、深度学习模型等转变,识别模型逐步地从复杂、低识别率向简单、高识别率的方向发展,并大量应用于家禽发声识别领域。
本文对蛋鸡、肉鸡等家禽生长发声、应激发声、疫病发声方面的研究进展进行了分析,阐述了音频处理技术在家禽养殖非接触、无应激监测方面的重要作用,提出了家禽音频分析技术发展方向。总体而言,欧洲在畜禽发声信息感知与监测识别技术方面的研究较为深入,部分技术已应用于生产实践。我国规模化养殖舍中,基于音频分析的监测设备应用较少,智能化水平难以满足实际需求。因此,亟待开发声学监测系统用于规模化养殖舍家畜生产过程监测,对提高养殖舍智能化水平具有重要意义。