曹晓慧,刘 晃,戚仁宇,张成林,刘世晶
循环水养殖大口黑鲈摄食颗粒饲料的声学特征
曹晓慧1,2,刘 晃2※,戚仁宇1,2,张成林2,刘世晶2
(1. 上海海洋大学水产与生命学院,上海 201306;2. 中国水产科学研究院渔业机械仪器研究所,上海 200092)
为突破智能投饲系统的技术瓶颈,近年来采用被动声学技术开展鱼虾摄食行为研究成为热点之一。该研究主要采用被动声学技术获取单体大口黑鲈()摄食声信号,从混合信号中提取完善的摄食信号,筛选可作为衡量大口黑鲈摄食活跃度的声学特征参数,以期对摄食活跃度进行量化。根据大口黑鲈喂食期间的同步音频与视频记录,确定信号类别并进行标记,主要提取每次吞食饲料的时域与频域特征,对比各参数与吞食次序之间的相关度。研究结果表明,摄食声信号能量主要集中于4.2~7.4 kHz,且大口黑鲈吞食间隔与吞食次序呈正相关,稳定性较强;而时域特征中的波形振幅极差与频域特征的功率积分值均与吞食次序呈负相关。吞食间隔、振幅极差及功率积分值均可以作为衡量摄食活跃度的量化指标,而共振峰与平均梅尔倒谱系数可作为摄食声识别参数,研究结果可为今后养殖鱼类被动声学智能投饲系统研发提供理论基础。
水产养殖;摄食行为;声信号;大口黑鲈
随着集约化养殖密度的提高,水产养殖越来越依赖于人工配合饲料,根据2020年淡水鲈产业报告显示,饲料占总成本的67.35%[1]。为使养殖饲料成本在可控范围内有所降低,目前最需解决精准控制投喂量的问题,以期在不影响养殖鱼类本身正常生长情况下最大限度的提升饲料利用率。为实现精准控制并达到按需投喂,很多学者从养殖鱼类行为入手,主要分析养殖鱼类摄食行为,以期能够得出摄食行为与饲料消耗量间的关系。目前观察养殖鱼类摄食行为的方式主要有机器视觉与被动声学两种[2]。
计算机视觉技术为记录行为参数提供了一种自动化的、非入侵性的有效方法,对摄食行为的判断是由摄食鱼类运动导致的两个连续图像差异强度总和来确定的[3]。目前对于摄食活跃度的判断依据有鱼群的聚集程度[4-5]、运动状态[6]、水花面积[7]等,其判断准确性均达到90%以上。但计算机视觉技术对水质和光照的要求较高,在实际养殖中会受水质混浊、光线昏暗以及鱼群密度的影响,因此难以适用于目前的高密度养殖。但是,采用被动声学技术可以克服这些不足,已成为获取水生生物信息的重要工具。被动声学技术主要运用水听器监测水生生物发声获得声信号,不会对监测目标产生危害[8],并且声学技术稳定,以水为媒介可进行可靠的远距离信息传输,具有很强的抗干扰能力。Silva等[9]分析不同体型的凡纳滨对虾()声学特性,认为凡纳滨对虾摄食时所产生的声信号可以作为衡量饲料消耗量的指标。Peixoto等[10]以不同饲料长度为变量仍然得到凡纳滨对虾的摄食声信号具有评估饲料消耗的潜能。这些结论不仅存在于虾类中,Lagardère等[11]也发现大菱鲆()的摄食声信号会随着摄食强度而变化,之后又发现利用水听器测量的摄食声信号与人工估计的喂食量之间存在线性关系[12],再次证明了养殖鱼类的摄食声信号可以衡量鱼类的摄食活跃度。
对养殖鱼类摄食行为的量化分析可以提供更可靠的决策支持,减少对人工养殖经验的依赖,从而提高产量,促进节能降耗。而目前养殖鱼类声信号分析中,并没有准确提取的特征参数,或者参数较为单一。多特征融合的量化特征,能够建立准确的摄食声学模型,从而达到高判别准确度。但目前对于养殖鱼类摄食声信号研究仍处于起始阶段,因群体摄食声信号较为杂乱,不利于声学特征的提取,且群体摄食的声学特征参数与摄食活跃度的关系较为复杂。因此本文针对摄食声信号与摄食活跃度研究从单体入手,以大口黑鲈()为试验对象,利用不同体型大小的大口黑鲈摄食声信号进行特征筛选与统计分析,确定声学特征参数的提取范围。以期得到准确的量化参数,拟为下一步群体摄食声信号研究提供明确的研究方向。
声信号采集地点为中国水产科学研究院渔业机械仪器研究所鱼类行为观察实验室(上海市杨浦区赤峰路63号)。试验所用大口黑鲈鱼苗均采购于爱科漫(上海)农业有限公司,将其鱼苗暂养于直径2m的工厂化循环水系统中,暂养期间的每天投喂量约为体质量的3%~4%,饲喂饲料均为硬颗粒浮性饲料。养殖3个月后待状态稳定进行试验,试验中随机从暂养池中选取单条大口黑鲈进行摄食声采集。在声信号采集前,为保持试验对象对饲料的兴趣,投喂间隔不少于1 d。研究共选用6条大口黑鲈进行试验(体长如表1所示)。
表1 试验对象统计表
试验池为1.5 m×1 m×1.5 m的透明玻璃水池,并内置小型循环水系统,具体试验系统如图1所示。本试验采用声像同步方法记录大口黑鲈每次的摄食过程,其录音装置主要是由AquaSound水听器测量系统(水听器型号:AQH-020;频率范围:20 Hz~20 kHz,前置放大器型号:Aquafeeler Ⅳ;增益控制:20~70 dB,日本京都大学信息学研究院);Roland QUAD-CAPTURE外置声卡(型号:UA-55,台湾乐兰企业股份有限公司),录像装置为SPORTS CAMERA4K高清防抖数码摄像机(型号:QOER V70,深圳市真视界科技有限公司)。采集的音频数据将以.wav文件存储于电脑,视频以.MP4存储于内存卡,用于后期处理。本研究中,录音采样频率设定为96 kHz,采样精度为24 bit,采样通道为单通道,增益为50 dB。
音频数据在采集过程中会存在多种状态声音和无效声段,因此需要进一步地进行手工切分,并对需要的声音片段进行标记,以构成试验所需声信号。利用Adobe Audition 2020音频处理软件中的多轨模式对声像进行同步处理,根据声信号的波动与图像中的行为确定摄食声信号并对音频进行标记,之后对标记的音频进行手动切分。根据获得的摄食音频可发现,大口黑鲈每次吞食声信号可持续100~200 ms,可由Adobe Audition频谱中明确观察吞食信号的能量变化,确保每次吞食信号的完整性。本研究在每次采集声信号过程中,为尽可能保持背景噪声的稳定性,会将循环系统关闭,并先录取3 min左右的背景噪声。其中背景噪声的声压级(SPL)均在65 dB左右,当大口黑鲈出现吞食信号或其他行为声信号时,SPL均会出现明显的波动,峰值均在72 dB以上。
摄食声信号预处理过程如图2所示,特征提取之前需要对声信号进行预处理,此过程包括数字转换(A/D转换)、降噪、预加重、加窗分帧等。
模数转换(A/D)转化又称为数字化,可更方便更准确的对声信号进行分析处理,本研究采用Roland QUAD-CAPTURE声卡完成。
降噪可将摄食声信号较为清晰的从混合信号中提取出来,经频谱图可得背景噪声干扰最大的频率范围主要集中在1~1 000 Hz,与摄食声信号频率范围存在明显分段。本研究采用子空间语音增强算法,通过空间分解将整个声信号分解为噪声子空间和含有噪声的声信号空间,将噪声子空间去除,并采用最优估计器来估计摄食信号特征值,进而实现信号增强。经降噪后摄食声信号信噪比可提高至70 dB以上。
预加重可避免摄食信号的高频分量削弱,本研究使用预加重滤波器来强化高频部分,预加重系数通常取0.9~1.0,本研究依经验值取0.97。
大口黑鲈摄食声信号与语音信号相似,同样具有短时平稳的特点,并对其进行分帧处理提取短时特性,为减少帧与帧之间的不连续性,选取窗函数为汉明窗[13],此外本研究根据大口黑鲈摄食声信号特征,选取帧长为100 ms,帧移为50 ms。
所采集到的大口黑鲈摄食声信号中一般长达10 min左右,期间存在非摄食信号与无声段,因此为准确确定每次吞食饲料的起始点,改善后期处理效率,本研究通过帧能量与帧过零率对声信号进行重采样。
声信号本身就是时域信号,针对完整的摄食声信号可提取到吞食间隔、振幅极差、振幅最大值。吞食间隔:为两次吞食颗粒饲料的时间差,如图 3中所示;振幅极差:为每个吞食信号振幅最大值与最小值的差,也就是电压峰-峰值,如图3中Vpp所示;振幅最大值:为每个吞食信号振幅的最大值,如图3中所示。
功率谱反应声信号在不同频率上的能量大小,通常采用快速傅里叶变换(Fast Fourier Transform,FFT)将时域信号转化为频域信号得到频谱图,公式如下:
共振峰是声信号频谱中在特定频率区域聚集大量声能的表现,反映了声道的物理特性。对声信号进行倒谱处理,将激励信号与声道响应分离,去除激励信号后做傅里叶变换,以得到声道响应包络,在包络上寻找最大值便是共振峰频率。
梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)是在Mel标度频率域提取出的倒谱参数,更着眼分析人耳的听觉机理[14]。对每帧进行傅里叶变换、三角形梅尔滤波器、离散余弦变换得到梅尔倒谱系数(C),而平均梅尔频率倒谱系数(Average Mel-Frequency Cepstral Coefficients,AMFCC)为所有帧倒谱系数(C)的平均值(M),即
其中,=1,2,...,12,i()为第1帧的第一个接收系数,为吞食信号帧数。
本研究中所有声学特征参数均由MATLAB R2019a运算获得。
为判断各特征参数随着大口黑鲈摄食声信号的变化规律,该研究利用Minitab 17进行统计分析,主要利用Pearman相关来测量特征参数与吞食次序的相关性,与LSD方法进行单因素多重比较显著性分析,比较个体间的差异性。
在时域特征分析中常用的参数有短时能量、短时过零率、持续时间等[15],都可在波形图中通过计算直接得到。本研究通过时域特征分析,对提取的振幅极差、振幅最大值、吞食间隔分别与吞食次序做相关性分析。从6条试验个体中随机选取3次摄食声信号,每次吞食次数均在10次以上,并对各相关系数做显著性分析,结果如表2所示。发现6条试验个体的吞食次序与振幅极差、振幅最大值均呈负相关,与吞食间隔呈正相关。
大口黑鲈吞食饲料颗粒后声信号会随之产生波动,振幅是声信号波动最为直观的特征,同时也在一定程度上反应此次吞食的能量大小。而在实际养殖中鱼类摄食活跃度会随摄食次数的增加而降低,即吞食颗粒饲料的能量以及摄食积极性随之降低。因此提取每次吞食信号的振幅极差、振幅最大值与吞食间隔作为衡量摄食活跃度的量化参数。而摄食次数则由吞食次序表示,吞食次序是指按照吞食时间依次排序,如第一次吞食饲料产生的声信号为吞食次序1,第二次为吞食次序2,以此类推为1,2,...,。其中吞食间隔是较为直观的量化值,因吞食间隔需在第二次吞食后才有数据累计,所以与吞食次序的相关性序列以2开始(如2,3,...,),其余特征参数与吞食次序的相关性序列均为1,2,...,。
由表2可知,振幅极差与吞食次序的相关系数均在-0.61以下,且6条试验样本(以下相同)间无显著性差异,振幅最大值与吞食次序的相关系数在-0.61以下,且个体之间也无显著性差异。从相关系数看,时域特征中吞食间隔与吞食次序的相关性最好,相关系数均大于0.67,呈正相关,虽然表中A1个体的相关系数与其他个体之间存在一定的差异性,但相关系数却最大,故此差异可忽略不计。
表2 振幅极差、振幅最大值、吞食间隔相关系数显著性分析
注:表格中同列相同小写字母表示差异不显著(>0.05),不同小写字母表示差异显著(<0.05)。
Note: In the column, values with same small letter mean no significant differences (>0.05) different small letter mean significant differences (<0.05).
如图4a所示为某次大口黑鲈吞食饲料的波形图,图 4b为其相对应的频域信号即功率图,图中每个频率对应的功率之和称为功率积分值,峰值为功率最大值(如图中峰值为-71.44 dB)。按照吞食次序依次提取功率积分与最大值,并统计与吞食次序的相关性系数以及值大小(以=0.05为标准),从每条试验个体中随机选取3次摄食信号,每完整的摄食信号可获得一个相关系数与值,每个声学特征参数与吞食次序均可获得18个相关系数,结果如图4c所示。发现功率最大值与功率积分值均与吞食次序呈负相关。
经对多条大口黑鲈摄食声信号功率谱分析可得其摄食声信号频率范围为1~10 kHz,功率范围为-130~-70 dB,但其较大能量普遍集中于4~7 kHz范围内,如图4c中突出曲线部分。而功率最大值与功率积分值与吞食次序的相关性存在明显的差异,因功率最大值与吞食次序有3次不存在相关性,功率积分值有2次,且功率最大值的值波动明显较大,远超于=0.05的界限。未被直线连接的散点图表示每次摄食信号功率最大值和功率积分值与吞食次序的相关系数,在图中可明显看出圆形点比方形点更加接近于-1。从相关系数大小与值波动可以确定功率积分值与吞食次序的相关性更好,可达-0.90以下,因此在频域特征中单次吞食信号的功率积分值可以作为衡量摄食活跃度的量化参数。
共振峰一般包括共振峰的频率位置和频带宽度,在不同情感或者不同应激条件下声信号的共振峰位置不同[16]。根据这一特性,共振峰常常被选为识别物种发声的重要特征之一,本研究从6条试验个体中随机选取300次吞食信号提取第一、二共振峰,而第一共振峰分布较为密集,如图5a所示,且第一共振峰位置主要集中于4.2~7.4 kHz左右,如图5b所示。
在声信号分析中第一、二、三共振峰均有一定的参考价值,但分析过程中发现第三共振峰分布较为分散,无规可寻。而第二共振峰在10~40 kHz均有分布,且在15 与22 kHz左右分布较为密集,中间存在断层,30 kHz以上分布较少,因此不可做为大口黑鲈的摄食声学特征。第一共振峰集中分布在5 kHz左右,且数据特点符合正态分布,根据95%置信区间可得第一共振峰密度分布图如图5b所示,可确定大口黑鲈摄食的第一共振峰范围为4.2~7.4 kHz左右,这与功率谱中主要能量频率范围一致。但所有共振峰与吞食次序并无明显的相关性,该声学参数不能作为衡量摄食活性的量化指标。
AMFCC中Mel标度描述了人耳频率的非线性特性,大体上对应于实际频率的对数分布关系,在语音与动物发声识别中运用广泛[17-18]。本研究选取6条大口黑鲈摄食声信号,提取吞食信号的AMFCC变化曲线,结果如图6所示,吞食信号在系数3处均有明显峰值。
图中每条曲线代表一次吞食信号的AMFCC变化趋势,其中共包含13个AMFCC,第一个系数为平均帧能量系数。大口黑鲈每次摄食均包含若干次吞食信号,因此将每次吞食信号的AMFCC叠加可看出统一变化趋势,如图6a代表试验样本A1某次完整摄食的AMFCC整体变化趋势。观察A1至A6可以看出第3系数明显小于其余系数,第1系数至第3系数的变化趋势存在明显类似,均会在第2系数处出现拐点。第4系数至第13系数杂乱无章,不存在明显的统一变化趋势。第3系数处的峰值最为明显且统一,可作为大口黑鲈吞食信号的声学特征。
由于生活环境复杂,水生生物声学研究较为困难,鱼类不具有发声器官-声带,发声机理与其他陆地动物也存在明显区别。目前对于鱼类的发声方式共有摩擦机制、鼓声机制、弦式机制、空化机制、水动力机制、充气机制、呼吸机制和敲击机制8种[19]。但针对与某种特定鱼类的发声机制却很难抉择。本研究以大口黑鲈为试验对象,共筛选出振幅极差、振幅最大值、功率积分值、吞食间隔4种可衡量大口黑鲈摄食活跃度的声学参数,但振幅极差、振幅最大值与功率积分值三者为非独立性参数,因此只能选择其中之一。虽然振幅极差、振幅最大值与吞食次序的相关程度从相关系数看相差并不明显,但在同一次摄食声信号中振幅极差与吞食次序的相关系数更优于振幅最大值的相关系数,因此振幅极差作为衡量摄食活跃度更为稳定。在功率谱分析中,发现功率积分值与吞食次序呈负相关,即随着吞食次序的增加摄食功率呈逐渐减小的趋势,这与Lagardère等[11]以及汤涛林等[20]的研究结果相同,再次证明了这一结果的普遍性,与发展潜力。而功率积分值与吞食次序的相关程度较振幅极差更佳。但从实际应用角度考虑,在声信号处理过程中吞食功率积分值的提取在重采样过程中较为繁琐,没有明确的端点阈值而易受人为主观因素的影响。因此,三者中振幅极差作为衡量大口黑鲈摄食活跃度的声学特征参数更佳。吞食间隔是对完整摄食信号进行分析,是较为直观的量化指标,不涉及分帧加窗、重采样繁琐的处理过程,但人为标记工作量大且速度缓慢,若能将摄食声信号进行准确识别,便可以解决这一弊端。将对之后摄食声学投饲系统模型构建提供良好的基底。
大口黑鲈摄食声信号频率范围为1~10 kHz,而大菱鲆、虹鳟(Oncorhynchus mykiss)的最大能量分别集中于7~9 kHz与4~6 kHz[21],产生差异的主要原因是由于摄食方式以及发声机制的不同。根据大口黑鲈吞食信号的声音与特性,比较符合空化发声机制。空化机制是最早确定在鱼类喂食过程中产生的,鱼类摄食时嘴巴突然张开造成内部负压,食物因压力作用被吸入嘴巴,随后由于压力迅速下降导致出现空化气泡,伴随声音脉冲的产生[22]。除此之外,鼓声机制也有可能参与摄食发声,虽然鱼鳔振动产生的声音频率较低(1 kHz左右),但会受到发声肌以及坚硬构造摩擦的影响,从而产生会高频信号。
共振峰与AMFCC是作为声学识别最常见的两种特征。如宣传忠等[23]运用功率谱与共振峰两种特征参数对母羊的发声进行识别,结果表明共振峰特征参数的识别率高于功率谱特征参数。除此之外在识别家禽发声特性与行为间的关系中,共振峰特性也是重要的声学特征参数之一[24]。因此第一共振峰频率范围可作为识别大口黑鲈摄食声学特征。虽然MFCC比线性预测倒谱系数(Linear Prediction Cepstral Coefficients,LPCC)具有更好的棒鲁性,但李志忠等[25]在识别蛋鸡叫声中发现AMFCC方法的识别准确率高于LPCC与MFCC。Lee等[26]人在识别动物发声中也认为AMFCC的性能更优于平均线性倒谱系数(Average Linear Prediction Cepstral Coefficients,ALPC)。并且AMFCC表征了鱼类的声纹信号,是基于人类听觉感知的低频包络,不同鱼种的AMFCC有不同的变化趋势。但大口黑鲈与鲤科鱼类相似都是仅有一个峰值,而草鱼()有3处峰值[27],造成这种结果的原因可能是由于不同鱼种间的体型、鳍的大小以及鱼体的长宽比例不同。但同一鱼种的AMFCC变化趋势特点不会随着鱼群数量的变化而改变,也因此可以作为识别鱼类种类的声学特征。虽然具有一定的唯一性,但在摄食过程中会出现很多异常信号,例如吞食后嘴巴会冒出类似于吞食声信号的气泡以及水面摆尾声等信号,都属于大口黑鲈的发声,因此仍需提取更多声学参数特征才能达到更高的准确率。在信号分析过程中,不以视频为参考仅通过人耳也可识别出大口黑鲈的吞食信号,虽然会受某些异常信号的干扰,但仍可大概率做出正确判断。后期若建立足够大的信息量,将各种信号分别提取,并识别其特征参数,就可达到准确识别。
1)时域特征中振幅极差与吞食次序相关性最佳,呈负相关。吞食间隔作为最直观的特征参数与吞食次序呈正相关。随着吞食次序的增加,电压峰峰值逐渐降低,吞食间隔逐渐变大。
2)频域特征中每次吞食信号的功率积分值与吞食次序相关性最佳,呈负相关。随着吞食次序的增加功率积分值逐渐降低。
3)大口黑鲈吞食信号的第一共振峰分布范围为4.2~7.4 kHz左右。AMFCC趋势中,均在第三系数处有明显峰值。二者可作为大口黑鲈吞食声信号自动识别的特征参数。
[1] 国家特色淡水鱼产业技术体系. 中国淡水鲈产业发展报告[J]. 中国水产,2021(3):40-48.
National characteristic freshwater fish industry technology system. China freshwater bass industry development report[J]. China Fisheries, 2021(3): 40-48. (in Chinese with English abstract)
[2] Li D L, Wang Z H, Wu S Y, et al. Automatic recognition methods of fish feeding behavior in aquaculture: A review[J]. Aquaculture, 2020, 528: 735508.
[3] Liu Z Y, Li X, Fan L Z, et al. Measuring feeding activity of fish in RAS using computer vision[J]. Aquacultural Engineering, 2014, 60: 20-27.
[4] Zhou C, Lin K, Xu D, et al. Near infrared computer vision and neuro-fuzzy model-based feeding decision system for fish in aquaculture[J]. Computers and Electronics in Agriculture, 2018, 146: 114-124.
[5] 陈彩文,杜永贵,周超,等. 基于图像纹理特征的养殖鱼群摄食活动强度评估[J]. 农业工程学报,2017,33(5):232-237.
Chen Caiwen, Du Yonggui, Zhou Chao, et al. Evaluation of feeding activity of shoal based on image texture[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(5): 232-237. (in Chinese with English abstract)
[6] 陈志鹏,陈明. 基于光流法与图像纹理特征的鱼群摄食行为检测[J]. 南方农业学报,2019,50(5):1141-1148.
Chen Zhipeng, Chen Ming. Detection of shoal feeding behavior based on optical flow methods and image texture[J]. Journal of Southern Agriculture, 2019, 50(5): 1141-1148. (in Chinese with English abstract)
[7] 胡利永,魏玉艳,郑堤,等. 基于机器视觉技术的智能投饵方法研究[J]. 热带海洋学报,2015,34(4):90-95.
Hu Liyong, Wei Yuyan, Zheng Di, et al. Research on intelligent bait casting method based on machine vision technology[J]. Journal of Tropical Oceanography, 2015, 34(4): 90-95. (in Chinese with English abstract)
[8] Chen G, Cai L. Survey of Marine Organisms Based on Passive Acoustic Technology[J]. International Journal of Design & Nature and Ecodynamics, 2020, 15(5): 729-737.
[9] Silva J F, Hamilton S, Rocha J V, et al. Acoustic characterization of feeding activity of Litopenaeus vannamei in captivity[J]. Aquaculture, 2019, 501: 76-81.
[10] Peixoto S, Soares R, Allen D D. An acoustic based approach to evaluate the effect of different diet lengths on feeding behavior of Litopenaeus vannamei[J]. Aquacultural Engineering, 2020, 91: 102114.
[11] Lagardère J P, Mallekh R. Feeding sounds of turbot (Scophthalmus maximus) and their potential use in the control of food supply in aquaculture: I. Spectrum analysis of the feeding sounds[J]. Aquaculture, 2000, 189(3): 251-258.
[12] Mallekh R, Lagardère J P, Eneau J P, et al. An acoustic detector of turbot feeding activity[J]. Aquaculture, 2003, 221(1-4): 481-489.
[13] 李宏松,苏健民,黄英来,等. 基于声音信号的特征提取方法的研究[J]. 信息技术,2006(1):91-94.
Li Hongsong, Su Jianmin, Huang Yinglai, et al. The research on characteristics extraction based on voice signal[J]. Information Technology, 2006(1): 91-94. (in Chinese with English abstract)
[14] 梁维谦,许海国,陈一宁等. 应用于语音识别片上系统的语音检测算法[J]. 电路与系统学报,2003(2):66-70.
Liang Weiqian, Xu Haiguo, Chen Yining, et al. Two Forms of Ohm's Law on Anisotropic Basic Electronic Elements[J]. Journal of Circuits and Systems, 2003(2): 66-70. (in Chinese with English abstract)
[15] 张雪英. 数字语音处理及MATLAB仿真第2版[M]. 北京:电子工业出版社,2016:27-48.
[16] 余伶俐,蔡自兴,陈明义. 语音信号的情感特征分析与识别研究综述[J]. 电路与系统学报,2007(4):76-84.
Yu Lingli, Cai Zixing, Chen Mingyi. Study on emotion feature analysis and recognition in speech signal: An overview[J]. Journal of Circuits and Systems, 2007(4): 76-84. (in Chinese with English abstract)
[17] Sithara A, Thomas A, Mathew D. Study of MFCC and IHC feature extraction methods with probabilistic acoustic models for speaker biometric applications[J]. Procedia Computer Science, 2018, 143: 267-276.
[18] Zgank A. Acoustic monitoring and classification of bee swarm activity using MFCC feature extraction and HMM acoustic modeling: 2018 ELEKTRO,2018[C]. Mikulov: Czech Republic IEEE, 2018.
[19] Kasumyan A. O. Sounds and sound production in fishes[J]. Journal of Ichthyology, 2008, 48(11): 981-1030.
[20] 汤涛林,唐荣,刘世晶,等. 罗非鱼声控投饵方法[J]. 渔业科学进展,2014,35(3):40-43.
Tang Taolin, Tang Rong, Liu Shijing, et al. Acoustic control of feeding in Tilapia culture[J]. Progress in Fishery Sciences, 2014, 35(3): 40-43. (in Chinese with English abstract)
[21] Lagardère J. P, Mallekh R, Mariani A. Acoustic characteristics of two feeding modes used by brown trout (Salmo trutta), rainbow trout (Oncorhynchus mykiss) and turbot (Scophthalmus maximus)[J]. Aquaculture, 2004, 240(1-4): 607-616.
[22] Muller M, Osse J W M. Hydrodynamics of suction feeding in fish[J]. The Transactions of the Zoological Society of London, 1984, 37(2): 51-135.
[23] 宣传忠,武佩,马彦华,等. 基于功率谱和共振峰的母羊发声信号识别[J]. 农业工程学报,2015,31(24):219-224.
Xuan Chuanzhong, Wu Pei, Ma Yanhua, et al. Vocal signal recognition of ewes based on power spectrum and formant analysis method[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(24): 219-224. (in Chinese with English abstract)
[24] 余礼根,滕光辉,李保明,等. 蛋鸡发声音频数据库的构建与应用[J]. 农业工程学报,2012,28(24):150-156.
Yu Ligen, Teng Guanghui, Li Baoming, et al. Development and application of audio database for laying hens[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(24): 150-156. (in Chinese with English abstract)
[25] 李志忠,滕光辉. 基于改进MFCC的家禽发声特征提取方法[J]. 农业工程学报,2008(11):202-205.
Li Zhizhong, Teng Guanghui. Feature extraction for poultry vocalization recognition based on improved MFCC[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2008(11): 202-205. (in Chinese with English abstract)
[26] Lee C H, Chou C H, Han C C, et al. Automatic recognition of animal vocalizations using averaged MFCC and linear discriminant analysis[J]. Pattern Recognition Letters, 2006, 27(2): 93-101.
[27] Tu Q Z, Huang H Y, Li L, et al. Feature extraction and analysis of passive underwater acoustic signals for different species and quantities of freshwater fish[J]. Transactions of the ASABE, 2018, 61(5): 1505-1513.
Acoustic characteristics of the feeding pellets forin circulating aquaculture
Cao Xiaohui1,2, Liu Huang2※, Qi Renyu1,2, Zhang Chenglin2, Liu Shijing2
(1.,,201306,; 2.,,200092,)
A passive acoustic technology has been widely used to monitor the behavior of aquatic organisms for the intelligent feeding system in recent years. Taking six sizesofas research objects, this study aims to acquire the acoustic signals of pelletfeeding in circulating aquaculture using passive acoustic techniques. The signals were first identified to classify for the post-processing using simultaneous audio and video recordings during feeding. The feeding activity was then quantified to extract and screen the characteristic parameters from the acoustic signals. Six kinds of pre-processing were utilized for thefeeding sound signals, including A/D conversion, denoise, pre-emphasis, windowed framing, and endpoint detection. A Fast Fourier transform, real-time, and Mel frequency cepstrum methods were also used to extract the time- and frequency-domain features of each swallowing signal in the complete feeding acoustic signal, in order to obtain the correlation between each acoustic feature parameter and the swallowing order. Specifically, the swallowing interval, the peak-to-peak value of voltage, and the maximum amplitude were extracted from the time-domain features. It was found that the swallowing interval was positively correlated with the order of swallowing (>0.68), whereas, the maximum and range amplitude was negatively correlated with the order of swallowing (<-0.61), but there was no significant difference between the correlation coefficient of three time-domain characteristic parameters. Furthermore, the maximum sum of power intensity and integral value was extracted from the power spectrum of each swallowing signal. Among them, P=0.05 was assumed as the basis to evaluate the integral value of power, where a more stable and reliable measurement was achieved for the characteristic parameters of feeding activity. In addition, the formant frequency and the average Mel cepstrum coefficient (AMFCC) were extracted to find each acoustic signal of feeding mainly in 4.2-7.4 kHz. More importantly, the third coefficient in AMFCC presented an outstanding and stable peak. Particularly, the feeding activity decreased significantly, as the feeding sequence increased. The extraction of power integral parameters depended significantly on subjective factors, although both time domain and frequency domain parameters presented an excellent correlation with the order of swallowing. The feature parameters of the time domain also behaved more reliable stability. Subsequently, the feature parameters for the activity of eating were screened out, according to the correlation between the acoustic feature parameters of ingestion and the order of swallowing. Correspondingly, the feature parameters of multi-feature fusion can be expected to better quantify the feeding activity, indicating the best choice for the swallowing interval and peak-to-peak value of voltage. The finding can also provide theoretical support to identify the sound signal of farmed fish in the intelligent feeding system.
aquaculture; feeding behavior; acoustic signal;
曹晓慧,刘晃,戚仁宇,等. 循环水养殖大口黑鲈摄食颗粒饲料的声学特征[J]. 农业工程学报,2021,37(20):219-225.doi:10.11975/j.issn.1002-6819.2021.20.025 http://www.tcsae.org
Cao Xiaohui, Liu Huang, Qi Renyu, et al. Acoustic characteristics of the feeding pellets forin circulating aquaculture[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(20): 219-225. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2021.20.025 http://www.tcsae.org
2021-08-24
2021-10-04
上海市科技兴农项目(沪农科推字(2019)第3-2号);国家重点研发计划项目(2021YFE0108700);中国水产科学研究院渔业机械仪器研究所基本科研业务费资助(2017YJS006)
曹晓慧,研究方向为养殖鱼类行为研究。Email:18839772622@163.com
刘晃,研究员,硕士生导师,研究方向为水产养殖工程。Email:liuhuang@fmiri.ac.cn
10.11975/j.issn.1002-6819.2021.20.025
S951.2
A
1002-6819(2021)-20-0219-07