秦 颢 刘 军 张 宸
(北京物资学院 信息学院,北京101149)
国务院新闻办公室发布的《中国的粮食安全》白皮书指出2001 年至2018 年年均进口的粮食总量中,大豆占比为75.4%[1]。不难看出,中国的大豆需求量远远高于生产量,缺口巨大,如何提高大豆产量迫在眉睫。大豆在生长、收获和运送途中,种皮都有可能产生裂纹。大豆种皮产生裂纹后,种皮损伤严重的会降低种子发芽力和种子活力,同时会使籽粒和幼苗遭受微生物及害虫的侵害,其造成产量损失约计8.6%~12.3%[2]。因此,必要的种子检验可以选出优质大豆,这对于大豆的增产意义重大。介于传统的人工筛选法和机器筛选法对于种皮裂纹这一物理性状的识别效率不高,实现对大豆种皮裂纹更高效的自动化识别就有着一定的研究意义。
本研究对大豆撞击碰撞板产生的声音进行处理与识别,进而区分种皮完好大豆与种皮裂纹大豆,其依据是不同的物理结构会产生不同的声音。本文的研究内容是大豆碰撞声的预处理方法,以待为后展开的特征参数提取和模型识别奠定基础。
大豆碰撞声信号的预处理主要包括前端处理,降噪处理和端点检测。前端处理主要包括碰撞声信号的采样、量化、预加重、分帧和加窗[3]。
采样是按照既定规则在原始信号上取值,将原本连续的模拟原始信号离散成一个个值。当采样频率大于两倍原始信号最高频率时,采样生成的信号可替代原始信号,大大提高了可靠性。
量化就是用最接近的电平值代替采样得到的瞬时值。
大豆碰撞声信号经过采样变成离散信号,再通过量化变成计算机能够处理的数字信号。
在信号传递时,碰撞声信号高频分段会受损。为了抵消这种信号衰减以及降低信号失真带来的影响,就需要传输前对信号高频部分进行预加重。预加重一般采用一阶数字滤波器,其公
图1 大豆碰撞声信号预加重
经过预加重的大豆碰撞声信号如图1 所示,可以明显看出信号的高频部分得到了加强,信噪比得到提高。
碰撞声信号整体是不稳定的,但从局部来看,信号是稳定的[4]。分帧是对信号进行加窗处理,得到一个一个的信号帧片段,这些片段都具有短时平稳性。常用的窗函数包括矩形窗、汉明窗和汉宁窗。
矩形窗
汉明窗
汉宁窗
一般情况下,多使用汉明窗,但也要根据实际的情况选择不同的窗函数。
由于外部噪声的存在,录制的大豆碰撞声信号伴有噪声,这对信号原始的声学特性造成了破坏。为了还原信号和降低噪声对后续相关分析的影响,就需要对采集到的碰撞声信号进行降噪处理。
噪声是指一切干扰人们休息、学习和工作的声音,即人们不需要的声音[5]。具体来说,大豆碰撞声信号是带噪信号,其中原始的纯粹碰撞声信号为目标信号,而同时采集到的环境声就是噪声。
噪声具有可加性,通常分为冲击噪声、周期噪声、宽带噪声等。
3.2.1 冲击噪声
冲击噪声一般来源于一些突发事件,比如爆破,打雷等,其声音信号的瞬时幅值一般都非常大。消除冲击噪声的一种方法是对带有噪声的信号幅度求均值,并以此为判断阈值,高于此值即为冲击噪声,将其滤除。
3.2.2 周期噪声
周期噪声,顾名思义就是有规律的重复的噪声,比如匀速运转的风扇、发动机所发出的噪声。一般可以利用高通或低通滤波器滤除。
3.2.3 宽带噪声
宽带噪声的频率比较均衡,从低频到高频都有,因此比较难以消除。
3.3.1 滤波降噪
基于滤波的信号降噪法通常用来滤除信号中特定频率的噪声信号,或者在特定的频率范围内对信号的频谱进行整形[6]。周期噪声的频率有一定规律,利用滤波器可以有效消除。如果可以精确估算出噪声信号,那么滤波降噪效果将十分显著。常用的滤波器有三个:固定滤波器、自适应滤波器和傅里叶变换滤波器。
3.3.2 小波降噪
对于混有复杂噪声的信号,传统的傅立叶变换局限性较大,而小波变换具有多尺度分辨率、选基灵活、时域和频域局部化特性、去相关性等特点,对于信号,通过多层分解,使得噪声在不同的层上可以有良好的区分[7]。
小波降噪的原理为:经过小波变换,原始信号的小波系数较噪声的小波系数而言较大。只要能够选取到合适的阀值,就能有效区分原始信号和噪声,从而达到降噪的目的。
短时过零率就是一帧语音信号经过零电平的次数[8]。
由图2 可知,噪声相比于碰撞声信号幅值较小,所以大豆碰撞声信号的过零率反而明显小于背景噪声的过零率。与此同时,碰撞声信号的起始点与噪声区别不大,造成了过零率比较相近的结果,不能够准确判别目标信号的起始点,因此基于过零率的端点检测不适合含噪大豆碰撞声信号端点的判断。
图2 基于短时过零率的端点检测
通常,噪声蕴含的能量远远不如碰撞声信号蕴含的能量。高信噪高条件下,可以利用短时能量区分碰撞声信号和噪声。
定义碰撞声信号x(n)的短时能量[9]为:
图3 基于短时能量的端点检测
从图3 可以看出,在高信噪比的条件下,可利用短时能量对整段音频信号进行端点检测,得到碰撞声信号。然而在实际应用中,不能够完全保证较高的信噪比,这时往往需要结合其他特征对信号进行综合检测。
设碰撞声信号时域波形为x(n),加窗分帧处理后得到的第i帧语音信号为xi(m),则xi(m)满足
式中,ω (m)为窗函数;i = 0,1,2,···;N 为帧长;T 为帧移长度。
对xi(m)进行离散傅里叶变换可得频谱[10]
定义均值为
频带方差为
图4 基于频带方差的端点检测
由计算公式可知,影响频带方差的因素有碰撞声信号的短时能量和频带的幅度大小,而碰撞声信号的能量和频带幅度大小比噪声要大,因此碰撞声信号的频带方差要更大些。由图4可知,利用频带方差可以有效区分碰撞声信号和噪声。
式中,pi(k) 为第i 帧第k 个频率分量fk对应的概率密度;N为FFT 长度。
每个分析语音帧的短时谱熵定义为
由图5 所示,谱熵对大豆碰撞声信号和噪声的区分度不太明显,因此不太适合碰撞声信号的端点检测。
从短时过零率、短时能量、频带方差和谱熵四个方面对碰撞声信号的端点检测进行验证,初步得到了短时能量和频带方差可以用于大豆碰撞声信号的端点检测。
图5 基于谱熵的端点检测
本文对大豆碰撞声信号的预处理方法进行了研究学习,主要包括信号的预加重、加窗、分帧、降噪和端点检测,并得到了初步的结果。这为之后的大豆碰撞声信号特征参数的选取和模型的识别奠定了基础。但是,大豆碰撞声信号的预处理过程仍然存在一些问题:一是录制环境比较安静,信噪比较高,但实际运用中可能没这么理想;二是处理的效率还有待加强。