范珍艳 王莲子 庄晓东
摘要:针对传统变换域中信号和噪声交叉重叠较大,无法彻底分离去噪的问题,本文提出了一种基于分数阶傅里叶变换的自适应阈值语音增强方法。对带噪语音信号做分数阶傅里叶变换,采用加权方差方法确定其最优变换阶数。作最优阶数下的分数阶傅里叶变换,在分数阶域自适应确定阈值,采用软硬阈值折衷法进行阈值切割,做分数阶傅里叶反变换得到增强语音信号。同时,将本文算法和传统的维纳滤波法和谱减法进行比较。实验数据和仿真结果表明,分数阶域的自适应阈值去噪方法可有效地去除噪声,得到较好的听觉效果,且去噪效果优于维纳滤波法和谱减法。本方法计算量小,易于实现,具有良好的实用性。
关键词:分数阶傅里叶变换; 最优阶; 自适应阈值; 语音降噪; 信噪比
在语音通信过程中,由于外界环境噪声的干扰,语音通话的质量大大降低,影响人们正常的交流,因此语音增强方法显得尤为重要。一直以来,人们提出了很多语音去噪的方法,经典的方法有谱减法和维纳滤波法[1]。这些传统的语音增强方法对平稳噪声具有良好的去噪效果,但由于没有事先考虑语音和噪声的先验信息,故对非平稳噪声的去噪效果不佳[2]。近年来,分数阶傅里叶变换被广泛应用到信号处理方面。分数阶傅里叶变换是一种广义的傅里叶变换,它是由时频平面内的信号轴绕原点逆时针旋转任意角度所得,是一种很好的信号滤波处理工具[3]。在分数阶傅里叶变换域,由于交叉部分较小,信号的时频域表现更清晰,更适合用于处理非平稳信号[4]。目前,分数阶傅里叶变换已经用于很多领域,例如线性调频脉冲压缩雷达的灵巧噪声干扰抑制[5],微弱信号检测[6],地震信号去噪[7],声呐探测信号鉴别[8]和偏心轮振动台系统的振动信号分析[9]等。王景芳[10]等人提出了一种动态FrFT滤波声音信号语音增强方法,该方法能有效地去噪滤波,且在不同的噪声环境和信噪比条件下具有鲁棒性;P.Kumar等人[11]提出了基于分数阶域的硬阈值语音去噪方法,该方法可以有效去除噪声。由于以上两种FrFT域语音增强方法中,阈值确定方法会造成较大的方差,因此本文提出了一种基于分数阶傅里叶变换的自适应阈值语音去噪方法,以更好地确定阈值,去除噪声,提高语音质量。该研究具有良好的实用性。
1 分数阶傅里叶变换
分数阶傅里叶变换是一种广义的傅里叶变换。信号的分数阶傅里叶变换是时频平面的信号轴绕原点逆时针旋转任意角度所得。分数阶傅里叶变换是用单一变量表示时频信息的线性变换,避免了传统时频分布二次变换的交叉项干扰问题,是一种新的时频分析工具[9]。
4 结束语
本文通过观察语音信号和噪声在FrFT域的能量聚集特性,提出在分数阶傅里叶变换域进行滤波去噪的方法。采用加权方差方法确定最优FrFT变换阶数,且对加噪前后语音最优阶数进行研究,发现加噪前后的最优阶数变化不大。对带噪语音信号进行最优阶数下的分数阶傅里叶变换,自适应确定阈值后,采用软硬阈值折衷法在FrFT域切割幅值去噪,最后做分数阶傅里叶反变换,得到去噪语音信号。仿真结果表明,采用本文方法对含噪连续语音进行去噪,可有效滤除信号中的噪声,提高信噪比,且听觉效果得到较大的改善。同时,将本文方法和传统的维纳滤波法和谱减法进行比较,表明在强噪声环境中,本文方法的去噪效果明显优于维纳滤波法和谱减法。本方法计算量小,且易于实现。该研究具有较好的实用性和使用价值。
参考文献:
[1] 黃苏雨, 梁声灼, 黄苏园. 语音增强方法综述[J]. 计算机与现代化, 2007(3): 16-20.
[2] 陈楠, 鲍长春. 基于双耳线索编码原理的语音增强方法[J]. 电子学报, 2019, 47(1): 227-233.
[3] 步衍瀚, 王平波. 基于分数阶傅里叶变换的滤波[J]. 舰船电子工程, 2016, 36(4): 38-40, 91.
[4] Kumar P, Kansal S. Noise removal in speech signal using fractional fourier transform[C]∥2017 International Conference on Information Communication Instrumentation and Control (ICICIC). Indore: IEEE, 2017.
[5] 韩博文, 杨小鹏. 基于FrFT域滤波的灵巧噪声干扰抑制方法[J]. 信号处理, 2017, 33(12): 1602-1608.
[6] Xia J, Zhang J Y, Li X B, et al. Weak signal detection based on FRFTdomain adaptive filtering algorithm[C]∥2016 CIE International Conference on Radar. Guangzhou, China: IEEE, 2017.
[7] 彭建亮, 彭真明, 张杰, 等. 基于分数域自适应滤波的地震信号去噪方法[J]. 地球物理学进展, 2012, 27(4): 1730-1737.
[8] 丁智慧, 王彪. 基于分数阶傅里叶变换的声呐探测信号鉴别[J]. 舰船科学技术, 2017, 39(9): 142-147.
[9] 高宇, 黄宜坚. 基于分数阶傅里叶变换的振动信号分析[J]. 计量学报, 2012, 33(6): 532-535.
[10] 王景芳, 许慧燕. FRFT滤波的语音增强[J]. 计算机工程与应用, 2012, 48(12): 129-134, 167.
[11] Kumar P, Kansal S, Noise removal in speech signal using fractional fourier transform[C]∥2017 International Conference on Information, Communication, Instrumentation and Control (ICICIC). India: IEEE, 2017.
[12] 杨秀丽, 冯小平. 基于分数阶傅里叶变换的Chirp信号参数估计及恢复[J]. 空间电子技术, 2007, 4(3): 78-81.
[13] Ma D J, Xie X, Kuang J M. A novel algorithm of seeking FrFT order for speech processing[C]∥ 2010 7th International Symposium on Chinese Spoken Language Processing. Tainan: IEEE, 2010: 286-290.
[14] Xiao D, Zhang L Y. The parameters estimation of underwater transient signal based on FRFT[C]∥Proceedings of 2011 International Conference on Electronic & Mechanical Engineering and Information Technology. Harbin: IEEE, 2011: 3781-3784.
[15] Qi S, Guo D X, Zhang B N, et al. LFM and FRFT to a novel FSK method[C]∥2017 6th International Conference on Computer Science and Network Technology (ICCSNT). Dalian, China: IEEE, 2017: 477-481.
[16] Pang N, Xu P J. A new acceleration estimation method based on special FRFT in MIMO radar[C]∥IET International Radar Conference 2015. Hangzhou, China: IEEE, 2015: 1-5.
[17] Ozaktas H M, Arikan O, Kutay M A. Digital computation of the fractional Fourier transform[J]. IEEE Transactions on Signal Processing, 1996, 44(9): 2141-2150.
[18] Candan C, Kutay M A, Ozaktas M. The discrete fractional fourier transform[J]. IEEE Transactions on Signal Processing, 2000, 48(5): 1329-1337.
[19] 李洋洋. 分數阶域最优滤波算法[J]. 电子测试, 2011(12): 23-26.
[20] 姜磊. 基于自适应小波阈值收缩算法的冲击消噪[J]. 测控技术, 2015, 34(1): 45-47, 51.
[21] 林杰, 付梦印, 李道平. 自适应小波阈值去噪算法及在图像处理中的应用[J]. 兵工学报, 2011, 32(7): 896-900.
[22] 赵未莲. 基于小波变换的阈值语音信号去噪[J]. 重庆科技学院学报: 自然科学版, 2005, 7(4): 73-75.
[23] Ling G, Yamada T, Makino S, et al. Performance estimation of noisy speech recognition using spectral distortion and SNR of noisereduced speech[C]∥2013 IEEE International Conference of IEEE Region 10 (TENCON 2013). Xi′an: IEEE, 2013.