一种优化的语音信号处理方法

2021-06-08 21:59伍松吴小龙魏晟弘
广西科技大学学报 2021年2期
关键词:高斯矩阵重构

伍松 吴小龙 魏晟弘

摘  要:为了解决传统利用壓缩感知采集语音信号的方法中所用的测量矩阵难以硬件实现,且所用的重构方法过于繁琐导致重构时间过长的问题,采用0-1随机矩阵对语音信号进行测量,用分段正交匹配追踪算法对语音信号进行重构.实验结果表明,优化后的方法可以很好地解决传统压缩感知中硬件难以实现和重构算法繁琐的问题.该方法中所用的0-1随机矩阵便于硬件实现,所用的分段正交匹配追踪(StOMP)算法能够加速信号的重构.

关键词:压缩感知;语音信号;0-1随机矩阵;分段正交匹配追踪

中图法分类号:TN912.3;   DOI:10.16375/j.cnki.cn45-1395/t.2021.02.013

0引言

通信技术中一个重要的部分是语音信号的处理.传统的奈奎斯特采样定理指出,必须用大于或等于整个信号最高频率两倍的采样频率来恢复原始信息才能使其不失真.近年来提出的压缩感知理论能够使信号的采样和压缩在同一步骤中进行,从而可以采用比奈奎斯特采样频率低得多的采样频率重构信号,并且原始信号几乎可以恢复而没有失真[1-2].这大大降低了信号采样率,降低了数据存储和传输的成本.

高斯随机矩阵、哈达玛矩阵和伯努利矩阵等都属于压缩感知中常用的测量矩阵,能够很好地满足压缩感知对测量矩阵的要求.但这些矩阵多为稠密矩阵,元素所需的储存空间大,而且由于其非结构化的本质导致其计算复杂,不利于硬件实现.

除了测量矩阵,重构算法也是压缩感知中一个核心的部分.常用的重构算法主要分为3种:第一种是凸优化算法,主要有基追踪算法、稀疏重构梯度投影算法等[3-4];第二种是贪婪算法,主要有匹配追踪算法、正交匹配追踪算法等[5-6];第三种是非凸优化算法,主要有迭代重加权算法.而其中贪婪算法[7-8]是求解稀疏化问题最基础的方法.贪婪算法基于最小l0范数[9],其中正交匹配追踪(orthogonal matching pursuit,OMP)[10]算法是使用较为广泛的算法.但上述算法的过程较为繁琐,当信号数量增多时,重构精度不高,运算时间过长.

对于上述问题,采用0-1随机矩阵对语音信号进行测量,采用分段正交匹配追踪(stagewise orthogonal matching pursuit,StOMP)算法[8]对语音信号进行重构.经实验验证,该方法可行.

StOMP算法当中通过残差r_n控制步长的选取,当残差较大的时候选择大步长快速逼近近似值,当残差较小时,通过小步长逐渐挑选影响较大的元素,在保证重构精度的同时也加速了整个信号重构的进程,很好地解决了原始算法重构时间过长的问题.并且该算法不需要提前知道信号的稀疏度,通过增量矩阵的长度与观测矩阵的行数作比较,来控制迭代的次数,使压缩感知中的矩阵与重构算法的联系更为紧密.

3实验结果对比与分析

为了验证上述算法和矩阵的有效性,分别采用高斯矩阵和0-1随机矩阵,OMP算法和StOMP算法对语音信号进行重构,变换基为傅里叶变换矩阵.该语音信号设置为4个频率,分别为[f1]=50 Hz,[f2]=100 Hz,[f3]=200 Hz,[f4]=400 Hz,采样频率为  800 Hz.所用软件为Matlab2015b.

图2为两种测量矩阵与两种算法相互组合对语音信号进行重构的测量矩阵行数与重构概率的关系图,测量矩阵的列数为256,行数介于1~256之间,图中重构概率介于0~1之间,每隔20个行数计算一次重构概率,每个重构概率重复计算100次.信号重构的误差是重构值与原信号之间差值的绝对值.重构误差小于10-8则重构成功,重构概率为重构成功的次数与总次数的比值.信号稀疏度是信号中未知数的个数.

由图2(a)和图2(b)可知,0-1随机矩阵重构概率要高于高斯随机矩阵.由图2(a)和图2(c)可知,StOMP算法重构信号的概率要优于OMP算法.此外,信号稀疏度K为12时,重构概率从12开始计算;K为20时,重构概率从20开始计算;K为28时,重构概率从28开始计算;K为36时,重构概率从36开始计算.因为当测量矩阵的行数小于稀疏度时,就要从P个方程中解P+1个未知数,这是一个欠定性问题,没有具体解.由图2(a)和图2(c)还可以看出各个稀疏度在测量矩阵行数较少时计算的重构概率并不一定为1,因为在压缩感知中,理论上求解P个未知数需要P个方程,但在实际观测当中,并不一定能够观测并保存信号中最重要的P个原子,这与测量矩阵、变换基和重构算法的设计相关.

表1为不同测量矩阵与不同算法下重构信号所用时间,从表1可知,运用StOMP算法比OMP算法节省很多时间.这是因为StOMP算法每次不再只计算一列元素,而是一次计算多列元素,并且根据运算过程中残差的改变,对具体需要计算的列数作出判断.

图3为高斯矩阵和0-1随机矩阵分别重构语音信号的波形图,重构算法采用OMP算法,两种矩阵的维数均设置为128×256,采用高斯矩阵重构信号的误差为6.72×10-14,采用0-1随机矩阵重构信号的误差为6.21×10-14,再次说明采用0-1随机矩阵效果更好,且0-1随机矩阵相比于高斯矩阵更易于硬件实现.

4理论分析

常用的高斯矩阵、伯努利矩阵等由于其内部元素是随机产生的数,所以其硬件实现比较困难.本文采用的0-1随机矩阵元素简单,易于硬件实现,并且可以很好地记录原始信号当中重要的元素.StOMP算法对比之前常用的重构算法,解决了此前迭代过程繁琐的问题,在保证重构精度的同时,大大缩短了运行时间.对于一个语音信号,时域特性就是信号强度随时间的变化规律,频域特性就是信号是由很多单个频率信号合成.分析时域和频域的一种方法是傅里叶分析.傅里叶原理表明,连续测量的信号可以表示为不同频率的正弦信号的无限叠加.基于此原理的傅里叶变换算法使用直接测量的原始信号来累计计算信号中各种正弦波的频率、幅度和相位.因此,采用傅里叶变换矩阵当作变换基.

5结论

在用压缩感知的方法对语音信号进行重构时,采用0-1随机矩阵当作测量矩阵,解决了此前测量矩阵难以硬件实现的问题;对于重构算法,采用StOMP算法解决了此前重构算法重构信号精度不高,算法运行时间过长的问题.

参考文献

[1] CANDES E J,TAO T. Decoding by linear programming[J]. IEEE Transactions on Information Theory,2005, 51(12):4203-4215.

[2] EFTEKHARI A,HAN L Y,ROZELL C J,et al. The restricted isometry property for random block diagonal matrices[J].Applied and Computational Harmonic Analysis,2015,38(1):1-31.

[3] ZHANG R,SEN M K,SRINIVASAN S. A pre-stack basis pursuit seismic inversion[J].Geophysics,2013, 78(1):1-11.

[4] DENG J,REN G H,JIN Y S,et al. Iterative weighted gradient projection for sparse reconstruction[J]. Information Technology Journal,2011,10(7):1409-1414.

[5] HUANG H L,MAKUR A.Backtracking-based matching pursuit method for sparse signal reconstruction[J]. IEEE Signal Processing Letters,2011,18(7):391-394.

[6] YANG B,LI S T.Pixel-level image fusion with simultaneous orthogonal matching pursuit[J].Information Fusion,2012,13(1):10-19.

[7] NEEDELL D,VERSHYNIN R.Uniform uncertainty principle and signal recovery via regularized orthogonal matching pursuit[J].Foundations of Computational Mathematics,2009,9(3):317-334.

[8] DONOHO D L,TSAIG Y,DRORI I,et al.Sparse solution of underdetermined systems of linear equations by stagewise orthogonal matching pursuit[J].IEEE Transactions on Information Theory,2012,58(2):1094-1121.

[9] 李穎,王泽,王军华,等.基于l0范数近似最小化的稀疏信号重构方法[J].计算机工程与应用,2015, 51(10):200-204.

[10]   刘记红,黎湘,徐少坤,等.基于改进正交匹配追踪算法的压缩感知雷达成像方法[J].电子与信息学报,2012,34(6):1344-1350.

[11]   劳兴松,李思敏,唐智灵.大规模MIMO系统的贝叶斯匹配追踪信道估计算法[J].广西科技大学学报, 2017,28(2):8-16.

[12]   李春贵,陶佳伟,周爱霞.基于邻域能量的压缩感知医学图像融合研究[J].广西科技大学学报,2016,27(4):15-20.

[13]   CAND?S E J.The restricted isometry property and its implications for compressed sensing[J].Comptes Rendus Mathematique,2008,346(9-10):589-592.

[14]  DONOHO D L.Compressed sensing[J].IEEE Transactions on Information Theory,2006,52(4):1289-1306.

An optimized voice signal processing method

WU Song1, 2, WU Xiaolong1, 2, WEI Shenghong1, 2

(1.School of Mechanical and Traffic Engineering, Guangxi University of Science and Technology, Liuzhou 545006, China;2. Guangxi Key Laboratory of Automobile Components and Vehicle Technology (Guangxi  University of Science and Technology), Liuzhou 545006, China)

Abstract: To solve the problem that the measurement matrix used in the traditional method of using compressed sensing to collect voice signals is difficult to implement in hardware, and the reconstruction method used is too cumbersome, resulting in a long reconstruction time, a 0-1 random matrix is used to measure the speech signal, and stagewise orthogonal matching pursuit algorithm is used to reconstruct the speech signal. The experimental results show that the optimized method can well solve the problem of difficult hardware implementation and cumbersome reconstruction algorithm in traditional compressed sensing. The 0-1 random matrix used in this method is convenient for  hardware implementation, and stagewise orthogonal matching pursuit algorithm used can speed up   signal reconstruction.

Key words: compressed sensing; speech signal; 0-1 random measurement matrix; stagewiseorthogonal matching pursuit

(责任编辑:黎   娅)

收稿日期:2020-10-11

基金项目:国家自然科学基金项目(51665006);广西汽车零部件与整车技术重点实验室自主研究课题(2017GKLACVTZZ01)资助.

作者简介:伍松,高级实验师,硕士研究生导师,研究方向:机械振动与噪声控制、信号处理、压缩感知,E-mail:swu262160@163.com.

猜你喜欢
高斯矩阵重构
长城叙事的重构
重构
数学王子高斯
学科哲学导向的高中历史教学重构
动脑算算题
多项式理论在矩阵求逆中的应用
矩阵
矩阵
矩阵
基于FPGA的动态可重构系统设计与实现