叶文雄
(广西中烟工业有限责任公司广西 南宁 530001)
等间隔采样的信号拆分方法在压缩感知中的应用
叶文雄
(广西中烟工业有限责任公司广西 南宁 530001)
基于压缩感知重构算法中常用的OMP算法,针对压缩感知在处理整段大数据量信号时存在的重构效率低,以及处理过程需为观测矩阵开辟巨大存储空间的问题,考虑到将信号进行合适拆分后再运用压缩感知进行处理,同时针对常规信号拆分方法,即常规分段方法存在的局限性,提出一种等间隔采样的信号拆分方法。通过实验分析,以上所提问题得以解决,基于此拆分信号方法的信号在压缩感知处理中,重构信号质量及效率都得到较大的提高;同时相对于常规信号分段方法,此信号拆分方案适用于任何类型的信号,适用范围更广。
压缩感知;大数据量信号;信号拆分;正交匹配追踪(OMP)
传统奈奎斯特采样定理要求信号的采样频率必须大于信号最高频率的两倍,受其约束。然而为满足实时性要求和提高分辨率及精确度,某些系统在信号处理过程与硬件设备要求上面临着信号高采样率,数据处理效率慢及存储空间巨大等问题的严峻挑战。
近年来,D.Donoho、E.Candes及T.Tao等提出了一种全新的信号采样理论——压缩感知(Commpressed Sensing,CS)。理论指出,在信号满足稀疏性的条件下,在信号获取的同时就对数据进行适当压缩,其采样率可远低于奈奎斯特采样率。
由于CS的特殊性质以及对传统奈奎斯特采样定理的,其一经提出,在信息论,图像处理、模式识别、无线通信、雷达成像、医学成像等领域得到了广泛的研究与应用,同时引起广大信号处理专家及数学家的兴趣,迅速成为了信号处理领域的一个研究热点。
传统的信号采集、编解码过程如图1所示:编码端先对信号进行采样,再对所有采样值进行变换,并将其中重要系数的幅度和位置进行编码,最后将编码值进行存储或传输:信号的解码过程仅仅是编码的逆过程,接收的信号经解压缩、反变换后得到恢复信号。采用这种传统的编解码方法,由于信号的采样速率不得低于信号带宽的2倍,使得硬件系统面临着很大的采样速率的压力。此外在压缩编码过程中,大量变换计算得到的小系数被丢弃,造成了数据计算和内存资源的浪费。
图1 传统信号编解码流程图
压缩感知理论指出,只要信号时可压缩的或在某个变换基上的分解表示结果呈现稀疏性,那么就可以用一个与变换基不相关的测量矩阵(RIP准则)将稀疏变换后的高维信号投影到一个低维空间上,最后可通过对优化问题的求解即可高精度重构出原始信号。
压缩感知理论框架下的信号编解码流程图如图2所示。对于一可压缩稀疏信号X∈RN×1,在某个正交基ψ上得到其稀疏表示Θ=ψTX,其稀疏度用K表示,满足关系K=N。然后设计一个与正交基不相关的M×N维观测矩阵φ,通过观测矩阵φ观测得到低维的M个观测量Y,且满足关系M<N。最后通过求解最优化问题可精确重构或近似逼近原始信号。
图2 压缩感知理论框架下的信号编解码流程图
有一时域观测信号如图3所示,由图可知该信号为稀疏信号。信号长度为580,稀疏度为20。由于信号本身为一稀疏信号,故稀疏变换步骤可以省略。观测矩阵φ选取M×N维的高斯白噪声矩阵。重构算法选取压缩感知在工程上常用的正交匹配追踪(OMP)算法。从图4可看出,经过压缩感知处理后,原始信号得到了精确的重构。
由上可了解到压缩感知在一维信号处理中的应用,然而当所需处理数据量较大时,压缩感知的应用遇到了阻碍。如图4所示信号—高速采样雷电信号,此信号包含雷电峰值信息以及噪声信息,经滤波器处理,噪声基本可忽略。由于系统处理过程中对精确度和分辨率要求较高,每段信号数据量很大,为5000000,稀疏度在60000左右。
图3 基于CS理论的OMP算法对一维信号的重构
图4 雷电信号,数据量500000,稀疏度60000左右
面对类似稀疏信号,应用压缩感知对信号进行处理遇到了障碍,主要存在两个问题:
(1)重构效率太低,由于所使用重构算法复杂度依赖于信号长度、信号稀疏表示后的稀疏度K以及观测矩阵φ的大小,故对此类大数据量信号运用压缩感知处理,重构效率很低,无法达到某些系统的实时性传输要求;
(2)硬件设备压力太大,当信号数据量过大时,压缩感知处理过程中的变换矩阵和M×N维观测矩阵φ元素数量会非常大,使得软件处理过程中需要为它们开辟巨大空间,则容易出现空间分配不足的问题,例如实验证明,对图4的信号,在matlab上采用压缩感知处理时,在分配变换矩阵和测量矩阵时,产生了溢出,压缩感知在此将无法使用。
4.1 针对上文中遇到的两个问题,我们很容易想到一个信号拆分方案,就是将大数据量的信号进行适当常规分段,即从头至尾对信号进行合适数量的分段,再对每段信号运用压缩感知处理。以下是一种常用的信号等长分段方法。
假设有一长度为N一维向量x,记为x(n),n∈[1,2,…,N]。现将其分段,取每段长度为L,则分段数为R=[N/L]。则一维向量可拆分为R段向量,分别记为X1,X2,…,XR。且Xi=x(j),j∈[1+(i-1)×L,…,L+(i-1)×L],其中i∈[l,…,R]。则有X1={x(1),x(2),…,x(L)},依次类推,即可得到所有分段后的信号,且为方便程序设计及实现,若最后一段信号长度不够L,则补零即可。分段处理后,再分别对每一小段信号进行压缩感知处理,再将得到的R段重构信号直接进行连接,即可得到重构的原始大数据量信号。
当然,面对某些结构类型的稀疏信号,此类方法是可行的。在压缩感知处理图像中用到的图像分块处理方法,即用到了类似于上述分段的方法,其原理一样。其中还有一种自适应子信号长度的分段的方法,即可根据信号实际情况决定每段子信号的长度,而不是等长分段,此类方法适用性更强,但由于子信号长短不一,对于子信号的压缩重构过程也比较繁琐,在此对这些方法的的说明就不再赘述。
然而上述的分段方法用来处理图4的大数据信号显然是行不通的。首先分析其原因。由图4可知,从整体上看,该信号属于稀疏信号。但此信号有其自身特点,即非零点相对集中。假设分段长度为1000,则可分为5000段。若简单从头至尾进行分段,则会出现某些子信号全为零值,某些子信号全为非零点的数据段,则得到的大部分子信号将不再满足稀疏信号特性,故用压缩感知进行处理得到的结果必然是错误的。同样,自适应信号长度的分段方法显然也是行不通的。为此,面对以上信号拆分方法存在的问题,此处考虑到一种新的拆分大数据量信号的方法。
4.2 以下提出一种改进的信号拆分方案在压缩感知中的应用
针对于4.1中分段方案存在的问题,此处考虑到一种基于等间隔采样的信号拆分方案。具体实现步骤如下:
(1)同理,假设有一长度为N一维向量x,记为x(n),n∈[1,2,…,N]。现将其分段,根据实际信号结构,取每段长度为L,则分段数为R=[N/L]。则一维向量可拆分为R段向量,分别记为X1,X2,…,XR。则对整段信号即按采间隔为R进行采样,有Xi=x(j),j∈[i+(h-1)×R,h∈[1,…,L]],其中i∈[1,…,R]。即可得Xi={x(i),x(i+R),…,x(i+(L-1)×R)},最终可得到拆分后的所有小段稀疏子信号。同理,为方便程序设计及工程实现,若最后一段信号长度不够,则补零即可。
(2)对每一子信号Xi,取相同的观测矩阵φ0,其维数为M0×N0,且在OMP算法中,取M0=L×P,P∈(0,1),即为采样率,N0=L。对整段信号处理中的M×N维的观测信号φ,取M=N×P,P∈(0,1),N为原始信号的长度,且满足N=N0×R。由上分析易知相对于φ,φ0所需要开辟的存储空间显然要小的很多,故经信号拆分处理后既大大降低了实现过程所消耗存储空间,也在一定程度上加快了压缩感知实现的效率。
(3)根据步骤(2)中的观测矩阵,对每一个子信号Xi进行稀疏量化,得到对应的观测值Yi,再采用OMP算法从以上所得的低维观测值中重构出每个原始子信号Xi,最后根据信号拆分的规则依次插入Xi中各元素,即可得xr={X1(1),…,XR(1),…,X1(j),…,XR(j)},其中j∈[1,…,L],最终可得到重构的信号xr。
在此说明,子信号长度L及采样间隔R的选取与实际信号的长度,信号结构和所用软件、计算机配置相关,子信号数太少或太多都可能达不到分段处理的优化效果。
(1)首先以图3中的原始信号为研究对象,根据其结构特性,为便于研究,此处对信号不进行拆分、分为两个子信号、四个子信号进行对比分析,当然分段数还可以是其它参数,在此不再赘述。不进行拆分的仿真结果在图3已经得到。再基于4.2中的步骤,得到子信号数为2和子信号数为4的信号处理仿真图如图5~8所示,其中各处理过程中采样率均取P=0.5。即信号长度N,观测值个数M,以及对应的观测矩阵φ满足关系:M/N=0.5,且相应的φ的维数为各自对应的M×N。
由于OMP算法存在一定的随机性,故对于每一个拆分方案进行10次实验,并分别求取相应的平均运行时间及平均重构误差。其中单个重构误差计算公式为:误差=(原始信号-重构信号)/原始信号。各项参数对比表如表1所示。
得出结论:在一定范围按4.2中方法内对信号进行拆分后,基于压缩感知的信号处理效率及重构信号质量比未分段之前要高,且在合理范围内,处理效率及重构信号质量与分段数是成正比的。同时,例如在硬件平台上实现时,可对每段信号采取并行处理,信号重构的效率将有质的飞跃。
图5 拆分为两段子信号
图6 重构信号与原始信号比较(拆分数为2)
图7 拆分为四段子信号
图8 拆分为四段子信号
表1 不同子信号数下信号处理时间及重构误差比较
(2)再以图4信号为研究对象,实验证明,若不采取信号拆分处理,在处理过程中将出现变换矩阵与观测矩阵存储空间分配不足的问题,压缩感知根本无法实现。其次若采用4.1的分段方法进行分段,简单分析即可知重构信号结果是错的,从实验结果来看,也得到证实,即重构后得不到原始信号,说明对于此类信号,4.1中的分段方法是行不通的,最后采取4.2中所提出的等间隔采样信号拆分方法,可以精确恢复原始信号,重构误差仅为6.2364e-016。结果如图9所示。
图9 重构雷电信号与原始雷电信号比较
综上,运用信号拆分方法,相对于不进行信号拆分而言,可以大大提高了压缩感知在信号处理过程中的效率,并在一定程度上提高重构信号的质量,同时,对信号处理过程中所需开辟内存也会大大减小,节约了存储空间。
同时对于4.1中的分段方法而言,由于其使用的局限性,无法实现对图4中雷电信号的重构,而文中在4.2提出新的信号拆分方法可以较精确的实现对雷电信号的重构,说明文中所提出的信号拆分方法适用范围更广。
针对基于压缩感知的大数据量信号的处理,本文提出了一种基于等间隔采样的信号拆分方法,将信号拆分后再运用OMP算法进行重构。实验证明,该方法加快了压缩感知中信号处理速度,并提高了信号重构质量,并在一定范围内,优化效果和拆分子信号数量是成正比的。同时相对于简单的将信号常规分段处理来说,文中提出的方法适用范围更广。
在以上研究的基础上,还存在很多需要研究的内容。例如子信号数的数量怎么确定,信号的分段数并不是越多越好,因为子信号也要受到稀疏性这个条件的限制。还有针对OMP算法的稳定性也是一个值得研究的问题等等。
[1]李树涛,魏丹.压缩感知综述.自动化学报,2009,35(11):1~7.
[2]张春梅,尹忠科,肖明霞.基于冗余字典的信号超完备表示和稀疏分解.科学通报,2006,51(6):628~633.
P427.32
A
1004-7344(2016)16-0324-03
2016-4-12