基于分块压缩感知图像重构算法研究

2017-05-08 07:22黄寒冰
科技创新与应用 2017年12期

黄寒冰

摘 要:近年来,压缩感知作为一种新型的信息获取与压缩框架,被广泛用于图像的编解码。其中分块压缩感知作为一种有效的编解码框架,得到了国内外广泛的关注。该框架首先对图像进行分块处理,依次对每个分块进行采样和压缩传输。在其解码端依次对每个分块进行重构,最后将分块重组成完整的图像。这一框架能有效降低编码的复杂度,减少内存的开销;并使得解码端图像重构的速度得到显著提高,保证传输的实时性。然而,采用块处理的方式会降低图像的重构质量。针对这一问题,文章对其阈值迭代重构算法进行了研究,采用自适应硬阈值方案,保留图像更多的细节信息,从而提高图像重构质量,并通过仿真实验验证了方案的可行性。

关键词:分块压缩感知;重构算法;阈值迭代

Abstract: Recent years, compressed sensing as a novel information acquisition and compression framework has been widely exploited into image compression codec. Whereby, Block Compressed Sensing is considered as an efficient framework having received widespread attention. In the framework, firstly, the image is blocked, and the blocks are sampled and compression transmitted by using the traditional compression sensing mode. The decoder successively reconstructs each blocks, and finally recombines blocks into a complete image. This framework can reduce the complexity of coding and overhead of memory efficiently, and improves the speed of decoding so that the real-time transmission of image is guaranteed. However, the quality of reconstruction would be reduced by the way of block processing. In this paper, we introduce the principle and framework of block compression sensing, and study the corresponding iterative threshold reconstruction algorithm. As a result, the soft threshold scheme is used to preserve more details of image, so as to improve the quality of reconstruction. Finally, the feasibility is verified by simulation results.

Keywords: Block compressed sensing; Reconstruction algorithm; Threshold iteration

1 概述

在傳统数字图像系统中,图像通过JPEG[1]或JPEG2000[2]图像编码器对数字图像进行编码,从而使图像信号能够得到有效的压缩和存储。然而,这类编码器的运算复杂度高,不适合应用于低功率、低像素的图像设备。

近年来,一种新型的采样方案压缩感知理论被提出。压缩感知理论[3]中证明,若信号存在稀疏表示,那么就可以通过一个与变换基不相关的测量矩阵对信号进行稀疏采样,获得的观测信号就是原信号的压缩形式。

但是在实际应用中,若对图像进行整体的观测压缩,那么在解码端计算复杂度会随着图像尺寸的增大呈几何倍数增加,导致解码速度缓慢。Lu Can[4]受到JPEG分块结构的启发,提出了分块压缩感知框架。编码端不再需要大尺寸的观测矩阵,在减小了编码端的内存开销的同时,提高了处理的实时性,同时对于解码端的处理,因为观测尺寸减少、重构复杂度下降,加快了重构速度。

2 压缩感知概述

压缩感知原理:

压缩感知是近年来被提出的新型信号采样理论,该理论的两大特点是不受限于奈奎斯特采样速率,以及在采样的同时,对信号进行压缩。在2004年,Donoho、tao[3]等人证明了,只要一个信号在某个变换域中存在稀疏表示,那么就可以对信号进行降维采样,而采样得到的信号包含原始信号的全部信息。

假设有一个 维信号x∈RN×1,若x是稀疏的,不同于传统的采样,压缩感知理论对信号进行线性测量:

y=?椎x (1)

这里y∈RM×1,?椎称为测量矩阵,维度为M×N。

然而通过压缩感知得到的信号y是M维的,已知测量矩阵是M×N维的,如果希望通过求解线性方程对信号进行重构是不可能的。但是由于这里的?兹是K稀疏的,即可以将原问题的求解转换为求解x在字典?追的最稀疏表示,即:

3 分块压缩感知

3.1 编码端结构

考虑有一幅Lr×Lc的图像,其像素为N=Lr×Lc。在分块CS中,图像被分为B×B的块,令xi代表第i个块的向量表示,CS的采样输出可以表示为:

这里的?椎B为一个mB×B2的矩阵,mB=■,M为测量数。为了满足RIP条件,这里?椎B为正交化的i.i.d高斯随机矩阵。对整幅图像而言,原式(1)的?椎等价于如下的块对角化矩阵:

由此可知,若对?椎B的采样率进行调整,就能够改变整体系统的采样率,这为硬件设计提供了便利。同时,不同块大小的也会给图像重构带来不同的影响。若块过小,虽然可以减少重构的复杂度、加快重构速度,但同样也降低了质量。

3.2 解码端结构

在文献[4]中指出,分块压缩感知的重构效果之所以随着块尺寸减小而下降,是因为随着分块的数量变多,重构的块效应的影响也就越大。所以该文献提出了基于分块压缩感知的迭代硬阈值重构方案,在提高运算速度的前提下,消除块效应,提高图像的重构质量。

第一步是对每次迭代得到重构图像去块效应,这里采用维纳滤波进行平滑处理。第二步是将上一步得到图像进行域变换,通过硬阈值操作保留最大的K个系数,其余设为零,再进行反变换恢复图像,这样做的意义是去除重构带来的高斯噪声。

3.3 算法改进

上述算法忽略了由于硬阈值操作丢失了部分的细节信息,导致了图像质量的下降。通过改进现有的阈值操作,提高了图像的重构质量。

对阈值处理的改进:

自适应硬阈值方案[5]与硬阈值方案最大的区别在于,自适应硬阈值则是通过设定一个门限值。若系数大于该门限值则保留,反之舍弃。通过该方案的优势在于,该门限值的设定是参考了全体的系数,能够根据系数的分布情况,保留能量占多数的系数。对于能量分散的图像保留的系数将增加,对于能量集中的图像保留的系数也会相应减少。以下是自适应硬阈值的函数表示:

这里的?子(i)代表第i次迭代阈值函数的门限值,其计算公式如式(6):

这里的?姿是控制收敛速度的常数因子,K代表变换系数的个数,而?滓(i)在文献中指出是通过中值估计得到的:

改进之后的重构算法如表1所示:

4 仿真结果

为了评估上述压缩感知重构方案,采用matlab搭建平台进行仿真验证。

这里采用离散傅立叶基作为变换域的基,首先比较在0.3采样率的情况下,对lenna图的恢复。由于lenna图存在大量的细节信息,采用自适应硬阈值可以保留更多的细节信息,可以直观地体现出其优势。

图1(a)为自适应硬阈值重构lenna部分图像,图1(b)为硬阈值重构lenna部分图像,从帽子的细节可以看出,自适应硬阈值的表现力更强,还原度更高,而硬阈值重构的图像在羽毛部分存在大量的模糊。所以从视觉的角度考虑,自适应硬阈值更符合人的观察习惯。

从仿真曲线来看,不论是高采样率还是低采样率,自适应硬阈值方案的重构质量都高于硬阈值方案。尤其是在低采样率的情况下,自适应硬阈值方案能够保留更多的细节信息,使其重构质量得到明显的提升。

最后,为了验证方案的普适性,加入更多的图像对两种阈值方案进行比较。

从最后的仿真结果可以发现,在多数情况下,自适应硬阈值的重构质量都优于硬阈值。尤其是在低采样率的情况下,自适应硬阈值的优势更加明顯。由此可以得出结论,自适应硬阈值方案更加适合分块压缩感知的重构框架。

5 结束语

本文主要介绍了分块压缩感知框架,讨论了该框架应用于图像压缩的优缺点以及如何去除块效应带来的重构噪声,并对重构算法中的阈值函数进行了改进。最后,通过与硬阈值函数的对比,发现自适应硬阈值算法适合更多场景的重构。虽然压缩感知图像编解码的效率依然不及传统的图像编解码框架,但相信在未来,基于压缩感知的低编码复杂度的图像或视频框架将得到广泛的应用。

参考文献

[1]Digital Compression and Coding of Continuous-tone Still Image-Part 1:Requirements and guidelines ISO/IEC 10918-1, JPEG Coding Standard,1991.

[2]Information Technology-JPEG 2000 Image Coding System-Part 1: Core Coding System ISO/IEC 15444-1, 2000.

[3]D. L. Donoho, "Compressed sensing," IEEE Trans. Inform.Theory, vol. 52, pp. 1289-1306, July 2006.

[4]L. Gan, "Block compressed sensing of natural images," in Proceedings of the International Conference on Digital Signal Processing, Cardiff, UK, July 2007, pp. 403-406.

[5]D. L. Donoho, "De-noising by soft-thresholding," IEEE Transactions on Information Theory, vol. 41, no. 3, pp. 613-627, May 1995.