基于K-SVD的低信噪比WMSN视频图像稀疏去噪

2014-09-15 01:22褚红亮王世昌
计算机工程与科学 2014年3期
关键词:关键帧字典残差

罗 晖,褚红亮,王世昌

(华东交通大学信息工程学院,江西 南昌 330013)

基于K-SVD的低信噪比WMSN视频图像稀疏去噪

罗 晖,褚红亮,王世昌

(华东交通大学信息工程学院,江西 南昌 330013)

无线多媒体传感器网络WMSN因感知视频等信息的优势而被广泛应用,但受天气、光照等外因干扰,所采集视频图像常含有较为严重的噪声。因此,在低信噪比条件下进行视频图像去噪是保证WMSN视频监测有效性和可靠性的关键。在分析WMSN视频图像特征的基础上,首先对其进行周期性采集、分帧及帧差等预处理;然后对关键帧运用K-SVD训练DCT冗余字典以充分稀疏表示图像特征,并采用基于残差比的改进型Batch-OMP实现关键帧去噪及重构,而对残差帧则基于DCT冗余字典进行稀疏去噪处理;最后,叠加去噪后的关键帧和残差帧,从而整体上实现低信噪比WMSN视频图像的去噪及重构。实验表明,本算法能更加有效地、较为快速地滤除视频图像噪声,适用于低信噪比WMSN视频图像去噪。

稀疏去噪;K奇异值分解;残差比;低信噪比;无线多媒体传感器网络

1 引言

无线多媒体传感器网络WMSN(Wireless Multimedia Sensor Network)[1]是由一组具有计算、存储和通信能力的多媒体传感器节点组成的分布式感知监测网络,常用于智能交通、工业控制等领域。然而,WMSN监测视频不可避免地受到雨雪雾恶劣天气、光照等外界因素的影响,致使图像信噪比低,视觉效果较为模糊;此外,WMSN监测场景复杂,视频图像中存在大量的边缘、纹理等细节信息[2]。传统去噪方法如高斯滤波、小波阈值去噪等,未考虑图像和噪声之间的相互独立性,会丢失图像有用信息、破坏图像原有特征、造成边缘和细节模糊或伪吉布斯效应,从而在整体上降低了视频图像的可解释性,增大了不可预测事故发生的可能性。因此,迫切需要研究适用于低信噪比WMSN视频图像的去噪方法,以保证视频监测的可靠性和有效性。

近年来,信号的稀疏性日益受到关注,广泛应用于信号处理,如图像去噪、压缩传感等。其中,鉴于图像稀疏表示能更好地刻画图像本质特征,并能有效区分图像有用信息和噪声,已形成稀疏去噪理论并应用于视频、图像等去噪领域[3]。其中,作为一种高效的稀疏表示方法,超完备字典在很大程度上决定了图像结构特征能否被有效地表示[4]。依据Mallat S等人提出的超完备字典信号分解思想, 离散余弦变换DCT(Discrete Cosine Transform)冗余字典、多尺度Ridgelet字典[5]以及级联字典等算法得到深入研究。但是,上述基于某种变换框架的字典数学模型较为简单,自适应性不强。为了提高字典自适应性,近几年出现了最优方向法、K-SVD等字典训练方法。其中,Aharon M等人[6,7]提出的K-SVD算法应用最为广泛。K-SVD可同时实现图像的稀疏估计与去噪,对噪声方差较大的图像具有较好的去噪鲁棒性;算法非常灵活,可与常见的稀疏分解最优原子搜索算法,如OMP(Orthogonal Matching Pursuit)[7]、Batch-OMP[8]等,结合使用。其中,正交匹配追踪系列算法因其复杂度较低、运行速度快而被广泛应用,但其通常将硬阈值作为迭代终止条件,会丢失图像的部分有用信息,且在低信噪比下容易引入重构噪声。

为了在保证视频图像去噪有效性的同时,最大限度地保留图像有用信息,避免在图像重构过程中引入噪声,本文首先对WMSN视频图像进行周期性采集、分帧及帧差等预处理,然后对关键帧和残差帧采用不同的去噪算法,保证视频图像质量的同时减少数据量,在整体上实现低信噪比WMSN视频图像的去噪及重构。

实验结果表明,该算法在去除噪声的同时,有效保留了图像的有用信息,能够较为快速地得到视觉效果良好的去噪视频图像,适用于高噪声强度的WMSN监测环境。

2 WMSN视频图像特征分析及预处理

(1)

Figure 1 PPreprocessing of the WMSN video images图1 WMSN视频图像的预处理

对WMSN视频图像进行周期性采集、分帧、帧差等预处理,可以在保证视频图像质量的同时减少数据量、降低网络能耗、提高算法运行速度,以确保WMSN视频监测的有效性和可靠性。

3 基于K-SVD的低信噪比WMSN视频图像稀疏去噪

这里,针对关键帧的稀疏去噪加以具体阐述。首先,根据视频图像特征分析,采用K-SVD算法以关键帧图像块为训练样本逐列更新DCT冗余字典,获得充分反映视频图像结构特征的字典。然后,考虑到WMSN视频图像的信噪比较低,采用基于残差比[10]的改进型Batch-OMP算法对含噪图像进行充分和快速的重构及去噪。

对关键帧的稀疏去噪算法的具体实现过程可描述为:

(1)获得稀疏系数矩阵。

s.t ∀i,‖αi‖0≤T0

(2)

通过求解式(2)可获得K-SVD算法所需的稀疏系数矩阵α。

(2)运用K-SVD算法更新字典。

在获取训练样本集和稀疏矩阵α后,K-SVD训练字典交替应用l1范数稀疏约束的追踪和奇异值分解算法,逐列更新初始字典D,其大致过程如下:

(3)

其中,矩阵Ek代表的是去掉原子dk的成分在所有N个样本中所造成的误差。

(3)采用基于残差比的改进型Batch-OMP重构去噪关键帧。

作为OMP算法的改进,在基于同一冗余字典对大量数据信号进行稀疏分解时,Batch-OMP算法会针对冗余字典进行预处理,从而提高算法运算速度、有效减少算法内存占用率,大大降低了算法的复杂度[8],尤其适用于数据量巨大的WMSN视频图像处理。

假设第m次迭代为:

si=sim+Rm(si)

(4)

由Batch-OMP重构算法过程可知:

(5)

将式(1)代入式(3)可得:

(6)

(7)

其中,

(8)

其中,E为期望值。

采用基于残差比的改进型Batch-OMP获得去噪关键帧的稀疏系数矩阵α′,求解式(9)即可获得去噪后的关键帧S′。

(9)

4 实验方案设计和结果分析

为了验证并突出本文所采用方法在WMSN视频图像去噪中的优越性和有效性,分别用本文方法以及另外三种去噪方法对包含高斯白噪声的低信噪比WMSN视频图像进行了去噪效果比较。这些方法分别是基于Wavelet变换的硬阈值去噪算法、基于Contourlet[11]变换的去噪算法及基于DCT冗余字典的稀疏去噪算法[6]。本文算法的具体方案如图2所示。

Figure 2 Process of the proposed sparse denoising method图2 基于稀疏分解的WMSN视频图像去噪

提取在高速道路上所拍摄视频图像的关键帧Road,采用 MATLAB对其进行仿真处理。WMSN视频监测场景复杂,在雨雪、光照等外因影响下,视频图像中噪声成分较多。为了反映实际监测场景,本文采用σ=45的含噪视频图像,上述四种方法的去噪效果如图3所示。

Figure 3 Different performance of the four denoising algorithms图3 不同算法对含噪图像Road的去噪效果

由图3可以看出,在高强度噪声环境下,采用基于小波变换和Contourlet变换的去噪算法所得去噪图像模糊失真,细节信息不清晰;而两种基于冗余字典的稀疏分解去噪算法均能够有效去除噪声,去噪图像视觉效果良好。主要原因是基于变换的去噪算法通常会将图像边缘等高频信息当做噪声而滤除,造成空域边缘和细节的锐度下降;而基于字典的稀疏去噪算法则依据能否被稀疏表示作为标准将噪声与有用信息区分开来,受噪声强度影响较小。

为了更客观地评价图像的去噪效果和算法的去噪性能,本文还采用图像结构相似度SSIM(Structural Similarity)作为客观评价标准。图4显示了上述四种算法在不同噪声强度下去噪图像SSIM值的变化。分析图4可知,按照客观评价标准,基于冗余字典的稀疏分解去噪算法优于Wavelet去噪和Contourlet去噪算法,而且本文算法去噪效果更好。

Figure 4 SSIM of the four algorithms at different noise levels图4 不同噪声强度下四种算法的SSIM值变化

从视觉效果和SSIM评价标准均可看出,DCT冗余字典稀疏去噪算法效果不如本文算法。前者去噪图像稍显模糊,边缘等细节存在一些失真,两者SSIM差值近似在0.01~0.03,且在σ=45处最大,此时也最接近WMSN视频监测的实际场景。主要原因为:一方面,DCT字典未经过训练而无法实现字典原子和图像特征的最大化匹配;另一方面,低信噪比图像的噪声方差可能大于有用信号方差,基于硬阈值的OMP迭代会将部分噪声误认为有用信号,在重构过程中引入噪声成分。而本文算法先采用K-SVD算法以自适应训练字典,再结合基于残差比的Batch-OMP稀疏分解算法,从而充分刻画图像细节特征,并克服硬阈值无法自适应选择迭代终止阈值的去噪缺陷,表现了更好的去噪效果。这表明相对于其他三种算法,本文算法在强噪声环境中具有更好的去噪性能,适用于WMSN视频图像的去噪处理。

此外,本文算法中,Batch-OMP稀疏分解算法会先对冗余字典进行预处理,从而减少每个信号的每次迭代运算量。随着信号数据量的增大,字典预处理的复杂度可以忽略不计,而各次迭代的复杂度总和相较于OMP等常规算法会大大减少。依据文献[8]对于Batch-OMP复杂度的计算说明,通过Matlab仿真分析验证可知:在字典D∈Rn×K,n=256条件下,Batch-OMP相比于OMP的算法处理速度可提高7~8倍。同时,K-SVD 训练过程产生的平均系数会呈现迅速递减趋势,算法速度也会不断提高。

5 结束语

WMSN视频监测场景复杂,加之雨雪雾天气及光照等恶劣条件,视频图像信噪比低,极大地影响了视频监测的有效性和可靠性。信噪比低就意味着噪声成分的含量更多,分布的频谱更宽,故传统方法不适用于WMSN视频图像去噪。本文首先针对WMSN的视频图像结构特征进行周期性采集、分帧、帧差等预处理;然后对残差帧进行DCT冗余字典稀疏去噪,而对关键帧则运用K-SVD训练DCT冗余字典以充分稀疏表示图像特征,并采用基于残差比的改进型Batch-OMP获得去噪关键帧,从而在整体上实现低信噪比WMSN视频图像的去噪及重构。实验表明,本文算法能更加有效地、较为快速地滤除图像噪声,适用于低信噪比WMSN视频图像去噪。其中,K-SVD与Batch-OMP的结合采用降低了WMSN视频图像的处理复杂度,有利于保证WMSN视频图像的实时性。本文算法适用于场景固定的WMSN视频监测,若要扩展运用于运动场景,需要进一步改进。

[1] Lu Qin. Research on multi-node cooperative image acquisition and compression technology in wireless multimedia sensor networks [D]. Changsha:National University of Defense Technology, 2009. (in Chinese)

[2] Pinar S, Kerem I, Sebnem B, et al. Image quality estimation in wireless multimedia sensor networks:An experimental study[J]. BROADNETS, LNICST, 2012, 66(2):226-241.

[3] Gribonval R, Nielsen M. Sparse approximations in signal and image processing [J]. Signal Processing,2006, 86(3):415-416.

[4] Yaghoobi M, Blumensath T, Davies M E. Dictionary learning for sparse approximations with the majorization method[J]. IEEE Transactions on Signal Processing, 2009, 57(6):2178-2191.

[5] Candes E, Donoho D. New tight frames of curvelets and optimal representations of objects with C2 singularities[J]. Common Pure and Applied Math, 2004, 57(2):219-266.

[6] Aharon M, Elad M, Bruckstrein A. The K-SVD:An algorithm for designing of over-complete dictionaries for sparse representation [J]. IEEE Transactions on Signal Processing, 2006, 54 (11):4311-4322.

[7] Aharon M, Elad M. Sparse and redundant modeling of image content using an image-signature-dictionary [J]. SIAM Journal on Imaging Sciences, 2008, 1(3):228-247.

[8] Rubinstein R, Zibulevsky M, Elad M. Efficient implementation of the K-SVD algorithm using batch orthogonal matching pursuit[R]. CS-2008-08.Haifa, Israel:Computer Science Department, Technion-Israel Institute of Technology, 2008.

[9] Garg K, Nayar S K. Vision and rain[J]. International Journal of Computer Vision, 2007, 75(1):3-27.

[10] Liang Wei, Que Pei-wen, Chen Liang, et al. Residual ratio iteration termination condition for MP method[J]. Journal of Shanghai Jiaotong University, 2010, 44(2):171-175. (in Chinese)

[11] Cunha L A, Zhou J P, Do M N. The nonsubsampled contourlet transform:Theory, design, and applications [J]. IEEE Transactions on Image Processing, 2006, 15(10):3089-3101.

附中文参考文献:

[1] 鲁琴. 无线多媒体传感器网络多节点协同图像采集与压缩技术研究[D].长沙:国防科学技术大学, 2009.

[10] 梁巍, 厥沛文, 陈亮, 等. 基于残差比阈值的迭代终止条件匹配追踪稀疏分解方法[J]. 上海交通大学学报, 2010, 44(2):171-175.

LUO Hui,born in 1969,MS,associate professor,his research interests include multimedia information process, and wireless communication system.

K-SVD based sparse denoising for WMSN video image with low SNR

LUO Hui,CHU Hong-liang,WANG Shi-chang
(School of Information Engineering,East China Jiaotong University,Nanchang 330013,China)

As a highly effective method of perceiving multimedia information, Wireless Multimedia Sensor Networks (WMSNs) has shown its potential in many areas. However, the outside interference in the monitoring environment brings severe noise to video images. Obviously, video image denoising becomes the key to ensuring the validity and reliability of WMSN video monitoring. To denoise WMSN video image, firstly, its features are analyzed and some pretreatment are done. Secondly, the K-SVD algorithm is employed to adaptively train DCT dictionary for reflecting the image characteristics and reconstruct the key frame through improved Batch-OMP algorithm with residual ratio as the iteration termination, while DCT dictionary is adopted to sparsely denoise the residual frames. Finally, the video image is reconstructed under the situation of low SNR. Experimental results show that, compared with its counterparts, the superiorities of the algorithm can be observed in both visual and some numerical guidelines, showing the suitability for the WMSN video image denoising in low SNR.

sparse denoising;K-SVD;residual ratio;low SNR;wireless multimedia sensor network

2012-10-15;

2012-12-22

国家自然科学基金资助项目(61261040)

1007-130X(2014)03-0497-05

TP391.41

A

10.3969/j.issn.1007-130X.2014.03.021

罗晖(1969-),男,江西南昌人,硕士,副教授,研究方向为多媒体信息处理和无线通信系统。E-mail:lh_jxnc@163.com

通信地址:330013 江西省南昌市华东交通大学信息工程学院

Address:School of Information Engineering,East China Jiaotong University,Nanchang 330013,Jiangxi,P.R.China

猜你喜欢
关键帧字典残差
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
字典的由来
基于改进关键帧选择的RGB-D SLAM算法
我是小字典
正版字典
基于相关系数的道路监控视频关键帧提取算法
基于聚散熵及运动目标检测的监控视频关键帧提取
平稳自相关过程的残差累积和控制图