张莉 朱茜
摘 要:引入稀疏编码思想实现对数据信息的最优非线性逼近,在图像去噪方面已取得较好的实验效果。本文对图像去噪模型进行分析,介绍了稀疏编码思想实现图像去噪的原理,并对经典的稀疏去噪模型进行对比与分析。最后,基于稀疏模型对去噪算法进行分析,提出了稀疏模型在其他研究领域的展望。
关键词:稀疏编码 字典学习 自相似性 非局部 图像去噪
中图分类号:TP751.1 文献标识码:A 文章编号:1674-098X(2019)03(b)-0133-03
Abstract: The sparse coding can achieve the optimal nonlinear approximation of data information, and has achieved good experimental results in image denoising. This paper through analyze the image denoising, introduce the principle of image denoising by sparse coding, and understand and analyze the classical image denoising methods based on the sparse model. Finally, based on the sparse model, the denoising algorithm is analyzed, and the prospect of sparse model in other research fields is proposed.
Key Words: Sparse coding; Dictionary learning; Self-similarity; Nonlocal; Image denoising
圖像是视觉的基础,是自然景物的客观反映,是我们社会活动中最常用的信息载体。据统计,一个人获取的信息大约有75%来自视觉[1]。图像可以直观、生动地显示出客观事物的具体信息,随着各种数码产品和数字仪器的普及,图像以其快捷的优势,已成为我们获取外界原始信息的主要途径。然而在图像的获取、传输和存贮过程中时常会受到外界干扰或者自身因素影响而使图像降质,掩盖了图像的真实信息,给我们的后续工作带来了一定困扰。
图像去噪借助于现代数字信号处理技术尽可能的保持图像原始信息完整性(即主要特征),又能够去除信号中的干扰信息[2]。图像去噪算法多涉及数学方法,比如概率论、数理统计、偏微分方程等。图像去噪领域,稀疏表示模型具有较好的理论完备性和图像去噪效果,受到了国内外很多研究学者的关注[3-6]。
1 稀疏编码
稀疏编码(Sparse Coding)最早出现在20世纪Stephane Mallat和张志峰的研究中[7],文章也首次提出“字典”的概念。紧接着,Scott Shaobing Chen等人基于图像块,提出用范数对图像的稀疏性进行客观评估。对自然图像中的信息提取、特征保护、图像恢复等问题的有效解决具有重要的理论现实意义与实践应用价值。
在现实生活中,图像x经过一系列外界干扰,退化成图像y,在具体研究过程中,我们的目标是对退化图像y进行研究分析,找到合适的方法使其复原接近于原始图像x,同时又要保证解的唯一性,稀疏编码思想给我们的实践研究提供了一个新思路。假定字典D,图像目标列b,通常采用规则化方法进行优化:
这里,矩阵D是满秩矩阵,矩阵DDT是正定矩阵,因此该优化过程是可逆操作。
基于稀疏编码的图像去噪方法,首要任务是对数据信号进行采样,同时对其进行稀疏编码,算法模型的建立可概括为两类:基于合成(Synthesis-based)建立稀疏模型[8]、基于分析(Analysis-based)建立稀疏模型[9]。前者是由于数据信号本身具有稀疏性,所以假定图像的每一个图像块都可以用一个稀疏向量表示出来,并且该向量中绝大多数元素都是零,且数据信号越稀疏其稀疏向量中的原子接近零或者等于零的个数就越多。对图像构建学习字典,利用式(6)分别获取每一图像列的最优解。而基于分析建立稀疏模型,则是对图像进行分类、建组,利用类、组信息的非局部自相似性进行稀疏求解。具体实验过程中,根据不同需求情况,分析算子可以有多种形式,比如卷积、投影、求导、Curvelet、小波变换等。
2 经典算法分析
2.1 基于合成的稀疏模型
(1)K-SVD算法[10]的目标函数为:
作为经典的学习字典算法,K-SVD根据最小误差原则,有效解决了高维矩阵求解问题,通过对误差项进行SVD分解,选择使误差最小的分解项作为更新的字典原子核对应的原子系数,经过不断迭代从而得到最优解。式中,U是图像的所有图像块集合,D是对图像块进行学习获得的过完备字典,Λ是稀疏编码系数。K-SVD算法中字典D进行迭代学习更新,并利用字典D和系数Λ对图像块进行降噪处理。
(2)CSR算法[11]目标函数为:
将图像分成固定大小的图像块,以该图像块的位置坐标为中心、以该图像块对应的灰度值为目标,在中心块中去寻找相似图像块进行聚类学习。式中,Di是对图像块ui进行聚类后学习获得的PCA特征字典,μi是对稀疏系数αi的近似估计。算法利用PCA特征字典对图像块进行稀疏编码,非相关图像块对应的稀疏系数项统一设为0,使得目标函数在l1范数的稀疏编码过程更加快速,从而提高了算法的迭代收敛速度。
(3)PGPL算法[12]的字典构造模型为:
式中,正则化特征字典D由字典DE、DI合并而成,其中,DE用于保护图像的特征信息,由自然干净图像学习字典的前r个特征值构建而成,图像DI由噪声图像学习获得,以补充图像的个体化特征信息。
2.2 基于分析的稀疏模型
(1)BM3D算法[13]的目標函数为:
式中,、是图像在水平方向、垂直方向上的梯度,f是观测图像,α1、α2是非负正则化参数。该算法是基于k-support范数的图像去噪模型,将k-support范数引入图像梯度域作为正则化项,使得该图像去噪模型中的稀疏解的非零元具备一定关联性,进而取得较好的图像去噪效果。
(3)组稀疏模型算法[15]为:
式中,f是观测图像,α是非负正则化常数,用于约束图像在水平方向和垂直方向上的两个梯度、。该模型利用图像边缘信息具有连续性且梯度较大这一特性,构造组稀疏正则化算子,在图像梯度域选取邻近k个点组成一组,既考虑了图像内部稀疏特性又兼顾了图像边缘连续性,这样构造出来的就包含了图像的部分先验知识,该模型在图像去噪方面有较好的表现效果。
3 质量评价方法
图像去噪算法的量化指标和性能评价方法很多,但是相比于图像质量评价的主观方法,客观评价方法基于相关数学模型,在实验研究中更有利于对算法进行评价。我们常见的评价方法有均方差(Mean Squared Error,MSE)、相对误差(Relative Error,RE)、信噪比(Signal to Noise Ratio,SNR)、结构相似性(Structural Similarity,SSIM)[16]、峰值信噪比(Peak Signal to Noise Ratio,PSNR)[17]和实时性等。假设原始图像X,复原图像Y,图像大小m×n,则:
基于结构相似性的度量准则可以从两幅图像的结构特征判定算法的优劣,其结果更符合人类的视觉特征,更接近人类的视觉观察。式中,uX、uY分别是图像X、Y的平均值;是图像X、Y的方差;σXY是图像X和Y的协方差;k1、k2是分母的非零常数项;L是图像最大灰度值。
4 结语
基于稀疏编码思想,图像去噪问题转化为稀疏残差优化问题。近年来的经典算法有:BM3D、LSSC[18]、EPLL[19]、NCSR[20]、WNNM[21]、PGPD[22],实验结果如表1所示。
基于合成的模型是从学习的角度建立字典,适用于任何类型的图像,但只局限于低维度信号,并且计算复杂度较高。基于分析的模型是从非局部自相似性的角度,适合高维图像,但是大多算法只考虑噪声图像的非局部自相关先验知识,而忽略了自然图像的非局部自相关信息。毕竟算法本身是在搜索窗口中进行相似块的匹配,其实质上在有噪声干扰情况下并不能较好地进行相似块的匹配。
基于稀疏性建立模型对图像进行去噪的研究已经达到了相当高的水平,这些方法可拓展应用在图像去模糊、超分辨率方面会有较好的理论价值和意义。
参考文献
[1] 张春田,苏育挺,张静.数字图像压缩编码[M]. 北京: 清华大学出版社,2006.
[2] 何小卫,张莉.基于稀疏表示的图像分类字典学习[J].浙江师范大学学报:自然科学版,2015,38(4):402-409.
[3] Bruchstein A M,Donoho D L,Elad M.From sparse solutions of systems of equaitons to sparse modeling of signals and images[J].SIAM review,2009,5l(1):34-81.
[4] Elad M.Sparse and redundant representation:from theory to applications in signal and image processing[M].Springer,2010.
[5] Elad M,Aharon M.Image sequence denoising via sparse and redundant representations[J].IEEE Transactions on Image Processing,2009,1 8(1):27-35.
[6] Wright J,Yi Ma,Maival J,et al.Sparse representation for computer vision and pattern recognition[J].Preceedingsofthe IEEE,2010,98(6):1031-1044.
[7] Stephane G.Mallat, Zhifeng Zhang. Matching Pursuits With Time-Frequency Dictionaries[J]. IEEE Transactionson signal processing, 1993,41(12): 3397-3410.
[8] Cai J F, Osher S, Shen Z. Split Bregman methods and frame based image restoration[J]. Multi-scale Modeling &Simulation, 2009, 8(2):337-369.
[9] Candes E J, Eldar Y C, Needell D, et al. Compressed sensing with coherent and redundant dictionaries[J]. Applied and Computational Harmonic Analysis, 2011, 31(1):59-73.
[10] Michael Elad, Michal Aharon, Image Denoising Via Learned Dictionaries and Sparse representation[C].CVPR, 2006:895-900.
[11]Weisheng Dong, Xin Li, Lei Zhang, et al. Sparsity-based Image Denoising via Dictionary Learning and Structural Clustering[C].CVPR,2011:457-464.
[12]Jun Xu, Lei Zhang, David Zhang. External Prior Guided Internal Prior Learning for Real-World Noisy Image Denoising[J]. IEEE Transactions on Image Processing, 2018,27(6):2996-3010.
[13]KostadinDabov, Alessandro Foi, Vladimir Katkovnik, et al. Image Denoising by Sparse 3-D Transform-Domain Collaborative Filtering[J].IEEE Transactions on Image Processing,2007,16(8):2080-2095.
[14]Argyriou A, Foygel R, Srebro N. Sparse Prediction with the k-Support Norm[C].Advances in Neural Information Processing Systems, 2012, 25:1466-1474.
[15]Junli Fan and Xiaowei He, Image processing model with k-support norm. International Journal of Signal Processing[J].Image Processing and Pattern Recognition,2015,8(4):257-268.
[16]Z. Wang, A. C. Bovik, H. R. Sheikh, et al. Image quality assessment: From error visibility to structural similarity[J]. IEEE Transaction on Image Processing, 2004, 13(4):600-612.
[17]Yao H, Huseh M Y, Yao G, et al. Image evaluation factors[J].Lecture notes in computer science, 2005:255-262.
[18]J. Mairal, F. Bach, J. Ponce, G. Sapiro, and A. Zisserman. Non-local sparse models for image restoration[J]. ICCV,2009:2272-2279.
[19]D. Zoran and Y. Weiss. From learning models of natural image patches to whole image restoration[J]. ICCV,2011:479-486,2011.
[20]W. Dong, L. Zhang, G. Shi, and X. Li. Nonlocally centralized sparse representation for image restoration[J].Image Processing, IEEE Transactions on,2013,22(4):1620-1630.
[21]S. Gu, L. Zhang, W. Zuo, and X. Feng. Weighted nuclear norm minimization with application to image denoising[J]. CVPR,2014:2862-2869.
[22]J. Xu, L. Zhang, W. Zuo, et al. Patch Group Based Nonlocal Self-Similarity Prior Learning for Image Denoising[C]. ICCV, 2015:244-252.