沈阳理工大学信息科学与工程学院 王亚清 石振刚
图像是人类社会活动中最常用的信息载体,是人们最主要的信息来源。但是,图像在其形成、传输记录和存储的过程中,经常会受到各种各样的噪声污染和影响从而使图像质量严重下降,以至于人们无法正常识别,不能获取图像中的有效信息,这给图像的后续处理增加了很大难度。因此,去除图像在采集、传输及存储过程中产生的噪声,成为数字图像处理领域中的重要部分。本文主要介绍了加权核范数最小化去噪算法的基本原理以及利用MATLAB软件进行算法的仿真实现。实验证明,该方法可以有效地去除噪声。并且通过多次实验,分析了噪声强度对于图像去噪效果的影响。
21世纪已进入信息化时代,信息的形式也多种多样,不再只是简单的语音形式,还有数据、文字、图像、视频等多种形式。事实上,人们主要通过视觉来获取外界信息,因而直观明了的图像是主要信息来源之一。
由于图像在拍摄和传输过程中受到各种噪声污染,使图像质量严重下降,妨碍了图像信息的正常传输与接收。所以,为了进行图像后续更高层次的处理、提高图像质量,对图像进行去噪处理是必不可少的重要环节。图像去噪就是在去除图像噪声的同时尽可能多的保留图像中的原有信息。图像去噪不仅提高人们视觉识别信息的准确性,还对图像进一步处理提供可靠保证。噪声去除的效果直接影响到图像的后续处理效果。
自然图像具有极高的结构性,表现在图像的像素间存在着很强的相关性。物体表面亮度信息与照度和反射系数相关,且场景中物体的结构与照度是独立的,反射系数与物体有关。结构相似性从亮度、对比度、结构三个对比模块进行测量,如图1所示。
图1 SSIM测量系统
对于给定的两张图像x和y,结构相似性可按如下公式求出:
其中,μx是x的平均值,μy是y的平均值,是x的方差,是y的方差,σxy是x和y的协方差。c1=(k1L)2,c2=(k2L)2是维持稳定的常数。L是图像像素值的动态范围,k1=0.01,k2=0.03。当两张图像完全相同时,SSIM值为1。
峰值信噪比(PSNR)是衡量图像失真或噪声水平的客观标准。PSNR公式如下:
其中,Peak是指8bits二进制位表示的最大值255,MSE指Mean Square Error,是原始图像与处理图像之间均方误差。PSNR的单位为dB,所以PSNR值越大,就代表图像失真越少。PSNR是最普遍、最广泛使用的评鉴画质的客观测量法。
在一个自然图像中选取一个局部块,可以在整个图像中搜索到多个与此图像块相似的块。由于这些相似的块分布在图像的不同区域,学术界称这种相似性为非局部相似性(non-local Similarity)。为了能够有效地将非局部相似性与图像在特定变换域的稀疏性充分结合,可以通过欧氏距离的方法将相似图像块聚类,而后组合构成一个矩阵。由于矩阵的每一列之间存在相似性,因而此矩阵具有低秩的特性,所以有稀疏的奇异值。
低秩矩阵近似(Low Rank Matrix-Approximation,LRMA)旨在从退化观测中恢复潜在的低秩矩阵并且在计算机视觉和机器学习中有广泛应用。基于静态摄像机拍摄的视频片段具有明显的低阶特性,可以进行背景建模和前景提取。研究还表明,自然图像中的非局部相似性块组成的矩阵是低秩的,这一点可以用于高性能图像的恢复任务。
低秩矩阵近似方法大致可分为两类:低秩矩阵分解(Low Rank Matrix Factorization,LRMF)和核范数最小化(Nuclear Norm Minimization,NNM)方法。对于一个矩阵Y,低秩矩阵近似方法旨在找到一个矩阵X,此矩阵在确切的数据保真度函数下尽可能接近矩阵Y,同时能被分解为两个低秩矩阵的乘积;低秩矩阵近似的另一种研究是核范数最小化,核范数最小化是指用矩阵X接近矩阵Y,同时使矩阵X的核范数最小。
矩阵X的核范数,记为,定义为其奇异值的总和,即,其中σi(X)表示矩阵X的第i次奇异值。NNM是用矩阵X逼近矩阵Y,同时使矩阵X的核范数最小。NNM一个很明显的优势在于它是对具有一定数据保真度的非凸LRMF问题有最严格的凸松弛。一方面,Candes和Recht证明了可以通过求解NNM问题完全恢复最低秩矩阵。另一方面,Cai等证明了基于低秩矩阵近似具有F范数数据保真度问题的NNM问题可以通过对观测矩阵的的奇异值的软阈值运算解决。得到NNM模型如下:
NNM为了追求凸性,标准核范数平等对待每一个奇异值,因此,软阈值算子以相同的量λ收缩每一个奇异值。然而,这一点忽略了对于矩阵奇异值的先验知识。例如,矩阵中的列(或者行)向量常位于一个低维度的子空间;较大的奇异值通常与主要投影方向相关联,因此它们最好减少收缩以保存主要的数据组成部分。很显然,NNM以及相应的软阈值操作并没有充分利用先验知识,尽管(3)中的模型是凸的,但是对于处理许多实际问题来说,它还是不够灵活。为了提升核范数的灵活性,我们提出加权核范数并研究它的最小值。
由于不同的奇异值有不同的重要性,NNM同等对待矩阵X的奇异值是不合理的,因此应区别对待。于是提出加权核范数最小化(WNNM)模型,WNNM在一般情况下是非凸的而且比NNM更难解决。矩阵X的加权核范数定义为:
当权重在不同情况下时,问题(6)的优化解随之不同。这里,我们考虑了三种不同的权重情况:
为了测试不同噪声强度对算法去噪效果的影响,实验采用了monarch、hill、Barbara、mandrill、Lena、boat、fingerprint、couple、man这九幅不同的图像,分别在噪声强度为σn=10、σn=20、σn=50、σn=100这四种情况下进行试验。经过比较试验数据,可以得到随着噪声强度的增大,去噪效果明显降低。并且在噪声强度为σn=10时,图像的PSNR数值和SSIM数值最高,去噪效果最好。仿真试验数据如表1所示:
表1 不同噪声强度去噪结果
本文中WNNM去噪算法显示出强大的去噪能力,在强噪声情况下依然有较好的视觉效果。在MATLAB仿真下进行的大量实验表明WNNM算法具有较强的细节保持能力,可以预期WNNM将在计算机视觉问题上有更为成功的应用。