阳雄耀等
摘 要: 高光谱数据中包含丰富的光谱和空间上下文信息。早期的高光谱图像去噪方法是单波段的、仅利用了高光谱数据的空间上下文信息。近年来提出的一些去噪方法综合利用了光谱和空间上下文信息,但是在对大尺度和全局上下文信息建模以及模型与图像内容自适应等方面存在局限,导致去噪结果出现过平滑的现象。针对上述问题,提出了一种基于回归树场的高光谱图像去噪方法:首先选择需要处理的高光谱波段;然后构建基于回归树场的高光谱去噪模型;最后利用基于特定代价函数的模型训练方法同时得到模型的结构和参数、输出去噪后的图像。实验结果表明,该方法能够充分利用高光谱数据的光谱和空间上下文信息,在有效去除噪声的同时很好地保存了图像中的重要细节,与BM3D和CRF相比,其PSNR提高了0.8~1.1 dB。
关键词: 高光谱去噪; 回归树场; 代价函数; 光谱和空间上下文信息; 过平滑
中图分类号: TN911.73?34; TP751.1 文献标识码: A 文章编号: 1004?373X(2015)21?0001?05
Hyperspectral image denoising method based on RTF
YANG Xiongyao, ZHONG Ping, WANG Runsheng
(Key Laboratory of National Defense Science and Technology of ATR, National University of Defense Technology, Changsha 410073, China)
Abstract: The abundant spectral and spatial contextual information are contained in hyperspectral data. The original hyperspectral image denoising methods are direct at the single band, and only the spatial contextual information of the hyperspectral data is utilized. Some denoising methods proposed in recent years utilize the spectral and spatial contextual information synthetically, but they have certain limitation in the aspects of large scale and global contextual information modeling, and the adaption of model and image content, which may cause the over?smooth phenomenon of the denoising results. For the above problems, a hyperspectral image denoising method based on regression tree field (RTF) is put forward. In the new method, the hyperspectral band which needs to be processed is selected first; then the hyperspectral denoising model based on RTF is constructed; finally the structure and parameters of the model are obtained by using the model training method of specific cost function, and the denoised image is output. The experimental results show that this method can make full use of the spectral and spatial contextual information of hyperspectral data, can preserve the important details in image completely while removing the noise effectively. The PSNR of this method has increased by a factor of 0.8~1.1 dB, compared with BM3D and CRF.
Keywords: hyperspectral denoising; regression tree field; cost function; spectral and spatial contextual information; over?smoothing
0 引 言
高光谱图像在采集与传输过程中不可避免地会受到噪声的污染,研究高光谱图像去噪技术具有十分重要的意义。早期的高光谱图像去噪方法是在单波段进行的,没有利用高光谱图像中丰富的光谱和空间上下文信息,随后出现了一些综合利用光谱信息和空间信息的去噪方法:Othman和Qian提出了一种光谱空间域混合去噪的方法[1],将高光谱图像光谱维变换到一阶微分域后再利用光谱和空间混合小波阈值去噪;Chen和Qian提出了一种主成分分析的高光谱图像去噪方法[2],通过对高光谱数据的协方差矩阵进行分析后剔除其中含有噪声的成分再重建高光谱数据实现对高光谱图像的去噪; Letexier和Bourennane提出了多维维纳滤波方法[3],该方法通过分离信号子空间和噪声子空间达到去除噪声的目的。这些方法中普遍存在的问题是去噪后的图像容易丢失细节纹理信息而出现过平滑的现象[4?5]。近年来,为了更好地利用图像中的上下文信息,基于概率统计模型的方法成为新的研究热点,其中较突出的代表有:非局部方法[6]、专家场(Fields of Experts,FoE)[7]、条件随机场(Conditional Random Field,CRF)[8?9]等,其中以CRF的去噪效果最佳[10],它能够较好地解决过平滑问题、比较完整地保存图像中的结构信息。
虽然已经证实CRF能够取得令人满意的去噪结果,但是它也存在一些问题,主要表现为:CRF具有固定的模型结构和参数,对于不同的图像内容不加区分的对待;CRF的格型结构能够方便和准确地表示图像中的局部邻域信息,但是对大尺度或者全局的邻域信息建模却比较困难。
近年提出的回归树场(Regression Tree Field,RTF)[11]对CRF做出了一些改进,与CRF相比,它的优势主要有:
(1) RTF实现了图像内容与模型参数之间的自适应,它的模型参数是由像元的邻域信息决定的,不同的像元具有不同的模型参数;
(2) RTF通过回归树的多层传递,实现了多尺度特征属性到模型参数的转换,可以对不同尺度的空间信息建模,能够更好地保存图像的全局特性。
虽然RTF已开始用于自然图像的去噪[12]但还没有扩展到高光谱图像处理领域,为此本文提出一种基于RTF的高光谱图像去噪方法,旨在充分利用高光谱数据中的光谱和空间上下文信息,提高去噪效果。
1 面向高光谱图像去噪的RTF模型
1.1 高光谱图像与噪声特性分析
高光谱图像是由光学传感器对同一场景利用几十甚至上百个光谱波段获得的图像。虽然同一场景的像元内容不尽相同,但是相邻像元之间具有很强的空间结构相关性,而且由于光谱分辨率的提高,各相邻波段之间也具有很强的相关性。同时,高光谱数据在成像、传输的过程中会受到多种噪声源的污染,导致最终的高光谱数据中大部分波段比较清晰,小部分波段则受到不同程度的污染,这些噪声波段以序列的形式存在于高光谱数据之中,并且在它们周围通常都会存在清晰的波段。对于高光谱图像而言,这种噪声波段与干净波段之间包含的光谱和空间相关信息以及波段内像元之间的差异性对于高光谱图像处理与分析具有非常重要的作用,而以RTF为代表的基于概率统计模型的方法正好能够同时和有效地利用这些信息。
1.2 面向高光谱图像去噪的RTF模型
将噪声波段与相邻高SNR波段组成的[d]波段高光谱数据表示成[y=y1,y2,…,yd,]其中噪声波段为[yn1≤n≤d,]其余为高SNR波段,对[yn]去噪后得到的图像可表示为[xn,]从而可以得到基于RTF的高光谱去噪模型的数学表达式:
式中:[Qy,w]为正定矩阵;[Ly,w]为列向量,双位置势函数具有类似的函数表达式。不同的单、双位置势函数,其系数[Quy,w, Luy,w]和[Qpy,w, Lpy,w]不尽相同,令[Quy,w=Wu,Luy,w=wu,Qpy,w=Wp,] [Lpy,w=wp]得到模型参数的简化表示形式为[W=Wu,wu,Wp,wp]。
与CRF对所有待处理像元采用统一的模型参数不同,RTF各个待处理像元的模型参数是由回归树根据像元内容决定的。每个势函数类型指定一棵回归树,回归树的顶点表示根节点,每一条路径的终点称为叶节点,根节点与叶节点之间的点称为节点。回归树的路径是由节点的分裂准则(通常是计算该点的特征属性值,然后和某一阈值进行比较)决定的,在一般的回归树中,当给定观察图像[x]中的某一像元[i]时,回归树就可以根据该像元的内容选择某一条路径(包括根节点与叶节点等),该像元的标记[yi]就是训练时同样到达该叶节点[l*]的标记值的统计平均[ul*,]该过程如图1(a)所示。在RTF中,叶节点中存储的并非平均值而是势函数参数[Wul,wul]或者[Wpl,wpl,]全部回归树叶节点存储的参数集合就构成了RTF的模型参数[W=Wul,wul,Wpl,wpl]。这种由回归树决定模型参数的形式如图1(b)所示。
由于RTF中的势函数被定义为高斯二次函数,故可以通过近似得到[x]的最优估计:
图1 RTF模型结构与参数化
2 基于RTF的高光谱图像去噪方法
根据高光谱图像中存在噪声的特性以及RTF用于高光谱图像去噪的优势,本文提出一种基于RTF模型的高光谱图像去噪方法。其核心思想是从输入待处理高光谱图像中选择要处理的噪声波段图像,然后利用其邻域存在的清晰波段图像,通过基于特定代价函数的RTF模型训练算法,充分利用噪声波段内部的空间上下文信息以及相邻清晰波段图像的谱间上下文信息,实现高光谱图像特定波段的复原。该方法的流程为:
(1) 对输入图像确定待处理的含噪波段图像;
(2) 选择含噪波段图像邻域中的高SNR波段图像;
(3) 通过基于特定代价函数的RTF训练方法,充分利用噪声图像和相邻波段高SNR图像中存在的光谱和空间上下文信息,得到含噪波段图像的复原结果,其中的第(1)步和第(2)步可以归结为波段选择问题。
下面将对提出方法中的波段选择方法和基于特定代价函数的RTF训练方法进行详细论述,最后从理论上分析所提方法的优势。
2.1 波段选择方法
在实际的高光谱数据中,噪声波段与干净波段同时存在,仅使用高光谱数据本身就能构建训练时所需的样本对。在高光谱数据中确定哪些波段为噪声波段主要有两种办法:一种是实际任务中通常采用的由专家确定感兴趣和待处理的波段图像;另一种是可以通过已有的噪声估计方法自动选择 [14?15],与之对应的相邻高SNR波段的选择也可以通过这两种方式实现。
2.2 基于特定代价函数的RTF模型训练
通过上述波段选择方法得到待处理噪声波段图像和其邻域高SNR波段图像后,本文进一步采用基于特定代价函数的RTF模型训练,在高光谱去噪过程中利用光谱和空间上下文信息。同时实现模型结构与参数的自适应确定(图像中自适应上下文信息的利用)以及输出复原图像。
RTF模型训练包括两部分内容:RTF模型结构训练与模型参数训练。目前的训练方法主要基于以下两种思路:其一是将模型结构与参数的学习分割开来,通过方差下降准则等分裂准则确定模型结构后再学习参数;其二则是将模型结构和参数的学习统一起来,通过梯度范数准则同时学习模型结构与参数。后者显然更为合理。
一般情况下,将训练数据视为独立同分布的像元对[xi,yni]的集合[D]。复原代价函数[?x,x:X×X→R]是评价去噪后的像元[x]与干净像元[x]之间差异的测度, PSNR(Peak Signal?to?Noise Ratio)是一种典型的非线性代价函数,它是评价图像去噪方法有效性的最普遍客观标准之一,[N]个像元的PSNR定义如下:
这种由于叶节点分裂而导致的代价函数梯度范数值的增加可以理解为通过参数设置所引起的代价函数值的变化,梯度范数值的提升能进一步促使目标函数值的增加,因此在实际训练过程当中,回归树叶节点的分裂可以通过求代价函数梯度范数的最大值来实现,新的叶节点中的模型参数即可设置为[w=][argmaxw??PSNRD,w?w。]由于RTF得到的估计值[xy,w=][argmaxxpxy;w]关于参数[w]是可微分的[12],因此代价函数[?PSNR]对参数[w]的梯度如式(6)所示。
综上所述,基于PSNR复原代价函数的RTF模型训练步骤简述如下:
(1) 初始化模型以及参数;
(2) 对每个训练像元对[xi,yni,]根据式(3)计算[x,]然后计算[c;]
(3) 计算式(7)中的偏导数;
(4) 计算式(6)中的梯度范数值,推导[wlt=] [argmaxw??PSNRD,w?w],分裂叶节点,并将新的叶节点中的参数初始化为[wlleftt←wlt,wlrightt←wlt;]
(5) 若达到最大迭代次数则停止,否则返回到步骤(2)。
2.3 研究方法特点分析
从理论上进行分析,提出的高光谱去噪方法具有如下特点:
(1) 提出的去噪方法由于只针对噪声波段进行复原,避免了对多波段同时复原时因为清晰波段图像引入伪信息而降低图像质量的问题;
(2) 由于只利用同噪声图像相邻干净波段的上下文信息,保证了利用的信息具有同噪声图像对应的干净图像所含信息的相似性,避免了其他多波段同时复原的方法中由于采用远距离波段而出现的不相关信息干扰问题;
(3) 由于RTF模型具有自适应确定的回归数结构,一方面能够对图像中的复杂结构进行建模;另一方面,也可以实现对高光谱图像中重要的光谱和空间上下文信息的自适应构建和利用;
(4) 采用的基于特定代价函数的训练框架,可以得到针对特定评价标准的最优去噪效果,使提出的去噪方法具有一定的扩展性。
3 实验结果与分析
3.1 实验设置
实验选择的数据是高光谱图像领域典型数据之一的Purdue Campus数据,它是一种城市混合地貌影像数据,包含丰富的人为结构信息,是评价高光谱去噪方法性能的理想数据类型。整幅图像的尺寸为[1 950×512] 像素点,共包含126个波段,由于篇幅的限制,只选取其中一个[200×200]的子图像块,实验数据如图2所示。
3.2 对模拟噪声的去噪效果分析
在高光谱图像当中,某个波段的干净图像和它的噪声图像并不是同时存在的,因此通过人工选取的方式将第4,26与78波段作为干净图像,通过对它们分别加入方差为25的高斯白噪声来拟合图像被污染的过程,然后分别利用BM3D、基于CRF的高光谱图像去噪方法和基于RTF的高光谱图像去噪方法对它们进行去噪。图3为对第4波段去噪结果的整体比较,图4为各去噪方法的细节比较,表1则列出了这三种方法的数字化评价标准。
从实验结果可以看出,BM3D具有较好的去噪视觉效果,但是容易丢失图像细节,与BM3D和CRF相比,RTF更完整地保存了原图像中的结构细节信息,同时PSNR值也普遍提高了0.7~1.1 dB。
3.3 对实际的高光谱图像去噪结果分析
由于天气、传感器等因素的影响,高光谱图像数据中通常都含有噪声波段,目前高光谱图像分析与处理领域最一般的做法是直接将这些波段给剔除掉,但是这样不可避免地会导致高光谱图像中部分有用信息的丢失,一种可行的解决方案便是对这些噪声波段进行去噪处理。虽然已经证实在去除模拟噪声上,RTF的确具有比CRF更好的效果,但是为了更加贴合实际,将RTF和CRF用于高光谱图像中噪声波段的去噪效果进行了比较,在Purdue Campus高光谱数据中,第63个波段为含有噪声的波段,简单起见,以人工选择的方式将第65波段作为其邻域高SNR波段,结果如图5所示。实验证明,在对高光谱实际噪声波段的去噪效果上,与CRF相比较,RTF的去噪结果更接近于干净图像,去噪效果更优。
4 结 语
本文提出了一种基于RTF的高光谱图像去噪方法。结合图像去噪任务的特性以及高光谱图像噪声的特点,分析了RTF用于高光谱图像去噪的理论优势,此方法对模拟噪声具有较好的去噪效果,但是去噪原理复杂,计算复杂度高,同时从实验结果可以看出,该方法对实际噪声还达不到很好的去噪效果,接下来的工作集中于提高RTF模型的计算效率以及对实际高光谱噪声的去噪性能。
参考文献
[1] OTHMAN H, QIAN S. Noise reduction of hyperspectral imagery using hybrid spatial?spectral derivative?domain wavelet shrinkage [J]. IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(2): 397?408.
[2] CHEN G, QIAN S. Denoising of hyperspectral imagery using principal component analysis and wavelet shrinkage [J]. IEEE Transactions on Geoscience and Remote Sensing, 2011, 49(3):973?980.
[3] LETEXIER D, BOURENNANE S. Noise removal from hyperspectral images by multidimensional filtering [J]. IEEE Transactions on Geoscience and Remote Sensing, 2008, 46(7): 2061?2069.
[4] RENARD N, BOURENNANE S, BLANC?TALON J. Denoising and dimensionality reduction using multilinear tools for hyperspectral images [J]. IEEE Geoscience and Remote Sensing Letters, 2008, 5(2):138?142.
[5] LIU C, SZELISKI R, KANG S B, et al. Automatic estimation and removal of noise from a single image [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2008, 30(2): 299?314.
[6] ANTONI B, BARTOMEU C, MOREL J. Nonlocal image and movie denoising [J]. International Journal of Computer Vision, 2008, 76(2): 123?139.
[7] ROTH S, BLACK M J. Fields of experts: a framework for learning image priors [C]// Proceedings of 2005 IEEE Confe?rence on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2005: 860?867.
[8] SUTTON C, ROHANIMANESH K, MCCALLUM A. Dynamic conditional random fields: probabilistic models for segmenting and labeling sequence data [C]// Proceedings of 2001 ACM International Conference on Machine Learning. New York: ACM, 2001: 282?289.
[9] KUMAR S, HEBERT M. Discriminative random fields: a discriminative framework for contextual interaction in classification [C]// Proceedings of 2003 IEEE International Conference on Computer Vision. Washington DC: IEEE, 2003, 2: 1150?1157.
[10] ZHONG P, WANG R. Multiple?spectral?band CRFs for denoising junk bands of hyperspectral imagery [J]. IEEE Tran?sactions on Geoscience and Remote Sensing, 2013, 51(4): 2260?2275.
[11] JANCSARY J, NOWOZIN S, SHARP T, et al. Regression tree fields: an efficient, non?parametric approach to image labeling problems [C]// Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2012: 2376?2383.
[12] JANCSARY J, NOWOZIN S, ROTHER C. Loss?specific training of non?parametric image restoration models: a new state of the art [C]// Proceedings of 2012 12th European Conference on Computer Vision. Florence: Springer, 2012: 112?125.
[13] KHOSLA P, RUBIN S. A conjugate gradient iterative method [J]. Lecture Notes in Physics, 1981, 9(2): 109?121.
[14] SENDUR L, SELESNICK I W. Bivariate shrinkage with local variance estimation [J]. IEEE Signal Processing Letters, 2002, 9(12): 438?441.
[15] USS M, VOZEL B, LUKIN V, et al. Local signal?dependent noise variance estimation from hyperspectral textural images [J]. IEEE Journal of Selected Topics in Signal Processing, 2011, 5(3): 469?486.