宁鸿章,谭 鑫,李宇航,焦庆斌,李文昊
1. 中国科学院长春光学精密机械与物理研究所,吉林 长春 130033 2. 中国科学院大学,北京 100049
高光谱遥感技术能够提供目标区域丰富的光谱以及空间信息,被广泛应用于农业、军事、地物目标勘测、目标识别等等领域[1-2]。 高光谱图像中的噪声分布复杂,降噪滤波是制约高光谱图像分析精度的难题[3]。 高光谱图像噪声滤除的主要方法有直方图匹配、矩匹配、光谱微分、Savitzky-Golay滤波等等方法,其中SG滤波被广泛应用于高光谱数据降噪滤波[4]。 然而,对受噪声污染严重的波段,以上滤波算法所带来的信息丢失会导致图像失真更为严重。 如由小麦籽粒三维形态影响造成高光谱图像中部分像素点过亮或过暗,即使在SG滤波后小麦籽粒赤霉病识别精度仍只有87.088 9%。
为了解决这一问题,提出将一维的SG卷积核按水平、竖直、斜向下、斜向上四个方向扩展成二维SG卷积核,与待滤波高光谱空间维数据进行卷积的TSG滤波方法。 经过TSG滤波后的小麦籽粒赤霉病识别精度高达99.155 6%。 采用PaviaU高光谱图像结合图像信噪比、峰值信噪比、结构相似度获取最优的TSG滤波核参数区间; 对比SG和TSG滤波后灰度图像与光谱图,研究SG和TSG滤波性能; 采用小麦籽粒高光谱图像开展TSG滤波算法应用研究,构建了基于TSG-PCA-SVM算法的小麦赤霉病高光谱分类识别模型。
基于最小二乘原理的SG滤波算法是一种多项式平滑算法。 首先确定一个固定大小(2m+1)的窗口,将窗口内的所有数据作为一个集合,各测量点x=[-m, 1-m, …, 0, 1, …,m],采用多项式(1)来拟合它[5]。
(1)
计算拟合曲线与原始光谱的二乘残差,设置二乘残差最小值作为边界条件[5],求解可得最佳的系数矩阵为B=X(XTX)-1XT, 将系数矩阵与高光谱图像中每个样本点对应的光谱进行卷积,即完成SG滤波。
如图1所示,设置m=2,n=3计算得到一维SG卷积核,可以看出一维卷积核系数是关于中心点对称的,将它按水平、竖直、斜向上、斜向下四个方向可组合成一个二维的卷积核。 对卷积核内的每个元素(x,y),可以通过式(2)来描述
(2)
图1 将一维SG卷积核按四个方向扩展成二维的卷积核Fig.1 Extending One-D SG convolution kernel into Two-D convolution kernel in four directions
如式(1)及式(2)所示,SG/TSG滤波算法均存在窗口系数m、阶数n两个核参数,其大小直接影响滤波效果,因此需对其进行优化选择。 采用通用的信噪比(SNR)、峰值信噪比(PSNR)、结构相似度(SSIM)三个指标[5]对SG/TSG滤波后高光谱图像进行评价,利用枚举法依据上述三个评价指标进行核参数优化。
实验图像采用Pavia University高光谱图像,该高光谱图像地面空间分辨率为1.3 m,大小为610×340像素,共包含115个波段,去除其中水吸收严重的12个波段[6],如图2所示,选取其中的一部分进行模拟实验,大小为200×200×103。 在对图像滤波之前先对图像进行归一化,归一化采用式(3)
(3)
式(3)中,f为某一像元的DN值,fmin为高光谱图像暗噪声,通常通过关闭镜头盖测得,fref为标准反射率板对应像元的DN值,R为标准反射率板的反射率,ref为该像元对应的反射率。
图2 Pavia University高光谱图像Fig.2 Pavia University hyperspectral image
设置SG滤波窗口系数m在3~15之间,TSG滤波窗口系数m在1~10之间,阶数n均在2~6之间,对归一化后的图像进行滤波,求滤波后图像的SNR,PSNR和SSIM,如图3所示为滤波后图像信噪比改善量、峰值信噪比、结构相似度等高线图(核参数满足n<2m+1,图中空白部分无值)。
图3 不同卷积核参数下TSG、SG滤波算法性能比较(a—c): SG滤波后信噪比改善量、峰值信噪比、结构相似度; (d—f): TSG滤波后信噪比改善量、峰值信噪比、结构相似度Fig.3 The performance comparison of TSG and SG with different convolution kernel parameters(a—c): SNR, PSNR, SSIM after SG filter; (d—f): SNR, PSNR, SSIM after TSG filter
信噪比作为图像噪声评价的关键指标,其数值往往是图像滤波算法所必须的[7],对比图3(a)和(d)可知TSG滤波后图像信噪比较原图提升了10%以上,而SG滤波最高提升不到1%。 一般图像滤波或压缩过程中PSNR大于30 db,为了尽可能多的提升图像信噪比,TSG滤波窗口系数m在2~4、阶数n在3~5较为合适。 SG滤波窗口系数m与阶数n可选择区间范围相对较广,一般针对不同数据须多次迭代对比才能找到最优的核参数区间。
根据以上实验设置SG滤波核参数m=7和n=3,TSG滤波核参数m=3,n=4对归一化后高光谱图像分别进行SG和TSG滤波。 如图4所示分别为未滤波、SG滤波后、TSG滤波后高光谱图像中77波段处的灰度图。 可以看出原图中央存在明显的条带噪声,经SG滤波后条带噪声依然清晰可见,经过TSG滤波后条带得到了明显抑制。
对比原始图像及经两种算法滤波后高光谱图像中三个随机像素点的光谱曲线图如图5所示,从原始光谱分布看,三个随机点在70~90波段均存在两个特征反射峰1,3和一个特征吸收峰2。 如图5(c)中ΔH1,ΔH2,ΔH3分别为三个特征峰的相对峰值高度,经过SG滤波后(45,45),(75,75),(105,105)点的这三个特征峰的相对峰值高度平均比原始图像降低了13.92%,14.59%和13.40%,特征趋于融合。 TSG滤波后图像光谱较原始图像平滑,(45,45),(75,75),(105,105)点的这三个特征峰的相对峰值高度平均比原始图像提升了31.68%,9.39%和7.01%; 同时(45,45)点在70~90波段内的平均强度较原始光谱提升了41.83%。 上述结果表明TSG滤波在平滑原始光谱的同时,可有效提升特征峰显著性,并提升特征波段显著性。
图4 77波段处灰度图像(a): 原始图像; (b): SG滤波后图像; (c): TSG滤波后图像Fig.4 Gray image of 77 band(a): Raw image; (b): Processed by SG filter; (c): Processed by TSG filter
SG滤波常被作为高光谱图像预处理的一个关键环节[8],TSG滤波具备许多优于SG滤波的特性,构建TSG-PCA-SVM分类识别模型,开展TSG滤波算法应用研究。 采用如图6所示的高光谱成像系统采集小麦籽粒高光谱数据,系统主要包括①成像高光谱仪、②光源、③标准反射率板、④样品台、⑤电控位移平台、⑥分析计算软件等部分。 其中成像高光谱仪为自主开发设备,主要参数如下: 成像波谱范围为375~910 nm,光谱分辨率2.3 nm,共540个波段,线视场含960个像素,镜头焦距为35 mm,光源为21 V/150 W溴钨灯。 将待测样本均匀平铺在白色背景板上并放置在位移平台中部,转动下方的电动位移平台,转速控制在0.6 m·min-1,镜头与样本距离为300 mm,CCD 积分时间为16 ms。
图5 采用不同滤波算法后的光谱(a): 原始光谱; (b): SG滤波后光谱; (c): TSG滤波后光谱Fig.5 The spectrum after processed bydifferent filtering algorithms(a): Raw spectrum; (b): Processed by SG filter; (c): Processed by TSG filter
图6 高光谱图像采集系统Fig.6 The acquisition system of hyperspectral image
小麦籽粒样本由安徽省农业科学院及合肥物质研究院太和试验站提供。 使用图6中的采集系统,连续采集小麦赤霉病染病率为0%和100%的小麦籽粒的高光谱图像如图7(a,e)所示。 其中染病/健康小麦高光谱影像大小均为470×280像素,均包含540个波段。
对比标准反射率板数据,利用式(3)对小麦籽粒高光谱图像进行归一化并黑白掩膜标定如图7(b,f)所示。 标定后图像中一共包含了116 880个样本点,其中健康小麦籽粒样本点70 007个,染病小麦籽粒样本点46 873个。 分别对归一化后的图像进行SG、TSG滤波,然后采用PCA算法保留包含信息量最多的前六个主成分,运用SVM构建分类识别模型。 SVM模型以高斯径向基核函数(RBF)作为核函数,训练采用十折交叉验证的方法评估,核参数优化采用网络交叉验证法。 随机选取高光谱图像中500个样本点作为训练集,4 500个作为测试集,其中染病与健康样本点各占一半。 在前面所得到的核参数优化区间内采用枚举法多次实验选取最优TSG(m=3,n=4),SG(m=6,n=3)核参数对高光谱图像滤波,滤波后预测模型测试集平均分类精度、测试集卡帕系数[9]、所有样本点的总体分类精度如表1所示,图像预测结果如图7(c,d,g,h)所示。
图7 小麦籽粒高光谱图像掩膜与分类结果可视化
表1 采用不同滤波算法后图像分类性能Table 1 Image classification performance after processedby different filtering algorithms
表1可以看出,对于小麦籽粒数据集,采用SG滤波算法后预测模型平均分类精度只有87.088 9%,比未经滤波时提高了1.155 6%。 而采用本文提出的TSG滤波算法对小麦高光谱图像滤波后,相同预测模型下分类精度高达99.155 6%,模型分类精度提高了13.222 3%。 从图7可以看出,经SG滤波后的图像预测结果中,会有一些分散的样本点(分散在小麦籽粒的边缘或中心)被错误分类,这些样本点中大部分都是受小麦籽粒三维形态影响而过亮或者过暗的异常点,TSG滤波能够根据像素点周围点的信息增强其光谱特征,如图5中经TSG滤波后(45,45)点的光谱特征就得到了显著增强,从而提高这些点的分类精度。
采用Pavia University、小麦赤霉病高光谱数据,针对所提出的TSG滤波算法开展了滤波性能评价与应用研究。 主要结论如下:
(1)结合滤波后图像的信噪比、峰值信噪比、结构相似度得到TSG滤波的优选窗口系数m在2~4、阶数n在3~5之间。
(2)TSG滤波(m=3,n=4)后图像信噪比提升了10%以上、峰值信噪比大于30 db,三个随机点中70~90波段光谱相对峰值高度最高提升31.68%,平均强度提升41.83%。 实验结果表明相较于SG滤波,TSG滤波能够有效抑制条带噪声、增强光谱特征峰,且能增强光谱特征波段。
(3)TSG滤波(m=3,n=4)后基于PCA-SVM算法的小麦赤霉病识别模型分类精度高达99.155 6%,卡帕系数0.983 613,模型分类精度比采用SG滤波提升了12.0667%,为小麦赤霉病高光谱识别系统建立提供了参考和依据。
致谢:感谢安徽省农业科学院汪建来研究员以及中国科学院合肥物质研究院太和试验站提供的小麦籽粒样本; 感谢杭州大江东空间信息研究院潘明忠副研究员对于实验所用高光谱硬件设备的技术支持与指导; 感谢刘爽师兄在生活及实验中的帮助。