刘志刚,刘 翔,廖佳俊,蔡 尚
一种基于RGB比值特征统计模型的高亮点检测算法
刘志刚,刘 翔,廖佳俊,蔡 尚
(第二炮兵工程大学,陕西 西安 710025)
高光谱图像反射率反演问题,已成为制约高光谱图像走向应用的重要障碍之一。常用的平场域法关键在于高亮点的正确选取,而目前的人工方法和自动方法均存在选点不准确和效率较低的缺陷。在进行大量的高光谱图像采集实验的基础上,以标准白板图像为基准,对理想白色区域的R、G、B三个谱段的DN值进行了统计分析,用高斯分布拟合了R、G、B的比值特征,以此模型为依据,给出了一种基于R、G、B谱段DN值分析的自动高亮点搜索方法。实验表明,本算法可有效提高高光谱图像反射率反演的准确性。
高光谱;反射率反演;平场域法;高亮点检测
高光谱遥感技术在军事伪装目标探测与识别领域正越来越受到重视。目前,基于高光谱图像的目标探测与识别,主流的方法还是基于光谱匹配的思想。但由于高光谱成像过程中受目标状态、环境、仪器及采集尺度等因素的影响,常出现“同物异谱”和“同谱异物”现象,使光谱匹配无法进行下去。一种普遍的解决方案是,在进行光谱匹配之前,先对高光谱图像进行预处理,将每个像元的DN值(辐射能量)波谱曲线换算成地物的光谱反射率曲线,使数据具有一定的稳定性,这就是所谓的反射率反演问题。但严格意义上的地物波谱反射率反演非常困难,它已经成为制约高光谱图像走向应用的重大障碍之一。
高光谱反射率反演[1-2]方法主要有3类:基于大气辐射传输方程的反射率反演[3]、借助特殊地物的反射率反演和基于图像数据本身的反射率反演。第1类方法需要用到较为苛刻的环境参数,第2类方法要求在视场内有特殊地物,这两类方法在实际应用中均受到很大的限制,因而第3类方法常常被作为首选方法。基于图像本身的反射率反演[4]方法又有3种:对数残差法[5]、内部平均法[6]和平场域法[7]。其中,对数残差法需要利用图像的全体像元数据,其计算结果受噪声的影响非常严重,同时存在对同种物质光谱的微小差别进行过分放大的缺陷[4]。内部平均法则在很多情况下(如图像中某一种地物所占比例高达90%)完全失效。平场域法是最常用的一种方法,其关键之处在于如何准确、高效地选取高亮区域。通常的做法是人工选取高亮区。由于人眼对色彩与亮度的判断并不客观,甚至还会出现视觉错觉现象,因此常常会选入错误的像元[4]。当图像中本身就不存在连续的高亮区域时,这种错误就更难以避免。
针对上述问题,本文在进行大量的高光谱成像实验的基础上,对白板的R、G、B三个谱段的DN值进行统计建模,以此为基础,提出了一种只用到3个谱段数据的快速高效的自动高亮点检测算法,实验表明,该方法用于高光谱图像的反射率反演与波谱匹配中,可取得很好的效果。
平场域法的本质是要找出视场中的“标准白板”来,由于“标准白板”的反射率处处为1,该处的DN值曲线就可看作是入射光的光谱。当然,这样的“标准白板”并不存在,即使存在,也不见得在每幅图像中都存在。尽管如此,很多时候找到一些接近“标准白板”的点或区域还是可以的。
传统的人工选取平场域法以R、G、B谱段合成的彩色图像为依据,虽然准确性上存在问题,但至少说明高亮区域与R、G、B三个谱段的DN值存在着某种关联。因为R、G、B三个谱段是与人眼视觉特性密切相关的3个谱段,而几乎没有人认为太阳光在正午时刻是偏色的,这就是说,根据经验,利用R、G、B这3个谱段是可以很好地检测出“白色”的太阳光的。不过,太阳光在一天之中会发生强弱和角度的变化,再加上仪器的感光参数也会随之发生变化,所以高亮区对应的R、G、B谱段的DN值肯定也会发生变化。如果只考虑光线强弱和仪器增益的变化的话,高亮区的R、G、B谱段DN值之比应基本不变。基于这一思路,本文对包含白板(高亮区)的同一目标,在不同时段采集了大量的高光谱图像,然后对白板区的R、G、B三个谱段DN值的比值进行统计分析,进而建立其概率分布模型。根据这一模型,通过对待处理的高光谱图像每个象素的R、G、B三个谱段之DN值进行自动分析与筛选,可以很快从中找出符合要求的高亮点来。
使用地面MSHyperSIS成像光谱仪对由高光谱仪器原厂配送的标准参考白板进行光谱数据采集。考虑到地物光谱数据在采集过程中,受到空气中水分、光照角、尺度、光照强度等多种因素的影响,为提高结果的准确性,选择两个晴朗无云且光照充足的夏季白天进行采集,采集时间为早11:00至晚17:00,每间隔半小时,采集一幅图像,总共采集20幅标准参考白板的高光谱图像数据,其中部分实验数据如图1所示,图1(a)~(c)分别为11:00、14:00、17:00采集到的图像数据。
根据高光谱图像中标准参考白板在可见光谱段(400~760nm)上R谱段(700nm)、G谱段(540nm)以及B谱段(430nm)所呈现出的特征,定义RGB比例特征1、2如下:
1=DNR/DNB(1)
2=DNG/DNB(2)
式中:DNR、DNG、DNB分别为R、G、B谱段上的DN值。
利用ENVI软件中的裁剪功能,将图像数据中的白板裁剪下来,每张图像数据根据裁剪大小的不同,有4000~6000个像元点不等,裁剪下来的图像数据仍然保留白板上每个像元的光谱曲线。对20幅图像数据中白板像元的1、2分别计算概率分布(1)、(2)(直方图包络线),如图2(a)和图2(b)所示。
图1 不同时刻采集到的白板实验数据示意图
图2 20幅白板各自的k1、k2分布拟合示意图
观察图2发现,1、2在各个时段均近似满足高斯分布,其中,1在不同时段的分布特性基本一致,2则表现出随时间变化而出现漂移的现象。分析认为,2的漂移主要表现在早晚,由于大气折射而出现入射光偏红引起。由于漂移不大,我们对不同时段采集到的全部1、2特征数据进行叠加,得到关于1、2的总体概率分布,如图3所示。
图3显示,不同时段的RGB比例特征仍能够近似地满足高斯分布,可近似表示为:
式中:、分别为比例特征k的均值和方差。
根据参数估计理论,可利用测量数据估计出和:
式中:k()(=1,2,=1,2,…)为k的第个样本;为样本总量。
图3 20幅白板所有像元点的k1、k2分布拟合示意图
在独立高斯概率模型基础上,可进一步将RGB比例特征作为特征矢量定义如下:
=[1,2]T(6)
则可得特征矢量的联合高斯分布密度模型为:
式中:为特征矢量均值=[1,2]T,可根据式(4)计算得到。为特征矢量的协方差矩阵,即:
式中:
且的对角线元素(=1,2)可由式(5)得出。
综上可知,仅根据采集到的光谱数据样本即可求得概率模型参数{,},在此基础上,可在任意光谱图像中利用概率模型搜索满足高亮点(白板)统计特性的光谱图像像元点作为反射率反演的参考像元点。
为在概率模型式(7)基础上建立搜索准则,将一维高斯分布的归一化置信区间定义推广到多维高斯分布情形,此时多维归一化置信区间可由马氏距离()定义如下,即对于任意光谱图像的第个像元点提取的特征矢量(j),有马氏距离M((j))如下:
设M((j))=,则距离=1,2,3,…,即对应于一维标准高斯分布的-置信区间。因此可作为搜索相似度阈值参数,本文中取=2,即:若某个像元点(j)的M((j))≤2,则认为该像元点是与高亮点(白板)相似的。
我们以绿草和假草的光谱曲线作为研究对象,针对不同实验数据,采用本文方法和传统方法计算绿草和假草的相对反射率光谱曲线,并对结果进行比较分析。绿草的光谱反射特性主要是由植物单叶的光谱反射特性决定的,在450~1000nm光谱曲线上,550nm处有一个反射峰,680nm处有一个吸收峰,700~740nm谱段反射率急剧增大,几乎达到最大值,740nm以后反射率增长缓慢。假草的光谱反射特性根据材质的不同有所区别,本文采集的图像中假草在550nm处有一个反射峰,在690nm和750nm处还有2个反射峰。
实验中使用了3幅高光谱图像作为验证传统算法与本文算法的实验数据。图像数据全部是用地面MSHyperSIS成像光谱仪获取的陕西省西安市某地的高光谱图像,实验选在夏季,拍摄角度为水平向下15°,视场域中的主要地物为绿草和人工假草,图4(a)~(c)分别为11:40、12:50、14:15采集到的图像数据,图像数据的光谱范围均为450~1000nm,共256个谱段,剔除其中的无效谱段(噪声),保留谱段231个。3幅图为各自个图像数据中第37、76、114谱段(分别为B谱段(430nm处)、G谱段(540nm处)、R谱段(700nm处))合成的RGB彩色图像。图像中位于图片下方的草地为绿草,位于图片上方的草地为人工假草。
在匹配标准(对比标准)的选取问题[8]上,考虑到不同时段的空气水分、光照角度等因素影响,由MSHyperSIS成像光谱仪采集一组图像数据中存在符合当时天气状况的标准白板的实验数据,利用视场内白板(图中右下角)的DN值对绿草及假草进行反射率反演,选取两天中不同时段的20个反演结果的平均值作为最后的参考基准,即绿草和假草的标准相对反射率(相对于标准白板),其中部分实验数据如图5所示,图5(a)~(c)分别为14:00、16:00、17:30采集到的图像数据。
依据本文算法针对图4数据进行高亮像元提取的实验结果如图6所示。
分别利用内部平均法、人工选点的平场域法、本文方法对图4所示3幅图像数据中绿草和假草的光谱曲线进行反射率反演,得到各自的结果。绿草和假草的结果分别如图7、图8所示。
在分析讨论实验结果前,我们先通过光谱角匹配[9](SAM)与光谱相似度[10](SCF)定量地评估所有结果与标准绿草曲线及标准假草曲线的匹配结果。
通过匹配的结果可以看出,本文方法在利用3幅图像数据进行反射率反演的情况下,所得结果的匹配率上都优于传统方法。
图4 不同时刻采集到的实验数据示意图
图5 提取标准相对反射率的实验数据示意图
图6 本文算法提取出的高亮像元示意图
图7 绿草的标准相对反射率与针对3幅数据使用3种方法的结果对比
图8 假草的标准相对反射率与针对3幅数据使用3种方法的结果对比
表1 绿草相对反射率与参考反射率的匹配结果
表2 假草相对反射率与参考反射率的匹配结果
以平场域法的2个局限性为切入点,通过实验统计白板的谱段特征,设计了基于R、G、B谱段关系的概率模型,对图像数据中的高亮像元进行自动搜索,实现了基于高光谱图像本身数据的自动反射率反演。总的来说,本文算法有效地克服了高亮区域主观选择的随机性,可有效解决图像数据中没有连续高亮区域的问题,提高了反射率反演的准确性,对进一步实现基于光谱匹配的目标检测有重要意义。另一方面,在研究过程中,根据高光谱仪器的敏感性及不同地区光照角度不同,我们发现本文算法尚且存在一定不足,如不同地区或不同时段,统计模型可能会出现参数变化,这也是我们下一步的研究方向。
[1] Philpot W. The derivative ration algorithm: Avoiding atmospheric effects in remote sensing[J]., 1991, 29(3):350-357.
[2] Farrand W H, Singer R B, Merengi E. Retrieval of apparent surface reflectance from AVIRIS data: A comparison of empirical line, radiative transfer, and spectral Mixing methods[J]., 1994, 47:311-321.
[3] Gao B C, Goetz F H. Colmun atmospheric water vapor and vegetation liquid water retrieval from airborne imaging spectrometer data[J]., 1990, 95(D4): 3549-3563.
[4] 张兵. 时空信息辅助下的高光谱数据挖掘[D]. 中国科学院, 2002. Zhang Bing. Hyperspectral data mining supported by temporal and spatial information[D]. Chinese Academy of Sciences. 2002.
[5] Green A A, Craig M D. Analysis of aircraft spectrometer data with logarithmic residuals[C]//, JPLPublication, 1985: 111-119.
[6] Goetz A F H, Srivastava V. Mineralogical mapping in the Cuprite mining district, Nevada[C]//(), JPL Publication, 1985: 22-31.
[7] Conel J E. Calibration of data using ground-based spectral reflectance measurements[C]//, JPL Publication 85-41, 1985: 184-185.
[8] 张翔. 基于光谱特征增强的高光谱图像地物目标识别[J]. 红外技术, 2010, 32(12): 717-722.
ZHANG Xiang. Target recognition of hyperspectral image based on enhanced spectral characteristics[J]., 2010, 32(12): 717-722.
[9] Kruse F A, Lefkoff A B, Boardman J W, et a1. The spectral image processing system (SIPS)-software for integrated analysis of AVIRIS data[C]//4. JPL Publication, 1992: 23-25.
[10] 许卫东, 尹球, 匡定波. 地物光谱匹配模型比较研究[J]. 红外与毫米学报, 2005, 4(4): 296-300.XU Weidong, YIN Qiu, KUANG Dingbo. Comparison of different spectral match models[J]., 2005, 4(4): 296-300.
A Highlight Pixel Detection Algorithm Based on Statistical Model of RGB Ratio Feature
LIU Zhigang,LIU Xiang,LIAO Jiajun,CAI Shang
(,710025,)
The difficulty of reflectivity inversion for hyperspectral images is of the main obstacle to the application of hyperspectral images. The performance of the commonly used Flat Field method heavily rely on the correct selection of highlight field, unfortunately neither the manual nor automatic selections method performs well in the perspective of accuracy and efficiency. On the basis of extensive experimental collections for hyperspectral images, with the standard referential white board served as ideal white region, the three band in spectrum, i.e. Red, Green and Blue band are chosen in order to exact the ratio characteristics among them. The ratio characteristics are statistically analyzed and demonstrated to be nearly Gaussion distribution, a Gausssion density is thus used to model these characteristics. Subsequently an automatic referential white pixel search method is proposed based on the established Gaussian statistical model, the resultant white pixels lay the foundation of reflectivity inversion for hyperspectral images. Experimental results suggest that the proposed method can effectively improve the accuracy of reflectivity inversion.
hyperspectral,reflectivity inversion,flat field,highlight pixel detection
TP75
A
1001-8891(2016)06-0461-06
2015-09-06;
2015-10-09.
刘志刚(1975-),男,博士,副教授,研究方向:信号与信息处理。
国家自然科学基金项目(41174093);陕西省自然科学基金(2013JM5012)。