郭越,王晓峰
(1.上海海事大学信息工程学院,上海 201306)
基于特征选取及广义傅立叶分形的SAR图像海洋溢油检测算法
郭越1,王晓峰1
(1.上海海事大学信息工程学院,上海 201306)
针对海上溢油SAR图像中油膜与类油膜的识别问题,提出了一种结合傅立叶分形与特征提取的检测算法。由于分形特征可以具有无穷多的细节,并在不同的研究尺度存在自仿射特性。这与油膜及类油膜表面的几何形貌特征非常吻合。该算法通过计算样本的傅立叶分形特征,组成油膜与类油膜的特征空间。然后,应用基于差分进化的特征选取方法将利于分类的重要特征值筛选出来。再利用重要特征值对原有样本进行分类。实验表明,经特征选取的分形特征向量能够以100%的准确率将两类样本区分开。该算法在选取重要特征的同时实现了对高维特征空间降维的目的,该思想可以应用于其他的基于高维特征的识别系统中,具有普遍的适用性。
SAR;油膜;类油膜;傅立叶分形;特征选取
由于海面油膜能够降低海面粗糙度,使合成孔径雷达的Bragg波衰减,造成油膜在SAR图像上一般表现为较暗的区域。因此利用遥感SAR图像监控海上溢油已经成以一种普遍可行的方法。然而,该暗区也可能是由“类油膜”所致(低风速海面、海藻区域、漩涡、暗流等),这就给油膜的识别带来了难度。所以,将油膜和类油膜区别开来,是溢油监测的一个非常关键的问题,也是溢油识别中的一个难点。
通过研究实际的溢油场景,发现在同一片溢油区域内,油膜与类油膜的类型普遍比较单纯。假设在相同的水动力及气候因素作用下,油膜与类油膜这两种具有不同介质属性的物质所呈现出的形态是不同的,并且具有一定规律性。Mandelbrot[1—2]提出并发展的分形几何学是对自然形体建模的最佳工具。分形特征可以具有无穷多的细节,并在不同的研究尺度存在自仿射特性,这与油膜及类油膜表面的几何形貌特征非常吻合,在海面SAR图像的识别中也有应用。Berizzi等[3]提出了一种估计海洋SAR图像的分形特征算法,可测量海洋SAR图像的粗糙度,用该分形特征可对ERS-1/2海洋图像进行表面异常物的分类和识别。Martino等[4]针对SAR图像提出了一个用于监控自然和人造灾害的完整框架,采用分形特征检测灾害区域发生的几何变化。Charalampidis和Stein[5]提出了应用改进的分形特征对SAR图像进行目标检测的方法,该方法针对边缘图像,在同一个尺度上计算改进的分形特征来完成目标检测。然而,目前大部分溢油识别算法通常是简单的通过不同的方法提取出特征,并直接应用这些特征进行分类。没有分析这些特征是否真正有利于区分目标,即没有对提取出来的特征进行评价。因此,以往方法存在的缺陷是:一方面特征维度较高,计算效率差,不具备实际应用价值;另一方面由于特征的有效性不明确,造成分类准确率不高。
本文针对溢油样本,从傅立叶分形参数中选取特征值,应用差分进化特征选取(DEFS)的方法对全样本的特征空间进行筛选。在特征空间中去除那些被DEFS选取出来的油膜与类油膜共有的特征向量,得到差异子空间。应用人工神经网络对油膜和类油膜的差异子空间进行学习,从而以高分辨率区分出油膜与类油膜。本文的主要目标是提供一种能够在高维形态特征中区分油膜与类油膜的方法。通过本算法将区分能力最强的特征子空间抽取出来,为今后的海上溢油识别提供快速,可行的识别方法。实验证明,该算法能够有效提高油膜与类油膜的分类效率及分类准确率。与现有算法相比,该算法不但具有较高的识别率,而且具有很高的灵活性,能够应用于任何基于高维特征的SAR溢油图像识别中,具备较好推广价值。
本文数据来源于30景海上溢油SAR图像,分辨率为100 m,文件格式为Geo TIF。该数据集不但标志出了溢油点的位置而且包含部分海面及天气条件信息,如风力、风向、海面情况等。SAR遥感图像来源于ers-1与ers-2两颗卫星,图像带有卫星拍摄时的详细信息。溢油区域位于南海,所有数据已经给出了对溢油点定性及定量的评价。考虑到SAR图像的分辨率以及运算效率,本文使用该数据集的子集图像即600×600的图像。从以上30景SAR图像中选取了22幅类油膜图像和32幅油膜图像。
图1 数据集样本
本文使用多级分割去噪算法[6],对油膜与类油膜样本进行预处理,能够有效的将原始溢油图像处理为带有极少量噪声的油膜及类油膜二值图像(图1)。首先,通过计算油膜及类油膜的150个分形特征值,得到两类样本由分形特征值组成的特征空间。然后,应用差分进化特征选取方法计算出该特征空间中油膜与类油膜的共同特征,这部分共同特征不利于油膜与类油膜的分类。因此,从特征空间中去除这些共同特征,从而得到差异特征空间。最后,对差异特征空间中的特征值的重要性进行排序,并且分别使用不同数目的重要特征组成特征向量,应用人工神经网络的方法对油膜及类油膜进行分类(图2)。
图2 识别算法总体架构
由于油膜与类油膜属于不同物质,因此二者具有不同的表面特性:表面张力、黏稠度和分子特性,从而导致二者在相同水动力及气候影响下呈现出不同的形态学特征。而分形维数经常被用来描述形态、纹理和粗糙程度等特征,因此分形维度完全可以作为表征油膜与类油膜表面特征的工具。
目前,已有很多方法能够计算出分形值。例如,傅立叶分形、Korcak分形、Kolmogorov分形、Minkowski分形、标准差的快速分形、小岛法分形等。这些方法具有不同的计算效率,数值精度和估计边界。在所有的方法中傅立叶分形法是最有前途一种,它具有以下几方面的优势:首先,傅立叶方法对图像中的噪声不敏感;其次,傅立叶分形算法基于已有的确定公式,并存在快速算法,快速傅立叶变换能够保证其在实际应用中的可行性;第三,傅立叶分形中,功率谱对数与频率对数所拟合的直线在Y轴的截距具有表征形态边缘的粗糙程度的功能。基于以上原因,本文选取傅立叶分形计算油膜与类油膜的分形值。
Russ[7]对傅立叶变换进行了扩展,用来计算数字图像的分形维度。他将牛顿势与图像经傅立叶变换后的功率谱联系起来。基于这一假设,文献[7—9]证明了图像的傅立叶变换功率谱与变频变换有简单的指数关系。
考虑理想情况下,一维分形信号的功率谱和分形维数D。功率谱用如下公式表示:
式中,c为一个常量,β为功率谱指数,该指数与分形维度D有关[10],
式中,DT为图像的拓扑维度(二维图像DT=2)。
下面我们给出如何应用公式(2)计算一个二维图像的分形维度。首先,对于一个图像I(x,y),通过快速傅立叶变换(FFT),得到其功率谱密度PSD,
F(u,v)为图像f(x,y)的傅立叶变换,u和v分别对应在x与y轴上的空域频率。图3a为预处理后的油膜样本图像经傅立叶变换的功率谱图像。由于以功率谱密度为中心的径向基线可以反映图像在该方向上的不同信息,所以从不同方向上对功率谱进行采样可以反映出原始图像在不同方向上的信息。图3b为在不同方向上应用双对数功率谱log P(f)~log(f)在图上描点,再用最小二乘法拟合直线,从而得到分形维度FD。
图3 样本的傅立叶分形
功率谱密度在θ方向上的信息可以通过将P(u,v)转换成极坐标P(f)来实现。
而且,功率谱密度在0<θ<π是对称的,可以通过D在不同径向直线上的极坐标点绘制出D的玫瑰图,如图4a。
图4 24个方向玫瑰图
另外一个有意义的参数是,应用最小二乘法拟合直线所得到的纵轴截距。Rawers和Tylczak[11]讨论了这个参数与图像表面的粗糙程度有关,指出式(1)中的常量比例系数c与拟合直线的纵轴截距有关,可以用来描述图像中客体的粗糙程度。当两个研究客体的分形维度(相同的)相同,而纵轴的截距不同时这两个图像客体也会具有不同的属性。因此,可以将纵轴截距作为分形维度的另外一个特征值。图4b以玫瑰图的方式,从24个方向对拟合直线的纵轴截距进行了描述。
对基于特征的图像识别来说,特征的选取是至关重要的。因此在基于多特征的识别算法中,有必要对特征的重要性进行分析,从而找出对分类更有利的特征子集。这样既能够降低特征空间的维度,又能够提高分类的准确率。在特征选取算法中基于种群的搜索策略比较普遍,例如粒子群算法,遗传算法和蚁群算法等。然而,这些算法在特征维度较高时会陷入局部最优解,并且由于算法本身计算量比较大,计算性能比较差。Price等[12]指出基于差分进化的特征选取方法可以很好的应用于高维特征的选择,并具有较高的计算性能。本文应用一种新型特征选取方法[13],将改进的差分进化算法与统计学方法相结合,从而形成一种简单有效的差分进化特征选取方法。
本文运用DEFS方法将油膜与类油膜的“相似特征”选取出来。我们假设这些“相似特征”不利于区分油膜与类油膜,并从总体特征集中将其去除,得到差异特征子集。根据差异特征子集中,各特征值在不同迭代次数以及不同数目的特征子集中出现的频率,决定特征值的重要性。依据特征值的重要性,组合出不同数目重要特征的特征向量。再应用这些重要特征向量对油膜以及类油膜的分类准确率进行验证。最后将本实验结果与已有方法进行比较。
本实验分别对每幅图像计算其24个方向的参数。θ的间隔为15°,即得到24个方向的拟合直线斜率及24个方向的拟合直线截距,共48维。再计算每幅图像在24个方向的维度及截距的平均值,共2维。然后针对图4中的数据点,取其功率谱密度对数与频率对数各50维作为图像的另外100维特征。因此每一幅图像的分形特征空间为150维。应用DEFS算法选取1~149个油膜与类油膜的相似特征,然后从全部特征值中去除这些相似特征值,对应得到能够区分油膜与类油膜的差异特征集(分别为149~1个)。在DEFS中本文选取了4种类型的迭代次数,分别为:50、100、300、1 000次。
从图5中可以看出不同迭代次数对分类准确率的总体影响。随着迭代次数的增加均值准确率从84%增加到86.9%,分类准确率最大值达到100%。并且可以看出四分位区间也随着迭代次数的增加而变小,这说明随着迭代次数的增加分类准确率集中于较高的准确率区间,既识别算法是收敛的。
图5 不同迭代次数分类准确率厢式图
图6显示了4种不同迭代次数的情况下,取不同数目的差异特征值得到的分类准确率。从图中可以看出,随着迭代次数的增加,准确率高于85%的点有所增加。这表明,随着迭代次数的增加,有更多的使得分类准确率更高的特征组合被选取出来。当差异特征集个数在50~100之间时,分类准确率比较高。图6数据显示,当选取的特征值个数太多时分类准确率都比较低。我们认为,确实存在部分特征值不利于油膜与类油膜的分类。
图6 不同迭代次数下选择不同数目差异特征值进行分类的准确率针状图
表1对不同迭代次数在不同准确率情况下的特征组合个数进行统计。从表1可以看出随着迭代次数的增加,准确率高于85%的特征值组合在300次迭代时达到最多53个;准确率高于90%的特征组合在300及500次迭代中达到最多32个。分类准确率小于80%的特征组合的个数逐渐减少。表1显示,当迭代次数为500次时效果最佳,最高准确率可达100%。
表1 不同准确率级别上特征组合的个数
为了找出所有150个特征值中的重要特征值,取所有4类迭代中准确率高于85%的特征向量,计算这些特征向量中特征值的出现频率。假设出现频率越高的特征值对成功分类贡献越大,因此可以通过各个特征值的出现频率来判断其重要性;假设出现频率越高,特征值越重要。图7中前1~24个特征值分别代表图形在24个方向的梯度;25~48个特征值代表24个方向的拟合曲线纵轴截距;第49,50维特征值为24个方向的梯度和纵轴截距的平均值;51~100个特征向值为一阶拟合直线的横坐标点,即频率的对数。101~150个特征值为该拟合直线中的纵坐标即功率谱密度的对数。
图7 不同迭代次数中各特征值出现次数
对所有特征值的出现频率进行分析。从图7可以看出,前1~24个特征值为方向梯度,其中仅有3个方向的梯度出现频率较低,有10个特征值进入前50个重要特征值。对于第25~48个特征值,既拟合曲线的截距来说,也只有4个出现频率较低,其中有7个特征值进入前50重要特征值。而第49、50维特征向量,即24个方向的平均梯度和截距明显没有明显优势。这说明在某些特定方向上的梯度特征对于油膜与类油膜是有差异的,而平均特征不能反映其差别。而对于拟合直线的50个横坐标及纵坐标点来说,大部分都具有较高的出现次数频率。我们认为这些出现频率较高的特征向量,具有比较好的分类性能,是区分类油膜与油膜的关键特征。
表2 不同数目重要特征的分类准确率对比
表2显示,分别选取9组不同数目重要特征的准确率。对于ANN,取不同数目的重要特征,分类准确率都接近100%。只有重要特征个数为30、40、70个时为98%。对于深度学习的方法,对22个类油膜样本及28个油膜样本使用这9组不同特征值进行测试。深度学习算法应用100×100×100的DBN,使用DBN的权重来初始化NN。迭代次数为100次,分组大小为5。从准确率可以看出深度学习的分类准确率明显低于ANN。因此,试图通过ANN方法,找到在150个特征值中有多少特征值对与分类是有利的。
取10~100个重要特征,并用ANN迭代200次,记录下每次的迭代的分类准确率。然后将不同特征值个数的分类准确率分布用盒图表示。从图8中可以看出,当重要特征值个数在50个的时候,准确率平均值以及四分区都比其他类型要高。而且当特征值个数多于50个时,均值及四分区间都比特征值较少时的准确率要低。这证明了前面的假设,并不是特征值越多越有利于分类。并且在150个特征中选取50个特征值对于分类的效果是最好的。
图8 不同数目重要特征值分类准确率厢式图
为了评估本算法的性能,对比了在相同样本空间的条件下使用全部特征值与使用前50个重要特征值的分类效果。从表3中可以看出,油膜及类油膜分类的准确率从全特征空间的87%上升到重要特征空间的100%。分类的覆盖率及命中率也都有很大提高。这说明被确定下来的特征值数目及被选取出来的特征值对于本次分类是非常有效的。
表3 对比150个特征与50个重要特征下分类效果
虽然利用不同的数据集对不同的算法进行比较是不合适的,但为了与其他算法对比,本文选取溢油识别领域,特别是针对油膜与类油膜的识别算法进行比较。Konstantinos和Apostolos[14]运用决策森林法从25个特征中选取了9个特征对油膜及类油膜进行分类。文献[15-16]应用智能计算的方法,使用9个特征对油膜进行识别。Pudil等[17]等运用序列浮动前向选择算法使用Fisher修复指数选取了4个几何特征和5个物理特征。Lena等[18]采用内置漏油模型和广义似然比检测理论,对溢油进行检查。Suman等[19]从油膜与类油膜中选取了41个特征,应用Patrick-Fisher距离标注了其重要性,从而对油膜进行识别。表4对以上几种算法的分类准确率进行了对比,唯有本文所提出的方法的准确率达到最高100%。
表4 不同方案的分类准确率
从算法的执行效率上来看,经过本文的特征选取方法得到的重要特征,是对特征空间所做的一次有效的降维。进而可以提高算法的运行效率。因此本算法是处理高维特征分类的有效方法。
由于存在自然类油膜及其他污染,油膜与类油膜的识别是溢油识别中一个比较大的挑战。现有的大部分研究主要集中在将不同的特征应用于样本的分类中,很少考虑该特征是否真正适合与分类。本文结合油膜的分形特征应用基于差分进化的特征选取方法,对所有150个特征值进行比较选择,从中选出50个重要特征值。实验证明,运用这50个重要特征向量能够有效的区分油膜类油膜,识别率达到100%,同时达到了降维和提高运算效率的目的。本文研究表明,分形特征可以较好地与海表面以及海面回波的结构相吻合,当海杂波中存在油膜与类油膜等目标信号时,分形特征将发生明显变化,因此可以利用油膜目标和类油膜之间的分形特征差异来检测目标。本文中提到的选取重要特征值的思想也可以应用到其它具有高维特征的分类系统中,以提高算法的分类准确率和效率。
[1]Mandelbrot B B.Fractals:Form,Chance,and Dimension[M].San Francisco:Freeman,1977.
[2]Mandelbrot B B.The Fractal Geometry of Nature[M].San Francisco:Freeman,1983.
[3]Berizzi F,Bertini G,Martoreua M,et al.Two-dimensional variation algorithm for fractal analysis of sea SAR images[J].IEEE Trans on Geoscience and Remote Sensing,2006,44(9):2361—2373.
[4]Martino G D,Lodice A,Riccio D,et al.A navel approach for disaster monitoring:fractal models and tools[J].IEEE Trans On Geoscience and Remote Sensing,2007,45(6):1559—1570.
[5]Charalampidi D,Stein G W.Target detection based on multiresolution fractal analysis[C]//Defense and Seourity Symposiom.International Society for Optics and Photonics,2007:65671B-6567TB-8.
[6]Guo Yue,Wang Xiaofeng.Oil Spill Detection by SAR Images Based on Shape Feature Space[J].International Proceedings of Computer Science and Information Technology,2011,17:187—194.
[7]Russ J C.Fractal Surfaces[M].New York:Plenum Press,1994.
[8]Chan K.Quantitative characterization of electron micrograph imageusing fractal feature[J].IEEE Transactions on Biomedical Engineering,1995,42(10):1033—1037.
[9]Quevedo R,Mendoza F,Aguilera J M,et al.Determination of senescent spotting in banana(Musa cavendish)using fractal texture Fourier image[J].Journal of Food Engineering,2008,84(4):509—515.
[10]Turner M J,Blackledge J M,Andrews P R.Fractal Geometry in Digital Imaging[M].London:Academic Press,1998.
[11]Rawers J,Tylczak J.Fractal characterization of wear-erosion surfaces[J].Journal of Materials Engineering and Performance,1999,8(6):669—676.
[12]Price K,Storn R M,Lampinen J A.Differential evolution:A practicalapproach to global optimization[M].Washington:U.S.Government Printing Office,2005.
[13]Adel Al-J,Ahmed Al-A,Rami K,et al.Differential Evolution based Feature Subset Selection[C]//Proceedings of the 19th International Conference on Pattern Recognition(ICPR-2008).Sydney:University of Technology,2007.
[14]Konstantinos T,Apostolos P.Oil spill feature selection and classification using decision tree forest on SARimage data[J].Journal of Photogrammetry and Remote Sensing,2012,68:135—143.
[15]Stathakis D,Topouzelis K,Karathanassi V.Large-scale feature selection using evolved neural networks[C]//Image and Sigmal Processing for Remote Sensing XII.Stockholm,2006.
[16]Topouzelis K,Stathakis D,Karathanassi V.Investigation of genetic algorithms contribution to feature selection for oil spill detection[J].International Journal of Remote Sensing,2009,30(3):611—625.
[17]Pudil P,Novovicova J,Kittler J.Floating search methods in features election[J].Pattern Recognition Letters,1994,15(11):1119—1125.
[18]Chang L,Tang Z S,Chang S H,et al.A region-based GLRT detection of oil spills in SAR images[J].Pattern Recognition Letters,2008,29:1915—1923.
[19]Suman S,Michele V,Olaf T.Automatic Synthetic Aperture Radar based oil spill detection and performance estimation via a semi-automatic operational service benchmark[J].Marine Pollution Bulletin,2013,73(1):199—209.
Oil spill detection by SAR images based on feature selection and fourier fractal
Guo Yue1,Wang Xiaofeng2
(1.Shanghai Maritime University,School of Information Technology,Shanghai 201306,China)
In this paper,a novel algorithm is present for oil spill detecting from look-alikes on SAR image.It based on Fourier fractal and feature selection.Fractal characteristics have an infinite number of details,and it has self-affine characteristics in different scales.These geometric characteristics are identical with oil film and look-alikes surface very well.The feature space of this method is composed by Fourier fractal characteristics.By using the differential evolution feature selection method,we select important eigen values(IEs)from total sample space.By using ANN and IEs,we classify the sample space.Experimental results show that classify accuracy rate reach the 100% when using selected eigenvectors.The algorithm gets the purpose of dimension reduction while select the important feature.This idea can be applied to other high-dimensional feature-based recognition system.
SAR;oil-films;look-alikes;feature selection;generalized Fourier fractal
TP753
A
0253-4193(2014)05-0061-07
2013-10-02;
2013-11-29。
海洋公益性行业科研专项(201205012)。
郭越(1977—),男,内蒙古包头市人,讲师,从事海洋遥感图像目标检索等研究。E-mail:yueguo@shmtu.edu.cn
郭越,王晓峰.基于特征选取及广义傅立叶分形的SAR图像海洋溢油检测算法[J].海洋学报,2014,36(5):61-67,
10.3969/j.issn.0253-4193.2014.05.007
Guo Yue,Wang Xiaofeng.Oil spill detection by SAR images based on feature selection and fourier fractal[J].Acta Oceanologica Sinica(in Chinese),2014,36(5):61—67,doi:10.3969/j.issn.0253-4193.2014.05.007