张彦敏,徐 卓,旭 锋
(中国海洋大学信息科学与工程学院,山东 青岛 266100)
海上溢油合成孔径雷达探测研究*
张彦敏,徐 卓,旭 锋
(中国海洋大学信息科学与工程学院,山东 青岛 266100)
在合成孔径雷达(SAR)图像中区分溢油和类油现象是溢油SAR探测的关键任务。实现该任务一般可分为3步:首先是提取油膜和类油膜的特征;然后筛选出有助于油膜和类油膜分类的关键特征;最后构造有效的分类器进行模式识别以便做出准确的判别。本文基于2011年蓬莱19-3油田溢油事故期间的15景SAR图像提取了138个油膜和类油膜样本的几何特征、背景特征、散射特征和纹理特征,将Fisher判别率和序列前向选择方法相结合,筛选出背景后向散射系数标准差、逆差距、能量和后向散射系数的均值四个关键特征组成的特征子集。在此基础上,为提高分类器的精度,将决策树模型CART算法与Bagging技术相结合,通过随机抽样给出多个维数相同大小的训练数据集从而建立多个决策树模型,以投票的方式对油膜和类油膜样本进行分类;最后,文中采用了五折和十折交叉验证方法对油膜和类油膜的分类结果进行评估,研究显示基于Bagging的决策树方法的油膜和类油膜分类的平均精度在85%以上,且将文中所用基于Bagging的CART决策树分类算法与经典CART决策树分类算法及神经网络分类算法相比较,发现本文所用方法的分类精度较高,从而表明了该方法在溢油SAR探测方面的可行性。
合成孔径雷达; 特征选择; 油膜分类; CART决策树; Bagging
大面积的海上溢油事故致使海洋环境受到严重污染和损害,造成众多鱼类、海鸟、藻类和海洋哺乳动物的大量死亡,对沿海生态环境和生物多样性构成严重威胁,直接影响沿海经济和社会的健康与可持续发展。遥感技术的发展为海面遥感溢油监测提供了多种手段,其中星载SAR由于具有全天时、全天候的工作能力,已成为监测海洋溢油的最为有效的手段之一。目前,国内外众多学者在SAR溢油探测方面做了大量研究[1-18]。
在单极化SAR溢油探测方面,相关学者提出了诸多溢油探测方法。通常,将溢油探测分为3步:(1)暗斑检测(2)特征提取(3)油膜与类油膜的分类。暗斑检测是基于图像分割技术来确定SAR图像上的暗斑目标。Solberg等[1-2]采用自适应阈值分割算法与多尺度金字塔方法相结合来分割SAR图像中的溢油目标。Fiscella等[3]利用半自动检测算法检测出SAR图像上的暗斑,然后进行目视判读识别溢油。Li Fang等[4]用C-V模型和水平集方法,对斑点噪声抑制后的SAR图像进行溢油检测,取得了不错的效果。在油膜与类油膜的分类方面国内外学者将模式识别引用到溢油和类油现象区分的问题中来,主要包括:贝叶斯分类器、模糊逻辑分类器、决策树、神经网络等方法。Solberg 等[1-2]利用贝叶斯分类器的方法对SAR图像海洋溢油和类油现象进行了分类识别,该模型具有较高的溢油识别准确率;Fiscella等[3]利用了Mahalanobis分类器对溢油和类溢油现象进行分类,也取得较好的结果。Akar等[5]基于模糊逻辑分类器开展了油膜和类油膜的分类。研究表明,在不同场景中,油膜分类精度不同,当油膜与背景对比度高时,油膜分类精度高;当油膜与背景对比度较低时,油膜分类精度较低。周慧等[6]针对威望号船只溢油等典型溢油事故期间的SAR影像,选出8个油膜和类油膜区分度高的特征,采用马氏距离分类器对海上溢油进行识别。施永春等[7]以纹理特征作为关键特征,并应用 Adaboost分类器开展了油膜与类油膜的分类研究,发现基于Adaboost的SAR影像溢油检测算法的性能优于神经网络分类器。Topouzelis等[8]提出一种新的基于决策树林的溢油特征选取与分类方法,分析了25个常用溢油特征对于分类结果的影响,以达到使用溢油特征数目最小,同时分类精度较高的双重目标。张渊智等[9]采用小波变换和水平集相结合的方法分割溢油SAR图像探测暗斑,并用神经网络方法把暗斑分为油膜和类油膜两类。邹亚荣等[10]提出了一种数据的多元指标溢油信息提取方法,以溢油形状参数、纹理特征指数、物理特性指数等为主要指标,并以层次分析法得出每一类指标的权重,针对每一类指标建立溢油特征的判断等级,判断溢油的置信度,为溢油识别提供依据。Xu等[11]针对目前常用的溢油特征,对七种经典的溢油检测方法进行了详细分析和评价,并给出了不同溢油检测方法的使用情况和所需的特征组合。
CART(Classification And Regression Tree)[21]是决策树的一种,采用二分递归分割技术,即将当前样本集分为两个子样本集,其生成的决策树是一棵二叉树,提高了生成决策树的效率。CART决策树方法同时还具有灵活、直观、清晰等特点,在遥感分类问题中表现出巨大的优势[22-23]。近年来,该方法在土壤分类、植被指数提取及海冰分类等方面越来越得到广泛应用[24-25]。然而,决策树分类器具有方差大的缺点,当训练集发生较小变化时会产生不同的树,这是由于分类树多层性的特点,在顶层节点上发生的错误会一直传播并延续到叶子,因此决策树是一种不稳定的分类器。Bagging[26]算法又称自助聚类,是一种简单但是能有效的产生一个集成分类器的方法,利用重采样方法将实际中唯一的训练集生成多个不同的训练集,从而改进不稳定分类器的分类性能。秦姣龙等[27]通过对UCI数据集中的haberman样本集进行测试,表明Bagging 算法能有效处理数据的分类问题。本文拟将决策树模型CART算法与bagging技术相结合对SAR油膜和类油膜样本进行分类。
提取油膜和类油膜样本的16种典型特征,并从中筛选出有利于油膜和类油膜分类的关键特征组成的特征子集。
1.1 溢油SAR数据介绍
本文所采用的数据是2011年蓬莱19-3油田溢油事故期间不同SAR传感器所获取的15景影像,数据的详细信息见表1。
首先,在对15景溢油SAR影像进行辐射校正、几何校正及滤波处理等预处理的基础上,通过专家经验目视解译获得了138个暗斑样本,其中,油膜暗斑样本87个,大气重力波、船尾迹、低风速区等类油膜暗斑样本51个。图1和2分别给出了油膜样本和类油膜样本的实例图。
图1 溢油样本Fig.1 Samples of oil spills
图2 类油膜样本(左图:大气重力波; 右图:船尾迹)Fig.2 Samples of lookalikes (Left:atmospheric gravity wave; right:wake of ship )
1.2 特征提取
类油膜(如:大气重力波、船尾迹、低风速区、上升流、雨团等)和油膜在SAR图像中都呈现为暗斑特征。因此,仅仅基于SAR图像的亮度值来区分油膜和类油膜是不可行的。为了能够有效区分油膜和类油膜,本文提取了油膜暗斑和类油膜暗斑的四类特征:几何特征、背景特征、散射特征和纹理特征,并从中寻找能够区分油膜和类油膜的关键特征,以便于应用于油膜和类油膜的分类。针对以上四类特征,本文所提取的16种特征如下:
几何特征:
(1)面积:暗斑的面积A;
(2)周长:暗斑的边界长度P;
环境特征:
(4)与航线的距离:暗斑与航线的距离;
(5)与石油平台的距离:暗斑与主要石油平台的距离;
物理特征:
(6)后向散射系数的均值:暗斑后向散射系数的平均值u0;(7)后向散射系数的标准差:暗斑后向散射系数的标准差σ0;
(8)背景后向散射系数的均值:暗斑周围后向散射系数的平均值us;
(9)背景后向散射系数的标准差:暗斑周围后向散射系数的标准差σs;
纹理特征:
1.3 特征选择
在应用本文所提取的特征进行模式识别之前,为了降低数据计算的成本和分类器分类的复杂度,我们将减少特征维数,删除对溢油分类效果不好的特征来提高分类效率。在SAR图像的特征中出现无法提供可用信息的特征是比较常见的,它们或是与分类无关,或是具有强相关性的冗余特征。一般特征选择的出发点有两类:一是考虑特征的分辨能力,一是考虑特征间的相关程度。为了获得精确度更高的模式识别模型,在选择特征时,不仅要求能够考虑到单个特征的分辨度,而且要求能够考虑到特征组合的特性。因此,本文将寻找一个特征子集,使其对油膜和类油膜的分类效果最优。
为了得到最优分类器,使错误率最小,本文利用Fisher线性判别分析法[19]对所提取的特征的分类能力进行判定。Fisher线性判别分析法是一种降低特征维数的方法,其基本思想是将高维空间中所有的样本数据都投影到某个方向上,实现从高维向一维的压缩,因此寻找投影直线的方向和实现投影的方法是解决问题的关键。希望在投影后的一维空间中,两类样本投影结果的均值的差距尽可能大一些,而使各类样本内部的离散程度尽可能小一些。各类别样本可以分离是因为它们位于特征空间不同的区域,显然这些区域之间距离越大类别可分性就越大。
定义下列矩阵[20]:
类内散布矩阵
(1)
其中:Σi是ωi类的协方差矩阵Σi=E[(x-μi)(x-μi)T];Pi是ωi类的先验概率。
类间散布矩阵
(2)
混合散布矩阵
Sm=E[(x-μ0)(x-μ0)T],
(3)
即Sm是全局均值向量的协方差矩阵。
由上述定义可得到下述准则:
(4)
如果用行列式代替迹,则会产生另一个标准
(5)
(6)
其中μ1、μ2、σ1、σ2分别表示两类特征的均值和方差。
由上述方法通过计算可得到油膜和类油膜两类问题分类中单个特征的FDR值见表2,从表中可看出区分油膜和类油膜的单个特征FDR值最大的是暗斑(油膜或类油膜)的背景后向散射系数的标准差,下面将其作为选定的第一个特征,再寻找其它特征组成溢油探测的最优特征子集。
表2 单一特征的判别准则FDR排序Table 2 The features are sorted from big to small based on the FDR value of single feature
设已有d1(d1=1)个特征的特征集合Xd1(Xd1=X1),对每一个未入选的特征ξj(即X-Xd1中的特征)计算准则函数Jj=(X1,ξj)T。选择使Jj值最大的那个特征,并将其加入集合Xd1中。重复以上步骤,直至Jj的值趋于稳定。
通过计算,本文得到背景后向散射系数标准差、逆差距、能量和后向散射系数的均值4个特征组成溢油探测的最优特征组合,这个组合的类间距与类内距的比值最大。在下面的分类过程中,将利用该特征组合对油膜和类油膜进行分类。
基于上面所得到的最优特征组合,进一步采用模式识别的方法对油膜和类油膜进行分类。
2.1 基于Bagging的决策树分类算法
决策树是一种通过变量值的拆分建立分类规则,且利用树形图分割形成概念路径的分类技术。节点分为根结点,内部结点和叶结点三类层次,不同层次的结
点对应不同的样本子集,根结点对应整个样本集。根结点和内部结点对属性进行测试,按照不同的判断,将树转向不同的分枝,直到最后传到叶结点。叶结点表示相应的类别。因此,可理解为整个数据空间被决策树划分为若干子空间,样本的类别就是其落到的某个子空间对应的叶结点的类别。决策树的构造为先利用训练集生成决策树,然后对决策树进行剪枝。一般从根结点开始,由上至下进行递归,采用分而治之的策略,不断地将训练样本分割成子集。剪枝过程就是修剪树结构,从而删除多余的分支。对样本进行分类时,从根结点开始对样本的特征进行测试,根据测试结果抵达下一个结点,不断重复该过程直到抵达叶结点,叶结点的类别即为所预测的类别。
CART算法是一棵二叉树,其提高了生成决策树的效率。在创建分类树递归过程中,选择当前数据集中具有最小Gini指标的特征作为节点划分决策树。
Gini指标定义为:
(7)
其中,p(j|t)为类别j在节点t处的概率。由(7)式可得,当节点中的样本属于同一类别时,Gini指标为零。若样本集合T分为m个部分,则该样本集合的平均Gini指标为:
(8)
其中:m为子节点数;ni为子节点i处的样本数;n为总样本数。从所有平均Gini指标中找到最小的,其对应的特征和阈值就是最优的分割特征。
为避免决策树过拟合样本,需要通过剪枝来进行简化。CART采用CCP(代价复杂度)剪枝方法,其选择节点表面误差率增益值最小的非叶子节点,删除该非叶子节点的左右子节点,如果存在多个非叶子节点的表面误差率增益值同样小,则选择非叶子节点中子节点数最多的非叶子
节点进行剪枝。表面误差率增益值定义为:
(9)
然而,决策树分类器具有方差大的缺点,当训练集发生较小变化时会产生不同的树,这是由于分类树多层性的特点,在顶层节点上发生的错误会一直传播并延续到叶子,因此决策树是一种不稳定的分类器。
Bagging是一种能提高不稳定性分类器的分类精度的技术。其主要思想是:给定一不稳定分类器和一训练集(x1,y1),…,(xn,yn),让该分类器训练多轮,每轮的训练集是从初始训练集中有放回地随机取出的n个训练数据组成的多个自助训练数据集,由于是有放回的采样,将导致初始训练集中的某些数据没有被选取,而某些数据被多次重复选取。将自助训练数据集视为训练数据集,训练不稳定的分类器从而得到多个预测结果,最终的预测结果将采用投票的方式确定。
基于bagging的决策树分类算法是一种提高决策树这种弱分类器的分类精度的技术。通过采用Bagging算法进行有放回地随机抽取来构造和训练集维数大小相同的多个自助训练集,从而构造出多棵决策树,最后将每棵决策树得到的预测结果再进行投票从而得到较为稳定的分类结果。下面我们将采用该技术来对油膜和类油膜进行分类。
2.2 油膜与类油膜的分类结果
本文结合决策树CART算法和bagging技术开展了油膜和类油膜的分类,其算法流程图如图3所示。
图3 基于bagging决策树的油膜和类油膜分类算法流程图Fig.3 The flow chart of the classification algorithm for oil spill discrimination
暗斑(油膜和类油膜)的总样本数为138个,把所有样本分为10等份,取其中的9份作为训练集,总样本为测试集。将测试集输入基于决策树的bagging算法100次迭代后进行测试,统计10次计算出现的结果如表3所示。
表3 油膜和类油膜分类结果
通过测试发现当迭代次数为100次,即将训练数据集有放回地取100次得到100个不同训练集,按照决策树方法分类后,进行100次投票,所得到的分类结果的精度趋于稳定。然而,上述方法由于训练集中的数据有部分和测试数据相重合,因此,该结果仅能说明100次迭代的bagging决策树算法分类结果的稳定性,其分类精度有待进一步讨论。为了给出有效的分类结果,下面分别采用五折和十折交叉验证法对油膜和类油膜进行了分类。
采用五折交叉验证法进行分类,这里将油膜和类油膜样本分为5等份,取其中的4份作为训练集,1份作为测试集,将测试集输入基于决策树的bagging算法100次迭代后进行测试,统计循环测试5次计算出现的结果如表4所示:
表4 五折交叉验证法油膜和类油膜分类结果
采用经典的十折交叉验证法进行分类,这里将油膜和类油膜样本分为10等份,取其中的9份作为训练集,1份作为测试集,将测试集输入到基于决策树的bagging算法100次迭代后进行测试,统计循环测试10次计算出现的结果如表5所示:
表5 十折交叉验证法油膜和类油膜分类结果
表4和5分别给出了五折交叉验证和十折交叉验证法对油膜和类油膜进行分类,可以看出,油膜和类油膜的分类精度都在85%以上,由于本文所用样本的数据量较小,因此,这里有必要采用交叉验证法的方法进行分类以获取有效的分类精度。
表6 BP神经网络算法五折交叉验证法油膜和类油膜分类结果
表7 CART算法五折交叉验证法油膜和类油膜分类结果
为了比较说明本文所采用基于bagging决策树的算法的有效性,我们将同样的油膜和类油膜样本采用经典CART算法和BP神经网络算法进行了分类,表6~9分别给出CART决策树分类算法及BP神经网络分类算法的五折和十折交叉验证法油膜和类油膜分类结果。与表4~5给出的本文所采用的基于bagging决策树算法的分类结果相比较,发现本文算法的分类结果无论是五折还是十折交叉验证法的油膜和类油膜的分类结果都优于其它两种分类方法的结果,这表明我们所采用的基于bagging决策树的算法在SAR溢油探测上的可行性。
表8 BP神经网络算法十折交叉验证法油膜和类油膜分类结果
为了区分油膜和类油膜,本文采用Fisher判别率和序列前向搜索方法确立了背景后向散射系数标准差、逆差距、能量和后向散射系数的均值四个关键特征组成的最优特征集,并采用基于bagging的决策树模型,对油膜和类油膜进行了分类,研究表明100次迭代,即通过有放回地抽样100个不同的训练集,建立决策树模型并进行投票方式分类,分类的总精度趋于稳定。进一步,采用五折和十折交叉验证方法给出基于bagging的决策树方法对油膜和类油膜分类的平均精度达到85%以上,且将文中所用基于bagging的CART决策树分类算法与经典CART决策树分类算法及神经网络分类算法相比较,发现本文所用方法的分类精度较高。该方法为海上溢油SAR探测的业务化应用提供了算法支持。
表9 CART算法十折交叉验证法油膜和类油膜分类结果
由于2011年蓬莱19-3溢油事故中所获得的溢油SAR数据所限制,仅提取了138个油膜和类油膜样本,为得到有效的分类精度,文中采用了五折和十折交叉验证的算法进行分类,在未来的工作中,随着获取溢油SAR数据的增多,将不断扩大溢油和类油膜的样本数目,以便于得到更为准确的分类结果。另外,本文的计算结果与类油膜的种类没有建立相应关联,在未来的工作中也将进一步讨论该问题。
[1]SolbergAHS,StorvikG,SolbergR,etal.AutomaticdetectionofoilspillsinERSSARimages[J].IEEETransactionsonGeoscienceandRemoteSensing,1999,37(4):1916-1924.
[2]SolbergAHS,BrekkeC,HusøyP.OilspilldetectioninRadarsatandEnvisatSARimages[J].IEEETransactionsonGeoscienceandRemoteSensing,2007,45(3):746-755.
[3]FiscellaB,GiancasproA,NirchioF,etal.OilspilldetectionusingmarineSARimages[J].InternationalJournalofRemoteSensing,2000,21(18):3561-3566.
[4]LiF,ShenCM.Atwo-stagemethodforoilslicksegmentation[J].InternationalJournalofRemoteSensing,2010,31(15):4217-4226.
[5]AkarS,SüzenML,KaymakciN.Detectionandobject-basedclassificationofoffshoreoilslicksusingENVISAT-ASARimages[J].EnvironMonitAssess,2011,183:409-423.
[6] 周慧,陈澎.利用Mahalanobis距离的SAR图像溢油识别[J].计算机工程与应用,2011,47(18):195-203.ZhouH,ChenP.OilspillsidentificationinSARimageusingMahalanobisdistance[J].Computer Engineering and Applications,2011,47(18):195-203.
[7] 施永春.基于Adaboost的SAR图像溢油检测[J].电脑知识与技术,2011,7(29):7252-7254.Shi Y C.Using Adaboost to detect oil spill in SAR images[J].Computer Knowledge and Technology,2011,7(29):7252-7254.
[8] Topouzelis K,Psyllos A.Oil spill feature selection and classification using decision tree forest on SAR image data[J].ISPRS Journal of Photogrammetry and Remote Sensing,2012,68:135-143.
[9] Zhang Y Z,Lin H,Liu Q,et al.Oil-spill monitoring in the coastal waters of Hong Kong and Vicinity[J].Marine Geodesy,2012,35:93-106.
[10] 邹亚荣,邹斌,梁超,等.多元指标的海上溢油信息提取[J].地球信息科学学报,2012,14(2):265-269.Zhou Y R,Zou B,Liang C,et al.Multiple index information extraction of marine oil spills[J].Journal of Geo-Information Science,2012,14(2):265-269.
[11] Xu L L,Li J,Brenning A.A comparative study of different classification techniques for marine oil spill identification using RADARSAT-1 imagery[J].Remote Sensing of Environment,2014,141:14-23.
[12] Evtushenko N V,Ivanov A Y.Oil seeps in the southeastern Black Sea studied using satellite synthetic aperture radar images[J].Atmospheric and Oceanic Physics,2013,49(9):913-918.
[13] Garcia-Pineda O,MacDonald I R,Li X F,et al.Oil spill mapping and measurement in the Gulf of Mexico with textural classifier neural network algorithm (TCNNA) [J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2013,6(6):2517-2525.
[14] Singha S,Bellerby T J,Trieschmann O.Satellite oil spill detection using artificial neural networks[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2013,6(6):2355-2363.
[15] Bandiera F,Masciullo A,Ricci G.A bayesian approach to oil slicks edge detection based on SAR data[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(5):2901-2909.
[16] Ivanov A Y,Kucheiko A A.Large discharges from ships in the Black Sea studied by synthetic aperture radar with the support of automated identification systems[J].International Journal of Remote Sensing,2014 ,35(14):5513-5526.
[17] Singha S,Vespe M,Trieschmann O.Automatic synthetic aperture radar based oil spill detection and performance estimation via a semi-automatic operational service benchmark[J].Marine Pollution Bulletin,2013,73(1):199-209.
[18] Marghany M.Automatic detection of oil spills in the Gulf of Mexico from RADARSAT-2 SAR satellite data[J].Environ Earth Sci,2015,74:5935-5947.
[19] Fisher R A.The use of multiple measurements in taxonomic problems [J].Annals of Eugenics,1936,7(2):179-188.
[20] Sergios Theodoridis,Konstantions Koutroumbas .Pattern Recognition,Fourth Edition[M].李晶皎,王爱侠,王骄,等译.模式识别:第四版.北京:电子工业出版社,2010.
[21] Breiman L,Friedman J,Olshen R,et al.Classification and Regression Trees[M].Pacific Grove:wikipedia,1984.
[22] Srinivas M,Patnaik L M,Adaptive probabilities of crossover and mutation in genetic algorithms[J].IEEE Transactions on Systems Man and Cybernetics,1994,24(4):656-667
[23] Iyer S K,Saxenab B,Improved genetic algorithm for the permutation flow shop scheduling problem[J].Computers and Operations Research,2004,31(4):593-606.
[24] 陈云,戴锦芳,李俊杰,基于影像多种特征的CART决策树分类方法及其应用[J].地理与地理信息科学,2008,24(2):33-36.Chen Y,Dai J F,Li J J,CART-based decision tree classifier Using multi-feature of image and its application[J].Geography and Geo-Information Science,2008,24(2):33-36.
[25] 张娜,张庆河,基于CART决策树方法的MODIS数据海冰反演 [J].海洋通报,2016,33(3):321-327.Zhang N,Zhang Q H.Retrievalof the sea ice area from MODIS data by CART decision tree method[J].Marine Science Bulletin,2016,33(3):321-327.
[26] Breiman L.Bagging predictors[J].Machine Learning,1996,24:123-140.
[27] 秦姣龙,王蔚.Bagging 组合的不平衡数据分类方法[J].Computer Engineering,2011,37(14):178-182.Qin J L,Wang W.Imbalanced data classification method for bagging combination[J].Computer Engineering,2011,37(14):178-182.
责任编辑 陈呈超
Study of Oil Spill Detection on SAR Images
ZHANG Yan-Min,XU Zhuo,XU Feng
(College of Information Science and Engineering,Ocean University of China,Qingdao 266100,China)
Discriminating oil spills from lookalike phenomena is a crucial procedure in oil spill detection.To achieve this purpose,three-step approach is taken in general:firstly,features of oil spills and lookalikes are extracted; then,key features which are beneficial to the oil spill classification are screened out; finally,effective classifier is built and pattern recognition method is used to conduct classification.In this paper,16 kinds of features which include geometric features,surrounding features,backscattering features and textural features of 138 oil spills and lookalikes are extracted from 15 SAR images.The images were acquired during Penglai 19-3 Platform oil spill accident in 2011.The 16 features are sorted from big to small based on the FDR value of the single feature.We find that the standard deviation of backscattering coefficient of the backgrounds has larger FDR value.Therefore,it can be selected as the first feature.Then,the forward selection method of sequential search method are used to determinate the optimal feature subset for oil spill detection.We find that the standard deviation of backscattering coefficient of the backgrounds,inverse difference moment,energy and the mean value of backscattering coefficient can be selected as the optimal feature subset in this work.CART(Classification And Regression Tree) is a kind of binary decision tree which is helpful to improve efficiency of generating tree.However,the disadvantage of the decision tree classifier is that the variance of classification results is quite high.So the decision tree classifier is an unstable classifier.While for bagging algorithm,the only real training set in practice are divided into different training sets through resampling methods.And that is benefit for improving the unstable classifier performance.The bagging method based on decision-making tree combines massive calculation of single classifiers which is helpful to improve the accuracy of oil spill detection.In this paper,we combine CART with bagging algorithm to classify the oil spills from look-alike.Multiple training data sets with the same size are generated by random selection,and then several decision tree models can be established.So the oil spills and lookalikes can be classified by voting.The experiment results show that,the classification accuracy tends to be stable through 100 iterations.In order to get effective classification results,five-fold and ten-fold cross validation are employed to evaluate the classification results,and the results show that the average classification accuracy of oil spills and lookalikes is above 85%.At last,we compared the CART that based on bagging algorithm with conventional CART and BP Neural network classification algorithm for oil spill discrimination.We find that the classification accuracy of our method is higher than the other two methods,which indicates that the effectiveness of our method in oil spill detection on SAR image.
Synthetic Apeture Radar(SAR); feature selection; oil spill classification; decision tree; bagging
海洋公益性科研专项(201505002);国家自然科学基金项目(61501520)资助
Supported by the Public Science and Technology Research Funds Projects of Ocean(201505002);the National Natural Science Foundation of China (61501520)
2016-09-15;
2016-11-20
张彦敏(1979-),女,副教授。E-mail:zhangyanmin79@163.com
TP722.6
A
1672-5174(2017)02-106-10
10.16441/j.cnki.hdxb.20160196
张彦敏,徐卓,旭锋.海上溢油合成孔径雷达探测研究[J].中国海洋大学学报(自然科学版),2017,47(2):106-115.
ZHANG Yan-Min,XU Zhuo,XU Feng.Study of oil spill detection on SAR images[J].Periodical of Ocean University of China,2017,47(2):106-115.