李京,刘亚静,刘明月
(华北理工大学 矿业工程学院,河北 唐山 063210)
植物入侵是当前生态研究方向热点之一[1]。互花米草原产于大西洋沿岸,于1979年引入我国,1997年作为生态工程种引入九段沙自然保护区并进行定居和扩张[2-4]。面向对象分类方法区别于传统基于单个像元的分类方法,以若干同质性像元集合作为对象处理单元,并综合光谱、纹理、空间以及形状等属性信息,能够很好地减小"椒盐效应"现象,从而提高分类精度[5]。
该研究以Sentinel系列影像为数据源,基于eCognition平台,通过面向对象-支持向量机分类算法,并构建分类特征空间,以九段沙自然保护区为研究对象进行2019年遥感影像解译,以探索互花米草的在空间层面的分布状况,为互花米草的分类以及动态监测提供理论依据。
九段沙(31°03′~31°17′N,121°46′~122°15′E)位于上海市长江口外河段,北至长江口北槽深水航道,东至东海,西至长江。九段沙湿地经过自然演变而成,主要分为上沙、中沙、下沙三部分。该地区位于亚热带的北部区域,九段沙生物多样性低,植被群落结构类型较为简单,高等植物较少。根据2000年相关调查研究表明,九段沙自然保护区主要有海三棱藨草、芦苇、互花米草等高等植被植物[6]。在1997年有"种引青鸟"工程在中沙人工种植互花米草50 hm2和芦苇40 hm2,并且在下沙试种50 hm2互花米草[7]。经过自然演变以及种间竞争等因素,不断演变形成互花米草群落、芦苇群落以及海三棱藨草群落的分布格局。研究区地理位置如图1所示。
图1 研究区概况图
该项研究选取2019年Sentinel-2A遥感卫星影像,对长江口九段沙区域进行研究。尽量选取云量少、低潮位、质量较好的遥感影像。该研究选用影像数据见表1所示。
表1 影像列表及其参数
使用ENVI5.3软件对影像执行大气校正、几何校正、辐射校正、图像融合和裁剪等预处理工作,其中在九段沙研究区域内,互花米草、芦苇以及海三棱藨草3种植被群落在一年中不同的季相会在影像中呈现一定的光谱相似性,所以在选择影像的同时,有必要采用其他不同时段影像作为辅助解译,并采用多时相、多季相影像以此来更好地区分植被类型,提高解译精度。
1.3.1最优分割尺度估计
尺度分割参数对面向对象分类结果的质量有重要影响。一般对于多尺度分割参数的确定需要不断实验不同的分割参数结合目视判断分割效果。为减少方法的耗时性、主观性,该研究采用最优分割尺度估计 (estimating the scale parameter 2,ESP2)来确定最佳分割尺度参数。ESP2的工作原理是对图像数据进行分割后,利用得出分割尺度的变化率依据相关公式来计算结果局部方差的平均值的大小,然后依据所得出的图像评估目标地物的最优尺度参数,将变化率曲线的峰值作为整个图像对象最大异质性的表示[8]。ROC计算公式如(1)式所示:
(1)
式中:LVL-1表示尺度为L-1分割结果中所有对象的LV均值;LVL表示尺度为L时的分割结果中所有对象LV均值。
通过计算ROC的值并根据结果用尺度L绘制ROC曲线,曲线中存在峰值表明基于现有的尺度,特定类型的对象特征图像可以实现最佳分割,即当LV变化率值具有最大峰值时,最佳分割比例就是与此点相对应的分割比例。由于图像特征的多样性和丰富性,ESP2计算出的最佳分割尺度参数主要是多个参数值,这主要是由于影像内存在多种优势地物所引起的。所以,根据所要研究的地物通过实验得出的峰值所对应的分割尺度可快速确定最佳分割尺度。
1.3.2面向对象分类
面向对象的遥感图像分类方法不仅可以基于地物的光谱特征,还可以利用其形状、纹理、大小以及对象层特征之间的关系,实现目标特征提取和更高层次的遥感图像分类,从而提高了分类精度。这种分类方法可以有效避免基于像素的分类方法结果中产生的"椒盐现象",从而使分类结果具有良好的完整性。该研究基于面向对象分类软件eCognition平台,开展对九段沙互花米草与其他湿地景观类型信息提取。主要过程包括:多尺度分割、特征选取以及构建分类器[9,10]。
通常,光谱异质性标准和空间异质性标准一起使用。确定形状因子和光谱因子要在多尺度分割操作之前。由于这2个因素对异质性的影响最小,因此可以获得整个图像中所有对象的最小的平均异质性。
f=wcolorhcolor+(1-wcolor)hshape
(2)
hshape=wcompacthcompact+(1-wcompact)hshape
(3)
其中,异质性值f是通过4个变量因子计算得出:hcolor表示光谱异质性值;hshape表示形状异质性值,其取值在0-1之间;wcolor表示光谱信息权重;wcompact表示用户定义的权重。
1.3.3支持向量机
支持向量机(SVM)通过监督学习来对数据进行二元分类,它对解决复杂的、非线性的、高维空间的分类问题具有巨大潜力。支持向量机利用结构化风险最小化原理代替了传统的经验性风险最小化原理。从设计开始,它就已经定位为用于处理小样本的机器学习方法。结构风险最小化的原则可确保在小样本情况下数据分类的可靠性和准确性。
在实际计算中,核心思想是将选定的样本点映射到高维特征空间,并通过构建最佳分类超平面来最大程度地降低分类风险的上限,如图2所示。
图2 线性可分支持向量机原理
对于样本是线性可分离的情况,通过找到最佳超平面将2个类别的样本点分离而没有错误。如果一个平面可以正确地分离出2种类型的特征,即训练样本点的错误率是0,并且分类间隔最大,则该平面称为最佳分类平面。遥感数据的大部分分类都属于非线性问题的分类。与传统遥感数据分类算法相比,该算法在大多数情况下都可以得到更好的分类结果。并且SVM在高维特征空间中获得的分类精度较高,训练速度以及收敛性等方面均可以达到很理想的效果[11],如图3所示。
图3 特征空间映射
基于eCognition9.0.2软件实现面向对象的互花米草信息提取,采用多尺度分割方法获取影像对象层,通过最优分割尺度估计(ESP2)确定多尺度分割参数。以下选取九段沙Sentinel-2A 为例,介绍基于ESP2确定多尺度分割参数的过程。其中主要的参数设置为:最小分割尺度为20、最大分割尺度为40、循环分割次数为100。在多尺度分割结束后,与每个分割尺度对应的局部方差将生成一个TXT文件,并将其保存在图像所在的目录中,并依据生成的TXT文件通过相关公式计算相应的ROC值,得到ROC_LV图,然后调整坐标值的范围,最后得到最优的分割尺度分析图,如图4所示。
图4 不同分割尺度下的图层局部方差变化率曲线
由图4可以看出,在不断变化的曲线中存在明显的峰值信息,根据这些峰值信息查看相对应的数值的大小。经过对比和筛选,可以得出峰值的最优分割尺度分别为29、36、53、60、64以及92,利用这些所筛选出的最优分割尺度和已经确定的紧致度0.5和形状因子0.2对遥感影像数据进行对比实验,得到的局部分割效果如图5所示。
图5 多尺度局部分割效果
通过对潜在最优的尺度进行实验,发现29、36和53尺度参数分割相对破碎,64和92尺度分割较为粗糙,尺度参数60刚好满足分类的需求,既不过于破碎又能很好地将不同地物进行分割。
首先采用生态地理采样方法生成随机采样点,在研究区域内随机生成验证点。根据分类影像和Google Earth 影像以及统计历史参考文献数据确定验证点的属性值,分别统计互花米草验证点中实际属性为互花米草及非互花米草的数量;非互花米草验证点中实际属性为非互花米草及互花米草的数量。统计研究区域验证点的类别属性,根据数据生成混淆矩阵。根据混淆矩阵,计算分类结果的总体的分类精度和Kappa 系数。该项研究结合分类影像、Google Earth 影像以及历史参考文献数据最终评价覆盖九段沙自然保护区的2019年影像分类结果的分类结果,最终计算结果如表2所示。
表2 2019年互花米草分类精度评价混淆矩阵
由表2可知,基于面向对象-支持向量机的2019年九段沙植被信息信息提取结果的总体精度和Kappa系数分别达到89%和86%。根据Kappa系数区间内,说明九段沙植被分布的遥感提取结果和九段沙实际空间分布具有高度的一致性。该结果提取精度表明:基于面向对象-支持向量机的九段沙植被信息提取方法能够初步提取出互花米草的空间分布信息,方法的应用具有一定的可行性。
表3所示为九段沙植被面积变化情况,图6所示为2019年互花米草信息提取分类图。
表3 九段沙植被面积变化/hm2
图6 2019年互花米草信息提取分类图
由表3和图6可知,2019年互花米草面积为5 856.85 hm2,主要分布在中沙以及下沙中上潮间带,夹在芦苇与海三棱藨草之间,在上沙有小部分分布;芦苇所占面积为2 081.39 hm2,在上沙、中沙以及下沙均有分布,其中在上沙分布面积最多,在中沙以及下沙主要生长在高程较高的潮间带;海三棱藨草所占面积为1 308.19 hm2,在上沙、中沙以及下沙均有分布,主要分布在中下沙高程较低的潮间带。
(1)基于面向对象-支持向量机的2019年九段沙植被信息信息提取结果的总体精度和Kappa系数分别达到89%和86%,该方法能够初步提取出互花米草的空间分布信息,表明方法的应用具有一定的可行性。
(2)2019年互花米草面积为5 856.85 hm2,主要分布在中沙以及下沙中上潮间带,在上沙有小部分分布。