基于ModelBuilder的图斑相似度分析

2021-07-28 08:31陈巡钟凤媛刘雅鑫郑梦婷
现代信息科技 2021年2期

陈巡 钟凤媛 刘雅鑫 郑梦婷

摘  要:在基于高光谱航空影像进行单木树冠分割和分类的过程中,需要选择合理的技术方案对影像分割的结果进行精度评价。基于使用ArcGIS中的空间数据处理工具和ModelBuilder建模工具进行数据处理与分析运算,结合Jaccard相似系数,计算影像分割得到的图斑栅格数据与真实地面验证数据的匹配度;基于ModelBuilder的方法整合了多个空间数据处理和统计分析工具,得出了Jaccard系数,高效地完成了对影像分割结果的精度评价。

关键词:Jaccard系数;高分辨率遥感影像;影像分割;多边形相似度;分割结果精度评价

中图分类号:TP273.4        文献标识码:A 文章编号:2096-4706(2021)02-0066-05

Abstract:In the process of single tree crown segmentation and classification based on hyperspectral aerial image,it is necessary to select a reasonable technical scheme to evaluate the accuracy of image segmentation results. Based on the spatial data processing tools in ArcGIS and ModelBuilder modeling tools for data processing and analysis,combined with Jaccard similarity coefficient,the matching degree of image segmentation and raster data and real ground verification data was calculated. The method based on ModelBuilder integrates multiple spatial data processing and statistical analysis tools,obtains the Jaccard coefficient,and efficiently completes the precision evaluation of image segmentation results.

Keywords:Jaccard coefficient;high resolution remote sensing image;image segmentation;polygon similarity;accuracy evaluation of segmentation results

0  引  言

傳统的森林资源调查和管理工作,主要通过实地调查及林相图辅助等方法来完成,这种方式不仅消耗大量的人力和物力,而且更新困难、准确率较低。遥感、地理信息系统和全球定位技术的出现,为森林资源调查和森林参数的测定提供了更高效、更便捷、更准确的研究方法。遥感分类在单木树种识别中有突出的成效,其不仅具有完整的光谱信息,还包括了大量的纹理、形状、位置等空间几何信息,对于树种区分提供了更高效、更精准、更便捷的研究方法。

在对单木树种进行识别时,从影像中将单木树冠分割出来是关键的一步。而且,单木树冠分割精度情况会影响后续的树种分类识别精度。国外学者Yasnoff等针对图像分割提出相应的评价方法和指标,是最早开始研究客观评价方法的一批学者。20世纪90年代后,我国学者才开始陆续关注分割算法的性能评价。现在,图像质量分割评价准则分为三部分:基于边缘的评价准则、基于像素点对的评价准则和基于区域的评价准则,使得评价准则更系统化。

单木树冠分割结果为图斑数据,即几何要素为多边形要素,而且树冠的边缘具有动态性和模糊性,因此,基于区域的评价准则符合单木树冠分割的评价要求。同时,影像分割后得到的图斑数据量往往十分巨大,高效准确的完成精度计算十分重要。基于此,本文使用ArcGIS中的空间数据处理工具和ModelBuilder建模工具,并用Jaccard相似系数作为标准对由高光谱影像进行单木树冠分割的图斑数据进行分割精度评价。

1  研究方法

1.1  数据介绍

使用遥感影像进行树冠分割的结果数据为栅格数据,像元值为浮点型。不同的像元值表示不同的树冠,实地调查数据为矢量多边形数据,数据格式为Shapefile,示例图如图1所示。取值均为整数编号,树冠的数量取值范围0~328。

1.2  相似性计算方法

影像分割的结果为面状数据,评价结果精度需要对面状图斑与实地验证数据的相似程度进行比较。比较面状数据相似程度时,常见的思路一种是对面要素的多边形边界进行比较,另一种是对面要素重合的面积多少进行比较。因为我们的研究对象是树冠,精度的要求主要是位置和对应的树冠重合度,而对边界的要求不是很高。这里考虑使用对面积重合度评价的方法。Jaccard相似系数就是一种很好的可以用于图斑相似度评价的方法。以下是Jaccard相似系数的相关介绍:

Jaccard index,又称为Jaccard相似系数(Jaccard similarity coefficient)用于比较有限样本集之间的相似性与差异性。Jaccard系数值越大,样本相似度越高。给定两个集合A、B,Jaccard系数定义为A与B交集的大小和A与B并集的大小的比值,计算公式如式(1)所示:

当集合A,B都为空时,J(A,B)定义为式(1)。

精度评价中使用的分割结果图斑数据集和实地验证数据集就相当于是两个不同的集合。通过计算分割结果图斑数据和真实的地面验证数据的交集和并集,可以将Jaccard系数计算出来,这个系数越接近于1,表明分割结果与真实数据相似度越高,也就是分割的单木树冠精度越高。

1.3  数据处理方法

利用ArcGIS地理信息系统平台软件,创建和使用地图,根据项目需求对地理数据进行相应的管理和编辑,做到对地理信息的分析、共享和显示处理。本次研究,利用ArcToolbox中处理栅格数据、矢量数据的工具,建立起图斑相似度的ModelBuilder模型。ModelBuilder即模型构建器,用来创建、编辑和管理模型的应用程序,有助于构造和执行简单工作流,能通过创建模型并将其共享为工具来提供扩展ArcGIS功能的高级方法。ArcToolbox集成ArcGIS几乎所有的数据管理和空间分析工具,能够帮助我们更高效的处理数据。

为了批量的计算影像分割结果图斑与实地调查的矢量多边形的Jaccard相似系数,高效完成图斑数据精度评价,需要将ArcToolbox中的相关工具组织起来,在ModelBuilder中建立起数据处理和分析的工作流。在计算Jaccaard相似系数时,需要集合A(分类结果图斑数据)与集合B(实地调查的矢量多边形数据)的面积及其相交面积,最后通过Jaccard公式计算出Jaccard系数值,Jaccard系数值越大,则相似度越高。

1.3.1  图斑数据预处理

由于分类结果图斑中的数据多数是栅格数据,且数据类型为浮点型,在ArcGIS中不能直接进行运算,所以我们需要通过一定步骤将栅格文件转换为矢量文件。这一步骤需要用到ArcToolbox中的Copy Raster工具(栅格数据集副本),Raster to Polygon工具(将栅格数据转为矢量多边形要素类数据),Feature Class to Shapefile工具(将要素类转为Shapefile格式文件,存在指定文件夹下,输出文件夹),Select Data(Model Only Tools)工具(在数据容器内选择数据)。

要想求得分类结果图斑的面积,在新生成的矢量文件中,我们需要对其添加ID字段和面积字段。这一步骤需要用到Add Field工具(在属性表中加入新字段),Calculate Field工具(计算属性字段值)。

1.3.2  Jaccard系数值计算

对遥感影像数据预处理得到具有ID和面积字段的矢量文件。实地调查的矢量多边形数据也具有ID和Area字段。因此,就可以对两份文件求交集。需要用到的工具是Intersect工具(计算输入要素的几何相交部分)。但这里交集可能出现一个多边形与多个多边形有交集,我们计算时取主要的相交多边形,也就是面积最大的多边形,需要用到的工具是Summary Statistics工具(计算属性表中字段统计值)。

遥感影像处理后的数据已知,实地调查矢量多边形的数据已知,交集已知。接下来就是将三份文件的面积字段放到一起进行计算。需要用到的工具是Join Field工具(建立两个属性表间连接,通过两表的连接字段,将所连接表中的指定字段复制到主表中去),Add Field(在属性表中加入Jaccard字段),Calculate Field(利用Jaccard公式计算Jaccard字段值)。最终可以得到图形中各个矢量多边形的Jaccard值,最后再把各个多边形的Jaccard值求取平均值,最终得出的Jaccard值。Jaccard值越大,则遥感影像数据与实地调查矢量多边形的相似性也越大。

2  实验实现和结果分析

实验基于ArcGIS软件进行数据分析计算,技术流程图如图2所示。

首先,根据Jaccard相似系数定义,分析需要用到的数据处理步骤,然后将数据处理步骤对应到ArcGIS软件的工具箱的特定工具,在进行运算时,根据每个步骤的输入输出数据要求进行调整,加入中间数据处理和转换步骤。最后,将各个步骤有序连接,建立起Jaccard相似系数计算模型,用ArcGIS里的ModelBuilder工具完成建模。

以本次研究为例,本次研究要用到两个输入数据,分别是影像分割结果图斑栅格数据和真实的地面验证数据。由于分割结果图斑数据为栅格数据,首先要将其转化成矢量数据,并通过添加相应的字段并计算其面积。然后将分割结果图斑数据和真实的地面验证数据相交,计算其相交数据。计算出图斑的交集、并集,并对计算得出的结果进行统计,就可以通過Jaccard公式计算其相似系数。下文对具体的操作流程进行论述由于我们运用遥感技术得到的数据多数是栅格数据,且数据类型为浮点型,在ArcGIS中要求栅格数据的数据类型为整型才能进行运算,所以我们需要先对栅格数据的数据类型进行转换,这一步通过Copy Raster工具实现。如图2所示,输入影像分割结果图斑数据,即,最初的浮点型栅格数据,运用Copy Raster工具得到像素类型改为整型,如无符号16位整型(16_BIT_UNSIGNED)的复制栅格数据集,然后将得到栅格数据利用Raster to Polygon工具栅格转为面要素类,存放在默认的文件地理数据库中。处理步骤如图3所示。

然后,我们需要进行属性数据表的字段添加和计算,数据文件类型就需要由上一步结果的地理数据库的要素文件转换为Shapefile文件类型。利用Feature Class To Shapefile(multiple)工具可以转为Shapefile,处理步骤如图4所示。

接下来,我们需要在属性表中添加出接下来在运算需要用到的两个属性:ID和面积。我们要对上一步得到的Shapefile属性表添加TreeGrowID字段,并给这个ID字段赋值为每个由栅格数据转换而来的矢量图斑的编号;添加tSh_Area字段,计算对应图斑的面积,如图5所示。到此,我们就完成了由栅格数据转化为矢量数据的所有步骤,得到了修改后的RasterT_treegro2.shp。

输入实地调查的真实数据文件,其文件格式为Shapefile,与上述步骤得到的结果图斑矢量数据求交集得到新的面要素类,得到文件Intersect_result面要素类,如图6所示。

这里交集可能出现一个分割结果多边形与多个实地调查多边形数据有交集的情况,我们计算时取主要的相交多边形,也就是相交面积最大的多边形,所以以实地调查多边形数据的ID为案例分组字段,以Shape_area为统计字段,以Max为统计类型,使用summary statistics工具,得到Intersect_Statistics面要素类,即与分割结果多边形相交面积最大的多边形,如图7所示。

接下来,需要把实地调查数据、栅格数据转换而来的矢量数据、数据交集的面积字段放到一起进行计算,步骤如图8所示。

通过表连接得到了具有完成运算所需要的三个属性,分割结果多边形的面积,实地调查图斑的面积,相交最多的多边形对应的重叠面积。现在计算Jaccard系数需要的输入值都有了,可以计算Jaccard值,所以最后进行Jaccard字段的添加和计算。得到数据如表1所示。

根据Jaccard值可以初步判断分类结果多边形和样本多边形的重叠程度。本例中因为是单木分割的结果集,Jaccard相似度主要在0.3左右,目前的数据和分类方法得到的单木分类结果还需要改进。

3  结  论

本次研究利用ArcGIS软件中ArcToolbox工具和Model-Builder建模工具建立图斑Jaccard相似系数的计算模型,对比分析影像分割结果的图斑栅格数据与真实地面验证数据的匹配度。首先对数据进行分析与处理,将分类结果的栅格图斑转化成含有面积字段并且可以进一步在ArcGIS中运算的矢量文件。将地面验证数据与由栅格图斑得到的文件相交,然后将分割结果转化得出的矢量多边形,地面验证数据与交集数据建立属性表连接,利用Jaccard公式进行计算。数据通过计算后,求出各个多边形的Jaccard值,最后再把各个多边形的Jaccard值求取平均值,最终得出Jaccard值。最终值反映了单木分割结果的平均情况。按照上述方法,可以初步判断分类结果多边形和样本多边形的重叠程度。此方法的提出,能够准确得出大量图斑的相似度,能以批处理形式高效运算完成多幅数据的处理,对于单木树冠区分提供了更高效、更精准、更便捷的研究方法。

参考文献:

[1] 孙振峰,张晓丽,李霓雯.机载与星载高分遥感影像单木树冠分割方法和适宜性对比 [J].北京林业大学学报,2019,41(11):66-75.

[2] 张雨朦,吴孔逸,岳建伟,等.基于F直方图的图斑几何形状相似性度量方法研究 [J].地理与地理信息科学,2019,35(3):9-15+27.

[3] 周迪,施冬,徐丰.基于改进Jaccard系数的分级统计地图相似性比较 [J].科学技术创新,2020(11):61-62.

[4] 李晓丽.基于Voronoi划分的区域化模糊聚类遥感影像分割 [J].测绘学报,2020,49(6):799.

[5] 张凝,冯跃文,张晓丽,等.结合航空影像纹理和光谱特征的单木冠幅提取 [J].北京林业大学学报,2015,37(3):13-19.

[6] 夏宇,朱欣焰.一种基于形状特征的地理实体相似性查询方法 [J].地理与地理信息科学,2015,31(1):6-11.

[7] 田原,蔡华,邬伦,等.基于局部相似的地籍宗地图斑匹配方法 [J].地理与地理信息科学,2011,27(5):25-28.

[8] 郝燕玲,唐文静,赵玉新,等.基于空间相似性的面实体匹配算法研究 [J].测绘学报,2008(4):501-506.

[9] 吴静,尹涛.多尺度空间关系相似性研究 [J].测绘科学,2011,36(4):69-71.

[10] 沈利强,姜仁荣,王培法.一种高分辨率遥感图像单木树冠信息提取方法 [J].遥感信息,2017,32(3):142-148.

[11] 滕文秀,温小荣,王妮,等.基于迭代H-minima改进分水岭算法的高分辨率遥感影像单木树冠提取 [J].激光与光电子学进展,2018,55(12):499-507.

[12] 董天阳,周棋正.基于形态Snake模型的遥感影像的单木树冠检测算法 [J].计算机科学,2018,45(S2):269-273+291.

[13] 刘春燕.图像分割评价方法研究 [D].西安:西安电子科技大学,2011.

作者简介:陈巡(2000—),女,汉族,四川泸州人,本科在读,研究方向:土地遥感;钟凤媛(1979—),女,汉族,重庆人,講师,硕士,研究方向:遥感和地理信息系统应用;刘雅鑫(2000—),女,汉族,四川自贡人,本科在读,研究方向:土地遥感;郑梦婷(2000—),女,汉族,四川雅安人,本科在读,研究方向:土地遥感。