典型遥感影像分类方法适用性分析

2024-09-14 00:00:00武英洁冯勇徐晓琳刘思宇朱辉
现代电子技术 2024年6期
关键词:建筑物水体向量

摘 "要: 分类技术是从遥感影像数据中提取信息必不可少的步骤,选择合适的分类器对提高分类精度至关重要,针对特定的研究如何选择适合的分类算法是一个亟需研究的问题。以北京市中心诚区中某一区域为研究区,应用“高分一号”(GF⁃1)数据和Landsat 8数据,分别采用最常用且分类精度相对较高的监督分类中的最小距离法、最大似然法、支持向量机法,将研究区分为林地、草地、水体、裸土、建筑物5种类型,并对分类结果进行空间分布、面积、精度三个方面的比对分析。结果表明,分类算法的选择主要取决于研究区的地物特点,其中最小距离法应用于植被覆盖面积较大的区域时精度较高,最大似然法适合于分类建筑物较多的区域,支持向量机法对各类地物的分类具有较高的普适性。

关键词: 遥感影像; 分类技术; 最小距离分类; 最大似然分类; 支持向量机; GF⁃1; Landsat 8

中图分类号: TN929⁃34; TP391; P237 " " " " " " " " 文献标识码: A " " " " " " " 文章编号: 1004⁃373X(2024)06⁃0137⁃05

Scalability analysis of typical remote sensing image classification method

WU Yingjie1, 2, FENG Yong1, 2, XU Xiaolin1, 2, LIU Siyu1, 2, ZHU Hui1, 2

(1. Key Laboratory for Meteorological Disaster Prevention and Mitigation of Shandong, Jinan 250031, China;

2. Shandong Meteorological Data Center, Jinan 250031, China)

Abstract: The classification is an indispensable step to extract information from remote sensing images. Selecting appropriate classifier is very important to improve the classification accuracy. How to choose suitable classification algorithm for specific research is an urgent problem to be solved. An area in the central of Beijing is selected as the research area, the GF⁃1 data and Landsat 8 data are applied, and the most commonly used and relatively high classification accuracy supervised classification methods such as minimum distance method, maximum likelihood method, and support vector machine method are applied, resperctively. The research is divided into five categories: forest land, grassland, water body, bare soil and buildings. The comparative analysis for the classification results in terms of spatial distribution, area, and accuracy are conducted. The results show that the selection of the classification algorithm mainly depends on the characteristics of the ground features in the study area, among which the minimum distance classification has a higher accuracy when applied to the area with large vegetation cover, the maximum likelihood classification is suitable for the area with many buildings, and the support vector machine has high universality to all kinds of objects.

Keywords: remote sensing images; classification techniques; minimum distance classification; maximum likelihood classification; support vector machine; GF⁃1; Landsat 8

0 "引 "言

遥感影像分类是将影像的所有像元根据其性质,按照某种规则或算法来划分为不同的类别[1]。为有效地从遥感影像数据中提取出有用的信息,分类技术是必不可少的,而且分类的结果是众多研究的基础。因此,遥感影像分类技术一直备受关注[2⁃5]。在过去的研究中已经开发了许多分类方法,常用的分类方法有非监督分类中的K均值、ISODATA和监督分类中的最小距离分类(Minimum Distance Classification, MDC)、最大似然分类(Maximum Likelihood Classification, MLC)、支持向量机(Support Vector Machine, SVM)[6⁃8]。这些算法创建时间较早,目前已经发展得较为成熟,在各影像处理软件中均有集成,应用范围极为广泛[9⁃10]。由于监督分类过程中加入了先验知识,所以其分类结果的精度普遍高于非监督分类。因此,目前在对遥感影像进行分类时多选择监督分类中的最大似然法、最小距离法和支持向量机三种方法。

遥感影像分类是一个复杂的过程,受到诸多因素的影响,例如所选择的遥感数据、研究区域的复杂性以及影像处理和分类的方法[11⁃12]。在实际分类中,并不存在一个单一“正确”的分类形式,需根据研究内容及要求选择合适的分类器。以往对遥感分类的研究多集中于发展先进的分类方法和技术以提高分类精度[13⁃14],但对分类方法适用性的研究较少,而选择合适的分类器对提高分类精度至关重要。针对特定的研究区域、特定的遥感数据、特定的研究内容,如何选择适合的分类算法是一个亟需研究的问题。

针对上述问题,本文以北京市中心城区中某一区域为研究区,选择高分辨率遥感数据的代表数据“高分一号”(GF⁃1)数据和中分辨率遥感数据的代表数据Landsat 8数据,进行如下研究:

1) 采用最常用且分类精度相对较高的监督分类中的最小距离法、最大似然法、支持向量机三种方法将研究区分为5种常见的类别:林地、草地、水体、裸地、建筑物;

2) 对各类别分类结果的空间分布特征和面积进行对比分析;

3) 对比分析运用不同数据和不同分类方法分类的精度。

通过研究来说明各分类方法的特点及其适用性,为选择适合于某一特定研究的遥感影像分类方法提供依据。

1 "研究区

研究区位于北京市中心城区,如图1所示,经纬度范围为:39°56'35[″]~40°1'3[″]N,116°13'46[″]~116°19'29[″]E。研究区内地物类型丰富,如:建筑物所占面积较大,较为密集,而且建筑物类型丰富,有低矮的建筑区、高层建筑群、飞机场等;水域类型较为全面,不仅有大片水域,还有城市公园中面积较小的观景湖,同时还有河流;研究区内的植被既有林地也有草地,且存在一些未开发的裸地。因此,以该研究区为例对分类方法适用性进行研究,其研究结果具有一定的代表性和普适性。

2 "数据与分类方法

2.1 "数 "据

本文选取“高分一号”(GF⁃1)数据和Landsat 8数据作为分类影像数据,分别代表高分辨遥感数据和中分辨率遥感数据。“高分一号”(GF⁃1)来源于中国资源卫星应用中心(http://www.cresda.com/CN/),影像获取时间为 2015年9月24日,空间分辨率为16 m,包含蓝、绿、红、近红4个波段。Landsat8数据来源于美国地质调查局 (http://glovis.usgs.gov/),影像获取时间为2015年9月23日,空间分辨率为30 m,包含蓝边、蓝、绿、红、近红、中红(两个)等7个波段。同时选择同年的Google Earth影像作为参考影像,用以选择验证样本来验证分类结果。所选影像在研究区内均无云,研究区假彩色合成的原始影像如图2所示。

2.2 "分类方法简介

2.2.1 "最小距离法

最小距离分类是最简单的监督分类方法,它是一种含参数的分类器。该算法是利用训练样本数据计算出每一类的均值向量[mii=1,2,…],然后以均值向量作为该类在特征空间中的中心位置, 计算未知向量X到各类中心的距离D,到哪一类中心的距离最小就属于哪一类。其中距离即为判别函数,最常用的距离是欧几里得距离。

[D=X-miTX-mi] (1)

2.2.2 "最大似然法

最大似然分类算法是一种用于监督分类的参数分类算法,是1999年由Erdas提出的基于贝叶斯方程计算未知测量向量X,属于已知类别M中的似然度D的算法[6]。

[D=lnac-12lncovc-12X-McTcov-1cX-Mc]

(2)

式中:[ac]表示类别M中包含向量X的概率;[Mc]和[covc]是M的均值向量和协方差矩阵;未知向量X将隶属于似然度最高的类别。

最大似然算法的优势在于其考虑了类别内的方差⁃协方差,对于正态分布数据,相较于其他分类算法而言表现得更好;但对于非正态分布的数据,结果可能存在较大误差。

2.2.3 "支持向量机

支持向量机是一种用于分类和回归的非参数算法。SVM理论最初是1971年由Vapnik和Chervonenkis提出的,1998年被引入了遥感领域。设训练样本集为k个样本的两类问题,可以用[Xi,yi(i=1,2,…,k)]表示。其中,[X∈RN],是N维的空间向量;[y∈{-1,1}],为类别标签。SVM算法是以两类别之间的距离最大为原则,寻找最优的分类超平面[15],从而分离两个类别。分类超平面可以表示为:

[W∙∅X+b=0] (3)

式中:W为垂直于线性超平面的向量(它决定了超平面的方向);标量b表示判别超平面与原点的偏移量;[∅]为将X映射到高维特征空间的映射函数,用于在高维空间中构造最优分类平面。在从低维映射到高维的时候,常用的核函数包括线性核函数、多项式函数、径向基函数(RBF)和Sigmoid核函数。

2.3 "影像分类

根据研究区地物特点将研究区分为5类常见的类别:林地、草地、水体、裸地、建筑物,全面均匀地在研究区的“高分一号”(GF⁃1)数据上选取具有代表性的训练样本,勾选样本均为纯净像元,经检验样本在Landsat 8数据上也均为纯净像元。对训练样本进行波谱可分离度检验,分离度均在1.8以上,都属于合格样本。利用选取的训练样本,采用最小距离法、最大似然法、以RBF为核函数的支持向量机法和以Sigmoid为核函数的支持向量机法等方法对研究区内的“高分一号”(GF⁃1)和Landsat 8数据的全部像元进行分类。

3 "结 "果

3.1 "分类结果

两类数据5类地物4种分类方法的8个分类结果如图3所示,对分类结果中各地物类别面积的统计结果如图4所示。将分类结果与原始影像对比分析可知,最小距离法的分类结果中水体面积偏大,建筑物面积偏小,这是由于将建筑物阴影错分为水体所致。最大似然法的分类结果中建筑物和草地面积较大,水体和林地的面积偏小,存在部分林地错分为建筑物的情况以及水体漏分的情况,其中河流分类效果较差。采用不同核函数的支持向量机的分类方法的分类结果类似,仅在水体和林地分类结果中存在微小的区别。相比于另外两种分类方法,支持向量机法分类结果的各地物面积均处于较均匀的水平;但存在将建筑物阴影错分为水体的现象,且以Sigmoid为核函数的方法要比以RBF为核函数的方法现象更为严重。综上,各分类方法结果不同的根本原因是分类算法的不同。

同种分类算法不同遥感影像的分类结果也存在区别,由于Landsat 8影像的分辨率较低,所以其分类结果相对较为粗糙。GF⁃1数据分类结果中建筑物和草地的面积均偏低,裸地面积均偏高;Landsat 8影像最大似然法的分类结果中草地面积较大,裸地面积则偏小;采用支持向量机分类时,Landsat 8影像的分类结果要比GF⁃1影像的分类结果更好,河流可以得到较好的区分,裸地的分类结果也较为准确,但依旧存在将建筑物阴影错分为水体的现象。不同影像的分类结果不同,这与数据的空间和波谱分辨率有着密不可分的关系,同时也和研究区的地物特点相关。因此,对研究区进行分类时要依据研究目的,结合研究区特点选择合适分辨率的影像。

3.2 "精度评价

通过目视解译Google Earth参考影像选择检验样本。利用混淆矩阵对分类结果进行精度评定,所有分类结果均使用相同的检验样本进行精度评定,结果见表1、表2。表中:Prod.Acc为制图精度;UserAcc为用户精度。

表中最大似然分类的结果精度最高,应用GF⁃1分类的总体精度为89.15%,应用Landsat 8分类的总体精度为98.42%,分类效果整体较好,仅裸地用户精度和水体的制图精度相对其他分类结果的精度而言较低,以及存在少部分裸地误分的现象,导致裸地分类结果中面积过大,而水体则存在漏分现象,致使分类结果中面积过小。

最小距离分类结果精度最低,应用GF⁃1数据进行分类时的总体精度仅为66.78%,这是由于过多建筑物的阴影被错分为水体所导致的。应用支持向量机的两种核函数(RBF、Sig)的分类结果均处于中等水平,其中应用核函数RBF要比应用Sig函数的分类精度高。采用支持向量机分类存在的主要问题是裸地的错分现象严重,使得最终分类总体精度降低,同时也存在林地错分致使其面积过大的现象,但其对水体的分类相较于其他两种方法而言精度较高,用户精度均在80%以上,制图精度均在95%以上,但存在建筑物阴影错分为水体的现象。

对比GF⁃1数据和Landsat 8数据分类结果的精度可得知,Landsat 8数据分类结果的精度要整体高于GF⁃1数据的分类结果,这可能是Landsat 8数据波段信息更为丰富的原因。最小距离法分类结果中应用Landsat 8数据进行分类时水体分类精度有明显提高,且建筑物阴影错分为水体的现象有显著的改善,但是裸地和林地的制图精度有所降低。最大似然分类结果中Landsat 8数据分类结果的精度均大于GF⁃1数据的分类结果。支持向量机的分类结果中应用RBF为核函数的支持向量机分类时,Landsat 8数据分类结果中建筑物的用户精度和裸地的制图精度有微小的降低,其余精度均有所提高;而应用Sigmoid为核函数的支持向量机分类时,Landsat 8数据分类结果的精度均大于GF⁃1数据的分类结果。

4 "结 "论

本文以北京市中心城区中某一区域为研究区,应用“高分一号”(GF⁃1)数据和Landsat 8数据,采用最小距离法、最大似然法、以RBF为核函数的支持向量机法和以Sigmoid为核函数的支持向量机法等方法将研究区分为林地、草地、水体、裸地、建筑物5类,并对分类结果进行了空间分布、面积、精度三个方面的对比分析,得出如下结论:

1) 最小距离法的分类精度最低,存在较为严重的将建筑物阴影错分为水体和建筑物错分为裸地的现象,林地和草地的分类精度相对其他类别而言精度较高。因此,若研究区内植被覆盖面积较大时,可以采用最小距离法进行分类。

2) 应用最大似然法进行分类所得到的分类结果精度最高,这与研究区内建筑物面积较大有关。建筑物的像元较为杂乱,像素值整体呈正态分布,采用最大似然法进行分类的结果较好;而水体像素值比较集中,不适合应用最大似然法进行分类。

3) 支持向量机分类的结果中各类别的分类精度较为均匀,不存在某一类别精度过高或过低的现象,说明该方法更具有普适性。采用不同核函数进行分类时结果精度的变化不大,而以RBF为核函数的分类精度相对较高。

4) 不同分辨率影像分类结果精度不同,运用Landsat 8影像进行分类的分类结果精度大于运用GF⁃1影像的分类结果。由此说明,并非空间分辨率越高则分类精度越高,需要根据具体的研究内容选择合适的影像数据。各分类算法对不同影像的分类结果精度排名一致,这说明影像数据对分类算法的选择影响较小,主要影响分类算法选择的是研究区的地物特征。

注:本文通讯作者为冯勇。

参考文献

[1] 郑潇柔.面向遥感影像分类的半监督学习及其时效评估研究[D].深圳:中国科学院大学,2022.

[2] 胡杰,张莹,谢仕义.国产遥感影像分类技术应用研究进展综述[J].计算机工程与应用,2021,57(3):1⁃13.

[3] 高剑,孙辉,潘之腾,等.基于分类回归树方法的遥感信息快速提取研究[J].现代电子技术,2023,46(11):33⁃37.

[4] 陈磊,周询,陈明叶.一种多级再分类技术耕地提取方法[J].遥感信息,2017,32(4):120⁃125.

[5] 隋瑜,徐泮林,谷彦斐.基于遥感数据的土地资源分类方法比较研究[J].测绘与空间地理信息,2021,44(2):107⁃110.

[6] 李小玉,蒲智,李全胜.基于最大似然分类算法的土地利用变化特征分析[J].计算机与数字工程,2022,50(6):1153⁃1157.

[7] 孙文瑞,姜慧芳,左晓庆,等.Landsat8影像分类多分类器对比分析[J].地理空间信息,2022,20(1):101⁃104.

[8] 张峰,赵忠国,李刚,等.基于不同分类器的农用地分类提取[J].新疆农业科学,2019,56(8):1560⁃1568.

[9] 李楠,王雪林.基于ENVI的遥感图像分类方法研究[J].科技创新与生产力,2020(5):63⁃65.

[10] 童威.基于ENVI的遥感影像监督分类方法的研究[J].科技创新与应用,2019(23):6⁃9.

[11] 周珂,杨永清,张俨娜,等.光学遥感影像土地利用分类方法综述[J].科学技术与工程,2021,21(32):13603⁃13613.

[12] 贾玉洁,刘云根,杨思林,等.面向Sentinel⁃2A影像的大理市土地利用分类方法适用性研究[J].浙江农林大学学报,2022,39(6):1350⁃1358.

[13] CHENG X, SUN Y, ZHANG W, et al. Application of deep learning in multitemporal remote sensing image classification [J]. Remote sensing, 2023, 15(15): 104.

[14] 杨星,宋玲玲,王时绘.基于改进的ResNeXt网络结构的遥感图像分类[J].计算机科学,2023,50(z1):282⁃287.

[15] 万意,李长春,赵旭辉,等.基于SVM的光学遥感影像分类与评价[J].测绘地理信息,2018,43(6):74⁃77.

猜你喜欢
建筑物水体向量
向量的分解
农村黑臭水体治理和污水处理浅探
生态修复理念在河道水体治理中的应用
邻近既有建筑物全套管回转钻机拔桩技术
聚焦“向量与三角”创新题
描写建筑物的词语
广元:治理黑臭水体 再还水清岸美
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
火柴游戏