基于航空影像的建筑信息遥感提取

2023-03-21 08:57姚磊
资源导刊(信息化测绘) 2023年1期
关键词:聚类成果精度

姚磊

(山东省地质测绘院,山东 济南 250000)

1 引言

建筑是地表覆盖相对较多的类型,是人类活动的产物。如何准确获取地表建筑信息对于自然资源监管起着重要作用[1,2]。随着遥感技术的发展,基于中高分辨率卫星影像的分类提取已成为应用最多的建筑信息获取手段,该方法可较快获取建筑信息。通过大量应用,遥感分类手段有了更深层次的研究与提升。吴巧玲等基于多源多时相遥感影像和地形数据,综合利用非监督分类等知识建立分类决策规则,有效提取了城镇建筑用地信息,准确度不低于90%,并且满足城镇建筑用地动态变化分析的精度要求[3]。曾涛等在传统的面向对象基础上提出了面向对象的高空间分辨率遥感影像建筑物信息提取方法。该方法首先通过影像分割将影像划分为互不相交的影像对象,然后根据影像对象的特征(如光谱、纹理、形状和上下文等信息)进行分类,从而快速有效地提取建筑信息[4]。马海荣等基于高景1 号卫星影像,构建建筑物遥感特征指数,并采用面向对象分类提取农村建筑物信息,经过多轮次分割与解译,有效提取了农村建筑物信息[5]。

基于此,本研究以无人机航空影像作为数据源,分别选用KNN 聚类、最大似然法、随机森林三种分类算法开展基于航空影像的建筑信息遥感提取,对比分析不同算法在建筑信息提取中的适用性。

2 数据及原理

2.1 数据介绍

本研究选用的无人机平台为深圳市大疆公司生产的精灵4pro,该飞机具有起降灵活、携带方便、操作简单等优势,可实现定点悬停、低速飞行、多样载荷等特点。搭载于无人机平台的镜头拍摄获取的影像为4 波段多光谱影像,涵盖了可见光近红外光谱范围,空间分辨率为5cm,具体成像效果如图1 所示。

图1 航空影像区

2.2 原理介绍

本研究主要采用KNN 均值聚类、最大似然法分类以及随机森林分类三种方法进行基于航空影像的建筑信息遥感提取[6-8]。三种分类原理如下:

(1)聚类分析原理

k 均值聚类算法是一种迭代求解的聚类算法,首先将影像数据分为N 组,然后随机选取N 个像元对象作为影像信息的初始聚类中心,其次计算每个像元与临近各个初始聚类中心之间的距离,把每个像元均分配给距离它最近的中心,并计算最优距离。KNN 均值聚类方法在无样本以及地表纹理信息明显的状态下,可快速获取高精度的地物提取结果,该算法通过临近像元分析及权重附加,对像元进行聚合与分离,可较快获取分类成果。

(2)最大似然法原理

最大似然法相对于其他监督分类方法,在样本集计算与优化时具有一定的优势,是用统计的方法根据最大似然比贝叶斯判别准则法建立非线性判别函数集而进行分类的一种图像分类方法。该方法可对各样本类型进行相似分析与正态分布分析,将不符合样本特征的错误信息剔除,最终得到具有较高精度的样本模型,以此进行遥感分类。

(3)随机森林原理

随机森林(Random Forest)是指用随机抽样方法建立一个森林。随机是指随机采样来建立模型;森林是指包含很多独立的决策树。随机森林基本原理如下:

①从原始数据中以有放回的方式随机取样得到n个训练数据集。②从每个训练数据集中随机选择K 个特征(K 小于原始数据总共的特征)。③反复根据这K个特征建立起m 棵决策树。 ④应用每个决策树预测结果,且保存所有预测结果。⑤对分类模型进行投票,计算每个预测结果的得票数,选择得票最高的模型作为最终决策。该方法可通过平均决策树,降低过拟合风险。

3 结果分析

3.1 样本选择

本研究采用在影像上勾画样本的方式采集建筑、水体、植被、裸地、道路5 大类。各类采集的样本数量保持1∶1左右,各地类样本采集数量均为30个左右。对采集的样本进行筛选,挑选出20%的样本作为预留的精度验证样本,80%的样本作为训练样本进行分类。样本选择如图2 所示。

图2 样本选择

3.2 遥感解译

3.2.1 KNN 聚类分类

KNN 均值聚类分类效果如图3 所示:由图可知,各地类分布情况均已识别出来,但存在部分同物异谱现象,如水体中存在部分道路、裸地误识别现象。但K 均值对连片分布的地类识别效果较好,如植被的识别,本研究选择的影像有大量植被分布,通过聚类分析,较好识别出了植被的分布情况。

图3 KNN分类成果

3.2.2 最大似然法分类

最大似然法分类效果如图4 所示:由图可知,最大似然法分类成果整体较KNN 均值聚类分类成果更精细,尤其是建筑信息的识别,较多的独栋建筑也完整识别出来,水体的边缘浅滩也能准确识别。

图4 最大似然法分类成果

3.2.3 随机森林分类

随机森林分类效果如图5 所示:由图可知,随机森林分类成果整体精细度优于KNN算法与最大似然法。如图5 中裸地信息的识别,无论是连续分布的大块裸地,还是零星分布的裸地,均较好地识别出来,并且在道路识别中也较少出现断头路现象。

图5 随机森林分类成果

3.3 建筑信息提取

3.3.1 KNN 算法提取

KNN 算法提取建筑物的效果如图6 所示 :由图可知,建筑物信息大致都识别出来,但仍存在误识别现象,如将部分水体边缘的河滩地、部分细小裸地识别成建筑等。但建筑与道路等硬化地表的区分度较好。

图6 KNN算法建筑提取成果

3.3.2 最大似然算法提取

最大似然算法提取建筑物的效果如图7 所示:由图可知,最大似然法的识别成果中河滩地不存在误识别现象,且细小裸地图斑的误识别也较少。但硬化地表的误识别较多,均识别成了建筑。

图7 最大似然算法建筑提取成果

3.3.3 随机森林算法提取

随机森林算法提取建筑物的效果如图8 所示:由图可知,随机森林的建筑识别效果整体优于KNN 算法与最大似然法。建筑信息完整识别出来,并且严格按照屋顶边缘提取,硬化地表道路等均未参与到建筑识别中。

图8 随机森林算法建筑提取成果

3.4 精度验证

表1 分类精度验证

本研究采用预留的20%样本对三种分类方法的分类成果进行混淆矩阵精度验证,最终结果如表1 所示:整体来说,分类精度最高的是随机森林算法,其次是最大似然法,分类精度最低的为KNN 聚类方法;建筑信息识别精度最高的是随机森林算法,识别精度达到了89%。

4 结论与展望

本研究利用无人机航空影像,采用KNN 均值聚类、最大似然法、随机森林三种算法提取建筑信息,以此研究不同分类算法对建筑提取的适用性,为后期相关工作的开展提供一种更便捷、更高效的工作途径。通过试验,得出以下结论:

(1)大疆精灵4pro 无人机获取的多光谱影像具有较高的成像质量,地物信息表达清晰。

(2)三种算法均较好地识别出了各地物的空间分布情况,其中KNN 算法识别植被效果较好,最大似然法识别浅滩及独栋建筑效果较好,随机森林在分类成果上更加精细,避免了细小图斑的混淆。

(3)通过对比三种分类算法对建筑的识别精度得出,建筑识别最好的算法为随机森林,提取的图斑严格按照建筑边缘走向,识别精度达到了89%。

本研究虽然取得了较好成果,但仍存在一定的问题,研究选用的试验区植被分布较多、硬化地表与厂房占比较大,建筑屋顶多为灰色,代表性较差。在后期研究中将着重丰富建筑物的样本信息,以此提升识别精度。

猜你喜欢
聚类成果精度
基于K-means聚类的车-地无线通信场强研究
工大成果
分析误差提精度
基于DSPIC33F微处理器的采集精度的提高
“走出去”成果斐然
“健康照明”成果聚焦
基于高斯混合聚类的阵列干涉SAR三维成像
“三医联动”扩大医改成果
GPS/GLONASS/BDS组合PPP精度分析
一种层次初始的聚类个数自适应的聚类方法研究