基于尖τ型DS证据理论的机载LiDAR地物分类方法

2021-07-26 01:15马泽亮杨风暴
激光与红外 2021年7期
关键词:信任分配证据

马泽亮,杨风暴

(中北大学信息与通信工程学院,山西 太原 030051)

1 引 言

机载激光扫描与测距系统(Light Detection And Ranging,LiDAR)作为一种新兴主动式遥感技术,具有空间分辨率高、获取三维信息迅速等独特优势,广泛应用于森林树种分类[1],地物类别检测[2-3],三维城市建模[4-5]和自然灾害救援[6],而上述应用得以实现的必要保证是构造一种满足高精度要求,具有实时性的LiDAR数据地物分类算法。

现有的LiDAR数据地物分类方法主要是机器学习、深度学习和以证据推理为代表的多特征智能组合方法。机器学习和深度学习方法能够在大规模数据集训练的基础上,半自动或者全自动的识别地物。Hoang M N[7]等人运用支持向量机方法(SVM)实现了森林植被区域单株树木的提取;何曼芸[8]等人运用随机森林算法(RF)实现了城市地区建筑物点的提取;赵中阳[9]等人提出了一种基于多尺度特征和Point Net的深度神经网络模型,实现了复杂场景下LiDAR点云的自动分类。DS证据理论[10]作为处理不确定性问题的基本方法,通过构建信任分配函数描述不同分类特征与地物类别间的不确定关系,利用决策规则进行证据的合成,可以很好地处理不同特征数据间的复杂关系并且该过程不需要大量训练样本,能够大大提高算法运行效率,可以广泛应用于多种地物分类场景。冯裴裴[11]等结合模糊分布中的正态分布提出一种基于正态DS证据理论的LiDAR数据地物分类方法,将不同特征数据下的地物类别分布设为正态信任分配函数; Yang F B[12]等人基于DS证据理论,构造了一种线性信任分配函数,并利用分层组合框架对城市地物进行分类;上述方法解决了模糊点的分类问题,但其信任分配函数难以准确描述分类特征数据与地物类别间的不确定关系,算法分类精度不太高。

综上所述,本文基于基本DS证据理论,改进上述方法中的信任分配函数,构造了一种基于尖τ型信任分配函数的快速地物分类方法,在有效提高算法运行效率的同时提升了算法分类精度,可广泛应用于多种地物分类场景。

2 理论基础

2.1 LiDAR数据特征

本文用到的源数据包括机载LiDAR首次回波(FE),末次回波(LE),强度特征(IN),可见光图像(RGB),近红外图像(NIR)。根据源数据特征和地物特性得到两组衍生数据特征:首末次回波高程差(HD)、归一化差异植被指数(NDVI)。

首末次回波高程差(Height Difference,HD)可由公式(1)得到,激光雷达对树木有穿透特性,能够在树冠、树干与地面形成多次回波,而对于不可穿透地物,比如建筑物、道路、草地,HD没有能力将其区分,该衍生特征可以用来表征树木点的高度信息。

HD=FE-LE

(1)

归一化植被差异指数(Normalized Difference Vegetation Index,NDVI)通过测量近红外(植被强烈反射)和红光(植被吸收)之间的差异来量化植被。该衍生特征利用植物叶绿素对红光的吸收特性来进行植物的识别,获取公式如式(2)所示:

(2)

NDVI值总是在-1~+1之间,与植被分布密度成线性关系,如果接近+1,则是密集的绿叶。NDVI值的大小与地物覆盖种类关系如(3)所示:

(3)

本文采用首次回波(FE)、强度(IN)、首末次回波高程差(HD)、归一化植被差异指数(NDVI)四种特征来对包含建筑物、草地、树木、道路四类复杂地物场景进行分类。

2.2 DS证据理论

DS证据理论作为一种不确定性的推理方法,在解决地物分类问题时,其作用在于利用不同特征的输入数据,将待识别地物区分为符合实际地物的不同地物类别,其集合Θ称为识别框架。识别框架Θ的所有子集组成的一个集合称为Θ的幂集,记作2Θ,来自不同数据源的特征数据可以为一个或者多个命题提供支持度,这种支持度可以通过基本信任分配函数获得。

基本信任分配函数m(A)是一个从集合2Θ到[0,1]的映射,A表示识别框架Θ的任意子集(命题),记作A∈2Θ,基本信任分配函数m(A)满足0≤m(A)≤1,m(φ)=0,∑A∈2Θm(A)=1,其中φ为空集,且识别框架中的集合A只要满足m(A)>0,则称A为焦元。m(A)可利用函数根据传感器得到的数据计算获得,比如BPA函数。BPA函数可以根据传感器检测得到的数据构造而来。

基本信任分配函数是对一个命题的不确定性度量的基础,在地物分类应用中,由于不同特征数据来源不同,会得到两个或者多个不同的基本信任分配函数,此时为描述命题的不确定性,必须将两个或多个基本信任分配函数进行正交和运算来合成,上述方法即为D-S合成规则。若已知P个数据源,每个数据源i有基本信任分配函数mi(Bj),且有0≤i≤P,Bj∈2Θ。对于命题A可以由D-S合成规则对多个数据源的基本信任分配函数进行合成:

(4)

(5)

其中,焦元A,Bj∈2Θ,|Bj|是集合Bj的元素个数。

3 本文方法

3.1 尖τ型信任分配函数

信任分配函数的定义是DS证据理论的基础。本文基于基本DS证据理论的基础,引入模糊集理论,提出了一种新的信任分配函数——尖τ型信任分配函数,表示分类特征和地物类别间的不确定关系。该函数基于不同特征下地物点灰度值与所属地物类别可能性程度呈尖τ型分布的假设。利用直方图统计不同特征数据下不同地物类别的灰度值范围,由此确定不同特征对应信任分配函数的阈值。函数定义为:

(6)

(7)

(8)

式中,PAi(x)表示当数据源i输入为x时,图像某个像素点属于A类的可能性;PBi(x)表示当数据源i输入为x时,图像某个像素点属于B类的可能性;引入模糊类别A∪B用来表示A类与B类之间的模糊类,集合A∪B中的元素不能完全确定属于A类还是B类。当输入x小于阈值h12时,PAi(x)和PA∪Bi(x)可以由式(6)和式(8)求出,此时属于B类的可能性PBi(x)为0。同理,当输入x大于阈值h12时,PBi(x)和PA∪Bi(x)可以由式(7)和式(8)求出,此时属于A类的可能性PAi(x)为0。

尖τ型信任分配函数的曲线由图1给出。地物类别间的辨识度描述的是分类特征不同取值时属于某类地物的可能性程度[13]。考虑到不同数据源获取信息的不确定性,本文中选取P1=0.02,P2=0.98来表示实际情况中不确定程度的下限和上限。与基本DS信任分配函数相比,尖τ型信任分配函数的优势在于:

(1)对地物特性进行直方图统计可得,尖τ型分布更符合实际地物类别的分布。

(2)模糊类别A∪B,将无法准确分类的地物点归为模糊类别更符合实际情况,能有效提高分类精度。

(3)软阈值使得DS理论在处理不确定性问题时发挥更好的优势。

图1 尖τ型信任分配函数曲线

3.2 圆形区域均值滤波

均值滤波是一种线性空间滤波,可以均等地对邻域中的每个像素点进行处理。本文在使用尖τ型信任分配函数对地物场景进行分类时引入模板半径为3的圆形区域均值滤波,用于消除部分存在于某一类地物场景中表示其他类地物的孤立像素点,比如草地中存在的裸地点会被错分为道路类地物,应用圆形区域均值滤波可以有效减少错分率,提高分类精度。

4 实验与分析

本文实验采用两组LiDAR数据集,由TopoSys Falcon II系统拍摄,均经过预处理,空间分辨率为0.5 m。数据集1和数据集2尺寸分别为300×300像素和220×300像素。

4.1 实验设计

为说明本文方法应用于LiDAR数据地物分类时的有效性,使用基本DS证据理论方法和正态分布DS证据理论方法处理实验数据集,并将其实验结果与本文方法应用于同一数据集的实验结果作对比。图2为实验所使用的数据集1,图3为实验数据集2。

图2 LiDAR数据集1

图3 LiDAR数据集2

本文提出的尖τ型DS方法与基本DS方法相比,实验结果更接近人工解译真实值。在使用信任分配函数对像素点进行分类时,某个区域内可能会存在代表其他地物类别的孤立像素点。实际地物分类中,树木区域出现的混淆主要是激光无法穿透茂密树冠区域导致与建筑物区域产生的混淆;草地区域的混淆主要是由于草地区域有部分裸地点的存在,本文在采用尖τ型模糊DS证据理论分类过程中,引入模糊类别能够对上述混淆点进行所属地物类别的可能性分配,同时采用均值滤波算法对数据中的噪声点进行处理,可以有效提高分类精度。

4.2 实验结果与分析

数据集1实验结果如图4所示。图4(d)为人工解译真实值图像,由人工对比可见光图像逐个像素分类得到,作为标准用来评判分类结果的准确性和有效性。

图4 实验结果图

表1为本文方法应用于数据集1时的混淆矩阵,根据相关计算公式可得,Kappa系数为85.93 %,表明本文分类算法结果与实际地物具有比较高的一致性,因此该分类模型能够满足实际要求。

表1 数据集1混淆矩阵

表2为数据集1利用基本DS证据理论和本文方法的分类精度对比,表中S-DS为基本DS证据理论方法,F-DS+F为正态分布DS证据理论采用均值滤波方法。分析数据可得本文方法能够在有效提高建筑物、草地类分类精度的同时,显著提高了树木类的分类精度,平均分类精度由85.41 %提升到89.50 %,提高4.09 %。

表2 数据集1分类结果精度(%)

表3为本文方法与参考文献[14]中不同方法应用在同一数据集的算法复杂度对比,通过算法运行时间相比,参考文献[14]中算法运行时间最快的为ICM-MRF方法,运行时间为21.65 s,而本文方法仅为0.28 s,时间缩短了98.70 %,有效提高了算法效率,因此本文方法能够有效应用于实时性要求较高的场景中。

表3 几种算法运行时间对比

图5为本文方法应用于数据集的2实验结果图。图5(d)为人工解译真实值图像,对比结果图发现本文方法分类结果最接近实际地物类型场景。

图5 实验结果图

表4、表5、表6分别为本文方法应用于数据集2的混淆矩阵、实验结果精度表和算法运行时间对比。数据集2平均分类精度由82.38 %提高到88.64 %,提高了6.26 %;算法运行时间仅为0.26s,与参考文献[14]中运行速度最快算法相比运行时间缩短了98.02 %,Kappa系数为84.80 %,表明本文分类算法结果与实际地物具有较高的一致性,并且算法有比较好的鲁棒性。

表4 数据集2混淆矩阵

表5 数据集2分类结果精度(%)

表6 几种算法运行时间对比

5 结论与展望

本文提出一种基于尖τ型信任分配函数的快速地物分类方法,并且在两组数据集上验证本文方法的有效性。结论如下:(1)构造了一种新的信任分配函数,有效协调四种分类特征的分布合成方法;(2)解决了现有算法在复杂地物分类场景中实时性较低的问题。基于现有工作基础,下一步研究需构造各分类特征的可能性分布及其合成规则,构建基于可能性分布合成推理的LiDAR数据地物分类模型。

猜你喜欢
信任分配证据
应答器THR和TFFR分配及SIL等级探讨
遗产的分配
一种分配十分不均的财富
嘤嘤嘤,人与人的信任在哪里……
对于家庭暴力应当如何搜集证据
手上的证据
手上的证据
“证据”:就在深深的水底下——《今生今世的证据》“读不懂”反思
信任
我会好好地分配时间