严恩萍,莫登奎
(1. 中南林业科技大学 林业遥感大数据与生态安全湖南省重点实验室, 湖南 长沙 410004; 2. 中南林业科技大学 南方森林资源经营与监测国家林业与草原局重点实验室, 湖南 长沙 410004; 3. 中南林业科技大学 林学院, 湖南 长沙 410004)
散坟是森林火灾的主要隐患,其空间分布、数量、密度等信息都是林业、应急、民政部门需要掌握的基础数据。对大面积的散坟火灾隐患点进行系统监测与空间分布研究,有助于掌握散坟的位置、数量、密度以及分布规律,进而有利于森林火灾的早期预警,从而降低森林火灾的发生概率。然而由于未受到足够的重视,国内外鲜有大面积散坟火灾隐患点的智能监测与空间分布方面的研究报道,缺少基于散坟的火灾隐患点专题数据库。
相关学者一直致力于火灾隐患调查方法的改进研究[1-6]。传统的火灾隐患调查方法主要以人工实地调查为主,虽然这种方法检测精度高,但是消耗大量的人力、物力和财力,无法用于大面积火灾隐患的检测。现有的火灾隐患监测主要有2种。一是依靠卫星遥感的监测方法,包括基于低空间分辨率和高空间分辨率的2种监测方法。前者主要依靠中红外/热红外波段进行识别,然而这些卫星由于空间分辨率低,无法探测小面积的目标,故不利于火灾隐患点的早期识别[7-10];后者主要依靠短波红外/可见光波段进行识别,这些卫星虽然能够识别火灾隐患的大概范围,但是由于空间分辨率有限,无法自动定位火灾隐患点的具体位置[11-14]。二是依靠视频分析技术的火灾隐患检测,虽然该方法简便快捷精度高,能够获取火灾隐患点的精确位置,但是只能适用于面积较小的局部区域,无法实现大面积火灾隐患点的自动定位与快速检测[15]。
近年来,亚米级高分辨率遥感的发展为散坟的智能检测提供了新途径[16-18]。同卫星遥感相比,亚米级高分辨遥感具有单景覆盖面积广、海量星上存储、地理定位精度高的优势,能够实现大面积散坟火灾隐患点的高效精准监测。归纳起来,关于人工智能和高分辨率遥感结合研究很多[19-22],缺少对大面积散坟火灾隐患点进行自动检测与快速清查的研究报道。
鉴于此,研究以高分辨率航拍影像为数据源,提出一种基于Detectron2工具箱改进的Mask RCNN智能识别方法,以期实现大面积散坟火灾隐患点的自动检测与及时预警,同时尝试绘制具有极高应用价值的第一份散坟分布数据,试图揭示不同分级条件下散坟随地形和道路的空间分布规律。研究表明,文中提供的自动检测方法简单通用、可移植性强,具有应用于全国散坟火灾隐患点自动检测与预警的潜力。
研究区选择湖南省东部偏北的长沙县,位于长衡丘陵盆地的北部,地理位置介于112°58′23″~113°30′09″E,28°02′04″~28°39′51″N之间,属亚热带湿润气候,春暖夏凉,四季分明,年平均气温17 ℃,年均无霜期271 d,年均降水量1 877.1 mm,主要土地覆盖类型包括林地、耕地、草地、水体、建设用地和其他用地。
1.2.1 无人机影像
研究区的无人机高清影像拍摄于2019年10月19—21日,航拍当日天气晴朗、风速小、光线充足。无人机航线规划数据的采集高度100 m,速度5 m/s,镜头垂直于地面,航向重叠率70%,旁向重叠率80%,空间分辨率0.5 m×0.5 m。正值秋季,无人机航拍的散坟火灾隐患点更容易与背景区分。
1.2.2 地面实测数据
地面实测数据主要用于研究区火灾隐患点样本数据集的标注。课题组首先利用Google earth高清影像分析研究区火灾隐患点的总体分布情况,初步确定可调查火灾隐患点的分布和范围;然后于2020年2月5—10日前往长沙县开展实地调查,沿着可及的研究区道路,收集火灾隐患点(散坟)的位置、地形以及其他相关信息。
研究采用的数据为2016年无人机航拍的高分辨率遥感影像数据,格式为TIFF,影像分辨率为0.2 m×0.2 m。具体样本集构建包括5个步骤:1)样本抽样。以内辖行政乡镇为单位,从每个镇随机选取4块1 000 m×1 000 m的区域裁剪获取样本数据,共获取52张样本影像;2)数据标注。为满足网络训练要求,利用ArcGIS 10.7软件对散坟火灾隐患点进行人工标注,原则上以人眼清晰可见为准,标注完成输出二值图;3)数据裁剪。由于深度学习网络无法直接输入尺寸过大样本,因此,将样本数据和相应二值图按50%的重叠率裁剪为512 pixels×512 pixels的样本数据集(图1);4)数据扩增。研究综合考虑散坟目标的形状和分布特征,结合具有50%重叠步长的图像裁剪方法,采用图像旋转、图像移动和对角镜像等方法进行数据扩增,共获取样本图片1 256张;5)数据划分。将已扩增的数据集按照7.5∶2.5的比例分为2份:训练数据集和验证数据集。其中训练数据集用于模型参数训练和调优,验证数据集用于评估训练模型对样本的泛化误差。
图1 研究区散坟样本Fig. 1 Samples of scattered graves in the study area
研究采用目前应用广泛的Mask RCNN网络提取散坟目标,该算法包含3个任务分支:预测类别、预测矩形框和预测掩码。首先利用深度残差网络ResNet提取特征图像;然后结合区域生成网络RPN提取潜在ROI;利用ROIAlign层将ROI映射成固定维数的特征向量,其中2个分支经过全连接层进行目标分类和坐标框回归,另1个分支经过全卷积运算生成预测掩码[23]。具体结构如图2所示。
图2 改进的Mask R-CNN框架结构图Fig. 2 Network structure diagram of improved Mask R-CNN
2.2.1 训练环境
文中使用的Mask RCNN网络的主体框架来自于Facebook下FAIR研究院推出的基于Pytorch的Detectron2工具箱。实验在Ubuntu 18.04操作系统下完成,CPU为I9-10900k,GPU为RTX 3080,内存32G。程序在Pycharm编译器下,基于Python 3.6语言和Pytorch 1.8.0深度学习框架编译实现。实验过程中的影像读取和处理模块使用的工具包为GDAL 3.1.4和OpenCV 3.4.2。
研究使用的预训练模型为Detectron2官方提供的COCO目标检测模型,初始学习率为0.005,批次大小为4,每个Epoch进行迭代训练,共训练150个Epoch。训练初期采用预热策略保证参数稳定,以开始训练的前1 000次迭代为预热阶段,该阶段内线性增加学习率至初始学习率。
2.2.2 模型评价
由于需要同时考虑精确率和召回率,研究采用F1分数(F1 Score)作为模型预测结果的评价指标,散坟检测任务属于单分类任务,具体表达式见式(1)~式(3):
(1)
(2)
(3)
式中:Precision代表精确率;Recall代表召回率;TP表示实际为散坟且被识别为散坟的样本数;FP表示实际为背景但被识别为散坟的样本数;FN表示实际为散坟但没有被网络识别为散坟的样本数。
已有研究表明,分析目标的空间分布特征有利于提出科学合理的目标布局优化策略。鉴于此,文中采用核密度指数、最邻近指数、地理集中指数和不平衡指数对研究区散坟空间分布的集聚性进行可视化分析[24]。具体计算公式见表1。
表1 4种空间分布特征指数Table 1 Four spatial distribution characteristic indexes
研究对象属于均匀分布;若02.4 影响因素分析
地形地貌作为制约人类经济活动的重要基础,对研究区散坟分布有着广泛深刻的影响,文中研究采用分层分级的方法分析散坟空间分布的影响因素,主要因素包括海拔、坡度、坡向和道路。海拔按照[0, 200)m、[200, 500)m、[500, 1 000)m、[1 000,+∞)m划分为4类;坡度按照[0°, 2°)、[2°, 5°)、[5°, 15°)、[15°, 35°)、[35°, 55°)和[55°, 90°)的分类依据依次分为平坡、缓坡、斜坡、陡坡、峭坡和垂壁[25]:坡向以0°为起点,按顺时针将坡向平均分为8级,采用ArcGIS10.7软件分别统计不同级别散坟的分布数量;为量化道路的影响距离,研究采用ArcGIS10.7软件统计道路两侧[0, 100)m、[100, 500)m、[500, 1 000)m、[1 000, 2 000)m和[2 000, 3 000)m缓冲区的散坟分布情况。
由于风土习俗的影响,不同乡镇的散坟形状特征、空间分布和背景环境存在差异,进而影响散坟检测精度。为测试训练模型的泛化能力,研究将未参与训练的江背镇、黄花镇和路口镇作为试验区,分别随机选取3张1 km×1 km影像作为验证集进行测试,具体测试结果如表2,检测结果见图3。
表2 不同乡镇的测试结果Table 2 Experimental results for different townships
图3 黄花镇散坟火灾隐患点测试结果Fig. 3 Test results of fire hazard points for scattered graves in Huanghua Town
由表2可知,研究区江背镇、黄花镇和路口镇散坟检测的平均F1分数均超过88.42%,说明改进Mask RCNN模型的通用性较强,能够适应不同区域的散坟检测。由于路口镇的散坟特征接近训练样本提供的全局目标特征,因此该区域改进Mask RCNN模型输出的检测精度更精确,平均F1分数达到94.37%,同江背镇和黄花镇相比,高出约6%。说明利用改进Mask RCNN模型开展散坟检测时,可以结合训练阶段的检测结果,实时补充针对不同区域目标特征的训练样本,以期提高模型的泛化性,以满足不同区域散坟目标检测的精度需求。
图3为黄花镇散坟火灾隐患点的测试结果,从左到右依次为研究区影像、局部检测结果放大图、局部二值结果放大图。红色框覆盖背景为森林;蓝色框覆盖背景为城镇。分析可知,Mask RCNN框架对不同背景和密度的散坟目标检测效果均很好,其中森林覆盖的F1分数值(91.40%)略高于城镇覆盖的F1分数值(89.26%),说明林木阴影与土壤混淆的背景因素对模型检测效果影响较小,能够满足森林覆盖的散坟目标检测与清查的需要。
3.2.1 密度特征分析
长沙县散坟分布的总体密度约为25.13个/km2,呈现出“中部北部密集分布,其他区域零星分布”的空间分布格局(图4)。散坟密度介于60~135个/km2区域面积比例为1.60%,主要分布在开慧镇东北部、安沙镇中南部和北山镇北部,其次春华镇也有少量分布,上述区域主要分布在研究区城区外围,呈沿交通干线附近分布的格局,由于受到城区社会、经济的辐射作用,安沙镇的散坟分布最密集;散坟密度介于40~60个/km2区域主要分布在60~135个/km2区域的外围,呈环状分布,其次金井镇和果园镇中部也有大面积分布,另外北山镇西南部、黄兴镇南部、春华镇东南部和江背镇北部呈零星状态分布;散坟密度介于0~10个/km2区域面积比例为19.18%,主要集中在研究区西南部城区,由于城市化效应导致研究区散坟分布较为稀疏。
图4 长沙县散坟核密度分布Fig. 4 Kernel density distribution of scattered graves in Changsha County
3.2.2 集聚特征分析
研究运用ArcGIS10.7软件计算长沙县散坟的最近邻距离指数NNI,具体结果见表3。分析可知,研究区散坟总体呈现聚集-随机分布,且P值高度显著,说明研究结果可信。从区域方面分析,长沙县8个乡镇散坟呈聚集分布,占比为64.54%;其次35.43%的乡镇呈聚集-随机分布;1个乡镇呈随机-离散分布,即泉塘街道,占比为0.03%。
表3 研究区散坟分布最近距离指数Table 3 Nearest neighbor distance index of scattered graves in study area
3.2.3 均衡特征分析
根据表1公式分别计算研究区的地理集中指数和不平衡指数,结果表明长沙县散坟地理集中指数的实际值(G=9.214)大于理想值(G=5.556),说明研究区散坟空间分布不均匀。为进一步描述散坟的内部分布格局,研究采用不平衡指数S验证散坟分布均衡性[26],通过计算S=0.49,说明长沙县散坟空间分布不均匀。分析洛伦茨曲线(图5)可知,研究区散坟整体呈上凸趋势,主要集中在6个乡镇,占区域总数的66.65%。
图5 研究区散坟单位空间分布的洛伦茨曲线Fig. 5 Lorenz curve of spatial distribution of scattered graves in study area
海拔是地形地貌的重要属性,不同海拔位置的水资源、土壤条件等均有差异。由图6(a)统计可知,研究区散坟主要分布在0~200 m的平原地带,总占比高达98.52%,这是因为平原地带适宜人类居住,人类活动频繁,进而分布较多的散坟;坡度作为地面倾斜度的定量描述,表征研究区的地势起伏情况。由图6(b)可知,长沙县散坟随着坡度增加呈减少趋势,分布于缓坡区域的散坟数最多,比例为47.87%,其次是斜坡(25.05%),说明农村居民偏向选择有一定坡度的区域设置墓地;作为重要的地形因子,坡向直接影响地表接受的光热条件。由图6(c)可知,研究区散坟分布没有明显的坡向特点,阳坡的散坟数量和阴坡相当。阳坡分布范围内,西南坡的散坟数量较多(比例14.74%)。阴坡分布范围内,西坡的散坟数量较多(比例13.77%);道路作为灵活的交通运输方式,对研究区散坟分布具有重要的影响。将研究区散坟与主要道路叠加,同时按照分级建立缓冲区(图6(d)),分析可知长沙县高达74.40%的散坟沿道路2 000 m缓冲区范围分布,说明道路对研究区散坟的空间分布具有积极的正向作用。
图6 研究区散坟的分布情况统计Fig. 6 Statistics of distribution of scattered graves in study area
由于散坟主要分布在林地和城镇周边,且不同地类、密度和区域的散坟分布特征各异,为防止模型训练的过度拟合,因此需要大量训练样本。已有研究表明,数据扩增是一种常用的扩大数据集方法,其提高模型泛化能力的同时减少模型的过度拟合[27]。研究考虑农村散坟与林地阴影的相似性,以及无人机航拍的空间分辨率有限和背景的不确定性,难以满足Mask RCNN训练的样本需求,文中采用图像旋转、图像移动和对角镜像等方法,对样本数据进行扩增,目的是增加样本数量的同时减少复杂背景对散坟检测造成的不良影响,进而提高检测精度。
研究采用Mask RCNN框架对不同地类覆盖、分布密度和分布区域的散坟进行识别,结果表明该框架不仅能准确提取目标散坟的定位框,还能准确绘制目标散坟的Mask掩码,说明该框架具有良好的准确性和稳定性,检测精度较高[28]。为提高检测模型的泛化性,制作包含更多目标种类和分布特征的数据集,发展检测效果更好的深度学习算法是今后的研究方向。为满足大面积的散坟检测需求,文中结合多时相遥感影像,研究针对完全裸露或半裸露的散坟检测算法,旨在提出适应复杂数据的超参数训练模型,提高散坟检测精度。
已有研究表明,分布密集、遮挡重叠、背景相似以及表面阴影等是影响研究区散坟准确识别的主要干扰因素[29-30],例如城镇附近航拍的遥感影像通常容易引入相似的地物干扰特征,进而降低模型检出率;林区周边航拍的遥感影像虽然没有过多相似地物干扰,但是林区影像容易因光线不足和分布密集与背景土壤混淆,降低检测精度。文中通过采用全卷积神经网络FCN提取散坟目标的准确特征,减少背景、遮挡和阴影等因素的干扰,实现研究区散坟的高效检测,这与已有学者采用全卷积神经网络检测苹果的研究结论相似[31],说明全卷积神经网络具有消除背景干扰的潜力。由于文中重点针对高分辨率遥感影像中肉眼可见的散坟进行识别研究,因此不涉及被遮挡的散坟检测问题,但是作为重要的火灾隐患点,树林遮挡方面的影响不容忽视。随着研究范围的逐步扩大,后续将通过人工实地核查的方式予以补充。
地形地貌和道路是制约人类经济活动的基础,对其他要素与地理环境有广泛深刻影响。文中将长沙县散坟分布点与土地利用覆盖图进行叠加,分析农村散坟的空间分布格局及其影响因素,有利于揭示研究区散坟的空间演变规律,进而为农村墓地的合理规划建设提供合理依据。根据研究区散坟空间分布特征,结合国家倡导的“厚养薄葬、文明节俭、生态环保”殡葬风尚,将研究区散坟布局优化方案分为:一级区、二级区和三级区。一级区的散坟大都距离公共服务设施较近,交通便利,可将周边零星的散坟移至规模较大的散坟集中地;二级区的区位优势不明显,可以选择交通便利的墓地集中点为基础,引导附近规模小且不合理的散坟点归并;三级区的交通可达性差,可与二级区的墓地集中点合并。这样有利于加快农村公益性墓地建设,推进农村居民用地的合理利用。
由于缺乏足够的重视,散坟火灾隐患点(散坟)监测长期被忽视,国内外鲜有农村散坟(潜在火灾隐患点)的快速检测与清查报道。鉴于此,研究以高分辨率航拍影像为数据源,结合实地踏查数据,提出一种基于Detectron2工具箱改进的Mask RCNN网络识别方法,开展长沙县散坟(潜在火灾隐患点)的快速检测与清查,制作研究区散坟火灾隐患点分布图;同时结合4种空间特征指数分析研究区散坟的分布特征及其影响因素。结果表明:
1) 智能检测方面。基于Detectron2工具箱改进的Mask RCNN网络,能够有效识别不同土地覆盖、分布密度和研究区域的散坟目标,F1分数分别达90.33%、92.61%和90.41%;
2) 空间分布方面。研究区散坟总体呈聚集-随机分布,分布密度约为25.13座/km2,呈现“中部北部密集分布,其他区域零星分布”的分布格局;
3) 影响因素方面,研究区散坟空间分布格局主要受地形和道路等因素影响,集中分布在0~200 m平原地带,且0°~5°坡度的散坟分布最多,总体没有明显的坡向效应,主要沿道路网分布。研究表明文中绘制的国内第1份基于散坟的火灾隐患点分布数据,具有较高的应用价值,可为全国散坟火灾隐患点的快速检测和自动清查提供参考。