刘 专,潘 栋*,胡赛花
(1.湖南第二测绘院,湖南长沙 410029;2.南方丘陵区自然资源监测监管重点实验室,湖南长沙 410029)
近年来,人口快速增长与耕地数量逐渐减少间的矛盾日益突出,再加上地区冲突、气候变化、经济衰退、新冠肺炎疫情等影响,导致我国粮食安全面临大考,迫切需要执行最严格的耕地保护制度。2020年,我国相继下发《国务院办公厅关于坚决制止耕地“非农化”行为的通知》《国务院办公厅关于防止耕地“非粮化”稳定粮食生产的意见》,要求坚决守住耕地红线。传统的耕地监测主要采用人工目视解译等方法,该方法工作强度大、效率低、易出错,已经难以适应当前耕地常态化监测监管形势需求。大数据、人工智能、5G、区块链、知识图谱、空间信息等高新技术的迅猛发展和交叉融合,为耕地保护监测监管提供了必要的技术支撑和保障条件。研究耕地遥感监测关键技术对于提升自然资源管理现代化水平、全面压实耕地保护责任、保障社会安定和国家安全具有非常深远的意义。鉴于此,笔者从耕地减少和耕地增加2个方面开展耕地监测,阐述了耕地监测的主要流程,研究了耕地监测流程中高分遥感智能解译等关键技术,并以A县2022年第1季度耕地监测为工程实例,对智能提取结果进行了精度分析,测算了查全率和准确率2项评价指标,满足耕地监测需求,旨在拓展人工智能在耕地监测中的创新应用,进一步提升了耕地监测监管现代化水平。
耕地监测内容主要分为新增耕地、批准范围内耕地减少、耕地“非农化”和耕地“非粮化”4个方面。其中,新增耕地主要包括补充耕地项目增加、耕地整改恢复增加和农民自主开垦增加;批准范围内耕地减少是指在用地审批红线范围内耕地减少的情况;耕地“非农化”主要包括非农化违法用地、公共服务设施、农民建房、临时用地等占用耕地的行为;耕地“非粮化”主要包括设施农用地、农村灌溉设施、农村道路、农业结构调整、坑塘水面等占用耕地的行为,如表1所示。
监测更新机制。建立“月发现、季小结、年总结”监测更新机制。“月发现”是指每月根据当月采集的卫星影像,对比上年末1 m分辨率卫星影像,提取新增耕地、耕地非粮化和非农化图斑;“季小结”是指每季度根据当季采集的卫星影像,对比上年第4季度1 m分辨率卫星影像,提取新增耕地、耕地非粮化和非农化图斑。“年总结”是指年末根据年度卫星影像,对比上年第4季度1 m分辨率卫星影像,提取新增耕地、耕地“非农化”和耕地“非粮化”图斑。
最小上图面积。新增耕地图斑最小上图面积为400 m,耕地“非粮化”(除设施农用地)图斑最小上图面积为400m,耕地“非农化”和设施农用地图斑最小上图面积为200 m。
耕地监测流程大致可分为以下4个阶段:
资料收集与处理阶段。收集年度国土变更调查数据、地理国情监测数据、用地审批数据、增减挂钩数据、补充耕地项目数据、永久基本农田划定数据、高分遥感影像数据等。对收集的数据进行统一坐标转换、影像预处理等。
遥感解译阶段。首先建立样本库,立足大量样本训练,利用深度学习算法智能提取耕地变化图斑,然后利用人机交互解译,补充提取自动解译漏提图斑。
表1 耕地监测内容
外业调查核实阶段。对提取的耕地变化图斑全部开展外业调查核实,查明各图斑的变化类型、变化范围等实地情况,去除内业提取发现的伪变化图斑。
数据库建设与清单形成阶段。根据外业调查核实结果,建立耕地变化监测成果数据库,并生成耕地变化清单。
变化样本库建设。
(1)基本要求。综合利用国土调查等带有标签的地表覆盖分类数据及相关公开的带有类别标记的遥感影像数据库,考虑样本的纯度、数量、分布等因素,样本采集要求尽可能选择采集地区的所有地类;每一种地类分布情况和表现形式要有典型代表性,记录样本的地类名称、成像时间、地理坐标等属性信息须完整,建立新增耕地、耕地非粮化和非农化等耕地变化样本数据库。
(2)样本规格。像素值为1 024×1 024的3组图片,其中x文件夹包含2张jpg和y文件夹内1张png。jpg代表前后时影像,png代表标记二值图(图1)。其中,二值图由白色区域(像数值为255)代表标记的变化区域,反之黑色区域(像数值为0)代表未发生变化区域。如果将这一组样本输入训练模型,人工智能会将白色区域标记为正样本,黑色区域标记为负样本。所以1组样本可以包含正样本、负样本,也可以只包含负样本(如云雾的负样本二值图可为全黑)。
图1 变化样本库样本Fig.1 Change sample library sample
构建深度学习模型。深度学习采用卷积神经网络模型,模型为特征提取层、金字塔池化层、特征融合输出层和全连接层4个部分,框架如图2、3所示。基于样本构建并优化遥感影像深度学习模型,整体工作分为2个阶段,即训练和处理。
图2 变化检测网络结构示意Fig.2 Change detection network structure schematic
图3 深度学习算法模型构建Fig.3 Deep learning algorithm model construction
训练阶段主要是基于大数据(即训练数据和标注真值)和设计好的神经网络,不断地调节参数,如网络的层数等,深度学习算法由数据驱动,模型结构中的参数对深度学习的结果有明显影响。参数调整目的是为每个参数寻找最优值,以改善模型正确率。同时,根据验证结果对模型进行修正,迭代训练样本、调整模型参数,最终得到最优网络模型和参数。
处理阶段基于学习阶段得到的网络模型和参数,针对业务数据进行全自动的处理,得到处理结果。
模型训练与优化。神经网络输入为训练数据,输出为当前网络状态下的预测结果,使用已有的真值进行监督,利用当前神经网络的预测输出与真值计算损失函数,然后使用梯度反向传播算法将损失值在神经网络中进行反向传递,计算神经网络中每个参数的更新梯度值,从而对整个神经网络优化。在实际网络训练中,采用随机梯度下降法(SGD)等优化算法,使得神经网络能够收敛到一个好的状态。随机梯度下降法(SGD)在每次迭代的过程中会选取一部分样本(例如50个,称为1个mini-batch),使用这部分样本通过梯度反向传播算法对神经网络中的每个参数进行1次优化更新;然后在下1次迭代时重新选择一部分样本,在上1次优化的基础上对神经网络的参数进行进一步优化更新;整个优化过程如此迭代进行。
模型验证。利用已知真值信息,验证不同地形、不同地表覆盖等条件下相关深度学习算法模型的可用性与普适性,若能够较好地检测出结果,则提交模型接口,开展线上试运行;若漏检较多,则有针对性地补充未检测出的样本信息,微调网络结构,迭代优化模型,直至效果满意为止。
典型地物样本库建设。
(1)基本要求。地物分类样本通过地理国情监测成果获得。找到当前时期的国情监测成果的矢量和对应的影像,以县为单位,将分幅影像拼接为完整的县,必须要求以县为单位的矢量不可出现影像无覆盖区域,矢量地类与影像出现严重不套和的情况(图4)。
图4 典型地物样本库样本Fig.4 Samples from the sample library of typical ground objects
(2)样本规格。像素值为1 024×1 024的2组图片,其中包含1张jpg影像和标记图png以下为1组示例样本。一张标记图必须将影像上所有的地类标记,一组典型地类样本组包含多个地类的标记,当前像素点不同的值代表了不同的地类,其中白色代表水域,黑色代表种植植被,不用的灰度值分别代表建筑区、道路、林草覆盖等。
Deep Lab网络模型构建。结合典型地物识别样本库,实现全自动、快速、高精度分类,并使算法的分类能力在不断的应用过程中智能迭代提升,实现典型地物信息提取识别。Deep Lab 系列语义分割模型是针对图像进行像素级分类任务而设计的。像素级分类任务在计算机视觉中属于底层任务,因此特征图的尺寸和空间不变性对任务性能的影响更大。
在处理像素级分类任务中存在2个普遍困难:首先,为了使网络模型学习到更多抽象特征,在编码阶段会不断地执行下采样操作,该操作导致了特征的分辨率不断降低,并最终导致预测任务中需要的富含丰富空间上下文信息的密集特征无法被提取;其次,在面对不同尺度的目标时,如何有效提取不同尺度的物体特征也是一个棘手的问题。为了解决提取密集特征的问题,Deep Lab 利用了空洞卷积提取密集特征来执行像素级分类任务,空洞卷积本质是常规的卷积中添加空洞,通过空洞增加感受野之后,通过一定的膨胀率提升感受野,保持了原有特征图的分辨率。
工程应用以A县2022年第1季度为例。
A县县域面积接近2 100 km,截至2021年11月1日,该县常住人口约为80万人,由山地、丘陵、岗地、平原、水面等地貌构成。采用的遥感影像为2022年第1季度遥感影像和2021年第4季度遥感影像,对应参数如表2所示,参考数据为2020年度国土变更调查成果。
表2 高分遥感对应参数
耕地遥感监测提取变化图斑示例如表3所示。监测类型分别为新增耕地、耕地非粮化和耕地非农化。
表3 耕地遥感监测提取变化图斑示例
接下表
接下表
监测结果。
(1)遥感信息智能提取情况。利用遥感影像变化图斑智能提取技术,根据A县2022年第1季度遥感影像数据和2021年第4季度遥感影像对比分析,提取变化图斑269个,经过外业调查核实后,确定实际变化图斑207个,其中新增耕地图斑 31个;批准范围内耕地图斑75个;耕地“非农化”图斑21个;耕地“非粮化”图斑80个。
(2)实际监测情况。采用智能提取+人机交互提取耕地变化图斑的方式,A县2022年第1季度耕地监测情况为:提取变化图斑 304个,经过外业调查核实后,确定实际变化图斑255个,其中新增耕地图斑44个;批准范围内耕地82个;耕地“非农化”图斑22个;耕地“非粮化”图斑107个。
精度分析。
(1)查全率。查全率()是衡量遥感影像变化图斑智能提取技术提取变化图斑能力的一种尺度,指智能提取技术提取的实际变化图斑个数()与实际变化图斑个数()之比,用公式可表示为:
本次查全率为81%,查全率较高。
(2)准确率。准确率()是衡量遥感影像变化图斑智能提取技术提取变化图斑正确程度的一种尺度,指智能提取技术提取的实际变化图斑个数()与智能提取技术提取的变化图斑个数()之比,用公式可表示为:
准确率为77%,智能提取技术提取图斑正确率满足要求,证明该方法可有效地运用于耕地遥感监测中。
(1)该研究对耕地监测内容进行了细化分类,从耕地减少和耕地增加2个方面监测,耕地监测内容主要分为新增耕地、批准类耕地减少、耕地非粮化和耕地非农化4个方面的类型。
(2)高分遥感解译作为整个耕地监测技术流程中最关键的核心,在研究遥感影像变化图斑智能提取技术的基础上,补充研究了典型地物要素智能识别提取技术,并以A县2022年第1季度耕地监测为工程实例,对智能提取精度进行了分析,查全率为81%,准确率为77%,工作效率是传统人工目视解译的3倍,满足耕地监测需求。
(3)该研究拓展了人工智能在耕地监测中的创新应用,进一步提升了耕地监测监管现代化水平,对相关部门全面压实耕地保护责任提供决策依据,采取有关措施具有十分重要的意义。