刘森 马丙成
收稿日期:2023-05-09
DOI:10.19850/j.cnki.2096-4706.2023.22.032
摘 要:农业大棚在农业发展中具有举足轻重的地位,大棚提取对于农业的可持续发展和环境治理尤为重要。现有方法很难获得大棚的精确边界。文章通过对比6种常见语义分割模型,探究空洞卷积及空间注意力机制对大棚提取结果的影响。以安徽省宿州市萧县作为研究区域,使用吉林1号卫星遥感影像创建一个新的农业大棚数据集。SA_UNet获得了94.16%的准确率,明显优于主流语义分割网络模型结果,并且可以提取边界更精确的大棚结果。
关键词:高分辨率影像;农业大棚;深度学习;语义分割
中图分类号:TP391.4 文献标识码:A 文章编号:2096-4706(2023)22-0146-04
Information Extraction of Agricultural Greenhouse Based on High Resolution Image
LIU Sen, MA Bingcheng
(Bei Fang Investigation, Design & Research Co., Ltd., Tianjin 300222, China)
Abstract: Agricultural greenhouses play an important role in agricultural development. The extraction of greenhouses is crucial to the sustainable development of agriculture and environmental governance. Existing methods are difficult to obtain the precise boundary of the greenhouse. Therefore, by comparing six common semantic segmentation models, this paper explores the impact of dilated convolution and spatial attention mechanism on the results of greenhouse extraction. Taking Xiaoxian County, Suzhou City, Anhui Province as the research area, a new agricultural greenhouse dataset is created using Jilin-1 satellite remote sensing images. SA_UNet achieved an accuracy rate of 94.16%, which is significantly better than the results of mainstream semantic segmentation network models, and can extract greenhouse results with more precise boundaries.
Keywords: high-resolution image; agricultural greenhouse; Deep Learning; semantic segmentation
0 引 言
溫室作为现代农业中的常用设施,可以最大限度地减少天气条件、人为因素等外界环境对作物产量的影响,从而显著提高作物产量,在农业发展中发挥着至关重要的作用。根据第三次全国农业普查数据,截至2016年底,我国农业大棚面积达98.1万公顷[1]。大量温室大棚在带来更大农业产量的同时,也因为快速扩张而对环境造成一系列的影响,包括土壤污染和环境污染。因此,大规模温室测绘不仅对估算一个国家的现代农业覆盖率作用明显,对现代农业的可持续发展和环境治理也至关重要。
传统的大棚制图主要是采用人工野外调查的方法,这种方法需要投入大量的人力和物力。随着遥感卫星探测技术的发展,大范围遥感影像的获取变得越来越容易。目前,遥感影像已广泛应用于农业灾害监测、全球土地利用制图、地震监测、城市规划等领域[2]。近年来,利用遥感卫星观测数据进行农业大棚提取的方法已成为主流方法。赵璐等[3]人基于高分二号影像,采用面向对象最近邻的分类方法完成了农业阳光大棚信息的提取。随着深度学习技术的不断发展,卷积神经网络(CNN)已被广泛应用于遥感地物信息分类和大棚信息提取。宋廷强等[4]人采用一种改进的多时相语义分割模型,充分利用图像的空间信息和时间信息,可以快速实现蔬菜大棚信息的高精度提取。石文西等[5]人提出一种基于残差神经网络和迁移学习的农业大棚提取方法,通过将预训练的神经网络加载到ResNet网络模型中,能够有效提高大棚信息的提取精度。上述文献针对大棚提取任务有不同的改进优化方法,但通过实验发现,网络的加深会导致空间分辨率的降低和空间信息的发散。因此,本文采用Fan等[6]人提出的SA_UNet进行农业大棚信息的提取。该算法使用不同尺度的扩张卷积来扩大感受野,使网络能够有效地融合多尺度特征并增强浅层特征。通过融合残差模块,将浅层和深层特征深度融合,并有效利用浅层和深层特征的特点。为了将更多的空间信息集成到上采样特征图中,空间注意模块(SAM)用于融合从跳跃连接获得的特征图与上采样特征图,以增强空间和语义信息的组合。本文以安徽省宿州市萧县为研究区,采用吉林1号卫星数据探究SA_UNet在大棚提取中的应用潜力,实现大棚信息的自动化提取,以期为农业生产设施管理提供数据支撑。
1 数据材料
1.1 研究区概况
萧县,安徽省宿州市辖县,徐州都市圈副中心城市,地处安徽省北大门、江苏省徐州近郊,位于长江三角洲地区、淮海经济区的中心部位和华北平原的东南边缘。素有“四省通衢”之称,是国家实施“一带一路”“中原经济区”等全局性战略和安徽省实施“东向发展”“皖北振兴”等区域性战略的节点。萧县由于黄泛冲击,形成了西南平原、故黄河高地和东南浅山区三个不同自然区域的结合体,主属黄淮冲积平原。萧县水系属淮河流域,属新汴河、故黄河、王引河3个水系;萧县处于北亚热带和暖温带的过渡区,属温带季风气候,兼有北方和南方的气候特点。
1.2 数据集的获取及制作
由于农业大棚公开数据集较少,难以满足深度学习网络模型的训练需求。因此,本文使用自制的农业大棚数据集进行实验分析,采用2022年5月萧县吉林1号卫星(空间分辨率0.75 m),运用Arcgis软件对研究区部分地区进行大棚人工标注,最后裁剪生成大小为256×256像素的数据集。该数据集包含3 660张精细标注的农业大棚图像,每张图像包含三个通道的信息:红色(R)、绿色(G)、蓝色(B)。为了增加样本的多样性,采用数据增强的方法对训练样本进行一定的处理,包括随机裁剪、随机旋转、颜色增强和水平翻转。扩充后的数据集共包含5 000张图像。训练、验证和测试数据集的比例为3:1:1,三个数据集相互独立。图像和标签数据集如图1所示,其中白色表示大棚,黑色为背景。
2 研究方法
农业大棚形状各异,其分布较为散乱,目前众多学者对农业大棚信息的提取主要采用多尺度特征的语义分割。虽然借助深度神经网络可以实现对农业大棚信息的自动提取,但由于农业大棚之间的密集分布及其类内多样性和类间相似性,利用现有模型提取农业大棚信息存在一定的问题,例如提取错误和遗漏[7]。语义分割算法中的编码器-解码器结构将输入图像下采样为压缩特征图,随后将特征图上采样回输入图像大小。在此过程中,密集分布的地物边界信息丢失,导致出现地物边界黏附问题。U-Net网络作为语义分割中的经典网络,直接通过跳跃连接将低级特征和高级特征进行特征融合,其中跳跃连接和特征融合是U-Net语义分割的关键,基于U-Net改进的深度学习进行大棚信息提取应用广泛。因此本文采用空间注意力-空洞空间金字塔池化U-Net(SA-UNet),通过融合注意力和多尺度特征提高语义分割精度。
SA-UNet包括编码器和解码器两个部分,它们通过跳跃连接组合在一起。整体结构包括五个残差模块、五个ASPP模块和四个SAM。骨干网络的每个卷积层都伴随着一个批量归一化层和一个ReLU层。在ASPP模块中,空卷积伴随着ReLU层,池化大小为2×2,卷积核大小为2×2,转置卷积的步长为2×2。
2.1 空洞空间金字塔池化(ASPP)
ASPP共有5个并联的分支,第一个分支是一个1×1的普通卷积层;第二、第三、第四个分支使用3×3扩张卷积,扩张系数分别为6、12和18。第五个分支采用全局平均池化,然后通过1×1卷积改变通道数,最后使用双线性插值将特征图恢复到输入大小。5个分支得到的特征在维度上是叠加的。输出通道的数量是输入通道的5倍。通过1×1卷积改变通道数,得到最終输出。ASPP模块使用一个膨胀的卷积,它在普通卷积的基础上增加了空隙来扩大感知领域。因此,通过感受野和融合多尺度特征,增强了浅层特征的表达能力。此外,通过融合残差结构,将ASPP模块与骨干网络相结合,深度融合浅层和深层特征,更有效地利用了浅层和深层特征的特点。
2.2 空间注意力模块(SAM)
空间注意力机制主要关注当前语义分割对象的位置,利用SAM能够有效提高大棚与其他地物的区分度。SAM基于卷积注意力模块(CBAM)的思想,它的思路是对输入的特征图进行全局池化和平均池化(在通道维度进行池化,压缩通道大小,便于后面学习空间的特征),然后将全局池化和平均池化的结果,按照通道拼接,得到特征图维度H×W×2。最后对拼接的结果进行卷积操作,得到特征图维度H×W×1,通过激活函数进行处理。
3 结果与分析
3.1 训练过程与评价指标
本文采用PyCharm编译器实现模型代码撰写,主要选择PyTorch 1.10.0版本的深度学习框架,操作系统为Windows 11,使用单张英伟达RTX 2080 Ti显卡进行GPU加速计算。训练数据共5 000张,每个训练批次设置为8,共训练200 epoch,学习率设为0.001。
图像分割的本质是对像素进行分类,因此采用真正值True Positive(TP)、假正值False Positive(FP)、真负值True Negative(TN)、假负值False Negative(FN)表示分类情况,并引入交并比(Intersection over Union)、平均交并比(Mean Intersection over Union, IoU)、像素精度(Pixel Accuracy, PA)、平均像素精度(Mean Pixel Accuracy, MPA)和准确率(Accuracy, Acc)作为评价指标,计算式如(1)~(5)所示。
(1)
(2)
(3)
(4)
(5)
其中:nij表示混淆矩阵中第i行第j列的值,N表示分类数量,本文涉及大棚和背景两个类别,所以N为2。
3.2 结果与分析
为了验证SA-UNet在大棚信息提取方面的优越性,基于本文训练数据集分别采用U-Net、U-Net、AttU-Net、Segnet、HRNet、UNetResNet等模型进行对比实验。
采用5个评估指标(IoU、PA、MIoU、MPA和Acc)在测试集中分别对6个模型进行精度评价,评价结果如表1所示。从表中可以看出,SA-UNet整体表现较好,MIoU为91.01%,MPA为92.45%,Acc为94.16%,均明显高于其他模型。AttU_Net网络结构类似于U-Net,区别是U-Net在解码器和编码器同一层级只进行拼接操作,此处加入了Attention Gate,用于将同层级的encoder部分编码进行加权。整体提取结果与UNet较为接近,在大棚提取的IoU精度也较高,但在背景值中IoU值比SA-UNet低0.16%,比UNet低0.1%。HRNet通过并行多个分辨率的分支,加上不断进行不同分支之间的信息交互,同时达到强语义信息和精准位置信息的目的。在大棚信息提取中也取得了较高的精度,与UNet的预测精度相差较小。SegNet与UNetResNet预测的精度相对较差,准确率均低于93%,其中SegNet的精度最低,为91.24%。
如图2所示为不同网络的大棚预测结果,从图中可以看出,SA-UNet在大棚边界线的提取上更为精细,与真实标签数据较为吻合。而U-Net、AttU_Net和HRNet模型提取结果相较于SA-UNet,结果偏差较小。AttU_Net因为没有将大棚分隔开,大棚提取结果出现了黏连现象,Unet主要表现为在中间细节提取结果相对较差,而HRNet与AttU_Net情况类似,大棚结果黏连程度较高。SegNet预测结果最差,大棚边界不完整,漏提现象较为明显。而UNetResNet的误提现象较为明显,大棚边界线不明显。
利用SA-UNet对萧县全县进行大棚信息提取,并按照乡镇边界对大棚提取结果进行分区统计,结果如图3所示。结果表明,萧县2022年大棚统计面积为38 107.09亩,整体来看集中分布在萧县的西北方向,而其他方向均有小量集中分布。其中,大屯镇大棚面积最多,共8 842.66亩,占大棚总面积的23.20%;其次为黄口镇大棚面积,共5 427.21亩,占大棚总面积的14.24%。
4 结 论
为了更好地实现农业大棚遥感信息的提取,本文选择分辨率为0.75 m的长光卫星数据制作了大棚数据集,选择一种多尺度融合注意力模块和空洞卷积的SA-UNet网络,并采用U-Net、AttU-Net、Segnet、HRNet、UNetResNet网络进行大棚提取结果对比分析。结果表明,引入APSS和SAM模块的SA-UNet精度最高,MIoU、MPA和Acc分别达到了93.23%、94.62%和96.19%。利用SA-UNet网络对萧县全县的大棚信息进行提取,结果表明全县大棚主要分布在西北方向,其中大屯镇和黄口镇的大棚面积排在前列。
今后的研究工作将在两个方面进行改进。一是在数据集方面,更好地利用特征复杂、信息丰富的高空间分辨率遥感影像,提高算法的适用范围,扩大数据集,构建不同分辨率、不同地区的农业大棚数据集。二是在模型方面,复杂的网络结构需要进行大量的计算,需要兼顾SA-UNet的提取精度和计算速度。
参考文献:
[1] 汤紫霞,李蒙蒙,汪小钦,等.基于GF-2遥感影像的葡萄大棚信息提取 [J].中国农业科技导报,2020,22(11):95-105.
[2] 郑磊,何直蒙,丁海勇.基于ENVINet5的高分辨率遥感影像稀疏塑料大棚提取研究 [J].遥感技术与应用,2021,36(4):908-915.
[3] 赵璐,任红艳,杨林生.基于高分二号遥感数据的农业阳光大棚提取 [J].遥感技术与应用,2019,34(3):677-684.
[4] 宋廷强,张信耶,李继旭,等.深度学习在多时相大棚提取应用研究 [J].计算机工程与应用,2020,56(24):242-248.
[5] 石文西,雷雨田,汪月婷,等.基于深度学习的农业大棚遥感提取方法研究 [J].无线电工程,2021,51(12):1477-1484.
[6] FAN X S,YAN C,FAN J L,et al. Improved U-Net Remote Sensing Classification Algorithm Fusing Attention and Multiscale Features [J].Remote sensing,2022,14(15):3591.
[7] LI H Z,GAN Y H,WU Y J,et al. EAGNet: A method for automatic extraction of agricultural greenhouses from high spatial resolution remote sensing images based on hybrid multi-attention [J/OL].Computers and electronics in agriculture,2022[2023-04-03].https://kns.cnki.net/kcms2/article/abstract?v=LeQIq0pPraN7z56UFBXYmp5cqSpFXzXCsduiAbZweC6AiaAe9bGL9EZuKyBS8MXTirYhYrZGc8diSPu5awtU8S7iNuIIiN_BX-gfhU1MQ8oHeSXyyDgHo5knlSwn4vhS&uniplatform=NZKPT.
作者簡介:刘森(1989—),男,汉族,河南鹤壁人,工程师,硕士,研究方向:测绘工程、摄影测量与遥感。