基于GF-2影像和Unet模型的棉花分布识别

2022-06-22 06:49伊尔潘艾尼瓦尔买买提沙吾提买合木提巴拉提

自然资源遥感 2022年2期

伊尔潘·艾尼瓦尔，买买提·沙吾提,2,3，买合木提·巴拉提,2,3

(1.新疆大学地理与遥感科学学院，乌鲁木齐 830046； 2.新疆绿洲生态重点实验室，乌鲁木齐 830046；3.智慧城市与环境建模自治区普通高校重点实验室，乌鲁木齐 830046)

0 引言

棉花作为我国重要的经济作物，在我国新疆地区种植广泛。在遥感影像上高精度地识别棉花，掌握棉花种植面积等年度波动状况，为政府部门提供可靠的棉花农情信息，对提高经济生产和我国农业安全都具有重要意义[1]。

目前，国内外利用遥感技术进行棉花识别研究多使用MODIS数据[2-3]、Landsat数据[4-5]、哨兵数据[6]等中低分辨率遥感影像,采用支持向量机(suport vector machine,SVM)[7]、随机森林(random forest,RF)[8]、最大似然法[9]等传统机器学习算法进行棉花信息识别提取。虽然这些影像数据可以有效提高时间分辨率、减少成本，但混合像元数量众多，光谱识别度有限，缺乏有效的棉花识别特征参量等[10-12]，不能很好地满足复杂地貌条件下棉花高精度识别分类要求。另外，仅采用有限的浅层特征和规则简单、结构单一的自动提取算法在复杂地物分布情况下表现出极大的局限性。因此，需要探索提高棉花提取精度的新方法。

近几年我国高分系列卫星的发射以及深度学习算法的发展，为作物高精度识别研究带来了新的机遇[13-15]，尤其是GF-2卫星具有亚米级空间分辨率[16]，为较好实现复杂背景下的作物精准识别提供了重要数据源。同时，以Unet模型为代表的目标识别方法不断完善，在城市绿地提取[16]、水稻病害识别[17]、胡杨冠层提取[18]等方面均有较多的应用，这为今后利用Unet模型高精度识别农作物提供了技术参考，使得Unet模型成为实现作物高精度监测技术突破的重要支点之一，为作物识别精度提高，智能化、自动化信息提取指明了方向，必将成为新的研究热点。但是，通过总结前人研究发现，利用Unet模型进行棉花提取的研究较少，相关应用鲜有报道。因此本文尝试将Unet模型应用到棉花识别研究中。

另外，随着近几年新疆环塔里木林果业的发展，果棉间作的种植模式迅速扩大，使作物种植环境更加复杂，导致现有遥感监测方法无法满足复杂地理环境条件下及时、准确的作物识别要求。因此，本文针对地块破碎、种植结构复杂以及传统机器学习算法存在的高分辨率影像信息利用不足、大数量样本运算能力有限等问题，以渭干河—库车河绿洲为研究区，通过获取GF-2遥感数据，将Unet模型应用到棉花识别研究中，探讨Unet模型在干旱区作物精细分类中的适用性及优化流程，以期为干旱区作物精细分类提供新的思路。

1 研究区概况及数据源

1.1 研究区概况

研究区位于塔里木盆地北部的渭干河—库车河三角绿洲(简称“渭库绿洲”)是典型的冲积扇平原，地理坐标为E80°37′～83°59′，N41°06′～41°40′，年降水量为50.0～66.5 mm,年均蒸发量为2 000～2 092 mm，气候类型为暖温带大陆性干旱气候。研究区以种植业为主导产业，作物类型主要包括棉花、玉米、小麦等，是新疆重要的粮棉基地之一。从1994年起，新疆成为我国最大产棉区和最大的商品棉基地[19]。2011年统计数据显示，“渭库绿洲”棉花面积分别占新疆棉花总面积及阿克苏地区棉花总面积的8.56%及38.2%，产量分别占8.41%及40.34%，是新疆主要的棉花生产区域之一[20]。研究区地理位置及分类目标具体如图1所示。

(a) 研究区地理位置、解译点、样方分布(GF-2 B4(R),B3(G),B2(B)假彩色合成影像)

(b) 棉花(c) 玉米(d) 辣椒(e) 果园(f) 林地(g) 其他

1.2 数据源及其预处理

本文采用的数据是2018年9月17日的GF-2影像，GF-2数据包含4个多光谱波段(空间分辨率4 m)和1个全色波段(空间分辨率1 m)，幅宽可达43.5 km，是我国空间分辨率最高的民用陆地观测卫星。首先对原始影像进行大气校正、正射校正等预处理后将多光谱波段与全色波段数据融合得到空间分辨率为1 m的影像。然后，利用野外辅助调查数据在影像中选取棉花、玉米等作物样本，借助样本标注工具Labelme对选取出的图像进行精细标注获得样本标签。由于深度学习需要大量数据进行训练[21]，因此本文采用加噪、对称变换、旋转、改变亮度等数据增强方法对有限的样本数据进行扩充，最终获得8 000张图像大小为25像素×25像素的数据集，并按照9∶1的比例分为训练集与验证集，为作物分类做准备。

为了制作影像分类所需要的样本数据, 以及了解不同作物的分布特征,于2018年7月3—12日、2019年2月5—9日分别进行了2次野外实地调查，共获取各类地物样点478个、样方20个，并利用差分GPS获取各点经纬度信息，测算样方内地物面积等。根据野外调查样点和样方数据最终选取4 km×4 km范围作为实验区域，所选区域包含套种田地、套种园林等较为复杂的种植环境。

2 研究方法

2.1 Unet语义分割模型

Unet模型在深度学习遥感影像分类领域应用较为广泛，其结构是一种典型的编码-解码框架(图2)，主要过程一般为图像输入、编码操作、解码操作、图像输出4个部分[22]。本文首先将GF-2遥感图像输入该网络中；其次，对输入图像进行编码操作，编码过程通过2个3×3卷积计算后可以获得64个通道的特征图像，再利用2×2的卷积进行最大池化，将图像的大小缩小为原图一半，通过重复4次上述过程图像的特征通道逐渐增加，从而获取图像的深层次特征；然后，在进行解码操作时，利用2×2的反卷积恢复图像大小，每完成一次反卷积运算，将获得的图像与上一层提取到的特征图进行融合，并再次进行2次3×3卷积运算，来还原物体细节特征，使边缘特征更加精细；最后，完成解码操作，利用Softmax激活函数和1×1的卷积将各像素归类并输出分类结果图。

图2 Unet模型结构示意图

Unet模型作为深层网络参数众多，其中批次大小、学习率、迭代次数、优化器是较为重要的几类参数，需要多次实验进行调节[23]。通过多次实验，本文中将批次大小设置为4，学习率为0.001，迭代次数设置为100次。本文尝试了Adam,Adagrad,Rmsprop,SGD等4类常用的优化器，绘制了不同优化器在训练集上损失函数值的变化曲线，如图3所示。优化器对深度学习模型最终的分类效果影响较大[23]，它通过更新和计算影响模型训练和模型输出的网络参数，使其逐渐接近最优值，从而得到较低的损失函数值。从图3可知，Adam优化器相比于其他3类优化器最先达到最低损失函数值并提前进入稳定状态。因此，本文选择了Adam优化器[24]来提升训练效果，进而为获取高精度的作物分类结果打下基础。

图3 不同优化器的训练损失函数值随迭代次数变化曲线

2.2 精度评价指标

本文利用混淆矩阵计算Kappa系数、总体精度(overall accuracy,OA)、制图精度(product accuracy,PA)、用户精度(user accuracy,UA)、交并比(intersection over union,IOU)等评价指标分析影像分类结果[25-26]。其中，Kappa系数表示预测结果与真实值之间的匹配程度，数值范围在0～1之间； OA能够直观地体现预测结果与真实类别之间的正确匹配情况； PA为某一类验证样本被正确分类的概率，代表分类方法的好坏； UA则为某一类别预测结果正确代表实际真值的概率，反映分类结果的可信度； IOU为标签上所有类别的真实值和模型所产生的预测值的交集和并集的比值。各指标公式分别为：

，

(1)

，

(2)

UA=Xii/Xi+

，

(3)

PA=Xii/X+i

，

(4)

，

(5)

式中：N为总像素数;Xii为某类别正确分类数;Xi+为该类别分类总数;X+i为该类别验证样本数;pii为原为i预测为i的数量;pij为原为i预测为j的数量;pji为原为j预测为i的数量。

3 结果与分析

3.1 Unet模型训练

为了检验模型训练是否过拟合绘制了训练过程中损失函数值变化曲线，为了获知模型训练是否收敛绘制了训练过程中精度随迭代次数的变化曲线，如图4所示。从图4(a)中可知，训练集和验证集的损失函数值随着迭代次数的增加均大致体现为下降趋势，其中，训练集的曲线在大约进行25次迭代之后不再变化。虽然验证集的损失函数值出现了小幅度的波动现象，但是模型整体并没有过拟合。图4(b)中无论是训练集还是验证集，其精度随迭代次数增加平稳上升，同样大约于25次迭代之后不再变化，表明模型已经收敛，再增加迭代次数精度也不会出现较大改变，表明对于本次实验，迭代25次之后便可结束训练。

(a) 损失函数 (b) 精度

3.2 Unet分类结果

不同分类方法的精度评价结果如表1所示，从表1中可知，Unet模型的总体分类精度为84.22%，相比于面向对象、SVM和RF算法分别提高了7.94，11.93和11.73百分点，其Kappa系数为0.804 7，相对面向对象、SVM和RF提高了10.13%，14.72%和14.60%，Unet模型分类效果较好。从各地物分类结果来看，Unet模型分类结果中，棉花、玉米和辣椒的制图精度与用户精度均维持在较高的水平，尤其是棉花的制图精度与用户精度均高于其他方法的结果，说明利用Unet模型在GF-2遥感影像上较高精度地提取棉花具有一定可靠性。面向对象分类结果相比于SVM和RF具有较好的表现，从各地物情况来看，面向对象方法对玉米和林地有较好的提取效果。对于果园而言，4类方法总体表现较为一般，其中 Unet模型与面向对象方法相比SVM和RF算法，在提取果园方面精度都有一定的提升。不同方法分类结果如图5所示。

表1 分类结果精度评价

(a) Unet分类结果(b) 面向对象分类结果

从图5可以看出，Unet模型结果中识别棉花的视觉效果相比于面向对象、SVM和RF结果要好，面向对象结果中将一些棉地错分为辣椒，SVM和RF结果中有一些属于棉花区域的像素被错分为林地，Unet模型识别棉花地块边界较为平滑、斑点较少，在一些样方、样点所在的区域被错分的像素较其他3类方法结果而言相对减少。

为了更好地说明各地物目标的分类效果，利用野外调查样点和样方数据选取了4个局部区域，这些区域包含棉花、玉米、辣椒3类作物以及套种区域等复杂的种植环境，通过计算IOU分析分类结果中各类目标物的预测值与真实值的重合情况，如表2所示。由表2可知，Unet模型分类结果的IOU平均值为0.730 1分别高出面向对象、SVM和RF结果28.36%，28.01%和26.95%，说明Unet模型分类结果中目标的预测值与真实值更为接近。其中，从Unet模型结果各类别IOU来看，棉花、玉米和辣椒的IOU均高于0.8，说明该模型对这3类作物的识别效果较好。其果园和林地虽均低于0.8，但是相比于面向对象、SVM和RF算法得到了较好的提升，而面向对象、SVM和RF的分类结果的IOU平均值基本在同一水平，差距较小。

表2 局部区域各地物IOU统计

局部区域分类结果如表3所示，Ⅰ号区域中作物类型为棉花和辣椒， Unet模型分类结果中棉花和辣椒的边界较为平滑，错分的像素也相比面向对象、SVM和RF的分类结果明显减少。Ⅱ号区域包括玉米、果园、林地和其他4个类别，其中面向对象结果中存在将玉米错分为林地的像素，SVM和RF结果中将玉米错分为果园的像素居多，Unet模型则较好地识别出了玉米，错分像素大大减少。Ⅲ号区域中，果园里局部区域果树种植稀疏，SVM和RF算法将稀疏部分多数像素错分到其他类别中，Unet模型结果则有了一定的提升。Ⅳ号区域为棉花和辣椒套种区域，从面向对象分类算法识别效果看，没能将辣椒区域和周围的棉花区分，均被识别为了辣椒，而SVM和RF则是将套种的辣椒错分为了林地。Unet模型结果虽然也存在识别错误的像素，但识别出了大部分套种在棉花中辣椒。

4 讨论

本文基于GF-2影像数据，利用Unet模型识别了棉花和玉米等作物，并取得了较为理想的识别效果。国内外虽然在作物精细分类方面做了大量研究并取得了一定的成果[27-29]，但基于GF-2数据和Unet模型的干旱区棉花识别的研究相对较少。“渭库绿洲”在干旱区遥感应用研究领域具有一定代表性且为新疆重要的产棉区，本研究可为干旱区棉花信息提取提供新的思路。

从研究结果看，Unet模型提取棉花的精度较高，这与马永建[30]的研究结果一致，说明国产高分卫星和Unet模型方法在干旱区遥感棉花识别研究中效果较好。另外，本文利用的是9月中旬的GF-2影像，9月中下旬为棉花识别最佳时期[31]，因此棉花得到了较好地识别效果。对于玉米Unet模型同样表现出了较高的识别精度，这是由于玉米属于高冠层密度作物[32]，与其他作物相比有更为细致的纹理特征，因此模型提取精度较高。对于辣椒SVM和RF的分类精度较低，与之相比Unet模型的精度则得到了一定的提高，这是由于辣椒与棉花、玉米光谱特征相似，利用传统机器学习算法基于像元光谱特征识别辣椒，只能获取浅层特征从而影响识别精度。而Unet模型通过卷积运算可以充分利用GF-2影像高空间分辨率的优势，自主学习辣椒的深层次图像特征，因此其结果有了较高的提升。果树和林地的识别结果4种方法均表现较差，分析误差存在的原因，可能是研究区内林地与果树影像的纹理特征相似，进而影响了两者的提取精度。

另外，本文在Unet模型参数的调整需要进行多次的实验，本文中选择Adam算法优化器时，模型在训练集上的损失函数值下降最快并达到稳定状态，这与赵阳[23]的研究结果一致，Adam算法作为一种自适应算法，具有较快的收敛速度[24]。深度学习模型的网络结构复杂、参数较多，其调试过程依赖操作经验和数次反复试验，这也在一定程度上降低了工作效率。本文Unet模型训练过程中验证集损失函数值曲线出现小幅度波动，原因可能是训练集和验证集比例为9∶1，验证集数量分配较少所引起。因此，不同比例的数据分配对模型训练的影响也是今后值得研究的内容。本研究中Unet模型对作物的提取结果虽然优于SVM和RF算法，但是只利用了GF-2影像3个波段的光谱特征，缺少对其他光谱特征(如植被指数)的应用，可在以后的研究中构建多类植被指数[33]，以求获得更高精度的识别效果。

通过研究表明，深度学习方法应用于遥感影像作物识别具有较大的潜力，但作为一门新兴技术手段，需要进一步完善和提高。今后的研究中可以尝试多种深度学习模型提取作物信息，如Deeplab V3[32]和Pspnet[34]等。还可以尝试CRF[35-36]后处理方法优化分类结果以及引入集成学习[37]的思想，将多种方法提取结果进行集成，从而提高作物分类的精度。

5 结论

1)Unet模型对作物的分类精度较高，总体精度为84.22%，相比面向对象、SVM和RF算法提高了7.94，11.93和11.73百分点，Kappa系数为0.804 7，提高了10.13%，14.72%和14.60%。

2)从单个作物类别来看，Unet模型对棉花的分类效果优于其他作物的识别效果。对于部分套种区域，Unet模型能够挖掘作物图像的深层次特征，从而提升分类的准确性，较好识别套种作物，获取更精准的作物空间分布信息。

3)GF-2影像高空间分辨率的优势配合Unet深度学习方法在干旱区作物遥感影像高精度识别研究中具有可行性和可靠性。