马永建,汪传建,赵庆展,任媛媛,田文忠
(石河子大学信息科学与技术学院/兵团空间信息工程技术研究中心,新疆 石河子 832003)
耕地作为我国不可或缺的自然资源,为国家的粮食安全提供了物质保障[1]。近年来,快速推进的工业化和城镇化进程导致我国的耕地资源不断流失,为确保农业的可持续发展,政府部门推行了严格的耕地保护制度[2]。通过测绘方式获取耕地面积与空间分布,实现耕地信息动态监管,是判断耕地类型变化及基本农田有效性的主要依据,更是制定农业政策、确保粮食安全的科学支撑[3]。
新疆南部地区面积辽阔,以荒漠为主,在河流沿岸有绿洲性耕地,田块较大,形态不一,人工测绘将面临耗时长、投资大、数据更新缓慢等问题。随着卫星成像技术的不断发展,遥感影像覆盖范围广、探测周期短、空间分辨率高等优势更加明显[5],将其用于耕地测绘,可有效弥补传统人工测绘方法的不足,使高效、准确的大区域农田信息获取和监测成为可能。目前,利用遥感影像进行农田提取的方式主要分为人工目视解译和基于像素或面向对象方法的农田信息提取[6-8]二种方式,前一种方式识别结果精度高,但过程速度慢、成本支出较大,后一种方式提取速度快、成本低,但精度较差,易受影像中噪声影响。根据研究区特征不同,许多学者提出了相应的改进措施,陈杰等[9]针对丘陵地区农田特点提出了一种基于最优尺度选择的农田提取方法,在丘陵地区的农田识别准确度可达73.06%;鲁恒等[10]借助无人机遥感空间分辨率高的优势,对小面积耕地采用迁移学习方法进行提取,其识别准确度可达91.9%;OZDARICI A与TURKER M[11]研究了不同遥感数据源下通过滤波方式获取农田信息的效果,其中QuickBird PS影像整体准确度超过83%。这些改进的提取算法在一定程度上提高了结果精度,但多采取单一时期遥感影像进行信息提取,重点关注含农作物覆盖的田块识别,对农田光谱、形状特征依赖性较大,无法有效挖掘遥感影像中的深层次特征信息,因此难以区分与裸土较为相似的未耕种地块,在纹理特征复杂的套种耕地信息提取及类别划分方面更是少有涉及。深度学习因具有启发式学习策略与训练机制,能实现更强的特征学习和特征表达能力,已成为当前遥感领域目标提取的先进方法[12-13]。其中,U-Net作为FCN的改进型网络,兼具反卷积网络与跳跃网络的特点,对处理类间差异小、样本数据分布不均衡等问题具有良好表现[14],凭借其识别精度高和数据挖掘能力强的优势,在城区建筑物识别[15]、农田渠系提取[16]、林带冠层监测[17]等方面均取得较优效果,被越来越多应用于遥感影像分类识别研究。
针对当前基于像素或面向对象的遥感影像农田提取易导致“椒盐噪声”[17]、需多次人工选取分割参数[18]、对套种地块提取结果不明确、难以提取未耕种地块信息等问题,本文根据荒漠区耕地的耕作特点,引入以U-Net网络结构为基础的深度学习目标提取机制,以新疆省尉犁县为研究区,选取耕地信息提取关键时期GF-1遥感影像,充分利用研究区物候特征、植被指数及纹理特征,建立一种基于深度学习的耕地区域识别方法,同时将区域内耕地以未耕作耕地、果林和农田三种类型进行呈现,从而为实现荒漠区耕地信息提取,地块耕种状态判别及基本农田有效性监测提供数据参考。
研究区位于新疆省尉犁县,地理坐标介于86°47′E~87°07′E,40°47′N~40°58′N之间,海拔范围为856.48~940.31 m,地势西高东低,西部为塔克拉玛干沙漠,东部为库木塔格沙漠,该区域中两大沙漠相距最短距离仅5 km,属典型的温带大陆性干旱气候,冷热差异悬殊,年均气温10.1 ℃,年降水量30~150 mm。研究区光热资源充沛,凭借良好的地理气候条件,已成为享誉全疆的优质棉生产基地,同时,为提高土地利用效率,部分耕地区域实行作物套种方式。
高分一号卫星(GF-1)是我国第一颗高分辨率对地观测卫星,目前已在国土资源、环境保护、地理信息测绘等领域发挥重要作用。GF-1主要波段参数如表1所示。
表1 GF-1遥感数据参数
根据研究区主要地物物候特征,选取2017年8月以及2018年2月同区域两期GF-1遥感影像。为获取地物真实反射率,消除图像的空间和几何畸变,对两期影像进行辐射定标、大气校正、正射校正等预处理操作。正射校正后的多光谱和全色影像经图像融合操作可获取研究区2 m分辨率多光谱数据。数据预处理过程如图1所示。
图1 遥感数据预处理流程
对研究区地物类型进行野外调查,时间为2019年8月5—15日,根据数据采集时间及研究区范围,共分5个样区进行实地数据采集,采用地图打点的方式标记样区地块,记录地块位置、覆被、周边地物特征等信息。
本实验获取荒地、胡杨、枣林、香梨、棉花共580处地块信息,其中耕地属性4类,包含96块荒地、97块枣林地、105块香梨地以及235块棉花地,林地属性1类,为47块胡杨林地。
研究区内主要地物物候信息及地块覆被变化如图2所示,具体表现为棉花播种时间较晚,开春4月左右进行播种,枣林、香梨、胡杨林2月均处于休眠期,3月下旬进入萌芽期,荒地或轮休期地块因未有明显植被覆盖,均体现为裸地特征。
图2 研究区典型地块物候图
研究区位于塔克拉玛干沙漠与库木塔格沙漠之间,年降水量极少,冬季基本无雪。耕地覆被以棉花、香梨、枣树为主,部分耕地周边及荒漠边缘分布有人工种植的胡杨林作为防护林。夏季期间,光照充足,依靠滴灌的方式,棉花长势良好,具有典型的植被特征;8月期间,棉花处于花铃期,叶面积比例较大,对耕地覆盖完整,且与种植果树的耕地相比具有更大的密度。冬季期间,种植有棉花的地块经过采摘与翻地工作,与裸地表现相似。果林与胡杨林均已进入越冬期,此类区域在遥感影像中表现为枝干与裸地混合,具有较为明显的纹理特征。因此,结合研究区气候类型及物候规律,选取夏季(8月)及冬季(2月)两期GF-1遥感影像作为数据源。
植被指数作为衡量作物生长状态的定量因子,在遥感领域得到了广泛应用,其中归一化植被指数(NDVI)可有效削弱大气反射等不利影响,增强遥感影像中的植被影响力,精确反应植被信息,是当前最常用的指标之一[19],NDVI计算公式如式(1)
式(1)中ρNIR为近红外波段反射率,ρR为红波段反射率。
对8月GF-1遥感影像进行NDVI运算,去除计算结果异常值并进行线性拉伸操作,增强植被区特征。根据拉伸后的图像制作第1类耕地训练集,设置阈值为250,将取值范围在250~255的区域定义为覆被类型为棉花的耕地,初步生成掩膜文件。
除覆被类型为棉花的耕地外,覆被类型为枣树或梨树的耕地在夏季影像中的特征不如棉花明显,易与胡杨林产生混淆,且部分耕地为未耕作类型,无植被覆盖,8月遥感影像无法提供足够的裸地样本。在2月的遥感影像中,先前覆被类型为棉花的耕地表现为裸地特征,覆被类型为枣树或梨树的耕地区域表现为裸地与枝干混合特征,颜色较浅,由于套种耕作方式,在夏季区域中表现为棉田区域的耕地,此时剩余的果树同样表现为冬季果林特征。胡杨林区域表现为裸地与枝干混合特征,但颜色较深。
在纹理特征方面,裸地区域表现较为平滑,裸地与枝干混合的果林受植被特性及种植结构影响,有细小纹理,胡杨林地根据种植密度不同呈现不同的纹理分布,但其纹理较粗与果林及裸地特征相比差异明显。使用目视解译的方法对2月遥感影像中的裸地及果林耕地进行标注,获取二、三类耕地训练集,同时采用灰度共生矩阵(GLCM)的方式对冬季遥感影像进行纹理信息提取。作为典型的基于统计的纹理特征提取方法,灰度共生矩阵具有较强的适应性与鲁棒性[20],其中对比度、相关、能量、同质性作为互不相关的4种特征参数,具有计算简便以及分类效果良好的特点。对比度反映图像的纹理沟纹深浅,能量体现图像灰度分布均匀程度和纹理粗细程度,相关是度量图像的灰度级在行或列方向上的相似程度,同质性是衡量图像纹理局部变化的大小。根据研究区遥感影像特征,选取能量作为纹理特征提取参数,计算公式为
式(2)中i取值为灰度共生矩阵的所有行,j取值为灰度共生矩阵的所有列,P(i,j)为矩阵中相应位置的值。
在8月遥感影像加入NDVI波段,在2月遥感影像中加入纹理波段,共同构成深度学习模型输入数据。
U-Net网络模型由RONNEBERGER O等于2015年提出[14],因其结构清晰明了,呈现为U型而得名。作为一种改进的FCN结构网络,它沿用了FCN语义分割思想的同时兼具编码-解码结构和跳跃网络的特点,使模型能够充分利用高层与低层特征图,结合上下文信息与细节信息得到更加精确的输出特征[21]。
本文使用的模型借鉴传统U-Net网络结构并加以改进,如图3所示。
图3 U-Net模型结构
模型输入均为5通道遥感影像。输入数据像素尺寸设置为256×256(约为0.5 km×0.5 km),根据观察,此类尺寸拥有足够的上下文信息,即使通过目视解译的方式也可以正确判断像素类别。通过对图像块随机应用翻转、旋转以及颜色抖动等方法增加批次中的图像数量,以得到充足的样本数据,避免训练过程总网络产生过拟合现象,增强模型的泛化能力[22]。本文共获取样本数据13 000个,同时以训练样本与验证样本比例为4∶1进行调整。
在典型的卷积神经网络结构中,通常经最大池化操作处理后特征图谱数量会增加,以保证信息的完善程度。考虑到本实验训练过程上采样操作已获取相关低级特征,允许下采样操作丢失部分信息,且实验数据均为卫星遥感影像,无需识别高层次3D物体概念[21],因此,本模型不同层级特征图谱均保持为32个。
模型左侧为压缩通道,用于逐层提取影像特征,降低噪声对图像的影像。为了避免随着网络的加深,训练过程收敛越来越慢的问题,本模型选用ReLu激活函数,无论是在正向还是反向传播过程,其收敛速度要优于Sigmod和Tanh函数[22],同时在部分层级加入BN(BatchNorm)处理过程,通过规范化手段保证每一层神经网络的输入保持相同分布,减少梯度消失的影响;模型右侧为扩展通道,包括反卷积与拼接等处理过程;模型最后一层结构为1×1×1的卷积操作,得到单个特征图层,使用SIGMOID函数将特征图像素类别映射为0~1之间的概率值,获取分类结果。
针对待分类的三类耕地,根据数据量及数据特征分别训练特定的模型,从而更好地对每一类网络进行微调,训练过程设置批次大小为2,学习率0.001,以最小化交叉熵损失函数为目标。将训练完成的模型应用于不同时期遥感影像进行耕地信息提取,结合判别流程,共同确定耕地类型。判别方法流程如图4所示。
图4 耕地信息辅助判别方法流程图
我国对于基本农田有着明确的保护条例,在划定为基本农田的区域内只允许种植棉、粮、油等作物,禁止发展林果业或作其他用途。本文根据条例规定并结合研究区种植特点,设计耕地类型信息辅助判别条件如下:
(1)农田。野外实地调查结果显示,研究区内除棉田外,其余耕地类型均不属农田范畴,但由于部分棉田区域采用果棉套种耕作方式,农田最终分类结果中应剔除此类耕地区域,在判别流程图中表现为首先采用棉田训练模型对夏季数据进行识别,初步筛选出具有棉田特征的耕地区域,随后使用果林训练模型对冬季数据中果林区域进行提取,通过比较两种模型的识别结果,若同一区域在夏季数据中的识别结果为棉花,而在冬季数据中的识别结果为果林,则将此类区域在棉田的识别结果去除,划分为果林耕地,同时把剩余棉田耕地区域以农田的形式在提取结果中呈现。
(2)果林耕地。研究区中的果林耕地区域在冬季数据中的特征最为明显,即使部分区域采用果棉套种的耕作方式,依据我国的耕地划分标准,此类区域应划分为果林耕地,在判别流程图中表现为将果林训练模型在冬季数据中的识别结果即划定为果林耕地。
(3)未耕种耕地。研究区冬夏两期数据中均包含无植被覆盖耕地,且特征较为相似,为保证模型训练样本的充分性,同时利用冬夏两期无植被覆盖区域进行模型训练识别,并以夏季无植被覆盖区域为主,划定未耕作耕地区域。
为验证U-Net模型农田信息提取的有效性及适用性,分别使用棉田训练模型、果林训练模型以及未耕作耕地训练模型对典型区域进行地块识别,每类模型识别结果均为二值化分类图,并采用机器学习常用评判指标准确度A(Accuracy)、精确度P(Precision)和召回率R(Recall)进行量化评价,以棉田耕地为例,各指标计算方法与定义如下:
式(3)至(5)中TP为正确识别的棉田田块数量,FP为其他田块识别为棉田田块的数量,FN棉田田块识别为其他田块的数量,TN为正确识别的其他田块数量。
通过本文方法对3处典型地块进行耕地信息提取,为保证地物多样性,数据时相均为夏季遥感数据,每处区域尺寸为4 000×4 000像素,覆盖面积为16 km2,第1处区域包含棉花、果林和其他地物,第2处区域由棉花、裸地及其他地物构成,第3处区域为果林、裸地和其他地物,区域中部分标签及提取结果如图5所示,提取结果评价参数准确度、精确度和召回率如表2所示。
图5 测试区部分标签及分类结果图
表2 测试区提取精度统计
提取结果(表2)表明:
(1)3处测试区域均取得了较好的分类效果,其中对于棉花覆盖的地块识别准确度最高,可达93.85%。对果林耕地进行提取时,部分区域在冬季数据中的识别结果为果林,在夏季数据中则识别为棉花,这是由于研究区部分田地存在棉花与枣林的套种现象,冬季数据中不包含棉花特征,而夏季数据中棉花的特征反映较为明显,导致冬夏数据中识别结果不一致。根据农田使用分类标准,将此类地块在结果成划分为果林耕地。
(2)未耕作地块类型主要为抛荒耕地,在模型提取过程中存在部分抛荒耕地未识别出的情况。原因在于本文选取的研究区位于沙漠边缘,根据当地气候特点,夏季种植有棉花的农田收获后会进行大规模秋翻,在标记的冬季样本数据中,大多数是属于翻整后的耕地,其纹理特征与抛荒的耕地有区别,且被抛荒耕地多有杂草等其他野生植被覆盖,光谱特征不一,因此存在未识别出抛荒耕地。
本文方法可以较好满足荒漠区农田信息提取要求,为进一步探索其优劣所在,本文选取目前常用的SVM和随机森林分类器进行识别效果比较。根据研究区待分类目标数量,采用一对一法逐步构建SVM分类器,选取径向基函数作为分类器核函数,同时为了避免重要参数惩罚因子C和核函数参数γ选取不当带来的过拟合或欠拟合问题,选用基于交叉验证的网格搜寻法确定参数取值。随机森林作作为一个结合bagging集成学习理论与随机空间理论的新型机器学习方法,其实质是利用多个决策分类器投票确定最终分类结果。本文通过研究区子样本集构建决策树,生成包含n棵决策树的随机森林分类器,从子样本的分类特征集中选出m个最优分类特征用于该决策树分类,同时将子样本以外数据作为袋外数据,计算泛化误差,逐步优化分类器决策树个数n和分类特征m,完成随机森林分类器的构建。
本文使用3种方法对研究区中典型区域进行提取测试,3种方法提取效果的准确度、完整度与精度统计如图6所示。由图6可以看出:
图6 三种分类方法精度比较
(1)测试区域中3种分类方法对于棉花覆盖耕地的提取效果都相对较好,其中U-Net模型提取准确度为90.83%,随机森林次之为87.06%,支持向量机准确度为86.13%。研究区内棉田分布范围最广,可提供的样本数量与特征同样最多,这对于同属于监督学习算法的3种分类方法有着数据上的优势,因此也获得了良好的分类效果。
(2)针对环境复杂、像素特征交错的果林耕地区域,SVM和随机森林分类模型均产生了“椒盐噪声”现象,提取结果中果林与耕地像元混合严重,准确度分别为83.72%、84.62%,使用U-Net模型结合耕地类型判别方法则可以较好的对果林耕地区域进行提取,减少“椒盐噪声”的影响,识别准确度可达88.39%。
(3)由于未耕作耕地与裸土的光谱及纹理差异性较小,3种分类方法的提取效果均不如棉田与果林区域,SVM分类器出现大量将荒漠裸土识别为未耕作耕地的错分现象,识别准确度仅为73.40%,UNet模型结合判别方法的提取结果中虽存在未识别的轮休期及抛荒耕地,但没有出现严重的错分现象,将荒漠区域识别为耕地,整体提取效果优于其他2种分类方法,识别准确度为79.51%。
按本文方法提取研究区耕地类型,获取识别结果,再结合野外调查数据,验证其分类效果,结果表明:总体来看,研究区内耕地识别效果良好,各类型耕地空间分布特征与实际情况相一致,棉田覆盖面积最广,荒漠边缘河流沿岸均有棉田分布,果林耕地数量较少,且多分布于荒漠区绿洲耕地的中央区域,荒漠边缘未出现果林耕地,未耕作耕地分布零散,在荒漠边缘及大块棉田周边均存在未耕作耕地。
本文选取GF-1遥感影像,通过深度学习的方法对荒漠区耕地类型进行提取,利用冬夏不同物候期耕地光谱及纹理类型的差异性,将夏季数据NDVI值和冬季数据灰度共生矩阵能量值作为特征波段加入原始影像,进行训练,分别获取棉田、果林耕地、未耕作耕地的U-Net提取模型,综合判别条件确定最终耕地提取结果,同时与传统的遥感影像分类方法进行比较分析,得出结论如下:
(1)采用U-Net模型对研究区耕地类型进行判别,棉田区域的识别准确度最高,可达90.83%,果林耕地与未耕种耕地的提取效果同样优于传统分类方法。表明借助深度学习的方法可有效挖掘高分辨率遥感影像地块特征,能实现荒漠区绿洲性耕地提取和状态监测。
(2)充分利用冬夏两季不同时期的物候特征,根据当地农业耕种类别和不同模型识别结果,设计合理的地块类型判别方法,可一定程度上提升对研究区套种耕地的判别准确度,减少由于像元混合带来的错分效果。
(3)将荒漠区绿洲性耕地划分为农田、果林耕地及未耕作耕地三类地块进行分类,可充分反映该地区永久性基本农田的保护情况、新开垦和传统耕地的利用情况,这对于及时掌握可用耕地面积及类型的变化和维护荒漠区的生态环境稳定具有重要意义。