王丽美,靳国旺,熊 新,武 珂,黄启灏
·土地保障与生态安全·
耕地细碎化农业区冬小麦遥感制图方法
王丽美,靳国旺※,熊 新,武 珂,黄启灏
(信息工程大学地理空间信息学院,郑州 450001)
从遥感影像中提取作物播种面积和空间分布对耕地可持续发展和粮食安全意义重大。目前的遥感小麦制图研究主要依靠光学图像和高复杂度的分类方法,且现有分类算法在小样本条件下、耕地细碎化农业区的分类性能以及时间迁移性能仍然不确定,探索适合小样本的低复杂度的稳定算法具有现实意义。该研究基于Google Earth Engine(GEE)遥感云平台,使用Sentinel-1 SAR和Sentinel-2光学时间序列遥感数据,评估了时间加权动态时间规整算法(Time-Weighted Dynamic Time Warping,TWDTW)、随机森林算法(Random Forest,RF)和基于相似性测度(Difference and Similarity Factor,DSF)的OTSU阈值法在小样本条件下、耕地细碎化农业区的冬小麦制图精度和时间迁移性能。研究结果表明,在有限样本条件下,TWDTW方法小麦制图精度最高,总体精度(Overall Accuracy,OA)和Kappa系数分别为0.923和0.843;其次是RF(OA=0.906,Kappa=0.809)和DSF算法(OA=0.887,Kappa=0.767);基于欧式距离的OTSU阈值法分类精度最低。当利用算法进行时间迁移分类提取2021年的冬小麦分布图时,TWDTW和DSF算法表现出更好的稳定性且分类精度优于RF算法,其中TWDTW算法的精度最高,OA和Kappa系数分别为0.889和0.755;RF算法分类精度下降明显,OA和Kappa系数分别降低了约0.07和0.19,说明RF算法的迁移分类性能较差。综合来看,TWDTW算法对样本和耕地细碎化的敏感性较低,可以在有限样本条件下实现耕地细碎化农业区的高精度连续冬小麦制图;而RF算法对样本和耕地细碎化的敏感性较高,在有限样本条件下的耕地细碎化农业区进行连续冬小麦制图时稳定性较差。
遥感;作物;制图;冬小麦;耕地细碎化;Google Earth Engine
小麦是中国最重要、种植范围最广的粮食作物之一,据统计,中国夏粮中超过90%都是小麦。及时、准确地监测小麦种植面积与分布对粮食生产、粮食安全决策、社会经济和环境具有重要意义[1]。自中国实行土地承包制以来,耕地细碎化问题在广大农村普遍存在,主要表现为地块数量多、单位面积小和地块分散等[2]。导致耕地细碎化的主要原因是农业生产以家庭经营为主要形式、劳动生产力水平低下以及农村紧张的人地关系[3]。耕地细碎化浪费了耕地资源、破坏了土壤肥力、增加了生产成本,最终导致耕地生产力的下降,一直是国内外土地整治工作的核心[2-4]。对耕地细碎化地区进行小麦制图具有重要的战略意义。
遥感技术具有空间分辨率高、重访周期短、数据类型丰富、覆盖范围大、成本低等优势,被广泛应用于作物制图研究[5-8]。已有研究表明,利用单时相卫星影像的作物制图精度不令人满意,特别是在耕地细碎化农业地区[9-10],而基于时间序列遥感影像的作物制图在精度和可靠性上远优于单时相遥感[11-13]。随着中高分辨率卫星的不断发射(如美国Landsat卫星系列、欧空局Sentinel-1 SAR卫星和Sentinel-2光学卫星、中国的高分系列卫星)、卫星历史影像数据的积累以及遥感云平台技术(如GEE)的发展,时间序列遥感影像迅速成为作物制图中重要的数据来源。
利用时间序列遥感影像进行作物制图的研究中,基于机器学习的监督分类方法应用十分广泛。规则决策树、支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)等分类算法在其中发挥了重要作用[5-7]。这些监督分类算法中有些算法对样本的要求苛刻(如SVM、RF),当样本数量足够、样本分布均衡且具有典型代表性时能获得很高的分类精度,但当样本不满足上述条件时,分类精度存在不确定性;有些方法具有很高的算法复杂度(如基于规则的决策树),需要大量的专家知识和人工干预,虽然能够取得较好的分类精度,但是研究目标的变化往往导致原有规则的失效,需要重新建立新的规则,算法迁移性能有待评价。
阈值法是一种简单实用的土地利用/覆盖分类方法,其中OTSU自动阈值法[14]应用最为广泛。在阈值法作物制图中,相似性度量的选择是影响其精度和鲁棒性的关键因素之一。欧式距离(Euclidean Distance,ED)和余弦相似度(spectral angle cosine distance,SAD)是常用的相似性度量准则。ED[15]侧重反映物候特征向量之间的绝对距离差异,而忽略了形状相似性,容易受到特征向量的维度和特征参数相关性的影响而降低分类精度。SAD[16]通过计算两个向量夹角的余弦值来评估两个向量的相似性,侧重反映物候特征向量方向(形状)上的相似性而忽略两者之间的绝对差异。可见,不同的距离度量有各自的特点和优势,使用不当会造成偏差甚至错误的分类。目前针对阈值法作物分类的研究主要集中在特征工程和阈值确定方法上,对相似性度量的研究和分析较少。
实际上,由于受生长环境(天气、耕作方式、旱涝、病虫害)和遥感图像噪声等因素的影响,作物的物候曲线存在不可知的、非线性扭曲(如长度差、相位差),用简单直接的欧式距离强制对齐就会导致偏差甚至错误的结果。动态时间规整(Dynamic Time Warping,DTW)为解决这一问题提供了有效途径。DTW最初用于语音识别[17],后来被引入到时间序列遥感图像分类中,经常被用于时间序列遥感图像作物分类研究[18]。DTW通过非线性对齐来找到两个时间序列之间的最小路径,可以一定程度上处理因气候和耕作方式不同导致的物候曲线扭曲问题,但是,非线性对齐的过度灵活会降低DTW的分类性能。为此,Maus等[19]在DTW中引入了时间约束,提出时间加权动态时间规整算法(Time-Weighted DTW,TWDTW),以解决DTW分类性能降低的问题。TWDTW与阈值法有一定的关系,本质上都属于基于相似性度量的分类算法,阈值法常应用于单类地物提取,TWDTW算法在多地类样本条件下,可以实现多地类分类[20]。TWDTW算法原理简单易操作,目前已有一些利用该方法进行作物分类制图的研究[21-23]。但是,目前的研究多集中在遥感数据源和特征利用方面,对于小样本条件下、耕地细碎化地区的TWDTW冬小麦制图研究较少,算法的适应性和精度仍不确定。
耕地细碎化地区的作物制图难度一般高于规模化农业种植区,算法的适用性和稳定性对该类地区的作物制图非常重要;要实现该类地区的长期大范围作物制图需要采用对样本依赖度低、效率高的算法,因此探索适合小样本的、复杂度低的算法具有现实意义。本研究旨在评价3种典型代表算法(包括RF、TWDTW和OTSU)在小样本条件下、耕地细碎化地区进行冬小麦制图的精度与稳定性,为该类地区的冬小麦长期大尺度制图研究提供科学参考。
在南阳市卧龙区选择一块耕地细碎化程度较高的区域作为研究区(图1a),区内农业生产以家庭经营为主要形式,种植模式灵活度高,存在大量的细条状小地块,果园、林地等地块散布其中,呈现出耕地细碎化特点(图 1b,2020年3月的Sentinel-2月度真彩色合成影像),具有较强的代表性。研究区夏季作物以冬小麦为主,其次是花生,还有少量的果园和林地。冬小麦在每年的10月种植,次年的5—6月收割;花生一般在5月左右种植,8—9月收获,花生种植前的农田处于闲置状态,没有种植任何作物,此时地表呈现裸土特征,在真彩色影像上的色调与小麦有明显差别。2020年研究区主要土地利用类型包括冬小麦、居民地、道路、花生地、林地和果园等。
图1 研究区位置与地面参考数据
本文选用的遥感数据源为高空间分辨率的欧空局地球观测卫星Sentinel-1和Sentinel-2数据。
1.2.1 Sentinel-1 SAR遥感数据
Sentinel-1属于双极化C波段SAR卫星,是由A、B两颗同轨极轨卫星组成的星座。Sentinel-1A、Sentinel-1B分别于2014年4月3日和2016年4月25日发射升空,单颗星轨道周期为12 d,两颗星组网重访周期为6 d[24]。本文采用GEE遥感云平台中IW(Interferometric Wide swath)观测模式、双极化(VV+VH)的Sentinel-1地距影像(Ground Range Detected,GRD)产品COPERNICUS/S1_GRD,空间分辨率为5 m×20 m,该产品已经过多视处理、热噪声去除、辐射校准和地形校正处理。为提高作物分类研究中的SAR图像数据质量,本文对COPERNICUS/S1_GRD数据集进行了多时相LEE斑点噪声滤波[25]和月度均值合成。
1.2.2 Sentinel-2多光谱遥感数据
Sentinel-2是欧空局发射的高分辨率多光谱成像卫星,有13个光谱波段,分为2A和2B两颗卫星,两颗卫星的重访周期为5 d,空间分辨率为10 m。本文采用GEE云平台的Sentinel-2 Level-2A产品数据集COPERNICUS/S2_SR,该数据是经过大气校正的大气底层反射率产品。光学卫星影像易受云雾影响,为提高数据可用性,本文首先采用COPERNICUS/ S2_CLOUD_PROBABILITY数据集对COPERNICUS/ S2_SR数据进行去云处理,而后对数据集进行了NDVI指数添加和月度均值合成。NDVI计算式为
式中B8,B4分别是S2_SR数据集的B8近红外波段和B4红波段。
1.2.3 Sentinel-1和Sentinel-2月度数据集合并
考虑研究区冬小麦物候期范围,在2020年度小麦制图试验中,使用的遥感数据日期范围是2019年10月1日至2020年7月1日,研究区内Sentinel-1可用影像40张,Sentinel-2可用影像54张;在2021年度小麦制图试验中,使用的遥感数据日期范围2020年10月1日至2021年7月1日,研究区内Sentinel-1可用影像38张,Sentinel-2可用影像52张。图像噪声和田间管理差异等会造成遥感提取的作物特征曲线与真实特征曲线之间,以及同类作物特征曲线之间的偏差或者畸变,使得遥感数据无法准确表征真实物候特征,从而降低结果的可靠性。通过月度均值合成,可以有效地减少Sentinel-1图像上的斑点噪声,有效填补Sentinel-2光学图像去云过程留下的云、阴影等影像空洞,减少光学图像上由于去云不彻底而残留的云、阴影等像素的影响,同时削弱田间管理差异引起的误差,提高图像数据的表征能力和结果的可靠性。因此,本文对每个年度的Sentinel-1、Sentinel-2数据进行预处理,通过月均值合成,分别得到相应年份冬小麦物候期内的9景光学月度合成图像和9景SAR月度合成图像。
将Sentinel-1和Sentinel-2月度合成图像进行合并,可以得到S1_S2_stack时间序列数据集。近年作物分类研究中,国内外学者探索了利用Sentinel-1[20]或Sentinel-2[8,23]的单传感器作物分类精度,或者融合Sentinel-1和Sentinel-2[5,7]的作物监督分类精度。为充分利用不同作物生长过程中的结构和光谱差异,本文选择反映作物结构信息的Sentinel-1 VV和VH后向散射系数,反映作物光谱信息的Sentinel-2 可见光波段(B2、B3)、中红外波段(B11、B12)以及由可见光B4和近红外B8计算的NDVI指数,作为本文小麦制图方法的分类特征。
1.2.4 地面参考数据
2020年春季(3—5月)开展了实地调查,基于奥维地图软件进行田间采样并拍摄照片,得到了各地类的代表性样本(图1b,表1)。基于田间采样数据、Google Earth高分辨率影像、2020年3月份Sentinel-2 合成影像,以及NDVI月度时序数据,利用QGIS半自动分类插件(Semi-Automatic Classification Plugin,SCP)[26]人工解译得到研究区2020年主要作物地块分布图像(图1c),使用该数据作为参考图像,评定不同分类方法的冬小麦制图精度。
表1 研究区田间采样信息
本文研究方案包括3部分,如图2所示。首先,基于GEE遥感云平台,对Sentinel-1 SAR影像、Sentinel-2多光谱影像进行预处理,得到S1_S2_stack月度合成影像;然后,结合田间采样数据,基于相同的特征,在GEE上分别采用3种方法进行冬小麦制图试验;最后,以QGIS半监督分类方法获取的小麦地块为参考图像,利用MATLAB软件对不同方法的冬小麦制图结果进行精度评估。
注:RF,随机森林;TWDTW,时间加权动态时间规整算法;DSF,相似性测度;ED,欧式距离。下同。
本文采用的3种分类算法包括RF监督分类方法,基于距离测度的OTSU阈值法,以及TWDTW方法,对于每一种分类方法,使用相同的特征空间以便于比较算法的分类性能。以上3种算法的分类试验都是在GEE平台上实现,代码链接https://code.earthengine.google.com/? accept_repo=users/jytwlm/DTW_RF_DSP。
随机森林算法是将多棵决策树构成森林的集成学习分类器[27-28],主要包括模型训练和分类两个过程,算法实现流程,1)样本随机:假设训练数据集共有个对象,采取有放回(Boostrap)随机抽取个样本,每一次取出的样本不完全相同,这个样本就组成了单颗CART树的训练数据集;2)特征随机:假设每个样本都有个特征,从中随机地选取(≤)个特征,通过计算每一个特征所包含的信息量实现CART决策树分裂生长,决策树成长期间的大小始终不变;3)重复前面的步骤,建立棵CART树,这些树都要完全成长且不被修剪,形成森林;4)根据所有CART树的预测结果进行投票决定,得到样本的最终类别标签。在GEE平台上利用RF分类器(smileRandomForest())进行分类试验,基于对RF决策树数量与分类精度的分析,最终将RF分类器中决策树数量设置为100棵,其他参数使用默认值。
DTW算法由于匹配行为中的高灵活度以及受到物候相位差的影响导致距离计算偏差,降低了算法性能。Maus等[19]提出一种时间加权扩展的DTW算法,即TWDTW算法,这种方法灵活地考虑作物物候差异产生的相位差,采用线性函数加权或者逻辑函数加权将时间惩罚(权重)添加到距离计算中,分类精度和可靠性较高,并且适用于少量训练样本的情况。本文选择逻辑函数加权的Logistic TWDTW算法,因为它显示出比线性函数加权Linear TWDTW算法更精确的结果:Logistic TWDTW对小时间扭曲的惩罚较低,对大时间扭曲的惩罚较大;而Linear TWDTW对小时间扭曲的代价惩罚较大,降低了分类的敏感性[19-21]。Logistic TWDTW对参考类特征时间序列t与待分类像素特征时间序列t的每个对齐点对(t,i, t,j)增加一个权重w,j[19]:
式中(t,i, t,j)为对齐点对的日期之差,即时间扭曲(d)。逻辑函数模型需要设置2个重要的参数,分别为中点()和陡度(),本文使用文献[19-20]中推荐的参数值(= ﹣0.1,= 50),这意味着对小于50 d的时间扭曲给予较低的处罚,而对更大的时间扭曲给予更高的处罚。
本文在GEE平台上实现了TWDTW算法,主要包括3个步骤:首先,基于田间采样点位置和S1_S2_stack数据集,得到每个样本点的特征序列,对同一种地类所有样本点的特征序列求平均,得到该类别的参考特征序列,同样方法获取研究区各地类的参考特征序列;然后,利用Logistic TWDTW算法计算S1_S2_stack图像中每个像素的特征序列与各类别参考特征序列的距离;最后,把每个像素划分给TWDTW距离最小的地物类别,从而生成整个研究区的分类图。
不同地物的特征时间序列往往具有不同的形状和大小,由于气候、耕作方式、天气条件等方面的差异,同种作物的物候曲线往往具有形状或大小上的差异,这可能引起分类误差。理论上,综合考虑特征曲线的形状相似度和距离差异可以提高作物提取的精度。欧式距离(ED)是分类中评价两个特征向量相似度的常用距离度量,但ED的大小受向量维数影响,范围不固定,含义模糊。而且,ED侧重于表达两个向量之间的绝对距离差异,忽略了它们形状的相似性,分类结果往往会高估作物的种植面积。因此,本文提出一种融合距离差异因子和形状相似因子的复合距离测度DSF,计算式如下:
车间Milk-run系统运行模式是基于在上一个配送周期期间消耗的物料信息,在物料源(例如中央仓库、超市)处拾取完整的装满物料的容器,然后通过运输火车将容器带到一个或多个水槽(例如超市、工作站)。在交接地点,配送人员将装满物料的容器放到指定位置并取走空容器,根据路线上的水槽数量重复该过程。当所有满载货物的容器均被配送完毕时,列车将空箱运回原处。如果空箱在物料源处不需要被重新装满,则将它们带到收集区域。
式中1表示两个特征序列(X,Y)的相对距离偏差,值越小表示两个特征序列越相似;2是评价两个序列形状相似度因子,值越大表示两个特征序列越相似[29]。DSF距离度量同时考虑了特征序列的形状相似和距离差异,经分类试验证实,分类效果优于传统的欧式距离和光谱角距离测度。
本文在GEE上实施OTSU阈值法分类,首先利用S1_S2_stack数据,计算每个待分类像素与冬小麦参考特征序列的DSF距离,得到距离图像;而后,利用OSTU自动分割方法获取距离图像的最大类间方差阈值[14];最后,把小于该阈值的像素划分为冬小麦,否则为非小麦,从而实现冬小麦的提取。
在遥感分类研究中,JM距离(Jeffries-Matusita distance)常用于评价样本的代表性或特征对地类的分辨能力[30]。JM距离计算式为
式中1,2,1,2分别为类别1和类别2的样本特征曲线的均值和标准差;为Bhattacharyya距离。在本文研究中,利用JM距离来评价7个图像特征参数对典型地表覆盖类型的区分能力。
本文基于QGIS半监督分类得到的小麦地块参考图像,计算不同分类方法的混淆矩阵,从混淆矩阵中提取相关精度指标进行精度评价。利用混淆矩阵计算分类结果的总体精度(OA)和Kappa系数的计算式如下:
式中为分类结果的总像素数目。真正例(True Positive, TP)表示实际和预测都是正样例;伪反例(False Negative,FN)表示实际是正例而预测为反例;真反例(True Negative,TN)表示实际和预测都是反例;伪正例(False Positive,FP)表示实际是反例而预测为正例。OA直接反映正确分类像素占区域总像素的比例,当研究区各地类样本数量不均衡时,会造成OA在分类精度评价上的偏差。是反映地类样本数量不均衡性的指标,越不均衡,越大,因此Kappa系数在各地类样本数量不均衡时仍能客观的评价精度。
利用JM距离可以分析不同特征对地类的分辨能力。利用S1_S2_stack时序影像数据,提取每类样本的特征时间序列,根据特征类别(VV、VH、B2、B3、B11、B12和NDVI)对每类样本的时序数据进行划分,得到典型地物类型的特征时间曲线(图3),以及各个特征上的类间JM距离矩阵(图4)。
图3 典型地物类型的特征时间曲线
利用2020年S1_S2_stack数据和2020年样本,采用RF、TWDTW和DSF方法得到的2020年冬小麦制图结果如图5a~5e所示。总体来说,3种方法均可以获得较好的分类结果。图中蓝色虚线框范围是果园、花生、小麦和厂房的混合区域,地类结构复杂,RF算法对果园、厂房的分类结果内部一致性较好,但是对小麦有明显的误分,如图5b中黑色椭圆区域;在TWDTW分类结果中(图 5c),尽管有少量果园与林地的误分,但是在小麦的范围提取上,精度明显高于RF算法;DSF算法的小麦制图结果(图5d)与RF相当,但明显优于ED算法(图5e)。
基于小麦地块参考图像,计算了RF、TWDTW、DSF和ED算法的冬小麦制图精度,如表2所示。结果表明,TWDTW算法精度最好,OA和Kappa系数分别为0.923和0.843;其次是RF算法,OA和Kappa系数分别为0.906和0.809;DSF分类结果的精度较低,OA和Kappa系数分别为0.887和0.767。而作为对比的ED算法,OA和Kappa系数均明显低于本文的3种算法。
2021年的冬小麦提取结果如图5f~5j所示。对比图 5a和5f可知,2021年研究区的土地利用类型及其空间分布与2020年相比发生了一些变化。2021年花生的种植面积比2020年明显减少,其中大部分改种了冬小麦;另外2021年一些人造地物(如大棚)明显减少,大部分改种了冬小麦。在这种背景下,进行时间连续高精度作物制图时需考虑,1)是否需要密集型采样,获取数量充足的高质量样本数据以保证制图精度;2)分类算法的时间迁移性能如何,即是否需要在不同年份重复进行样本采样并分别训练分类器以实现不同年份的分类任务。为探索这两个问题,选择2021年冬小麦制图作为对比试验,验证不同算法的时间迁移性能。
图4 不同特征变量的JM距离矩阵
注:蓝色矩形框、蓝色椭圆和黑色椭圆区域表示小麦、果园、林地、花生、建成区等混合地类区,是评价分类精度的重要区域。
利用由2020年度特征数据和样本训练得到的随机森林分类器(RF_2020)对2021年S1_S2_stack数据分类,得到2021年分类结果(图5g);利用2020年采集的各地类参考特征时间序列,分别采用TWDTW和DSF算法对2021年S1_S2_stack数据进行分类和冬小麦提取,得到2021年分类结果如图5h和图5i所示。采用QGIS半监督分类方法人工解译得到2021年小麦参考图像,对三种方法的2021年分类结果进行精度计算,结果如表2所示。试验表明,使用2020年的样本对2021年的数据分类时,3种算法表现出不同的时间迁移稳定性,TWDTW算法仍然取得了最好的分类精度,OA和Kappa系数分别为0.889和0.755;DSF算法精度次之,OA和Kappa系数分别为0.855和0.669;RF算法的分类精度最低,与2020年的分类结果相比,OA和Kappa系数分别降低了约0.07和0.19。可以看出,RF的分类精度在迁移前后变化较大,说明RF分类器的时间迁移性能较差。
表2 不同分类方法整体精度和Kappa系数
耕作细碎化程度影响作物精确制图,本文选择耕作细碎化程度高,种植结构灵活的区域进行小麦制图试验,探索不同方法的作物制图精度和时间迁移性能。在作物生长过程中,作物结构和光谱信息都会随着物候期变化而改变,且不同作物在遥感图像特征上存在差异。Sentinel-1 VV和VH后向散射系数可以反映作物结构信息,Sentinel-2可见光波段(B2、B3)、中红外波段(B11、B12)以及由可见光B4和近红外B8计算的NDVI指数,反映作物不同波段的光谱特征差异,综合利用这些特征可以更细致地刻画作物,从而提高作物提取的精度。
RF算法是监督分类中应用最广泛的分类器,分类精度一般优于其他监督分类器。但是,RF算法要求数量丰富、分布均衡、具有代表性的样本,限制了算法在耕地细碎化区域的应用。本研究利用的样本数量偏少,且各地类样本数不均衡可能是导致RF分类精度低和稳定性较差的原因。试验分析了RF算法中不同的决策树数量对分类结果的影响,发现在样本确定的情况下,树的数目达到一定数值后,树的增多不会提高分类精度。
TWDTW、DSF和ED是基于特征序列匹配的分类方法,对样本数据的要求较为宽松,只需要少量的代表性样本,就可以获得较高的分类精度。一般来讲,不同地物往往具有不同的特征序列模式,而同一地物则具有相同的特征序列模式,但是由于生物与非生物因素的影响,地物的特征曲线会发生不可预测的非线性扭曲,从而出现时间轴上的“同物异谱”和“异物同谱”现象。过度宽泛的距离度量标准会造成目标地物的错检从而形成过高的估计,而过度严格的度量标准会造成目标地物的漏检从而形成过低的估计。现有的相似性度量有的侧重距离差异,有的侧重形状相似,使用单一度量评价特征时间序列之间的相似性往往具有片面性,造成分类结果的不确定性。欧氏距离侧重反映特征序列之间的绝对距离差异,而忽略了两者之间的形状相似性。DSF距离度量综合考虑了距离差异和形状相似性,能更准确地衡量特征序列之间的相似度,因此分类精度高于ED算法。TWDTW在特征时间序列匹配时考虑了物候差异的影响,因此分类精度优于传统的距离度量DSF和ED。
算法时间迁移分类中,基于特征序列匹配的分类方法(TWDTW和DSF)可以获得较高的小麦制图精度,且在分类精度和稳定性上均高于监督分类方法(RF)。造成这种结果的原因可以从算法和数据两个方面进行分析。从算法特点上分析,RF算法具有样本随机性和特征随机性。样本随机是指训练每棵树时,从全部训练样本中有放回的选取特定数量的样本作为训练样本;特征随机是指在每个节点随机选取所有特征的一个子集,用来计算最佳分割方式。样本随机造成选择的样本集是有重复的,降低了样本集的表征能力,这对小样本的研究影响更加突出;特征随机可能造成特征选择的偏见,造成特征种类或数量的不均衡,使得数量少的特征几乎不起作用。相比之下,TWDTW和DSF算法充分利用了全部样本与特征(光谱、指数、后向散射系数等特征并集)。从数据上分析,由于生物、非生物因素的影响以及遥感影像可用性的不同,造成不同年度的时间序列数据之间存在差异,导致所有算法的分类精度都出现不同程度的下降。这种数据差异对样本依赖性高的算法影响更为突出,而在几种算法中,RF对样本的依赖性更高,因此稳定性较差;而基于特征序列匹配的方法对样本的依赖性较低,尤其是TWDTW算法可以部分解决由气候和耕作方式不同导致的物候特征序列差异问题,因此迁移性能更稳定,精度更高。
本文旨在探索具有一定机理性、精度高且复杂度低的算法,为长期、大尺度作物制图以及快速更新提供有价值的参考。深度学习方法虽然能够利用神经网络提取深层特征,在一些应用中达到较高的精度,然而训练网络需要大量的人工标注样本,在耕地细碎化农业区,土地利用类型多而碎,年际变化大,获取大量的可靠样本存在困难,限制了算法应用。相比之下,传统方法具有更好的物理机理性、可解释性以及更低的算法复杂度。未来的研究中,可以探索将传统方法与深度学习有效结合,以发挥各自优势,进一步提高耕地细碎化地区作物制图的精度与效率。
本文利用Sentinel-1 SAR、Sentinel-2多光谱时序遥感数据和田间采样数据,研究了有限代表性样本条件下,时间加权动态时间规整(TWDTW)算法、随机森林(RF)算法和基于复合距离测度(DSF)的OTSU阈值法在耕地细碎化地区的冬小麦制图表现,得出以下结论:
1)Sentinel-1和Sentinel-2卫星遥感数据具有空间分辨率高、重访周期短、覆盖范围大、成本低等优势,两者结合使用可以弥补由云雾天气导致的光学影像数量不足的问题。在有限代表性样本支持下,基于Sentinel-1和Sentinel-2时间序列数据的TWDTW、RF和DSF算法,均可以获得较高的小麦制图精度。
2)在2020年的分类试验中,TWDTW获得的冬小麦制图精度最高,OA和Kappa系数分别为0.923和0.843,其次是RF算法和DSF算法;在时间迁移分类试验中,TWDTW仍可以获得很高的制图精度,OA和Kappa系数分别为0.889和0.755,其次是DSF算法和RF算法。
3)相对于RF算法,TWDTW算法对样本的敏感性较低,在有限代表性样本下,可以在耕地细碎化农业区获得高精度的冬小麦制图结果;TWDTW和DSF算法具有良好的时间迁移性能,可以使用单年份获取的样本数据实现跨年份的小麦制图。
[1] 董金玮,吴文斌,黄健熙,等. 农业土地利用遥感信息提取的研究进展与展望[J]. 地球信息科学学报,2020,22(4):772-783.
Dong Jinwei, Wu Wenbin, Huang Jianxi, et al. State of the art and perspective of agricultural land use remote sensing information extraction[J]. Journal of Geo-information Science, 2020, 22(4): 772-783. (in Chinese with English abstract)
[2] 文高辉,杨钢桥. 耕地细碎化对农户耕地生产率的影响机理与实证[J]. 中国人口·资源与环境,2019,29(5):138-148.
Wen Gaohui, Yang Gangqiao. Impact mechanism and empirical study of cultivated land fragmentation on farmers’ cultivated land productivity[J]. China Population, Resources and Environment, 2019, 29(5): 138-148. (in Chinese with English abstract)
[3] Tan S, Heerink N, Qu F. Land fragmentation and its driving forces in China[J]. Land Use Policy, 2006, 23(3): 272-285.
[4] 杜国明,盖兆雪,王洪彦. 中国耕地细碎化的理论解析与研究框架[J]. 地球科学与环境学报,2021,43(6):997-1008.
Du Guoming, Gai Zhaoxue, Wang Hongyan. Theoretical explanation and research framework of cultivated-land fragmentation in China[J]. Journal of Earth Sciences and Environment, 2021, 43(6): 997-1008. (in Chinese with English abstract)
[5] 周涛,潘剑君,韩涛,等. 基于多时相合成孔径雷达与光学影像的冬小麦种植面积提取[J]. 农业工程学报,2017,33(10):215-221.
Zhou Tao, Pan Jianjun, Han Tao, et al. Planting area extraction of winter wheat based on multi-temporal SAR data and optical imagery[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(10): 215-221. (in Chinese with English abstract)
[6] 邓刘洋,沈占锋,柯映明,等. 基于地块尺度多时相遥感影像的冬小麦种植面积提取[J]. 农业工程学报,2018,34(21):157-164.
Deng Liuyang Shen Zhanfeng, Ke Yingming, et al. Winter wheat planting area extraction using multi-temporal remote sensing images based on field parcel[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(21): 157-164. (in Chinese with English abstract)
[7] Li C, Chen W, Wang Y, et al. Mapping winter wheat with optical and SAR images based on Google Earth Engine in Henan province, China[J]. Remote Sensing, 2022, 14(2): 284.
[8] 陈彦四,黄春林,侯金亮,等. 基于多时相Sentinel-2影像的黑河中游玉米种植面积提取研究[J]. 遥感技术与应用,2021,36(2):324-331.
Chen Yansi, Huang Chunlin, Hou Jinliang, et al. Extraction of maize planting area based on multi-temporal Sentinel-2 imagery in the middle reaches of Heihe River[J]. Remote Sensing Technology and Application, 2021, 36(2): 324-331. (in Chinese with English abstract)
[9] Delrue J, Bydekerke L, Eerens H, et al. Crop mapping in countries with small-scale farming: A case study for West Shewa, Ethiopia[J]. International Journal of Remote Sensing, 2013, 34(7/8): 2566-2582.
[10] Gomez C, White J C, Wulder M A. Optical remotely sensed time series data for land cover classification: A review[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2016, 116: 55-72.
[11] 刘通,任鸿瑞. GEE平台下利用物候特征进行面向对象的水稻种植分布提取[J]. 农业工程学报,2022,38(12):189-196.
Liu Tong, Ren Hongrui. Object-oriented extraction of paddy rice planting areas using phenological features from the GEE platform[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(12): 189-196. (in Chinese with English abstract)
[12] 习文强,杜世宏,杜守基. 多时相耕地覆盖提取和变化分析:一种结合遥感和空间统计的时空上下文方法[J]. 地球信息科学学报,2022,24(2):310-325.
Xi Wenqiang, Du Shihong, Du Shouji. Multi-temporal cultivated land cover extraction and change analysis: A spatiotemporal context method combining remote sensing and spatial statistics[J]. Journal of Geo-information Science, 2022, 24(2): 310-325. (in Chinese with English abstract)
[13] 潘力,夏浩铭,王瑞萌,等. 基于Google Earth Engine的淮河流域越冬作物种植面积制图[J]. 农业工程学报,2021,37(18):211-218.
Pan Li, Xia Haoming, Wang Ruimeng, et al. Mapping of the winter crop planting areas in Huaihe River Basin based on Google Earth Engine[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(18): 211-218. (in Chinese with English abstract)
[14] Otsu N. A threshold selection method from gray-level histograms[J]. IEEE Transactions on Systems, Man, and Cybernetics, 1979, 9(1): 62-66.
[15] Mimmack G M, Mason S J, Galpin J S. Choice of distance matrices in cluster analysis: Defining regions[J]. Journal of Climate, 2010, 14(12): 2790-2797.
[16] Modh J S, Brijesh S, Satish S K. A new k-mean color image segmentation with cosine distance for satellite images[J]. International Journal of Engineering & Advanced Technology, 2012, 1(5): 27-30.
[17] Sakoe H, Chiba S. Dynamic programming algorithm optimization for spoken word recognition[J]. IEEE Transactions on Acoustics, Speech, and Signal Processing, 1978, 26(1): 43-49.
[18] Petitjean F, Inglada J, Gançarski P. Satellite image time series analysis under time warping[J]. IEEE Transactions on Geoscience and Remote Sensing, 2012, 50(8): 3081-3095.
[19] Maus V, Câmara G, Cartaxo R, et al. A time-weighted dynamic time warping method for land-use and land-cover mapping[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2016, 9(8): 3729-3739.
[20] Moola W S, Bijker W, Belgiu M, et al. Vegetable mapping using fuzzy classification of dynamic time warping distances from time series of Sentinel-1A images[J]. International Journal of Applied Earth Observation and Geoinformation, 2021, 102: 102405.
[21] 汪小钦,邱鹏勋,李娅丽,等. 基于时序Landsat遥感数据的新疆开孔河流域农作物类型识别[J]. 农业工程学报,2019,35(16):180-188.
Wang Xiaoqin, Qiu Pengxun, Li Yali, et al. Crops identification in Kaikong River Basin of Xinjiang based on time series Landsat remote sensing images[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(16): 180-188. (in Chinese with English abstract)
[22] Gella G W, Bijker W, Belgiu M. Mapping crop types in complex farming areas using SAR imagery with dynamic time warping[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2021, 175: 171-183.
[23] Mariana B, Ovidiu C. Sentinel-2 cropland mapping using pixel-based and object-based time-weighted dynamic time warping analysis[J]. Remote Sensing of Environment, 2018, 204, 509-523.
[24] Torres R, Snoeij P, Geudtner D, et al. GMES Sentinel-1 mission[J]. Remote Sensing of Environment, 2012, 120: 9-24.
[25] Mullissa A, Vollrath A, Odongo-Braun C, et al. Sentinel-1 SAR backscatter analysis ready data preparation in Google Earth Engine[J]. Remote Sensing, 2021, 13(10): 1954.
[26] Congedo L. Semi-automatic classification plugin: A Python tool for the download and processing of remote sensing images in QGIS[J]. Journal of Open Source Software, 2021, 6(64): 3172.
[27] Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[28] Pal M. Random forest classifier for remote sensing classification[J]. International Journal of Remote Sensing, 2005, 26(1): 217-222.
[29] Noce L, Gwaza L, Mangas-Sanjuan V, et al. Comparison of free software platforms for the calculation of the 90% confidence interval of f2 similarity factor by bootstrap analysis[J]. European Journal of Pharmaceutical Sciences, 2020, 146: 105259.
[30] Sen R, Goswami S, Chakraborty B. Jeffries-Matusita distance as a tool for feature selection[C]. 2019 International Conference on Data Science and Engineering (ICDSE), IIT Patna, India, 2019.
Winter wheat mapping in land fragmentation areas using remote sensing data
Wang Limei, Jin Guowang※, Xiong Xin, Wu Ke, Huang Qihao
(,,450001,)
An accurate and rapid extraction can be highly required for the crop sown area and spatial distribution from the remote sensing images, particularly for the sustainable development of cultivated land and food security. However, winter wheat mapping using remote sensing depends mainly on optical images and complex classification at present. Besides, it is still unclear on the classification performance and time-transferring capability of existing classification with the small sample sets in the highly land-fragmentation areas. The fragmentation of cultivated land has always been the core of rural land regulation, where the land resources are wasted to reduce the cultivated land productivity in the soil fertility with the high production costs. The difficulty of crop mapping in finely fragmented areas is generally higher than that in large-scale farming areas. The applicability and stability are very important for the study of such areas. It is necessary to realize long-term large-scale crop mapping with a low dependence on the number of samples and high efficiency. Therefore, it is of practical significance to develop a new extraction with a low complexity suitable for small samples. Previous studies have shown that the accuracy of crop mapping using single-phase satellite imagery cannot fully meet the high requirement in recent years, especially in land fragmentation areas. In this study, the high-level fragmentation of cultivated land was selected as the study area in the Wancheng District, Nanyang City, China. Using the Google Earth Engine cloud computing and Sentinel-1 SAR and Sentinel-2 optical images, three advanced classifications were evaluated, including the time-weighted dynamic time warming (TWDTW), random forest (RF), and OTSU with distance measure (DSF), for the winter wheat mapping accuracy and time-transferring capability with the small sample sets in the study area. The results show that effective extraction was achieved in the sown area and spatial distribution of winter wheat in 2020, but there were some differences in the classification accuracies. The TWDTW presented the highest classification accuracy, with the Overall Accuracy (OA) and Kappa coefficients 0.923 and 0.843, respectively, followed by the RF (OA=0.906, Kappa=0.809) and DSF (OA=0.887, Kappa=0.767). The OTSU with the Euclidean Distance showed the lowest classification accuracy. When transferring to extract the winter wheat classification maps of 2021, the classification accuracy of each model decreased: The TWDTW and DSF showed better stability and classification accuracy than the RF. The TWDTW shared the highest accuracy with the OA and Kappa of 0.889 and 0.755, respectively. The classification accuracy of RF decreased significantly, and the OA and Kappa decreased by about 0.07and 0.19, respectively, indicating the lower stability of the model. In general, the TWDTW presented low sensitivity to the training samples and spatial heterogeneity. As such, the high-precision continuous mapping was realized for the winter wheat in the agricultural areas with high spatial heterogeneity under the condition of limited samples. However, the RF was sensitive to the training samples and spatial heterogeneity. The condition of limited samples can cause low stability in the continuous winter wheat mapping in high spatial heterogeneity agricultural areas. This finding can provide important selection ideas and scientific support for continuous crop mapping with the small sample sets in the highly land-fragmentation areas.
remote sensing; crops; mapping; winter wheat; cultivated land fragmentation; Google Earth Engine
10.11975/j.issn.1002-6819.2022.22.021
S512.11
A
1002-6819(2022)-22-0190-9
王丽美,靳国旺,熊新,等. 耕地细碎化农业区冬小麦遥感制图方法[J]. 农业工程学报,2022,38(22):190-198.doi:10.11975/j.issn.1002-6819.2022.22.021 http://www.tcsae.org
Wang Limei, Jin Guowang, Xiong Xin, et al. Winter wheat mapping in land fragmentation areas using remote sensing data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(22): 190-198. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2022.22.021 http://www.tcsae.org
2022-08-03
2022-09-19
国家自然科学基金项目(41474010,61401509)
王丽美,博士生,研究方向为多源遥感图像处理与应用。Email:jwfreefool@163.com
靳国旺,教授,博士生导师,研究方向为雷达摄影测量、SAR图像处理与信息提取。Email:guowang_jin@163.com