邱鹏勋,汪小钦,茶明星,李娅丽
基于TWDTW的时间序列GF-1 WFV农作物分类
邱鹏勋,汪小钦,茶明星,李娅丽
(福州大学/空间数据挖掘与信息共享教育部重点实验室/卫星空间信息技术综合应用国家地方联合工程研究中心/数字中国研究院(福建),福州 350108)
【】焉耆盆地是新疆重要的特色农产品生产基地,农作物种植结构较为复杂。利用时间序列的遥感数据对研究区内的农作物进行分类识别,获得不同农作物的空间分布、种植面积等信息,为政府部门制定粮食政策、经济计划提供重要依据。同时探讨时间加权的动态时间弯曲(time weighted dynamic time warping,TWDTW)方法在农作物分类识别中的适用性以及高分一号(GF-1)WFV在农业领域的应用潜力。以新疆焉耆盆地为研究区域,利用2018年作物生长季的GF-1 WFV时间序列数据集计算归一化植被指数(NDVI),基于TWDTW方法开展农作物分类识别研究。分别采集不同作物的样本点,形成各作物NDVI的标准序列。利用TWDTW相似性匹配算法计算每个待分类像元与不同作物标准序列间的相似度距离,距离值越小则相似性越高,通过对比确定像元的农作物类型,得到最终的分类结果,同时根据时间序列NDVI曲线建立决策树(decision trees,DTs)分类规则,人工设置分类阈值得到分类结果,并与TWDTW方法的结果进行对比分析。2种方法的分类结果较为一致,辣椒的种植范围最广,小麦主要分布在焉耆盆地北部和西部的农二师二十一团,番茄和甜菜的种植分布较为零星。在种植面积统计中,辣椒的种植面积最大,其后依次为番茄、小麦和甜菜。利用野外样本点对决策树和TWDTW两种方法的分类结果进行精度验证,总体精度分别为89.58%和90.97%,kappa系数为0.804和0.830,TWDTW方法的分类精度相比于决策树法略有提高。相比于决策树分类方法,TWDTW方法的分类精度略有提高的同时,分类结果客观可靠,而且算法不受地域因素限制,具有较强的灵活性和适用性。基于密集时相的GF-1 WFV数据集,采用TWDTW算法对农作物进行分类,得到较好的分类结果,能够满足农业部门的管理决策需求,该方法在农业领域具有较大的应用和推广价值。
TWDTW;时间序列;高分一号;农作物分类;决策树
研究区位于新疆巴音郭楞自治州的焉耆盆地(85°58′—87°26′E,41°46′—42°21′N),东临博斯腾湖,北接天山山脉,行政范围上包括和静县、和硕县、焉耆县以及博湖县(图1)。焉耆盆地具有典型的干旱绿洲气候,春季回暖快,冬季较为寒冷,日照时间长,光热资源丰富。该地区地势平坦,开都河贯穿其间,水资源较为丰富,适合农业发展。焉耆盆地是新疆重要的特色农产品生产基地,番茄产业经过30多年的发展,已成为该区域的优势产业,番茄制品销往全国各地。辣椒在该区域内大面积种植,生产的辣椒质量好、产量高,是全国重要的辣椒生产基地。同时,研究区内还种有小麦、甜菜等农作物,种植结构较为复杂。
图1 研究区地理位置样本点分布图
1.2.1 GF-1/WFV数据集 本文所使用的GF-1/WFV影像数据集是从中国资源卫星应用中心获取的,空间分辨率为16 m,共10个时相(5-1、5-9、5-21、6-19、8-16、8-28、9-5、9-22、10-4和11-26)。利用DEM数据对影像进行正射校正,采用辐射定标和大气校正消除大气等因素的干扰。对于某一特定时相,仅利用单景影像无法覆盖整个研究区的情况,采用多景影像镶嵌,并根据研究区范围对影像进行裁剪,得到边界一致的数据集。由于NDVI能够很好地反映绿色植被的生长情况,对所有预处理后数据进行NDVI计算,得到NDVI时间序列数据集,为后续农作物分类做准备。
1.2.2 样本数据集 为了更好地验证农作物分类结果,2018年7月对研究区内的农作物种植情况进行了实地调察。采用GPS定点及拍照的方式,共收集到样本点243个(图1),根据实地调查样本点的分布情况,以及谷歌地球影像上不同农作物的色彩和纹理等特征进行目视判读,再增加118个样本点,共361个样本构建样本数据集,其中辣椒103个,小麦86个,甜菜48个,番茄54个,芦苇和其他植被58个,非农业区样本12个。
利用农作物样本点和GF-1 WFV时间序列数据构建NDVI时序曲线,时序曲线的波形反映了农作物的生长变化情况。根据不同作物生长的物候特征,利用TWDTW算法对研究区内的农作物进行分类。同时建立决策树分类规则进行对比,分析TWDTW方法在农作物分类中的适用性。图2为本文的技术路线。
图2 农作物分类流程图
1.3.1 农作物物候特征 由于不同农作物对生长的气候条件有不同的要求,因此它们最适宜的种植也存在差异。利用样本点与NDVI时间序列数据集生成农作物的NDVI时序曲线图(图3),可以发现研究区内小麦的最大生育期在5月底到6月初之间,7月收获,是最早种植的农作物。番茄和辣椒的种植时间都在4月底,但是番茄的生长季较短,NDVI值在8月初达到最高,8月下旬开始收获,而辣椒的收获期是在9月下旬,这段时期的NDVI下降幅度较大。甜菜和芦苇的生长季都较长,甜菜在9月底达到生长高峰,之后NDVI值迅速下降,是研究区内收获最迟的农作物。
1.3.2 时间加权的动态时间弯曲算法 时间加权的动态时间弯曲算法是在动态时间弯曲(DTW)算法的基础上引入了时间权重因子,基于动态规划思想,寻找一条最小累计距离的路径[30]。计算两序列的相似性程度时,不仅要考虑匹配点的数值大小,还要考虑匹配点间的时间跨度,避免序列间严重的畸形匹配现象[31]。
设有两长度分别为和的时间序列为:
当你需要“布置任务”的时候,要转过他的脸,看着他的眼,微笑,用较慢的语速说出你的需要,并让宝贝确认你想要表达的内容他是否明白。这只是第一步,接下来你需要给他足够反应的时间,跟他商量什么时间可以完成。第三步,你需要适时地提醒他。最后,孩子完成了任务,要为他竖起大拇指点赞;完不成任务则要和孩子一起找原因,建立下一次的规则。不断重复这一过程,在重复中帮助孩子建构时间规则。
图3 农作物NDVI时序曲线
A={a,=1,2,…,}T(1)
B={b,=1,2,…,}T(2)
构造时间序列和的距离矩阵为:
s×m=(s)×m(3)
式中,s为两序列间的基距离,一般采用欧式距离的平方和时间权重的乘积作为TWDTW的基距离,即:
s=w×s(4)
s=(a-b)2(6)
式中,w为权重值,为增益因子,值越大则对匹配点间隔差异的惩罚越大,为距离因子,m一般为时间序列的中间节点,本文设为150。设时间序列和在处的累积距离为Q,公式如下:
(i,j)=min[(i-1, j),(i-1, j-1),(i, j-1)]+s (7)
(1,1)=11(8)
在寻找最小累积距离路径时,应满足:
(1)max{,}≤≤+-1
(2)若Q=s, Q1=s则0≤-≤1,0≤≤1。
从样本数据集中随机选择20%的样本作为分类训练样本,提取各类样本点在NDVI影像上的均值作为标准序列的节点值,逐像元计算待分像元与标准序列间的TWDTW距离值,值越小则相似性程度越高。通过对比待分像元与各类农作物标准序列的相似性程度,确定像元属性,得到最终分类结果。
运算效率是应用TWDTW算法最大的挑战,其计算时间与影像的时相数、像元数以及分类体系的复杂程度相关。为了提高运算效率,本文对影像进行分块,采用多线程方法实现TWDTW的并行计算,极大地提高了该算法的时间效率。
1.3.3 决策树分类方法 根据不同作物具有不同的物候特征,本文采用决策树对农作物进行分类。决策树方法是通过设定一些判断条件对原始影像进行逐步的二分和细化[32-33]。其中,每一个分叉点代表一个决策判断条件,每个分叉点下有两个叶节点,分别代表满足条件和不满足条件[34-35]。根据农作物生长的NDVI时序曲线(图2),选取待分作物与其他作物特征差异较大的敏感时期,设定判断条件,并通过不断地尝试确定合理的分类阈值,建立分类规则(图4)。
决策树分类规则本着先易后难的原则,选取目标农作物与背景特征差异较大的“关键物候期”,优先提取较好区分的农作物。对于物候特征相近的农作物,综合利用多时相NDVI值,通过简单的物候学算法,构建农作物的分类条件,增大目标作物与背景特征的差异程度,设定阈值提取目标作物。由于小麦的种植时间最早,与研究区内其他农作物的物候期基本不重叠,NDVI在141 d时达到峰值,在228 d时已经回落到较低状态,分别对这两时期的NDVI影像设定阈值提取小麦。番茄和辣椒的最佳种植期都在4月底,虽然播种时间相近,但是番茄生长周期短,在191 d时达到最大生育期,之后NDVI不断下降,利用番茄在191 d到240 d NDVI差值较大的特点提取番茄。由于甜菜的收获时间最迟,在277 d时NDVI值还处于较高水平,但仅利用这一时相还不能完全区分甜菜与芦苇,根据NDVI时序曲线图(图2)可以发现,甜菜在170 d到228 d时NDVI还处于上升趋势,而芦苇处于下降趋势,通过两时相差值区分两类作物。辣椒和芦苇的物候曲线较为相似,但辣椒在生育期高峰的228、240和248 d的NDVI值都大于芦苇,而且辣椒生长季开始较芦苇晚,在170 d和141 d时NDVI都比芦苇低,通过后三期影像减去前面两期得到辣椒提取指标。对于剩下未分类的区域,只需要区分其他和非植被区2个类别,对于非植被区,NDVI值全年都处于较低状态,选取植被生长最旺盛3个时期(170 d、191 d和240 d)的影像值进行相加,设定阈值可有效地剔除非植被区域。
图4 农作物分类规则
TWDTW和决策树2种方法的分类结果如图5所示。从图中可以看出,2种方法的分类结果较为一致,其中辣椒的种植范围分布较广,小麦主要分布在焉耆盆地北部的和硕县、和静县以及农二师二十一团。相比于辣椒和小麦,番茄和甜菜的种植规模较小,且分布较为零星。在博斯腾湖西岸,主要分布着芦苇及一些其他植被,这与野外考察的真实情况相符合。
对研究区内各县(市)的农作物种植面积进行统计,可以发现2种分类方法估算农作物种植面积的结果较为接近(表1),其中番茄种植面积差异较大,这主要与番茄种植地块较为零星有关,混合像元增加了分类的不确定性。从TWDTW分类结果中可以得到,研究区内4种农作物的总种植面积为105 413.6 hm2,其中辣椒的种植面积最大,占总种植面积的69.6%,其次分别为番茄、小麦和甜菜,种植比例分别为14.4%、9.9%和6.1%。
表1 各县市农作物种植面积统计表
图5 农作物分类结果
将除训练样本外剩余的290个样本点作为验证样本,分别对2种方案的分类结果进行精度验证(表2—3)。采用决策树分类结果的总体精度(overall accuracy,OA)为89.58%,kappa系数为0.804;基于TWDTW算法分类结果的整体精度为90.97%,kappa系数为0.830,TWDTW算法的分类精度略好于决策树。
从用户精度(user accuracy,UA)的角度来看,不管是决策树还是TWDTW算法分类,小麦和番茄的分类精度都是所有类别中最高的2类。基于决策树的分类方法中,小麦的用户精度达到98.55%,只有1个样本被错分,而TWDTW分类方法中有4个小麦样本被错分,用户精度为94.20%。基于TWDTW分类方法相比于决策树,除小麦的用户精度有降低外,其他类别的作物精度都略有提高。番茄的精度从87.75%上升到91.84%,辣椒和甜菜的用户精度分别上升了2.22%和5.00%。
从制图精度(producer accuracy,PA)的角度来看,除了其他植被与甜菜以外,基于2种分类方法的其他3类农作物的分类精度都高于90%。基于TWDTW分类方法与决策树方法相比,除了番茄的精度有降低的情况外,其他类别的农作物均有小幅提高。在2种分类结果中,芦苇及其他植被的分类精度都较低,主要是其他农作物与该类别间均存在一些样本点误分现象。
表2 决策树分类混淆矩阵
表3 TWDTW分类混淆矩阵
决策树分类方法通过分析不同农作物的物候特征,选取特定时相建立分类条件,通过不断地试验确定类别阈值,分类结果虽然能够达到较高精度,但分类规则受人为主观影响较大,且需要不断地试验才有可能获得满意的结果。基于某一区域特定年份建立的决策规则普适性不高,无法推广到其他区域和应用于其他年份,对于不同的研究区或不同年份,均需构建不同的分类规则。基于TWDTW相似性匹配算法,根据样本点与时间序列NDVI数据建立不同作物的标准序列,不需要选取作物分类的“关键物候期”,通过计算并比较待分像元与各类作物样本的相似性程度,无需设定阈值,自动生成分类结果。农作物在生长过程中,由于种植时间的差异性及作物生长快慢导致曲线偏移,时间权重的加入使得TWDTW不仅能够解决这种偏移现象,又能很好地区分作物间的差异[28,36]。Belgiu等[29]和Manabe等[31]利用TWDTW方法在不同研究区提取农作物都取得了较高的精度。而决策树分类条件的设定较为固定,容易忽略同种作物生长具有快慢的客观规律,造成作物间的误分现象。因此,相比于决策树方法,TWDTW分类精度有所提高,分类结果客观可靠,而且算法不受地域因素和不同年份限制,具有较强的灵活性和适用性,在农作物分类中具有较大的应用潜力。
本文主要采用NDVI作为农作物区分的特征指数,NDVI能够很好地显示植被的生长状态,但对于生长季时间相近的农作物,采用TWDTW方法有可能导致误分现象。如分类结果中,有6个其他作物样本点被误分为辣椒,它们的生长物候规律与辣椒较为相近。为了进一步提高分类精度,针对这种现象可以考虑增加一些其他特征来加大作物间的差异,扩大相似性距离,从而识别不同的农作物。本文基于TWDTW算法的农作物识别分类仍然存在一些未解决的问题。基于像元作为影像分类的分析单元,存在“同物异谱,异物同谱”的现象,分类结果较为破碎,存在同一田块被分为多种农作物的情况,分类的完整性有待进一步提高,在今后的工作中,可以通过影像分割,基于面向田块的方法进一步提高影像的分类精度。在分类样本选择中,本文通过选取分类体系中所有作物类型,通过比较作物间相似程度确定待分像元的属性,对于单一作物空间信息的自动化提取还有待进一步研究,在今后的工作中,希望通过算法自动确定单一作物的分类阈值,实现对农作物专题信息的自动提取。
中低分辨率的卫星影像由于幅宽较大适用于大面积种植作物的信息提取,但对于种植结构复杂的区域具有较大的局限性,无法保证提取的精度。相比于中低分辨率的MODIS等其他卫星影像,GF-1 WFV具有更高的空间分辨率,能够更加准确地反映特定作物地生长变化情况。杨闫君等[37]采用时间序列的GF-1 WFV数据,利用SVM分类器对唐山市南部区域的农作物进行分类,分类精度达到了96.33%。姬忠林等[38]基于决策树模型和面向对象的分类方法,利用GF-1 WFV数据提取扬州市冬小麦和油菜的种植信息,提取精度分别为97%和96%。从本文的分类精度和前人的研究成果都表明GF-1 WFV数据在农作物的分类识别中具有较大的应用潜力。
GF-1 WFV数据与中低分辨率的影像相比,虽然在空间分辨上具有一定的优势,但对于地块较为破碎的地区,如焉耆县和博湖县的大部分地区,由于存在混合像元,分类结果较为零星,存在一定的误差。位于和静县和焉耆县交界的农二师二十一团以及和硕县,由于地块面积大且形状工整,在分类结果中,田块的边缘信息较为清晰,农作物在空间分布上也具有较高的连续性和完整性,与野外考察的实际情况相符合,分类精度较高。为了提高农作物的分类精度,在今后的研究中可以考虑采用更高分辨率的影像,或者结合高分辨率与中等分辨率影像对农作物进行监测,实现农作物种植结构的精细提取。
相比于其他的中等分辨率遥感数据,如Landsat系列数据具有16 d的时间分辨率,高分一号卫星具有较短的重访周期,4 d的重访周期极大地增加了获取无云和少云影像的机率。在本研究中,选取了研究区2018年作物生长季的10个不同时相的GF-1 WFV影像,而覆盖该区域农作物生长季无云和少云的Lansat8 OLI数据总共才8个时相,限制了准确获取农作物关键物候期的机率,不利于作物的识别。随着GF-6卫星发射升空,GF-1将与该卫星形成星座,时间分辨率从4 d缩短到了2 d,能更加充分地满足精准农业的要求,为我国的农业发展提供数据保障。
本文基于时间序列GF-1 WFV数据,采用TWDTW方法对研究区内的农作物进行识别,并与决策树分类结果进行对比。结果表明,TWDTW方法在农作物分类识别中能够取得较高的分类精度,除辣椒和其他外,其余农作物的分类精度都高于90%,能够满足作物监测管理的需求;对于农作物种植结构复杂且不同作物间物候具有差异性的地区,采用决策树分类方法,结合简单的物候学算法,虽然也能够得到较高的分类精度,但是分类主观性强,分类规则无法推广到其他区域。TWDTW相比于决策树具有更高的灵活性和适用性,在精准农业方面具有广阔的应用前景。
[1] 陈水森, 柳钦火, 陈良富, 李静, 刘强. 粮食作物播种面积遥感监测研究进展. 农业工程学报, 2005, 21(6): 166-171.
Chen S S, LIU Q H, CHEN L F, Li J, Liu Q. Review of research advances in remote sensing monitoring of grain crop area., 2005, 21(6): 166-171.(in Chinese)
[2] 胡琼, 吴文斌, 宋茜, 余强毅, 杨鹏, 唐华俊. 农作物种植结构遥感提取研究进展. 中国农业科学, 2015, 48(10): 1900-1914.
Hu Q, Wu W B, Song Q, Yu Q Y, Yang P, Tang H J. Recent progresses in research of crop patterns mapping by using remote sensing., 2015, 48(10): 1900-1914.(in Chinese)
[3] 唐华俊, 吴文斌, 杨鹏, 周清波, 陈仲新. 农作物空间格局遥感监测研究进展. 中国农业科学, 2010, 43(14): 2879-2888.
Tang H J, Wu W B, Yang P, Zhou Q B, Chen Z X. Recent progresses in monitoring crop spatial patterns by using remote sensing technologies., 2010, 43(14): 2879-2888. (in Chinese)
[4] Gómez C, White J C, Wulder M A. Optical remotely sensed time series data for land cover classification: A review., 2016, 116: 55-72.
[5] 宋茜. 基于GF-1/WFV和面向对象的农作物种植结构提取方法研究[D]. 北京: 中国农业科学院, 2016.
Song Q. Object-based image analysis with machine learning algorithms for cropping pattern mapping using GF-1/WFV imagery[D]. Beijing: Chinese Academy of Agricultural Sciences, 2016. (in Chinese)
[6] Wu W, Yu Q, Peter V H, You L, Yang P, Tang H. How could agricultural land systems contribute to raise food production under global change., 2014, 13(7): 1432-1442.
[7] Congalton R G. A review of assessing the accuracy of classifications of remotely sensed data.1998, 37(2): 270-279.
[8] 刘亚群. 基于多时相遥感影像的黑河流域农作物种植结构提取研究[D]. 重庆: 重庆交通大学, 2016.
Liu Y Q. Changes in crop planting structure of the Heihe River basin in china based on the multi-temporal NDVI from TM/ETM+/OLI images. Chongqing: Chongqing Jiaotong University, 2016. (in Chinese)
[9] Vintrou E, Desbrosse A, Begue A, Traore S, Baron C, Lo Seen D. Crop area mapping in west Africa using landscape stratification of MODIS time series and comparison with existing global land products., 2012, 14(1): 83-93.
[10] Shao Y, Lunetta R S, Wheeler B, Iiames J S, Campbell J B. An evaluation of time-series smoothing algorithms for land-cover classifications using MODIS-NDVI multi-temporal data., 2016, 174: 258-265.
[11] Zhang J, Feng L, Yao F. Improved maize cultivated area estimation over a large scale combining MODIS–EVI time series data and crop phenological information., 2014, 94: 102-113.
[12] Chen Y, Lu D, Moran E, Batistella M, Dutra L V, Sanches I D A, Da Silva R F B, Huang J, Luiz A J B, de Oliveira M A F. Mapping croplands, cropping patterns, and crop types using MODIS time-series data., 2018, 69: 133-147.
[13] 杨小唤, 张香平, 江东. 基于MODIS时序NDVI特征值提取多作物播种面积的方法. 资源科学, 2004, 26(6): 17-22.
Yang X H, Zhang X P, Jiang D. Extraction of multi-crop planting areas from MODIS data., 2004, 26(6): 17-22. (in Chinese)
[14] 陈颖姝, 张晓春, 王修贵, 罗强, 熊勤学, 罗文兵. 基于Landsat8 OLI与MODIS数据的洪涝季节作物种植结构提取. 农业工程学报, 2014, 30(21): 165-173.
Chen Y S, Zhang X C, Wang X G, Luo Q, Xiong Q X, Luo W B. Extraction of crop planting structure in seasons prone to waterlogging using Landsat8 OLI and MODIS data., 2014, 30(21): 165-173. (in Chinese)
[15] 张焕雪, 曹新, 李强子, 张淼, 郑新奇. 基于多时相环境星NDVI时间序列的农作物分类研究. 遥感技术与应用, 2015, 30(2): 304-311.
Zhang H X, Cao X, Li Q Z, Zhang M, ZhenG X Q. Research on crop identification using multi-temporal NDVI HJ images., 2015, 30(2): 304-311. (in Chinese)
[16] 白照广. 高分一号卫星的技术特点. 中国航天, 2013(8): 5-9.
Bai Z G. Technical characteristics of GF-1 satellite., 2013(8): 5-9. (in Chinese)
[17] 郭燕, 武喜红, 程永政, 王来刚, 刘婷. 用高分一号数据提取玉米面积及精度分析. 遥感信息, 2015, 30(6):31-36.
Guo Y, Wu X H, ChenG Y Z, Wang L G, Liu T. Maize recognition and accuracy evaluation based on high resolution remote sensing (GF-1) data., 2015, 30(6): 31-36. (in Chinese)
[18] 刘原峰. 基于多时相GF-1 WFV影像的绿洲主要粮食作物识别及估产——以民勤绿洲为例[D]. 兰州: 西北师范大学, 2016.
Liu Y F. Oasis main food crops remote-sensing recognition and yield estimation based on multi-temporal GF-1 WFV Images a case study in Minqin Oasis. Lanzhou: Northwest Normal University, 2016. (in Chinese)
[19] 黄健熙, 侯矞焯, 苏伟, 刘峻明, 朱德海. 基于GF-1 WFV数据的玉米与大豆种植面积提取方法. 农业工程学报, 2017, 33(7): 164-170.
Huang J X, Hou Y Z, Su W, Liu J M, Zhu D H. Mapping corn and soybean cropped area with GF-1 WFV data., 2017, 33(7): 164-170. (in Chinese)
[20] 原继东, 王志海. 时间序列的表示与分类算法综述. 计算机科学, 2015(3): 1-7.
Yuan J D, Wang Z H. Review of time series representation and classification techniques., 2015(3): 1-7. (in Chinese)
[21] Arvor D, Jonathan M, Meirelles M S P, Dubreuil V, Durieux L. Classification of MODIS EVI time series for crop mapping in the state of Mato Grosso, Brazil., 2011, 32(22): 7847-7871.
[22] SAKOE H, CHIBA S. Dynamic programming algorithm optimization for spoken word recognition., 1978, 26(1): 43-50.
[23] Keogh E. Exact indexing of dynamic time warping., 2005, 7: 386-758.
[24] Hamooni H. Phoneme sequence recognition via DTW-based classification., 2016, 48: 253-275.
[25] Jeong Y S, Jeong M K, Omitaomu O A. Weighted dynamic time warping for time series classification., 2011, 44(9): 2231-2240.
[26] 钟礼山, 李满春, 伍阳, 夏南, 程亮. 利用SAR影像时间序列的耕地提取研究. 地理科学进展, 2015, 34(7): 830-839.
Zhong L S, Li M C, Wu Y, Xia N, Cheng L. Cropland extraction using SAR time series image.2015, 34(7): 830-839. (in Chinese)
[27] 叶燕清, 杨克巍, 姜江, 葛冰峰, 豆亚杰. 基于加权动态时间弯曲的多元时间序列相似性匹配方法. 模式识别与人工智能, 2017, 30(4): 314-327.
Ye Y Q, Yang K W, Jiang J, Ge B F, Dou Y J. Multivariate time series similarity matching method based on weighted dynamic time warping algorithm., 2017, 30(4): 314-327. (in Chinese)
[28] Maus V, Cˆamara G, Appel M. dtwSat: Time-weighted dynamic time warping for satellite image time series analysis in R., 2017, 90(1): 1-30.
[29] Belgiu M. Sentinel-2 cropland mapping using pixel-based and object-based time weighted dynamic time warping analysis., 2018, 204: 509-523.
[30] Guan X, Huang C, Liu G. Mapping rice cropping systems in Vietnam using an NDVI-based time-series similarity measurement based on DTW distance., 2016, 8(19): 3390-3415.
[31] Manabe V D, Melo M R S, Rocha J V. Framework for mapping integrated crop-livestock systems in Mato Grosso, Brazil., 2018, 10(9): 1-17.
[32] 王凯, 赵军, 朱国锋, 张佩云, 刘江涛, 陈栋栋. 基于GF-1遥感数据决策树与混合像元分解模型的冬小麦种植面积早期估算. 遥感技术与应用, 2018, 33(1): 158-167.
Wang K, Zhao J, Zhu G F, Zhang P Y, Liu J T, Chen D D. Early estimation of winter wheat planting area in Qingyang city by decision tree and pixel unmixing methods based on GF-1 satellite data., 2018, 33(1): 158-167. (in Chinese)
[33] 王连喜, 徐胜男, 李琪, 薛红喜, 吴建生. 基于决策树和混合像元分解的江苏省冬小麦种植面积提取. 农业工程学报, 2016, 32(5): 182-187.
Wang L X, Xu S N, Li Q, Xue H X, Wu J S. Extraction of winter wheat planted area in Jiangsu province using decision tree and mixed-pixel methods., 2016, 32(5): 182-187. (in Chinese)
[34] 苏伟, 姜方方, 朱德海, 展郡鸽, 马鸿元, 张晓东. 基于决策树和混合像元分解的玉米种植面积提取方法. 农业机械学报, 2015, 46(9): 289-295.
Su W, Jiang F F, Zhu D H, Zhan J G, MA H Y, Zhang X D. Extraction of maize planting area based on decision tree and mixed-pixel unmixing methods.2015, 46(9): 289-295. (in Chinese)
[35] 周静平, 李存军, 史磊刚, 史姝, 胡海棠, 淮贺举. 基于决策树和面向对象的作物分布信息遥感提取. 农业机械学报, 2016, 47(9): 318-326.
Zhou J P, Li C J, Shi L G, Shi S, Hu H T, Huai H J. Crops distribution information extracted by remote sensing based on decision tree and object-oriented method.2016, 47(9): 318-326. (in Chinese)
[36] 管续栋, 黄翀, 刘高焕. 基于DTW距离的时序相似性方法提取水稻遥感信息—以泰国为例. 资源科学, 2014, 36(2): 267-272.
Guan X D, Huang C, Liu G H. Extraction of paddy rice area using a DTW distance based similarity measure.2014, 36(2): 267-272. (in Chinese)
[37] 杨闫君, 占玉林, 田庆久, 顾行发, 余涛, 王磊. 基于GF-1/ WFVNDVI时间序列数据的作物分类. 农业工程学报, 2015, 31(24): 155-161.
Yang Y J, Zhan Y L, Tian Q J, Gu X F, Yu T, Wang L. Crop classification based on GF- 1/WFV NDVI time series., 2015, 31(24): 155-161. (in Chinese)
[38] 姬忠林, 张月平, 李乔玄, 刘绍贵, 李淑娟, 任红艳. 基于GF-1影像的冬小麦和油菜种植信息提取. 遥感技术与应用, 2017, 32(4): 760-765.
Ji Z L, Zhang Y P, Li Q X, Liu S G, Li S J, Ren H Y. Planting information extraction of winter wheat and rape based on GF-1 images., 2017, 32(4): 760-765. (in Chinese)
Crop Identification Based on TWDTW Method and Time Series GF-1 WFV
Qiu PengXun, Wang XiaoQin, Cha MingXing, Li YaLi
(Fuzhou university/Key Laboratory of Spatial Data Mining and Information Sharing of Ministry of Education/National & Local Joint Engineering Research Center of Satellite Geospatial Information Technology/The Academy of Digital China (Fujian), Fuzhou 350108)
【】Yanqi Basin is an important production base of characteristic agricultural products in Xinjiang, and the planting structure of crops is complicated. In this study, the time series remote sensing data were used to classify and identify crops in the study area, so as to obtain the spatial distribution of different crops and their planting areas, which were the important basis for government sectors to formulate grain policies and economic plans. At the same time, the applicability of time-weighted dynamic time warping (TWDTW ) method in crop classification and the application potential of GF-1 WFV in agriculture were also discussed.【】The normalized vegetation index (NDVI), calculated from the 2018 time series GF-1 WFV data set in Yanqi Basin, Xinjiang, was used to study the crops recognition based on TWDTW method. Sample points of different crops were collected to form standard sequence of NDVI for each crop. The TWDTW similarity matching algorithm was used to calculate the similarity distance between each pixel to be classified and the standard sequence of different crops. The smaller the distance was, the higher the similarity was. The similarity was used to determine the crop type of the pixel, and the final classification result was obtained. At the same time, the classification rules of decision tree were established according to the NDVI curve of time series, and the classification result was obtained by manually setting the classification threshold, and compared with that of the TWDTW method. 【】The classification results of the two methods were very consistent. Peppers were the most widely planted and the wheat was mainly distributed in the northern part of the Yanqi Basin and the 21st Division of the Second Agricultural Division. The distributions of tomato and sugar beet were relatively sporadic. Among the results of planting area, pepper had the largest planting area, followed by tomato, wheat and sugar beet. The accuracy of the classification results of the TWDTW and decision tree methods was verified by the field sample points: the overall accuracy of them were 89.58% and 90.97%, respectively, and the kappa index of them were 0.804 and 0.830, respectively. The classification accuracy of the TWDTW method was slightly higher than that of the decision tree method. 【】Compared with the decision tree classification method, the classification accuracy of the TWDTW method was slightly improved, the classification result was more objective and reliable. The algorithm of TWDTW method was not limited by geographical factors and had strong flexibility and applicability. The experimental results showed that using TWDTW algorithm to identify crops based on the GF-1 WFV data set of dense temporal phase could get better classification results, and it had great application and popularization value in agricultural field.
TWDTW;time series; GF-1; crop identification; decision trees
10.3864/j.issn.0578-1752.2019.17.004
2019-04-20;
2019-07-03
国家重点研发计划课题(2017YFB0504203)、中央引导地方发展专项(2017L3012)
邱鹏勋,E-mail:490909513@qq.com。通信作者汪小钦,E-mail:wangxq@fzu.edu.cn
(责任编程 杨鑫浩)