基于Landsat-8的天山北坡经济带棉花种植面积提取

2024-10-27 00:00:00杨刚陈秋宇
农业灾害研究 2024年8期

摘 要:从天山北坡经济带主要农作物综合多特征的分类策略中提取棉花种植空间分布信息。利用谷歌地球引擎、遥感数据源为Landsat-8卫星影像资源,利用中国土地覆盖数据集对研究区进行耕地覆膜,提取出研究区的耕地,构建包含NDVI时序和棉花最佳识别月份的反射率特征多特征的影像;利用支持向量机分类器识别棉花种植面积空间分布信息。研究表明,基于Landsat-8数据的多特征的分类策略的棉花制图精度0.95、用户精度0.94,为天山北坡主要作物的识别和提取研究提供了参考。

关键词:Lansat-8卫星数据;多特征;支持向量机;棉花种植

中图分类号:S562 文献标志码:B 文章编号:2095–3305(2024)08–00-03

棉花种植历史悠久,是我国重要的农业经济作物。棉花与人们日常生活息息相关,并且在国家经济发展中占据至关重要的地位,尤其是对于新疆维吾尔自治区而言。2020年新疆棉花种植面积达到250.190万hm2,农作物种植面积628.261万hm2,棉花种植面积接近新疆维吾尔自治区全部种植物播种面积的1/2。种植面积和产量估算属于农情监测信息,有效地整合和利用作物的农情信息对提高农业生产效率和管理水平至关重要。

新疆地区不少学者开展了相关遥感研究,曹卫彬[1]

细致地研究了新疆维吾尔自治区的棉花监测现状,并就新疆维吾尔自治区棉花种植面积监测提出了系统性的措施和方法。郝鹏宇等[2]利用长时间周期的MODIS数据,提取新疆维吾尔自治区博乐市的棉花种植信息。

国内外许多学者针对棉花种植信息的提取,尝试了很多方法。龙翔[3]等研究了棉花处于不同生长时期的各波段上的反射率特征,研究其时间序列上的反射光谱变化趋势并结合实地调查作物监测长势,总结棉花整个生长期的光谱规律,为后续进行作物光谱研究奠定了基础。阳旭[4]的研究对象为棉花,应用LiDAR技术获取棉花生长周期内的多个时间段的点云数据,利用算法提取棉花主干的几何信息;在此基础上,完成对植株体积、叶面积指数、叶宽等性状参数的估计。王霄煜[5]等利用测量工具实际测量真实地物的光谱信息,利用GF-1卫星数据资源,设置合适的植被指数,将棉花与其他作物分开,也验证了监督分类策略和非监督分类策略对识别棉花面积的有效性。

在新疆维吾尔自治区的天山北坡经济带,利用多时相的Landsat-8卫星数据,采用综合NDVI时间序列和棉花最佳识别月份的反射率多特征进行棉花识别,在GEE平台实现天山北坡经济带的棉花识别和面积提取,最后查阅新疆维吾尔自治区2020年的棉花种植面积统计年鉴数据,对识别的棉花种植结果进行统计验证,从而为应用卫星快速统计农作物面积提供技术支撑。

1 研究区概况与数据预处理

1.1 研究区概况

天山北坡经济带位于新疆维吾尔自治区北面,南面是天山山脉,北面是阿勒泰地区,是北疆重要的经济地区,地处79°~98°E、42°~48°N,面积占新疆维吾尔自治区总面积5.7%(图1)。据李瑞雪[6]研究,天山北坡属于典型的中温带大陆性干旱气候,冬季寒冷干燥,夏季炎热少雨,春秋季时间短。天山北坡经济带河流众多,为当地带来丰富的水资源,许多农业生产基地都是建在河流水源附近。

表1归纳了天山北坡经济带主要农作物的物候信息,农作物生长状态随时间变化而变化。

1.2 数据源

1.2.1 Landsat-8影像数据

选用的Landsat-8遥感卫星数据来源于GEE上的数据集Landsat/LC08/C01/T1_SR,选取了研究区新疆维吾尔自治区天山北坡经济带内棉花生长期内4—10月逐月的Landsat-8影像,采用中值合成方式,得到1个月1幅影像,共7幅影像。全部数据源覆盖了棉花的整个生长时期,从棉花种植期到棉花拔秆期。

1.2.2 CLCD 30 m土地覆盖类型数据

武汉大学遥感院黄昕教授、李佳艺教授团队基于Google Earth Engine上335,709景Landsat数据,制作了全国年度土地覆盖类型数据集(CLCD),数据时间跨度为1985—2020年。CLCD的总体准确率达79.31%,CLCD的总体准确性高于同类产品中的MCD12Q1、ESACCI_LC、FROM_GLC和GlobaLand30。

1.2.3 样本点选择

查阅2020年《新疆统计年鉴》,新疆维吾尔自治区主要种植棉花、玉米、小麦和其他类的农作物,采取其他方法选取样本点。选取样本点时借助Google Earth(谷歌地球)高分辨率的影像,目视解译方式在研究区选取了棉花样本点572个,小麦样本点496个,玉米样本点582个,其他农作物样本点284个。

1.3 遥感数据预处理

调用GEE平台上的Landsat-8遥感数据集内的数据,拼接合成影像覆盖整个研究区,对影像进行辐射定标和大气校正,减少辐射传输过程中传感器和大气层对成像的影响,得到地物真实的反射率。使用GEE官方自带的去云函数对研究区进行去云处理,函数能准确识别云和阴影,设置云量构建掩膜图层,以达到去除云和阴影的目的。利用中国年度土地覆盖数据集中的2020年中国土地覆盖类型数据,数据的分辨率是30 m,对研究区域进行耕地覆膜,提取出Landsat-8影像上土地类型为耕地的区域,为进一步提取棉花种植信息作准备。剔除水体、裸地、林地等其他地物类型,为后续样本点选取奠定基础,就可以在耕地图层上选取后续选择样本点,减轻目视解译负担[7]。

2 棉花种植面积的遥感识别

2.1 利用Landsat-8数据和多特征的棉花种植面积识别

2.1.1 特征提取

NDVI植被指数反映地物在红光波段与近红外波段上的差异,该指数可有效提取出研究区内植被。利用公式(1)分别计算得到4—10月逐月的NDVI数据,构建NDVI时间序列影像。

NDVI=(1)

式(1)中,为ρNIR近红外(NIR)波段的反射率,ρRed为红波段(Red)的反射率。除逐月的NDVII值外,还计算了NDVI最大值、最小值及均值,合成为3幅影像。

不同农作物除NDVI时间序列存在差异外,不同地物在不同波段上的反射率也是存在差异的,这是依靠反射率特征识别地物类型的基础。9月棉花处于吐絮期,属生长旺盛期,植株繁茂,植被光谱特征明显,植被“红边”特征明显,在Landsat-8的B5波段反射率很高。9月初,开始收割玉米,在Landsat-8的B5上反射率特征不如棉花明显;6月就已经收割小麦,此时不具有植被特征,在Landsat-8的B5波段上的反射率特征也不如棉花明显。因此,选择提取出棉花最佳识别月份9月的各波段上反射率特征作为分类的特征向量,利用各波段反射率特征区分棉花与其他地物[8]。

综上所述,共选取16个特征,NDVI时间序列特征,

4—10月每月的NDVI,以及NDVI最大值、最小值及均值、棉花最佳识别月份反射率特征Landsat-8的B2~B7共6个波段。

2.1.2 利用Landsat-8数据和多特征的棉花提取

采用监督分类中支持向量机分类器,利用共16个特征进行分类。选取在耕地掩膜后的基础上,选取棉花、小麦、玉米及其他农作物,共4种训练样本,约束条件为NDVI时间序列和棉花最佳识别月份的反射率特征(图2),共计16个特征向量,对研究区主要农作物进行分类。最终得到分类结果,总体精度为0.90,Kappa系数0.84,其中棉花制图精度为0.95,用户精度为0.94。

2.2 棉花面积提取验证

对比统计年鉴,基于Landsa-8数据天山北坡经济带的棉花面积信息,采用多特征的分类策略识别棉花面积误差为0.077(表2)。参考各个县,不同县的提取面积误差有所不同,其中误差较大的地区包括托里县误差为0.15、霍尔果斯市误差为0.14。其中,托里县位于塔城地区,当地地物类型复杂是造成误差过大的主要原因。霍尔果斯市位于伊犁哈萨克自治州,在选取样本点时,伊犁哈萨克自治州样本数量选取较少,样本特征不够明晰,这是造成误差的主要原因[9-11]。

3 结论与展望

3.1 结论

利用2020年4—10月的Landsat-8遥感影像,结合CLCD中国土地覆盖类型数据集掩膜数据,对研究区耕地进行提取,选取NDVI时间序列特征和棉花最佳识别月份的反射率特征,利用监督分类中的支持向量机分类器,对天山北坡研究区主要农作物进行分类。最终结合统计年鉴数据,采用多特征的Landsat-8对整个天山北坡经济带棉花面积提取的误差为0.077,面积提取精度较高。

3.2 展望

(1)特征选取时只考虑光谱特征,遥感影像除光谱特征外,还有其他特征,如样本纹理特征,不同农作物植株的几何结构特征不同,可以利用该差异。此外,可加入DEM数据地形特征,DEM数据开源,获取方便,是很好的研究材料。后续研究进行作物分类时可考虑纹理特征和地形特征,有利于提高识别精度。

(2)选用的用于分类的特征数量为16个,在特征向量选取时未进行特征向量选取,依据训练样本和约束条件,部分向量未能有效区分样本,选择出区分度大的特征,减少总特征数量,提高单个特征质量。

参考文献

[1] 曹卫彬,杨邦杰,裴志远,等.我国农情信息需求调查与分析[J].农业工程学报,2004(1):147-151.

[2] 郝鹏宇,牛铮,王力,等.基于时序MODISEVI匹配的棉花信息提取:以新疆博乐市为例[J].遥感技术与应用,2013, 28(2):309-314.

[3] 龙翔,赵庆展,王学文,等.基于机载高光谱端元提取分析棉花生长期光谱变化[J].新疆农业科学,2021,58(7):1207-1216.

[4] 阳旭,胡松涛,王应华,等.利用多时序激光点云数据提取棉花表型参数方法[J].智慧农业(中英文),2021,3(1):51-62.

[5] 王霄煜,雷钧.基于高分一号卫星数据的新疆棉花种植面积信息提取研究[J].新疆农业科技,2021(1):23-26.

[6] 李瑞雪.中国天山山区气候变化的时空分布特征[D].兰州:西北师范大学,2010.

[7] 吕绍伦,赵阳,陈万基,等.基于遥感云计算的阿拉尔市棉花种植面积提取[J].棉花科学,2022,44(4):19-25.

[8] 王汇涵,张泽,康孝岩,等.基于Sentinel-2A的棉花种植面积提取及产量预测[J].农业工程学报,2022,38(9):205-214.

[9] 李路曼,郭鹏,张国顺,等.基于无人机可见光遥感的棉花面积信息提取[J].新疆农业科学,2018,55(3):548-555.

[10] 田野,张清,李希灿,等.基于多时相影像的棉花种植信息提取方法研究[J].干旱区研究,2017,34(2):423-430.

[11] 刘晓晨,买买提阿依甫.基于Landsat8遥感数据的新疆精河县棉花种植空间分布信息提取研究[J].新疆农业科技, 2015(5):5.