薛雨 姚金明 卢庆辉 杨忍
摘 要:冬小麦是我国重要的粮食作物之一,准确提取冬小麦种植区域范围对保证粮食安全具有重要意义。文章以山东省威海乳山市为研究区域,使用GF-1C、GF-6、ZY-3多源影像数据,提取乳山市冬小麦种植范围。根据乳山市冬小麦种植及生长情况,选取4月中旬至5月上旬最佳时期的卫星影像;用计算NDVI作为新波段替代红光波段与绿、蓝波段进行合成,更加突出植被信息;利用深度学习训练冬小麦提取模型,实现冬小麦种植范围的自动提取,提取精度为94.39%,效果较好。
关键词:冬小麦;NDVI;深度学习;多源影像
中图分类号:TP18 文献标识码:A 文章编号:2096-4706(2023)02-0120-03
Research on Winter Wheat Extraction from Multi-Source Images Based on NDVI and Deep Learning
XUE Yu, YAO Jinming, LU Qinghui, YANG Ren
(Shandong Provincial Institute of Land Surveying and Mapping, Jinan 250013, China)
Abstract: Winter wheat is one of the important food crops in China. It is great significance to extract the range of planting area of winter wheat accurately for ensuring food security. In this paper, we take Rushan City, Weihai City, Shandong Province as the research area, and use GF-1C, GF-6, ZY-3 multi-source image data to extract the planting range of winter wheat in Rushan City. According to the planting and growth of winter wheat in Rushan city, satellite images of the best period from mid-April to early May are selected; calculate NDVI as a new band to replace the red band and the green and blue band to synthesize, more prominent vegetation information; deep learning is used to train the winter wheat extraction model to realize automatic extraction of the planting range of winter wheat with an extraction accuracy of 94.39%, it has a good effect.
Keywords: winter wheat; NDVI; deep learning; multi-source image
0 引 言
習近平总书记指出:“我国是人口众多的大国,解决好吃饭问题,始终是治国理政的头等大事”。估算粮食产量对于制定国家社会经济发展规划、确保国家粮食安全和社会稳定、指导和宏观调控种植结构具有重要意义[1]。我国是世界上小麦总产量最高,消费量最大的国家,其种植面积和产量在全国粮食生产中占有举足轻重的地位[2]。传统的农业统计和调查方法,耗费巨大的人力物力,且容易出现漏提的现象;而遥感技术的发展,为大区域冬小麦种植区域监测和粮食产量的预估,提供了更便捷、更高效的方式。
国内外众多学者对基于遥感影像的冬小麦自动提取开展了广泛研究,主要方法归纳为:
(1)基于图像分割和NDVI的冬小麦种植区域提取:王碧晴等[3]构建了基于NDVI时间序列的冬小麦识别模型,利用图像分割的方法获取地块边界信息,提高目标识别的准确性,总体分类精度达98.74%。
(2)基于多特征提取和优选的冬小麦面积提取:杨蕙宇等[1]基于多时相光谱、植被指数和纹理特征计算特征变量并构建特征变量组合,然后基于随机森林分类器对优选后的特征组合进一步分类,总体精度达到96.3%。
(3)王晓晓等基于Sentinel-2和Landset8两种数据源的光谱特征、纹理特征、植被指数特征组合数据,利用随机森林与支持向量机对冬小麦进行提取[4]。
(4)周亮等利用MODIS类型数据建立了基于卷积神经网络的冬小麦种植估产模型,对北方小麦区域的平原区估产,精度较高[5]。
山东是粮食生产大省,是保障全国粮源供应的重要“根据地”和“大粮仓”[6]。本研究基于GF1、GF6、ZY3等多源卫星影像数据,提取2022年威海乳山市冬小麦空间分布,便于为区域作物相关研究提供支撑,为大面积农作物提取提供新思路和方法。
1 研究区域和数据
1.1 研究区概况
乳山市隶属于山东威海市,因“大乳山”在境内而得名。乳山地处北纬36°41′—37°08′,东经121°11′—121°51′之间,东西60千米,南北48千米,总面积1 665平方千米,海岸线长199.27千米,位于青岛、威海、烟台三市衔接腹地,南边濒临黄海,与韩国、日本隔海相望[5]。乳山地处暖温带季风型大陆性气候区,四季分明,季风进退较明显,具有雨水丰沛、气候温和、光照充足、无霜期长的特点[6],非常适合粮食作物生长,2021年粮食种植面积55.1万亩,选择该区域进行研究具有一定代表性,乳山市具体位置如图1所示。
1.2 数据情况
本研究方法对影像质量要求较高,云彩压盖、天气等因素都对影像质量有所影响,影像质量越高,提取效果越好。并且根据历年研究区域内冬小麦发育期统计,乳山冬小麦返青期为每年3月中旬以后,但是在影像上体现较为明显的是4月中旬至5月上旬,根据自然资源部定期下发的影像,我们筛选出GF-1C、GF-6、ZY-3三种类型影像。光学卫星GF-1B、C、D星座2018年3月31日成功发射,是中国第一个民用的高分辨率星座,由状态一致、性能相同的3颗业务卫星组成,空间分辨率为多光谱优于8米、全色2米,单星成像幅宽大于60千米[7],在开展自然资源全覆盖、全要素、全天候实时监测和调查方面发挥至关重要的作用。GF-6卫星是一颗低轨光学遥感卫星,采用CAST 2000平台,其携带的宽幅相机(wide field view, WFV)共有8个波段,相比于GF-1号卫星4个波段,新增了红边1、红边2、紫和黄4个波段[8]。我国自主研发的高分辨率民用立体测图卫星资源三号(ZY-3)于2016年发射成功,它实现了长期、稳定、连续获取高分辨率立体影像,同时具备获取多光谱影像的能力,广泛应用于基础设施建设、国土资源调查及检测、自然灾害防治等领域,成为我国测绘事业长期发展的有力支撑[9]。
2 研究方法
2.1 技术路线
本研究技术路线如图2所示,首先对影像进行校正和裁剪、样本区域选择、勾画冬小麦样本等处理,然后计算影像的NDVI值、影像分割、模型训练、影像预测、精度评价。
2.2 影像处理
由于影像成像过程中受到气溶胶等因素的影响,导致影像质量不高,从而影响样本的勾画及深度学习的模型训练。为了获取真实地表反射率以准确的计算植被指数,采用FLAASH模型对研究区域内的影像进行了大气校正;利用DEM数据,对影像进行正射校正,使冬小麦的位置能够准确匹配,最终将影像数据统一为GCS-WGS-1984坐标系。
2.3 冬小麦样本勾画
根据乳山市的地形及冬小麦的种植情况,我们选取了12个样本区域。样本区域的选择需要遵循以下两个原则:
(1)样本有正样本和负样本之分,并且一定数量的负样本有利于提高预测的准确性。在保证充足的冬小麦样本时,尽可能选取该研究区域典型的负样本,例如与冬小麦相似的韭菜、大蒜等。
(2)根据影像上冬小麦的分布特点选取,划分类型为较少、较多、很多等,用来减少人工标注的工作量。利用ArcMap软件对样本区域的冬小麦样本进行勾画,如图3所示。正样本即为冬小麦,我们在class字段中标注为“1”。负样本即不是冬小麦的样本,包括样本区域内的其他植被、居民地、水系、道路等类型数据,我们在class字段中标注为“0”。
2.4 NDVI波段合成
植被指数是遥感技术在实际应用范畴中反映地表植被各类信息的来源,它在定性和定量评估植被覆盖度方面已经得到普遍应用。当前有多种植被指数:歸一化植被指数(NDVI)、阴影植被指数(SVI)、增强型植被指数(EVI)等,其中NDVI为判别植被状况的重要指标。NDVI值如式(1)所示:
NDVI=(ρNIR-ρR)/(ρNIR+ρR)
式中,ρNIR为近红外光波段的反射率,ρR为红光波段的反射率。利用ArcGIS中的Raster Calculator工具计算NDVI值,然后用NDVI值波段作为新的波段替代红光波段,与绿光和蓝光波段进行合成,这样处理能够让冬小麦等植被信息更加突出,便于精准识别。
2.5 影像分割
深度学习需要大量的样本作为训练基础。本研究基于图像块样本中需要将影像和样本一一对应,且位置、面积也需要完全对应,这就需要对影像进行分割。首先将样本按照样本区域mask进行裁剪,然后将矢量样本转换成栅格,同样将影像进行裁剪,影像和样本的名称完全对应。由于选取的单个样本区域面积在5平方千米左右,不符合深度学习的模型训练,利用软件将样本和影像裁剪成512×512像素的小影像。如图4所示。
2.6 模型训练
深度学习可以利用卷积神经网络具备的学习性,在数据累积的情况下成长为预测冬小麦种植面积的模型。本研究中的模型训练是根据现有的样本数据及影像,利用卷积神经网络对影像数据和样本数据进行拟合。本研究的样本共129组数据,其中训练集117组,验证集12组,验证集占比为10%。由于样本数量不大,笔者将模型训练的轮回数epoch设置较高,每次学习前向和反向传播使用的图像数量(batch size)设置为4,以确保模型充分学习特征,达到较好的效果。由于影像类型不同,表现的色彩形态也不同,本研究根据影像类型训练了3种模型。
2.7 结果分析
模型训练完成后,对研究区域范围内的影像进行预测。预测的结果同样是栅格数据,最终转换为shp格式,以便于分析处理。本次冬小麦预测结果如图5所示,结果表明,2022年乳山市冬小麦种植面积为135.66万平方千米,合20.35万亩,与2022年公布的乳山市冬小麦种植面积21.56万亩对比,精度为94.39%。乳山市内岠嵎山、昆嵛山、垛山、马石山、大乳山、多福山等分布在乳山西南部、东北部、西北部、南部等区域,冬小麦则均匀分布在山地以外的地方,主要集中在乳山市的中部和北部以及东南部的午极镇、下初镇、夏村镇、育黎镇等,符合乳山市的地形分布情况,总体结果比较理想。
3 结 论
本文以威海乳山市为研究区域,利用GF-1C、GF-6、ZY-3多源影像数据,基于NDVI和深度学习方法,对冬小麦种植面积进行提取,精度为94.39%,得出以下结论:
(1)本研究基于NDVI的冬小麦提取,将计算的NDVI值替换红光波段,然后进行影像合成,更加突出包括冬小麦在内的植被信息,有利于提高信息提取的准确性。
(2)深度学习技术的发展,为快速影像解译提供了可能。本文以威海乳山市为研究区域进行研究,样本量相对偏少,但是深度学习训练模型具有成长性,随着样本量的不断增加以及深度学习迭代次数的增多,模型的学习效果会越来越好,提取精度也会随之提高。
(3)为满足研究区域内影像质量和覆盖范围的要求,选取3种类型的影像进行提取,有利于提升预测结果的准确性。多源影像丰富了模型的类型,在预测过程中具有相互的促进作用。
同时文中研究还存在一些不足,下一步可以从以下几个方面进行深入研究:
(1)本研究冬小麦提取结果总体精度较好,但是在丘陵、梯田等区域的零星地块,提取结果不太理想,主要是因为破碎地块与周边非冬小麦地块构成的混合地块无法有效识别。
(2)由于韭菜和大蒜在影像上的状态与冬小麦类似,虽然勾画样本我们将其剔除,但是在预测结果中仍然出现误提现象,需要进一步进行改善,将误提的图斑进行剔除。
(3)在本研究的基礎上,后期可以探索大区域、海量样本、多源影像的冬小麦提取。
参考文献:
[1] 杨蕙宇,王征强,白建军,等.基于多特征提取与优选的冬小麦面积提取 [J].陕西师范大学学报:自然科学版,2020,48(1):40-49.
[2] 杨闫君,占玉林,田庆久,等.利用时序数据构建冬小麦识别矢量分析模型 [J].遥感信息,2016,31(5):53-59.
[3] 王碧晴,韩文泉,许驰.基于图像分割和NDVI时间序列曲线分类模型的冬小麦种植区域识别与提取 [J].国土资源遥感,2020,32(2):219-225.
[4] 王晓晓,韩留生,杨骥,等.Sentinel-2与Landsat8数据组合下的多特征冬小麦面积提取 [J].测绘通报,2022(3):111-115.
[5] 周亮,慕号伟,马海姣,等.基于卷积神经网络的中国北方冬小麦遥感估产 [J].农业工程学报,2019,35(15):119-128.
[6] 中国乳山网.乳山概况 [EB/OL].[2022-08-01]. http://www.rushan.gov.cn/col/col51333/index.html.
[7] 陈文志,许调娟,童英良.GF-1B、C、D星数据在国土资源调查监测领域的应用研究[J].浙江国土资源,2022(3):40-43.
[8] 赵鸿飞,路钊,伊洋,等.基于GF-6的植被覆盖度遥感估测研究 [J].测绘与空间地理信息,2022,45(3):19-23.
[9] 郑冬梅,王海宾,夏朝宗,等.基于ZY-3卫星多光谱影像估算浙江省乔木林地上碳密度 [J].北京林业大学学报,2020,42(1):65-74.
作者简介:薛雨(1992—),女,汉族,山东济宁人,工程师,硕士,研究方向:遥感影像智能解译及地理信息数据处理。
收稿日期:2022-08-24