基于物候特征和全连接神经网络相结合的小麦自动识别研究

2024-03-23 08:02郭雪星陆国政申乾荣
中国种业 2024年3期
关键词:物候冬小麦河南省

郭雪星 陆国政 王 强 申乾荣

(北京华云星地通科技有限公司,北京100081)

面对气候变化和粮食安全的挑战[1],全球各国共同面临着确保粮食供应平衡的任务[2-3]。因此,对于国家有关部门来说,快速、及时、有效获取大范围内作物种植面积的空间分布信息十分重要,对于指导作物生产、促进农业发展,并确保国家粮食安全具有关键意义。

国内外学者的研究表明,利用时序遥感影像植被指数和农作物物候特征进行作物种类识别,是一种行之有效的方法。近年来,国内外诸多专家学者基于不同的卫星数据,从不同角度、不同层次、运用不同的方法对冬小麦面积的提取进行了研究[4-6]。以往的研究大多在获取冬小麦分布信息方面取得了很大的成就,但这些研究很多是基于单一物候期[7-8]或多物候期的单一特征指数时间序列[9-10],没有考虑不同物候期作物的特征以及不同物候期之间的关系。基于单一特征指数时间序列的作物分布信息提取受其他特征的影响,相似特征指数时间序列对作物的效应也会影响提取精度[11],而多物候特征通过考虑作物在整个生长周期中多个特征指标的变化,可以减少这些因素的影响。Ni 等[12]考虑到不同物候期的差异,开发出了一种多物候特征合成方法,提取了水稻分布信息,结果显示该分类方法在水稻分布信息提取上表现较好。如果仅选取单时相光学影像,会因为“异物同谱”而产生漏错分等问题[13-14]。刘佳等[15]采用HJ 时间序列数据,利用农作物全生育期波谱特征曲线提取了河北衡水的主要作物类型,通过基于NDVI 阈值的决策树的分类方法,对各类农作物的种植面积进行了遥感识别和分类。贾树海等[16]基于不同作物类型物候特征的差异,提取三期遥感影像不同的NDVI 特征值和影像特征信息,利用监督分类方法对花生种植情况进行了分类和制图。

尽管利用遥感监测各种农作物生长状况的技术已经比较成熟,在某种农作物的一定区域内的种植分布面积研究也取得了一定的成就,但在具有多种农作物和植被的大面积耕地上,如何快速且有效地对农作物进行分类的研究还不够,无论是方法的可操作性或是结果精度的验证上都还存在着一些问题[17],比如过高的分辨率会增加数据量、计算时效性等问题。本研究的主要目的是利用FY-3D MERSI 产品数据,探寻河南省内不同植被在冬小麦生长期内NDVI 时间序列曲线变化的特征,从而建立一种能够快速和高效提取冬小麦种植面积的方法,并通过对FY-3D 卫星数据的研究,经过相关处理后提高该方法的精度,以期能够为利用遥感数据对冬小麦进行大范围识别和种植面积提取提供一种新的且行之有效的研究思路。

1 材料与方法

1.1 研究区概况河南省位于中国的中部,地理坐标在31°23′~36°22′N,110°21′~116°39′E 之间(图1),属典型的亚热带季风气候,四季明显,温度变化较大。夏季炎热潮湿,冬季寒冷干燥,春季温暖多风,秋季凉爽宜人,日照时间较长,光能资源充足。截至2023 年,其常住人口超过1 亿,是中国人口最多的省份之一。河南省还是中国重要的农业和工业基地之一,拥有广阔的农田和丰富的农产品资源,主要种植水稻、小麦、玉米、棉花等作物,在冶金、化工、机械制造、能源等领域具有一定的实力。近年来,河南省逐渐加大了对高新技术产业的发展力度,涵盖了电子信息、生物医药、新材料等领域。

图1 河南省研究区示意图

1.2 数据源及预处理(1)遥感数据。本研究使用风云卫星遥感数据服务网提供的归一化植被指数(NDVI 产品),该数据集是全球10°×10°分幅的250m 及0.05°分辨率等经纬度投影植被指数的旬合成产品。选取数据日期为2019 年10 月至2020 年6月、2020 年10 月至2021 年6 月、2021 年10 月至2022 年6 月、2022 年10 月至2023 年6 月,每月有上旬、中旬、下旬3 旬数据,河南冬小麦整个关键生育期共27 组数据。(2)其他数据。本研究除了使用遥感数据外,还使用了矢量数据和采样点数据。矢量数据用于行政边界的确认和遥感数据的裁剪。采样点数据主要是通过Google 高清底图进行冬小麦样本点的选取,作为后续模型分类和精度验证。(3)数据预处理。归一化植被指数(NDVI 产品)是分块数据,根据研究目的,本文选取河南省冬小麦生育期的数据,按照河南省行政边界进行拼接、投影、裁剪、格式转换等预处理工作,采用Python 编程方式进行数据批量自动处理。处理结果如图2 所示。

图2 河南省植被指数处理结果图

1.3 研究方法冬小麦自动识别研究的技术路线如图3 所示,首先进行遥感数据的获取和预处理,然后进行河南省冬小麦的物候特征分析,筛选出冬小麦生长发育期的时序遥感数据,从而计算时间序列的NDVI 数据。由于冬小麦样本较少,本文采用K 均值聚类分析方法,在研究区内随机取一些点,对不带标签的随机点进行聚类分析,得到最佳聚类效果。基于冬小麦的时序NDVI 光谱分析,最终确定冬小麦的类别,结合机器学习的方法(全连接神经网络),迭代出最优分类规则进行冬小麦识别。基于识别出来的冬小麦的结果,寻找同期高清Google 影像,通过目视解译得到冬小麦数据作为精度验证的检验源,采用数据匹配和精度检验指标方法进行精度验证。

图3 冬小麦遥感自动识别流程图

1.3.1 物候特征分析提取作物的物候数据对于农业决策、研究气候变化和生态系统变化非常重要。为了更准确描述作物生长发育规律,可以结合遥感时序数据和作物物候数据。遥感时序数据可以提供大范围的地表信息,而作物物候数据则可以提供作物生长发育的具体信息。这两种数据的结合使用可以帮助制图者提高分类精度,同时也为农业决策和研究提供了重要的数据支持。冬小麦的物候历(表1)是冬小麦播种面积的重要参考信息,可以根据温度变化和生长发育规律来确定。通过提取冬小麦的物候历,可以更精确地区分冬小麦与其他地物,从而提高制图的准确性和可靠性。

表1 河南省冬小麦物候历

1.3.2 聚类分析K 均值聚类分析是一种常用的无监督学习算法,用于将数据集中的观测值划分为K个不同的簇。该算法的目标是使得同一簇内的观测值相似度最高,而不同簇之间的观测值差异最大化。在进行K 均值聚类分析时,首先需要选择合适的K值,即簇的数量。然后,根据给定的距离度量(如欧氏距离或曼哈顿距离),计算观测值之间的距离,并将它们分配到最近的簇中。通过迭代的方式,更新每个簇的质心(即簇内观测值的平均值),并重新分配观测值,直到满足停止(如固定迭代次数或簇分配不再改变)。

1.3.3 全连接神经网络分类全连接神经网络是一个常见的人工神经网络模型,也被称为多层感知机(Multilayer perceptron)。它由多个神经元(节点)组成的网络层连接在一起,神经元之间相互连接。全连接神经网络的算法步骤主要包括以下几个方面。

(1)数据预处理:对输入数据进行必要的预处理,包括归一化、标准化、特征缩放等操作,以确保数据具有合适的数值范围和分布。

(2)网络架构设计:确定神经网络的数量,以及它们之间的连接方式。还需要选择适当的激活函数和损失函数。

(3)初始化参数:初始化网络中的权重和偏置,可以使用随机初始化的方式,如服从正态分布或均匀分布的随机数。

(4)前向传播:通过前向传播计算每个神经元的输出。从输入层开始,通过每一层的权重和偏置进行加权求和,并经过激活函数得到下一层的输出。

(5)计算损失:将前向传播得到的输出结果与真实标签进行比较,计算损失函数的值,衡量网络输出与真实值之间的差异。

(6)反向传播:通过反向传播算法计算每个神经元的梯度,并根据梯度下降法则更新权重和偏置,以减小损失函数的值。这一步是全连接神经网络的核心步骤,它将误差从输出层向前传播,不断调整权重和偏置。

(7)参数更新:根据反向传播计算得到的梯度,使用优化算法(如梯度下降法)更新网络中的权重和偏置,使损失函数逐渐减小。

(8)重复训练:不断重复步骤4 到步骤7,直到达到预定的停止条件,例如达到指定的训练轮数、损失函数收敛等。

(9)预测与评估:使用训练好的全连接神经网络进行预测,并评估模型的性能。可以使用测试数据集进行验证,计算准确率、精确率、召回率等指标。

1.3.4 精度分析本文精度分析主要通过检验源数据和待检验数据的时空间匹配,选用质量检验指标进行冬小麦提取结果的精度验证。

(1)数据匹配方法:本文基于Google 高清影像底图数据,采用目视解译方法,筛选出河南省小麦样本数据作为精度分析的检验源,利用时间匹配方法和空间匹配方法,进行检验源和待检验源的数据匹配处理。时间匹配方法是以FY-3D 卫星的归一化植被指数(NDVI)的时间为准,找邻近的Google影像。空间匹配方法则是以FY-3D 卫星的冬小麦识别产品空间分辨率为250m,根据Google 影像目视解译的小麦样本数据的经纬度,寻找125m范围内最近冬小麦识别产品像元,进行空间匹配处理。

(2)冬小麦识别评价指标描述:如表2 所示,以检验源(Google)冬小麦识别产品为参考,若检验源冬小麦识别结果为冬小麦,而FY-3D 冬小麦识别结果为非冬小麦,则定义为漏判;检验源冬小麦识别结果为非冬小麦,而数据集冬小麦识别结果为冬小麦的情况,则定义为误判。

表2 FY-3D 冬小麦识别与检验源冬小麦样本结果

(3)质量检验指标:质量检验指标包括冬小麦识别准确率PODcm、非冬小麦识别准确率PODncm、冬小麦识别误报率FARcm、非冬小麦识别误报率FARncm、总体冬小麦识别准确率HR、KSS评分。各指标计算公式如下。

冬小麦识别准确率PODcm:

式中a 表示匹配时间段内相同空间范围中FY-3D 卫星数据和检验源都检测到有冬小麦的样本个数;b 表示检验源检测到冬小麦而FY-3D 为非冬小麦的样本个数,即FY-3D 冬小麦漏判的样本个数;c 表示检验源为非冬小麦而FY-3D 为冬小麦的样本个数,即FY-3D 冬小麦识别误判的样本个数;d 表示FY-3D 卫星和检验源都为非冬小麦的样本个数,即FY-3D 非冬小麦准确的样本个数。

2 结果与分析

2.1 聚类分析结果本研究基于冬小麦特有的生育期时间序列物候特征和随机点的时序植被指数值(NDVI),基于K 均值聚类方法进行聚类分析。如图4a 所示,聚类簇数量为3 个时,聚类分析结果达到最佳。图4b~d 分别为此次聚类的样本结果,基于农作物生育期内的特定物候特征得知,图4b 为树草等其他植被,图4c 为冬小麦,图4d 为陆地、建筑

图4 聚类分析过程图

等。聚类分析结果如图5 所示,采用随机点聚类方法准确得出小麦样本点,从而为后续全连接神经网络分类提供充足样本。

图5 真实小麦样本图和随机点聚类结果图

2.2 冬小麦识别结果利用冬小麦物候特征时期的风云三号D 星遥感数据提取NDVI 旬合成数据集和聚类分析得出冬小麦样本点,采用全连接神经网络分类方法实现河南省冬小麦种植面积的信息提取,获得2019 年、2020 年、2021 年和2022 年河南省农作物的分布面积和空间分布格局(图6)。由图6 可知,河南省冬小麦种植区域主要分布在河南中部平原地带和河南南部。

图6 河南省冬小麦空间分布图

2.3 精度验证本研究随机从Google 高清影像数据,采用目视解译方法选取1400 个小麦样本点和600 个非小麦样本点,共2000 个样本点作为本次精度验证的数据,采用质量检验指标方法进行精度验证。从表3、表4 可以得出,2019 年FY-3D冬小麦识别准确率为84.6%,非冬小麦识别准确率为84.3%;2020 年FY-3D 冬小麦识别准确率为86.1%,非冬小麦识别准确率为87.7%;2021 年FY-3D 冬小麦识别准确率为84.1%,非冬小麦识别准确率为82.5%;2022 年FY-3D 冬小麦识别准确率为85.5%,非冬小麦识别准确率为83.6%,历年整体冬小麦识别准确率为85.1%,非冬小麦识别准确率为84.5%。

表3 2019-2022 年FY-3D 冬小麦识别与检验源冬小麦样本结果

表4 历年FY-3D 冬小麦识别精度验证结果

3 讨论

在冬小麦分类过程中,单时相图像无论其具有多少波段,都较难区分同期生长的作物类型,利用多时相遥感信息,考虑冬小麦在不同生长发育阶段的光谱差异性原理,发现冬小麦归一化植被指数在不同物候期存在较大差别。因此通过冬小麦生长期选择最佳时相的遥感数据,利用时序植被指数和全连接神经网络机器学习方法进行小麦自动识别研究,可以高效减少其他作物的干扰,提高识别效率,具有实用性。

使用相同判别规则对不同地区的冬小麦进行提取可能会存在一定误差,因为不同气候条件会导致作物生长速率和长势存在差异。此外,FY-3D 影像的250m 分辨率可能会导致混合像元的存在,从而影响冬小麦识别和提取精度。为了提高提取精度,下一步研究重点为探索区域地理环境差异和混合像元对提取精度的影响。

4 结论

本研究以河南省为研究区,利用风云三号D星数据,采用物候特征和全连接神经网络相结合的方法对河南省冬小麦进行提取,得到历年河南省冬小麦空间分布情况,主要得出以下结论。

(1)分析河南省冬小麦的物候特征,利用冬小麦植被指数时序变化规律,采用聚类分析和全连接神经网络分类方法提出较为精准的冬小麦像元,通过该技术可以有效地减少非植被地物对冬小麦提取的干扰,使其能自动实现冬小麦的识别,提高了业务运行效率。而且结合物候特征、时序特征、指数特征的聚类分析和全连接神经网络的分类方法比一般分类方法具有更高的分类精度和更小的样本依赖性。

(2)物候特征和全连接神经网络相结合的方法在河南省冬小麦提取中有相对较好的效果。在进行精度验证时,本研究以Google 高清影像为数据,目视解译出的冬小麦和非冬小麦像元作为检验源数据,识别河南省冬小麦的准确率为85.1%,非冬小麦准确率为84.5%。历年河南省冬小麦自动识别结果表明,该方法具有一定普适性和鲁棒性。

总体来说,本研究在大尺度范围上,基于风云卫星D 星遥感数据,结合物候特征、时序特征、指数特征的聚类分析和全连接神经网络分类方法应用于河南省冬小麦自动识别研究中是可行的,而且为河南省冬小麦自动识别的业务化应用提供了新的思路和方法。

猜你喜欢
物候冬小麦河南省
海南橡胶林生态系统净碳交换物候特征
河南省树人教育交流中心
河南省树人教育交流中心
河南省树人教育交流中心
河南省树人教育交流中心
‘灰枣’及其芽变品系的物候和生育特性研究
甘肃冬小麦田
5种忍冬科植物物候期观察和比较
约旦野生二棱大麦在川西高原的物候期和农艺性状分析
冬小麦和春小麦