基于GF-6WFV影像提取玉米水稻种植信息

2023-01-12 05:58郭玉超李荣平任鸿瑞
关键词:波段纹理光谱

郭玉超,李荣平,任鸿瑞*

基于GF-6WFV影像提取玉米水稻种植信息

郭玉超1,李荣平2,任鸿瑞1*

1. 太原理工大学测绘科学与技术系, 山西 太原 030024 中国气象局沈阳大气环境研究所, 辽宁 沈阳 110166

玉米、水稻是我国重要的粮食作物,利用遥感技术高效获取其种植分布信息具有重要作用。GF-6 WFV遥感数据光谱波段较为丰富,空间分辨率较高,能够为作物遥感分类提供多种类型特征。然而多特征参与分类容易产生数据冗余、降低处理效率。如何优选GF-6 WFV数据丰富的特征信息对于提高分类精度具有重要意义。本文利用GF-6 WFV影像提取光谱特征、无红边指数、红边指数及纹理特征共26个特征变量,基于所有特征进行优选并采用不同分类方法及不同特征组合识别黑山县及北镇市玉米、水稻分布信息。结果表明:采用平均不纯度减少与相关系数双重指标共优选出14个特征,其中红边信息占比最大。基于优选特征采用随机森林法识别玉米、水稻精度最高,其总体精度为94.01%、Kappa系数为0.90,相比优选前分别提高1.14%、0.02。多源特征相对于单一特征能够改善作物分类效果,提高分类精度。该研究能够剔除非农田像元影响以高效高精度地提取玉米、水稻,具有可行性、有效性,能够为国产高分数据在作物遥感识别应用方面提供参考。

高分六号; 农作物; 影像提取

玉米、水稻以其重要的食用价值、饲用价值以及工业用途,在世界上广泛分布。我国玉米、水稻种植范围广、规模大,是国内种植面积分列第一、第二的粮食作物,其生产布局对农业发展及经济运行具有重要影响。利用遥感资料有效、及时监测玉米、水稻种植分布信息有助于进行产量预测、农业决策,对优化国家作物综合管理与确保粮食安全具有重大意义。

在遥感影像数据源方面,目前作物提取研究中多采用MODIS[1]、Landsat[2]等中低分辨率数据,中低分辨率的遥感数据覆盖范围广,获取来源较多,但易存在混合像元以及“同谱异物”或“异物同谱”现象。GF-1 WFV影像数据空间分辨率为16 m,相对于Landsat等数据更适合作物精细分类[3],然而该数据仅包含传统可见光以及近红外波段,波段信息具有一定局限性。GF-6卫星于2018年6月发射,是我国首颗具备红边波段用于农业观测的高分卫星,且打破了对国外卫星红边遥感影像依赖的局面,在农作物分类方面应用前景广阔[4]。刘佳等通过对比红边与无红边条件下玉米、大豆及其他作物分类效果,发现引入红边波段能够改善农作物分类效果[5]。濮毅涵等基于Sentinel-2A红边斜率对植被群落进行分类,研究结果表明,光谱红边斜率对植被分类应用能力较佳[6]。梁继等通过提取松嫩平原玉米、大豆、水稻,发现在作物识别中红边特征表现优越[7]。已有研究表明,红边信息能够增加不同作物可分性,提高农作物分类精度[5,7]。目前遥感识别研究中,特征类型较为单一,多采用可见光等传统波段及以NDVI为代表的传统植被指数,红边信息相对较少。

丰富的遥感特征能够改善地物识别效果,对于提高地物分类精度具有重要应用[8]。然而不同特征间存在相关性,若所有特征参与分类容易产生数据冗余、降低处理效率,故数据降维具有重要意义。但若仅考虑到特征间相关性筛选特征,容易遗漏对农作物分类重要程度高的特征。随机森林法具有特征重要性评估能力,其自带的平均不纯度减少法能够计算得到特征重要性[9]。鉴于此本研究拟用一种平均不纯度减少与相关系数双重指标进行特征优选的方法,以优先选择重要程度较高且冗余信息较少的特征。

为验证该特征优选法的有效性,本研究基于GF-6 WFV影像构建光谱特征、无红边指数、红边指数及纹理特征,并对所有剔除非农田像元后的特征进行优选,采用随机森林法对比优选前与优选后玉米、水稻分类精度。同时为挖掘不同分类方法及不同特征组合对玉米、水稻提取精度影响,基于优选特征共采用3种分类方法及8种特征组合进行对比分析。

1 材料与方法

1.1 研究区概况

本文选择辽宁省黑山县及北镇市作为研究区,该区属暖温带半湿润气候,地物复杂多样,地势西北高,东南低,自西北向东南依次形成丘陵区、平原区及低洼区。黑山县耕地面积13.7万hm2,是全国重点产粮县;北镇市耕地面积7.3万hm2,是全国著名粮食生产基地,玉米、水稻为研究区内主要粮食作物。

图1 研究区位置示意图

1.2 数据获取及预处理

GF-6 WFV空间分辨率为16 m,共含有8个波段,除蓝波段(B1)、绿波段(B2)、红波段(B3)、近红外波段(B4)4个传统波段外,还添加红边Ⅰ(B5)、红边Ⅱ(B6)两个红边波段及紫波段(B7)、黄波段(B8)。参考研究区作物物候信息及影像质量,选取2020年8月14日2景影像,该时期植被生长旺盛,与非植被光谱差异明显,各类作物生长稳定、光谱信息丰富,利于不同作物类型提取。对获取的遥感影像依次进行预处理,包括辐射定标、大气校正、正射校正、拼接裁剪。

样本选取参考2017~2019年东北10 m农作物分布产品[10],结合研究区作物物候期与类别特征,分为玉米、水稻、其他作物3类,所需样本通过借助此产品与Google earth高分辨率影像对遥感影像进行目视解译,采集样点时须使选取像元与周围像元特征一致,以此确保样本点准确性。经过反复目视纠正最终得到样本点玉米1249个,水稻431个、其他作物1829个,各类以7:3分别作为训练与验证样本点。

1.3 特征变量计算

本研究提取8个光谱特征、5个无红边指数、5个红边指数及8个纹理特征共26个特征(表1)。为提高数据利用率,对所有波段进行主成分变换(PCA),对第一主成分通过灰度共生矩阵法(GLCM)提取纹理特征[11]。为清晰反映地物纹理信息,将窗口大小设置为3×3,步长为1,同时为消除不同角度影响,取0°、45°、90°和 135°共4个方向特征平均值作为纹理特征。

表1 特征变量

1.4 特征优选及分类

对所有特征采用随机森林算法自带的平均不纯度减少(MDI)指标进行评估[9],在训练决策树时能够得到每个特征基尼不纯度减少量,随机森林通过计算每棵决策树不纯度减少量的平均值作为特征重要性得分。

若样本集合为,共含有个类别,则基尼指数公式如下:

式中:P为中随机选择的样本属于第类的概率。

若根据某特征结点分裂后,被划分为1和2,在该特征条件下,结点划分后基尼指数公式:

平均不纯度减少公式为:

上式中,是决策树个数,Gini()代表第棵决策树结点划分前的基尼指数,Gini()则代表结点划分后的基尼指数。某特征划分后平均不纯度减少程度越大,则该特征重要性程度越高,在分类时此特征发挥作用越强。

对所有特征进行相关性分析,特征之间相关系数越高,则重复信息越多。通过统计特征间相关系数,以选择相关性低的特征变量。

结合特征重要性得分及相关系数筛选特征集参与后续农作物分类,分类方法有随机森林法[9]、支持向量机法[12]、最大似然法。其中随机森林法设置决策树个数为100,特征数量为总特征个数的算术平方根。支持向量机法设置核函数为径向基核函数,Gamma为输入影像波段数的倒数,惩罚参数为100。

1.5 精度评价

基于验证样本对分类结果进行精度评价得到混淆矩阵,根据混淆矩阵计算总体精度、Kappa系数、制图精度、用户精度4个指标用以精度分析,确定分类结果准确性。

2 结果与分析

2.1 农田区提取

本研究采用分层提取策略,首先借助2020年10 m全球土地覆盖数据(ESA WorldCover)构造决策树规则,该数据耕地编码为40。另外利用黄波段(B8)筛除部分道路像元以进一步确保农田区域准确性,具体规则如图2。

图2 农田像元提取

2.2 特征优选结果

对所有基于农田区掩膜后的特征变量进行重要性评估(图3),发现4种特征类型中,红边指数重要程度最高,依次为无红边指数、光谱特征、纹理特征。

图3 特征重要性得分

由于影像选取时间位于植被生长中后期,此时玉米与水稻处于穗期,生长旺盛,具有叶片宽厚浓绿、茎杆粗壮等特点。红边波段是指示植被生长状况的敏感波段,与叶绿素含量、叶面积指数等生长参数具有很好的相关性[13,14],故红边波段重要程度高。该期植被叶绿素浓度较高,红波段吸收易饱和,归一化植被指数差异主要取决于近红外波段反射率。相对于近红外波段,红边波段完全处于植被反射率急剧变化的区域,对叶绿素含量更为敏感,因而更能反映出不同植被间光谱细微差别,故基于红边波段构建的NDVI750、NDVI710重要性得分更高。该期NDVI等指数易发生饱和,而WDRVI波段构造能够改善饱和现象,故WDRVI得分较高。研究区内不同作物植被覆盖分布不均,RVI适用于不同程度植被覆盖情况[15],且与作物生长参数相关性紧密,故该指数重要性排名靠前。此时各作物生长较为稳定,在空间分布上表现出一定规则性与密集性,相同类内纹理特征较为均匀,不同类别间纹理则表现出一定差异性,故纹理特征中能够体现图像差异性的CON重要性得分较高。

通过相关性分析得到相关系数图(图4),结合重要性得分依次从高到低筛选特征。B5、NDVI750、NDVI710得分占比前27.15%,且相关系数均低于0.9,故保留。WDRVI、NDVI、NDVIre1、NDWI、NDVI705与NDVI750相关系数均大于0.9,故均剔除。RVI、NDGI、NDVIre2、B6在重要性排序中位列前10,且与其它特征相关性偏低,故均保留。其余纹理特征中,MEA与B6相关系数高达0.98,故舍弃MEA;DIS与HOM相关性偏高,而DIS重要性得分高于HOM,故仅保留DIS;ENT与ASM相关性偏高,而ASM重要性得分偏低,故剔除ASM;CON、VAR、COR与其它特征相关系数均低于0.9,故全部保留。剩余光谱特征中,B4与B6相关系数高达0.97,故剔除B4;B2重要性得分高于B3、B7、B8、B1,而B3、B8、B1与B2相关系数均在0.9以上,故保留B2、B7。最终优选特征为:B5、NDVI750、NDVI710、RVI、NDGI、NDVIre2、B6、CON、DIS、B2、B7、ENT、VAR、COR。

图4 特征相关系数图

2.3 不同分类方法结果对比

利用14个优选特征采用不同分类法进行作物提取,并采用验证样本进行精度检验(表2)。由表2可知,随机森林法提取作物总体精度与Kappa系数最高,分别达到94.01%、0.90。相较于支持向量机与最大似然法,其总体精度分别提高1.34%、2.69%,Kappa系数分别提高0.02、0.05。同时利用随机森林法基于优选前特征进行分类,发现优选后较未优选总体精度提高1.14%,Kappa系数提高0.02。

对比优选特征下不同方法分类结果(图5),可以看出,随机森林法提取玉米、水稻效果最好,该法玉米图斑椒盐现象较少,水稻图斑更为规则、完整,作物错分漏分现象少。支持向量机提取的水稻地块完整度低,且存在将其他作物错分为玉米现象。最大似然法作物图斑更为破碎,错分现象严重。不同算法识别作物原理不同,导致提取精度存在一定差异。随机森林法采用多决策树的投票结果作为最终结果,能够保证较高精度;支持向量机利用有限的样本信息进行分类,在部分作物光谱混淆区域存在错分现象;最大似然法需假定样本数据符合正态分布,然而实际应用中数据不一定服从正态分布,从而导致分类结果有所偏差,不能满足作图精细化需求。由图5可知,黑山县玉米种植范围较广,主要分布于无梁殿镇、薛屯乡等中部区,水稻种植集中分布于二道乡,另外新兴镇等地区也有少量种植;北镇市玉米种植较少,主要分布于柳家乡等东部地区,水稻则主要分布于新立乡、青堆子镇、窟窿台镇等东南部地区。

表2 不同分类方法精度评价表

图5 不同分类方法作物局部识别效果对比图

2.4 不同特征组合分类结果对比

为深入挖掘各特征对作物分类精度影响,基于14个优选特征共构建8种组合并使用随机森林法进行分类,根据精度评定表(表3)可知,仅使用光谱特征作物分类总体精度与Kappa系数在所有方案中最低。当在光谱特征上单独或同时添加无红边指数、红边指数、纹理特征时,发现总体精度均在91%以上,Kappa系数均达到0.86。这表明GF-6 WFV多源特征相对于单特征能够提供更为丰富的特征信息,极大程度地改善作物分类精度。

根据不同特征组合分类结果图(图6),发现仅利用光谱特征提取玉米、水稻椒盐现象较为明显,且不能很好地识别田块,识别作物结果多为大片连续区域。添加纹理特征后,对作物田块间田埂的识别能力提高,但接近田埂的田块作物像元易产生错分。指数特征引入能够有效减少作物错分漏分现象,使得田块更为规则、完整,且红边指数区分各作物能力相比于无红边指数更强,能够更为准确地识别出玉米、水稻。故所有特征组合提取玉米、水稻精度达到最高,既能区分出田埂,又可保证作物田块较为完整。

表3 不同特征组合分类精度表

图6 不同特征组合分类结果图

3 结论

本文以黑山县及北镇市作为研究区,基于GF-6 WFV遥感影像提取黑山县与北镇市玉米、水稻种植区,结论如下:

(1)构建决策树规则提取农田像元时,新增黄波段在区分植被与建设用地方面表现良好,2020年ESA WorldCover数据有助于非农田像元剔除且能够保证农田区域完整性;

(2)对于玉米、水稻提取,特征贡献程度从高到低依次为红边指数、无红边指数、光谱特征、纹理特征,其中B5、NDVI750、NDVI710位列前3;

(3)相对于无红边指数与红边指数,光谱、纹理特征间冗余信息较少,而纹理特征MEA与光谱特征B4、RE2相关性较高;

(4)采用平均不纯度减少与相关系数双重指标共筛选出14个特征:B5、NDVI750、NDVI710、RVI、NDGI、NDVIre2、B6、CON、DIS、B2、B7、ENT、VAR、COR,发现红边信息占比最大;

(5)基于优选特征采用随机森林法的作物分类精度最高,总体精度为94.01%,相对于优选前总体精度提高1.14%。相较于支持向量机、最大似然法,其总体精度分别提高1.34%、2.69%;

(6)GF-6 WFV纹理特征在一定程度上有助于区分田埂与田块。红边指数则在保证作物田块完整性,有效识别玉米、水稻方面突出。光谱特征、红边指数、无红边指数、纹理特征结合相对于单特征能够有效减少作物错分漏分现象,提高分类精度。

[1] 朱彤,张学霞,王士远,等.基于物候特征和混合光谱信息的春玉米种植面积提取[J].沈阳农业大学学报,2017,48(3):328-337

[2] 李晓慧,王宏,李晓兵,等.基于多时相Landsat 8 OLI影像的农作物遥感分类研究[J].遥感技术与应用,2019,34(2):389-397

[3] 黄健熙,侯矞焯,苏伟,等.基于GF-1 WFV数据的玉米与大豆种植面积提取方法[J].农业工程学报,2017,33(7):164-170

[4] 张悦琦,李荣平,穆西晗,等.基于多时相GF-6遥感影像的水稻种植面积提取[J].农业工程学报,2021,37(17):189-196

[5] 刘佳,王利民,滕飞,等.RapidEye卫星红边波段对农作物面积提取精度的影响[J].农业工程学报,2016,32(13):140-148

[6] 濮毅涵,张栋,徐丹丹,等.Sentinel-2A红边波段对湖滨带植被分类能力的评估[J].林业资源管理,2021(2):131-139

[7] 梁继,郑镇炜,夏诗婷,等.高分六号红边特征的农作物识别与评估[J].遥感学报,2020,24(10):1168-1179

[8] 刘通,任鸿瑞.GEE平台下利用物候特征进行面向对象的水稻种植分布提取[J].农业工程学报,2022,38(12):189-196

[9] Breiman L. Random Forests [J]. Machine Learning, 2001,45(1):5-32

[10] You NS, Dong JW, Huang JX,The 10-m crop type maps in Northeast China during 2017–2019 [J]. Scientific Data, 2021,8:41

[11] Haralick RM, Shanmugam K, Dinstein IH. Textural features for image classification [J]. IEEE Transactions on Systems, Man, and Cybernetics, 1973,3(6):610-621

[12] Vapnik V. The Nature of Statistical Learning Theory [M]. Springer, 1999

[13] Ren HR, Zhou GS. Estimating above ground green biomass in desert steppe using band depth indices [J]. Biosystems Engineering, 2014,127:67-78

[14] 苏伟,侯宁,李琪,等.基于Sentinel-2遥感影像的玉米冠层叶面积指数反演[J].农业机械学报,2018,49(1):151-156

[15] 王李娟,孔钰如,杨小冬,等.基于特征优选随机森林算法的农耕区土地利用分类[J].农业工程学报,2020,36(4):244-250

Extraction Planting Information of Corn and Rice Based on GF-6 WFV Image

GUO Yu-chao1, LI Rong-ping2, REN Hong-rui1*

1.0300242.110166

Corn and rice are important grain crops in China, and it is important to use remote sensing technology to obtain planting distribution information efficiently. The spectral bands of GF-6 WFV data are relatively abundant and have high spatial resolution, which can provide multiple types of features for crop remote sensing classification. However, multi-feature classification tends to produce data redundancy and reduce processing efficiency. How to optimize the feature information of GF-6 WFV data is of great significance to improve the classification accuracy. In this study, GF-6 WFV data were used to extract 26 features, including spectral features, non-red edge index, red edge index and texture features. Based on all features, different classification methods and feature combinations were used to identify the distribution information of corn and rice in heishan County and Beizhen city. The results showed that: 14 features were optimized by using the double metrics of mean decrease impurity and correlation coefficient, among which the red edge information accounted for the largest proportion. Based on the optimized features, the random forest method had the highest accuracy in identifying corn and rice, the overall accuracy was 94.01% and kappa coefficient was 0.90, which were 1.14% and 0.02 higher than before optimization, respectively. Compared with single feature, multi-source features can improve the accuracy of crop classification. This study can eliminate the influence of non-farmland pixels to efficiently and accurately extract corn and rice, which is feasible and effective, and can provide a reference for Chinese satellite in the application of crop remote sensing recognition.

GF-6; crop; image extraction

TP79/S127

A

1000-2324(2022)05-0685-08

2022-03-10

2022-04-02

山西省省筹资金资助回国留学人员科研项目(2022-055);中国气象局沈阳大气环境研究所联合开放基金课题资助(2021SYIAEKFMS39)

郭玉超(1999-),女,硕士研究生,主要研究方向为植被遥感. E-mail:guoyc98@163.com

通讯作者:Author for correspondence. E-mail:renhongrui@tyut.edu.cn

猜你喜欢
波段纹理光谱
基于三维Saab变换的高光谱图像压缩方法
最佳波段组合的典型地物信息提取
高光谱遥感成像技术的发展与展望
基于BM3D的复杂纹理区域图像去噪
使用纹理叠加添加艺术画特效
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
TEXTURE ON TEXTURE质地上的纹理
L波段kw级固态功放测试技术
消除凹凸纹理有妙招!