基于灰数灰度的土壤有机质高光谱估测

2022-03-29 05:25丁天姿任文静李丽田野
关键词:决定系数波段灰度

丁天姿,任文静,李丽,田野

基于灰数灰度的土壤有机质高光谱估测

丁天姿1,任文静1,李丽2*,田野3

1. 山东农业大学信息科学与工程学院, 山东 泰安 271018 2. 山东农业大学经济管理学院, 山东 泰安 271018 3. 泰安市岱岳区开元中学, 山东 泰安 271000

为克服光谱估测中的不确定性,利用统计回归与灰色系统理论建立土壤有机质高光谱估测模型。以山东省济南市章丘区采集的76个土壤样本为研究对象,首先对土壤光谱数据进行变换处理,根据极大相关性原则选取特征波段的估测因子,建立各特征波段的一元线性回归预测模型;其次,对各估测因子进行由小到大排序,计算估测因子排序后的土壤有机质含量的滑动方差,将滑动方差转化为灰数的灰度值,并将其用于修正估测因子,然后再建立各特征波段的一元线性回归修正模型;最后采用平均法与加权法融合各个单波段的预测值。结果表明,所建估测模型精度和检验精度均显著提高,13个检验样本的2=0.911,=7.764%。研究表明,本文建立的基于灰数灰度的土壤有机质含量高光谱估测模型是可行有效的。

土壤有机质; 高光谱遥感; 灰数; 灰度; 光谱估测

土壤有机质是土壤的重要组成部分,是评定土壤肥力的一个重要指标[1]。快速有效地获取有机质的信息,对定量施肥、发展精准农业具有现实意义。目前,利用高光谱遥感技术估测土壤养分已成为一个研究热点。众多学者开展了土壤有机质光谱估测研究,并在光谱成因分析、光谱特性分析、光谱特征提取、反演建模等方面取得了丰富成果[2]。土壤有机质高光谱估测方法主要有逐步多元回归(SMLR)[3]、偏最小二乘(PLS)[4]、人工神经网络(ANN)[5]、支持向量机(SVM)[6]等单一模型,且各种建模方法有各自的优缺点。随着研究的深入,利用多种方法进行反演建模已引起高度重视,同时一些新方法也在不断涌现。由于影响因素的多样性,土壤光谱估测中不可避免存在不确定性,即随即性、模糊性和灰色性,因此模糊识别方法[7]、灰色关联识别方法[8]、灰色聚类与识别方法[9]、灰色关联局部回归方法[10]、可变模糊集方法[11]等不确定性理论被应用于土壤有机质的定量反演中,这为光谱估测提供了一种新途径。

土壤有机质是不断分解、补充而随时间变化的量,且取样点的空间分布也影响有机质含量实测值的代表性。由于影响因素的多样性和复杂性,测量的土壤光谱只是实际土壤光谱反射率的一个近似值。因此,广义而言,土壤有机质含量和光谱反射率都是灰数,它们的实测值仅是灰数的一个白化值。灰色系统理论是研究部分信息已知、部分信息未知对象的新理论,可有效处理光谱估测中的灰色不确定性。统计回归模型可有效处理光谱估测中的随机不确定性,且计算简单、便于实用,但建模精度易受异常点影响。因此,为克服异常点对线性回归建模的影响,本文将灰色系统理论与统计回归分析相结合,提出一种基于灰数灰度的线性回归估测模型,并应用于山东省济南市章丘区的土壤有机质含量光谱估测,取得了较为满意的结果。

1 土壤有机质光谱估测模型

1.1 光谱特征数据标准化

为克服特征指标量纲量级的差异,可采用式(2)或(3)对其进行归一化处理,即:

1.2 建立估测模型

根据最小二乘法,由式(5), (6)建立一元线性回归方程,即:

虽然一元线性回归模型计算简单方便,但由于光谱特征指标与土壤有机质含量之间的相关性不高,导致模型精度也不高,如图1所示。为提高模型精度,需要对一元线性回归模型进行修正。

图 1 估测因子修正示意图

(9)再建立预测模型。根据最小二乘法,由式(17)和(6)建立因子修正后的一元线性回归方程:

1.3 计算预测值

(1)平均法

(2)加权平均法

2.4 检验样本的精度评价

3 应用实例

3.1 数据来源与处理

本研究以济南市章丘区(117°10′~117°35′E,36°25′~37°09′N)为实验区。济南市章丘区位于山东省中部,属暖温带大陆性季风气候区,土壤类型丰富多样,其中褐土占全区可利用面积的70.2%以上。在实验区选择地势平坦且裸露的区域,按照事先设定的路线随机均匀的取样,采用“梅花样”法采集深0~20 cm的土样,利用手持GPS测定采样点的位置。将采集的76个样本分别分为两份,装袋密封并编号。其中,一份用于测量土壤光谱反射率,一份用于化验有机质含量。为节省篇幅,土样光谱测量、有机质含量测定方法、光谱变换和特征因子提取方法等不再详述,请详见文献[12]。

通过观察光谱曲线图将异常样本1、29、32和41剔除,将剩余72个样本用于建模分析。选取的特征波段分别为530 nm,562 nm,1507 nm,2035 nm和2108 nm,这5个波段的特征因子与土壤有机质的相关系数分别为:0.680,0.699,0.683,0.769,0.685。

3.2 土壤有机质高光谱估测结果

在建模分析的72个样本中,按有机质含量大小随机选出13个样本作为检验样本,其余59个作为建模样本。建模样本的特征指标值与有机质的相关系数分别为0.673、0.693、0.670、0.757和0.681,检验样本选取前后相关系数的浮动较小。

3.2.1 一元线性回归估测结果按照前述方法对5个特征波段分别建立一元线性回归方程。结果表明,5个特征波段的模型决定系数均在0.5附近,平均相对误差在15%左右;检验样本的决定系数均在0.6附近,平均相对误差在13%左右。这说明传统一元线性回归方法的模型精度与预测精度都不高。

3.2.2 基于灰度改正的一元线性回归估测结果为进一步提高建模精度,利用灰度对一元线性回归模型进行修正。由式(8)~(18)对特征波段的一元线性回归模型进行修正,以2108 nm波段为例,若令阈值5=0.1,则2108 nm波段建模样本的平均相对误差由15.924%下降到7.119%,决定系数2由0.464提高到0.900。同理,530 nm,562 nm,1507 nm,2035 nm波段的一元线性回归模型的决定系数2分别为:0.453,0.480,0.449,0.573;修正后模型的决定系数2分别为:0.823,0.886,0.832,0.894。可见,5个特征波段的估测模型经修正后其精度都得到较大提高,模型的决定系数2由0.5附近升高到0.85左右。这说明利用土壤有机质含量的灰度修正模型是可行有效的。

然后,由式(19)和(20)计算13个检验样本单波段的估测值,再由式(24)和(25)计算多波段的综合估测值。结果表明,通过平均法、加权法融合单波段的估测结果后,13个检验样本估测精度均较高。其中,平均法的平均相对误差约为7.464%,决定系数高达0.911。这说明融合单波段的估测结果可有效提高估测精度。

3.3 对比分析

为对比模型的有效性,再利用多元线性回归、BP神经网络和支持向量机方法分别进行建模和预测,其中13个检验样本的决定系数2分别为:0.701,0.762,0.729;平均相对误差分别为:12.120%,12.953%,11.129%。可见,利用这三种常用方法估测结果的决定系数均在0.8以下,平均相对误差均在10%以上。而本文模型估测结果的决定系数为0.911,平均相对误差为7.464%。相较而言,本文模型的估测精度较高。这是因为本文的估测模型充分利用了灰色不确定性信息,有效克服了异常点的影响。

4 结语

为减小高光谱遥感数据的随机性与灰色不确定性,本文针对线性回归模型精度不高的问题,将灰色系统理论与回归模型相结合,建立了基于灰数灰度的土壤有机质高光谱估测模型。该模型不仅可充分利用部分已知信息的灰度对估测模型修正,而且还可以对预测值进行修正,从而有效克服异常点对模型精度的影响。实验结果表明,基于灰数灰度的土壤有机质高光谱估测模型是可行有效的,这为土壤有机质光谱定量估测提供了一种新途径。但如何将灰色系统理论、模糊理论和统计分析相结合,有效处理遥感分析中的灰色性、模糊性和随机性,有待进一步研究。

[1] WeiLF, YuanZR, WangZX,. Hyperspectral inversion of soil organic matter content based on a combined spectral index model[J]. Sensors, 2020,20(10):2777-2794

[2] MiaoCH, LiXC, LuJH,. The modified model of soil organic matter grey relation estimating pattern based on hyper-spectral data [J]. The Journal of Grey system, 2019,31(2):51-64

[3] ZareS,ShamsiSRF,AbtahiSA. Weakly-coupled geo-statistical mapping of soil salinity to stepwise multiple linear regression of MODIS spectral image products[J]. Journal of African Earth Sciences, 2019,152:101-114

[4] Ward KJ.,Chabrillat S,Brell M,. Mapping soil organic carbon for airborne and simulated EnMAP imagery using the LUCAS soil database and a local PLSR [J]. Remote Sensing, 2020,12(20):3451-3471

[5] 钟浩,李西灿,翟浩然,等.耕层土壤有机质高光谱间接估测模型[J].测绘科学技术学报,2019,36(1):74-78,85

[6] EzzaharJ,OuaadiN,ZribiM,. Evaluation of backscattering models and support vector machine for the retrieval of bare soil moisture from sentinel-1 data [J]. Remote Sensing, 2019,12(1):72-92

[7] 李希灿,王静,李玉环,等.基于模糊集分析的土壤质量指标高光谱反演[J].地理与地理信息科学,2008,24(4):25-28

[8] Miao CH, Li XC, Lu JH. The grey relation estimating model of soil pH value based on hyper-spectral data [J]. Grey System: Theory and Application, 2018,8(4):436-447

[9] Li XC, Zhang GB, Qi FG,. Grey cluster estimating model of soil organic matter content based on hyper-spectral data [J]. The Journal of Grey System, 2014,26(2):28-37

[10] Cao XS, Li XC, Ren WJ,. Hyperspectral estimation of soil organic matter content based on grey relational local regression model [J]. Grey System Theory and Application, 2021,11(4):707-722

[11] 徐邮邮,李西灿,尚璇,等.可变模糊集的土壤含水量高光谱估测模型[J].测绘科学,2018,43(9):81-87

[12] 任文静,李西灿,刘杰亚,等.正反向关联度的土壤有机质高光谱估测[J].山东农业大学学报(自然科学版),2021,53(5):840-844

Hyper-Spectral Estimation of Soil Organic Matter Content Using Greyness of Grey Number

DING Tian-zi1, REN Wen-jing1, LI Li2*, TIAN Ye3

1.271018,2.271018,3.271000

To overcome the uncertainties in the spectral estimation, a hyper-spectral estimation model of soil organic matter was developed using statistical regression and grey system theory. Firstly, 76 soil samples collected from Zhangqiu District, Jinan City, Shandong Province, were transformed and processed, and the estimation factors of the characteristic bands were selected according to the principle of great correlation, and a one-variable linear regression prediction model for each characteristic band was established. Secondly, the estimated factors were ranked from small to large and the sliding variance of soil organic matter content was calculated after ranking the estimated factors, the sliding variance was transformed into the greyness value of the grey number and used to correct the estimated factors, then a one-variable linear regression correction model for each characteristic band was built. Finally, the prediction values of each single band are fused using the averaging or weighting method. The results show that the accuracy of the constructed estimation model and the precision of the test samples are significantly improved, with R2= 0.911 and MRE = 7.764% for the 13 test samples. The study shows that the hyper-spectral estimation model of soil organic matter content based on greyness of grey number developed in this paper is feasible and effective.

Soil organic matter; Hyper-spectral remote sensing; Grey number; Greyness of grey number; spectral estimation

P237

A

1000-2324(2022)01-0085-06

10.3969/j.issn.1000-2324.2022.01.014

2021-11-25

2021-12-28

山东省自然科学基金项目(ZR2016DM03);山东省SRT项目(20211636)

丁天姿(2000-),女,本科生主要从事高光谱遥感研究. E-mail:987946970@qq.com

Author for correspondenc. E-mail:Taian0803@126.com

猜你喜欢
决定系数波段灰度
采用改进导重法的拓扑结构灰度单元过滤技术
最佳波段组合的典型地物信息提取
日本乌贼(Sepiella japonica)形态性状与体质量的相关性及通径分析
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
不同规格香港牡蛎壳形态性状对重量性状的影响
Arduino小车巡线程序的灰度阈值优化方案
2种贝龄合浦珠母贝数量性状的相关与通径分析
基于颜色读数识别物质浓度的数学模型研究
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块