文 兵
(成都理工大学,四川 成都 610000)
土壤重金属反演的基本数据包括土壤的光谱数据和地球化学分析数据。地球化学分析数据一般是采集地面样本点的表层土壤,然后对土壤样本的化学成分进行检测,进而得到土壤各元素含量数据。光谱数据来源主要可分为两方面,地面波谱测试仪和机载、星载遥感测量波谱仪。目前地面波谱仪最常用的仪器是美国 ASD公司(Analytic Spectra Devices)的系列产品。而机载、星载传感器是各国发射的一些列高空间和高分辨率卫星传感器。
在建模之前我们一般会对光谱数据预处理,进行一些变换,如对数、倒数对数、一阶微分、二阶微分、连续统去除、连续小波变换等方法。用这些方法对光谱数据进行预处理是为了光谱平滑、消除了噪声和基线漂移,并且还突出了光谱特征波段的位置。
在建模之前,首先必须选择最佳波段进行反演。最佳波段的选择问题一般采用诊断指数法,就是判断光谱反射率与重金属元素或者间接物质的相关性,在这其中最常见的就是皮尔逊相关系数法。
当前,运用土壤反射和辐射光谱来预测重金属含量,通常采用经验模型的方法。经验模型的常用建模方法包括单变量回归,主成分回归,多元逐步线性回归,偏最小二乘回归,人工神经网络回归等。
单变量统计分析主要选择土壤重金属含量与光谱反射率之间相关性最大的谱带,以建立预测模型。有2种方法:一种是直接单波段分析方法;另一种是直接单频带分析方法。
主成分回归是一种分析多元共线性问题的方法。将光谱数据转换为主要成分负荷矩阵和得分矩阵,提取独立变量以建立回归方程,模型的准确性取决于均方根误差大小。
多元逐步回归方法是通过双向过滤引入了有意义的变量,并删除了无意义的变量。它通常用于识别某些物质敏感的波段,然后通过物质的含量与其反射率之间的相关性估算出研究区该物质的含量分布。
偏最小二乘回归集成了多元线性回归分析、典型相关分析和主因子分析的特点,因此广泛用于光谱数据处理。偏最小二乘回归方法克服了多元线性回归分析面临的多重共线性问题,可以更有效地提取光谱信息,因而用它得到的反演模型更加准确。
人工神经网络可以学习要表达的任何内容。它具有一定的自学习、自组织和自适应能力,强大的容错能力,信息的分布式存储和并行处理以及强大的非线性逼近能力。
由于高光谱数据具有内部相关性较高的海量光谱数据,因此多元线性回归和主成分回归方法在重金属含量反演建模中并不适用。偏最小二乘回归方法可以在海量波段和自相关严重的情况下进行回归建模,较好地解决了多重共线性问题,更适合重金属含量反演。另外,神经网络技术、遗传算法和支持向量机等方法的发展,将促进重金属含量反演技术的发展。
目前,在土壤重金属反演研究中,线性偏最小二乘回归是应用最广泛的方法。各种非线性机器语言反转方法如神经网络等方法仍在探索中。目前土壤重金属建模方向存在的问题如下。
(1)建模方法相对单一,通常是单个线性或非线性模型,亦或是它们的组合,这些数学模型不具有通用性。今后的发展可以考虑将环境因素融入模型使它具有通用性。
(2)土壤重金属污染元素类型很多,单独研究这些元素与光谱关系通常得不到较好结果。如果将土壤的成分与光谱进行分析将有更好的反演模型。
(3)目前对光谱中有效信息提取的方法不够成熟,在建模过程中模型很容易被光谱噪声干扰。
(4)土壤重金属反演的基本机理条件尚未明确。今后土壤重金属反演的发展方向,多开发利用一些非线性数学分析方法,如支持向量机;将线性和非线性方法相结合,将提升对土壤中金属含量的预测精度。利用AI人工智能和大数据算法对高光谱影像提出新的更有效的反演方法,研究重金属定量反演的物理机理也是一个热点方向。