玉米叶片重金属铅含量的SVD-ANFIS高光谱预测模型

2021-06-10 07:15韩倩倩杨可明李艳茹张建红
光谱学与光谱分析 2021年6期
关键词:光谱重金属叶片

韩倩倩, 杨可明, 李艳茹, 高 伟, 张建红

中国矿业大学(北京)地球科学与测绘工程学院, 北京 100083

引 言

现今人类对金属矿的开采利用、 冶炼加工等活动导致铅(Pb)、 汞(Hg)、 镉(Cd)等重金属进入土壤, 使得土壤中有害元素的含量超过可允许值。 作物吸收了过量重金属元素, 则会表现出较普遍的叶片失绿、 出现棕色斑块、 叶缘变色以及根颜色变深等症状, 更会严重影响作物的产量和品质, 而且能通过食物链危害人体健康甚至生命。 如Pb及其化合物通过呼吸道、 消化道进入人体后将对神经、 造血、 消化、 肾脏、 心血管和内分泌等多个系统造成伤害, 若在人体内累积过高则会引起铅中毒[1]。 因此如何有效监测作物中重金属的含量备受人们关注。 传统的生化方法主要是通过采集作物样本来检测其中重金属元素含量或浓度及一些生化特征参数等, 但这种方法费时费力、 工作量大等且无法满足无损、 快速、 便捷等污染监测需求。 高光谱遥感具有高达纳类级的波谱分辨率且光谱连续、 波段范围从可见光到红外、 理化特性与参量反演能力强等特点, 已成为现今环境、 农作物等重金属污染监测的重要手段[2]。

近年来, 奇异值分解(singular value decomposition, SVD)和自适应模糊神经网络推理系统(adaptive network-based fuzzy inference system, ANFIS)已被应用于一些具体研究, 如利用SVD分析臭氧与气象要素的关系[3]、 压制微地震记录中的噪声[4]、 解决旋度算子相关核的问题[5]等, 利用ANFIS预测发电机功率输出[6]、 构建红黏土蠕变模型[7]、 预测交通污染物浓度[8]等; 在遥感监测与应用等方面, 如将SVD理论应用于遥感卫星影像去噪[9]等, 利用ANFIS结构对多光谱遥感影像进行陆地覆盖分类[10]等, 而在高光谱遥感监测重金属污染方面鲜有报道。 目前针对农作物重金属污染的高光谱遥感监测提出了许多方法, 如利用小波分析对水稻的光谱反射率数据进行处理, 选取具有异常光谱特征的奇异点, 利用奇异点对应波段的光谱反射率构建反向传播神经网络模型, 实现对水稻冠层重金属含量的反演[11]; 利用谐波分析技术将玉米叶片光谱特征信息转化为以振幅和相位的能量谱特征信息, 提取低次谐波振幅和初始相位, 分析振幅和相位与玉米的健康状况以及重金属污染之间的关系[12]; 采用支持向量机分类建立土壤重金属反演模型, 定性分析土壤重金属污染程度[13]等, 其中, 小波变换依赖于小波基的选择, 选择的小波基不同, 则实验的结果也不尽相同; 谐波分析依赖于谐波分解的最佳次数, 选取的分解次数不同, 则分析的结果也有所差异; 支持向量机是借助二次规划来求解支持向量, 而求解二次规划将涉及m阶矩阵的计算(m为样本的个数), 当m数目很大时该矩阵的存储和计算将耗费大量的机器内存和运算时间。 针对上述方法存在的一些局限性, 本文将以不同浓度Pb(NO3)2溶液胁迫下Pb污染的盆栽玉米及其植株叶片光谱作为研究对象, 结合SVD原理和ANFIS结构, 构建一种玉米叶片中Pb含量预测的SVD-ANFIS模型, 利用SVD对受Pb污染的玉米叶片光谱进行分解并获得奇异值, 再将获取的奇异值作为ANFIS结构的输入参数来实现玉米叶片中Pb含量的预测, 同时基于不同年份的Pb污染玉米叶片光谱数据检验该模型的预测能力与鲁棒性, 并通过与多参数的反向传播(back propagation, BP) 神经网络方法预测结果的比对验证该模型的预测精度及其优越性。

1 理论与算法

1.1 奇异值分解

奇异值分解(SVD)是矩阵分解技术的一种, 经常用来简化数据, 提高模型的精度[14]。 SVD分解能适应于任意矩阵, 它将原始矩阵分解为三个矩阵的乘积, 即假设原矩阵为Am×n(m

(1)

式(1)中,Um×m为单位正交矩阵, 其列向量为单位向量且互相正交, 是矩阵A对应的特征向量;Vn×n为单位正交矩阵, 其行向量为单位正交向量且互相正交, 也是与特征值对应的特征向量;Σm×n为对角矩阵,Σm×n=diag(σ1,σ2,σ3,…,σm),其元素σi为按降序排列矩阵A的奇异值, 它的对角元素即为Am×n的奇异值。 在相关研究中, 存在一个普遍事实: 矩阵Σm×n中的奇异值即为原始数据集Am×n中的全部重要特征, 其他特征大多为多余的或是噪声。

就光谱信号的SVD处理而言, 设光谱数据矩阵为矩阵A, 则矩阵A中存在m×m的正交矩阵U=[u1,u2,…,um],和n×n的正交矩阵V=[v1,v2,…,vn], 则

UTAV=diag(σ1,σ2,σ3,…,σm)=Σ

(2)

式(2)中,σi为各胁迫梯度下的玉米光谱数据A的奇异值;ui为相应于奇异值σi的左奇向量;vi为相应于奇异值σi的右奇异向量, 且满足

(AAT)ui=λiui

(3)

(4)

AV=UΣVTV

(5)

AV=UΣ

(6)

Avi=σiui

(7)

根据式(5), 式(6)和式(7)得奇异值σi为

σi=Avi/ui

(8)

1.2 自适应模糊神经网络推理系统

自适应模糊神经网络推理系统(ANFIS)是一种基于已有数据的建模方法, 其原理是使用输入输出数据集构建一个模糊推理系统, 使隶属函数适应于输入输出函数。 ANFIS与神经网络系统相比具有可表达语言变量和具有学习功能的优点[15]。

ANFIS结构包括5层: 模糊化层、 规则推理层、 归一化层、 去模糊化层和求和神经元层。 其中, 模糊化层和去模糊化层为自适应节点, 其余层为固定节点。 ANFIS结构图如图1所示, 图中每一层节点具有相同的函数,x和y为输入变量,M,N和Σ为固定节点。

图1 ANFIS结构图

第1层为输入变量的隶属函数层, 即模糊化层, 负责输入信号的模糊化。 每个节点i为自适应节点, 节点i具有输出函数

(9)

(10)

(11)

式(11)中,ai,bi,ci为隶属度函数参数。

第2层为规则推理层, 该层的固定节点M是将输入信号相乘, 将乘积作为输出

(12)

式(12)中,wi为权重。

第3层为归一化层, 其节点如图1中的N表示, 第i个节点计算第i条规则的wi与全部规则w值之和的比值

(13)

第4层为去模糊化层, 它的每个节点i为自适应节点, 其输出为

(14)

式(14)中,pi,qi,ri为设置的参数。

第5层为求和神经元层, 它的节点是一个固定节点, 计算所有输入信号的总输出为

(15)

如上所述, ANFIS训练是通过实时调整推理系统的线性和非线性参数来优化代表输入空间的实际数学关系式。 该算法在初始模糊模型系统的基础上, 结合梯度下降反向传播算法与最小二乘算法, 通过迭代的自适应学习过程来调整神经网络结构中的参数。 在每个节点上, 系统实际输出值与学习值的计算误差在减小, 当获得预定义的节点号或误差率时, 训练停止。 模糊推理系统的混合学习过程有两种传递方式, 在向前传递的过程中, 函数信号直接传递至第4层, 结果参数通过最小二乘估计确定; 在向后传递的过程中, 误差率向后传递, 并且最初的参数通过梯度下降法进行更新。

1.3 评价指标

选择合理的评价指标可以有效反映模型预测能力的强弱, 通常选择均方根误差(RMSE)和决定系数(R2)来评估模型的预测效果。 其中RMSE是反映一组数据测量值与真实值之间的差异, RMSE值越小说明模型的预测效果越好, 其计算方法见式(16);R2是反映模型拟合优度的重要统计量, 取值在0到1之间且无单位, 其数值大小反映了回归贡献的相对程度,R2越接近1, 模型的拟合效果越好, 精度越高, 计算方法见式(17)。

(16)

(17)

2 实验部分

(1)玉米植株培养。 选用有底漏的花盆对“密糯8号”玉米种子进行培育。 将铅离子(Pb2+)含量为0, 50, 200和400 μg·g-1的Pb(NO3)2溶液(分别标记为ck(0), Pb(50), Pb(200)和Pb(400)), 加入到玉米盆栽中对其进行生长胁迫, 每个梯度平行培育3组, 共12组, 2017年5月对玉米种子进行催芽处理, 玉米出苗后在同等条件下向花盆的土壤中浇灌等量的NH4NO3, KNO3和KH2PO4营养液。 玉米培育期间定期进行通风和浇水以保持适宜的培育温度和湿度。

(2)光谱数据采集。 2017年7月17日对玉米叶片反射光谱进行测量。 在50 W卤素灯光源照射条件下, 使用光谱范围为350~2 500 nm的SVC HR-1024I型地物光谱仪测量玉米叶片的反射光谱, 测量时探头视场角设置为4°并垂直于玉米叶片表面5 cm, 并用平面板对光谱进行标准化。 对每盆玉米的老(Old, O)、 中(Middle, M)、 新(New, N)三种叶片分别进行光谱测试, 每盆获得3组数据。 各胁迫梯度下的玉米叶片光谱如图2所示。

图2 不同浓度Pb2+胁迫下玉米叶片光谱

(3) Pb2+含量测定。 收集光谱数据采集后的玉米叶片并进行干燥、 冲洗、 微波消解等预处理, 使用WFX-120原子吸收分光光度计对玉米叶片中的Pb2+含量进行测定, 测定依据为《硅酸岩石化学分析方法》(GB/T 14506.30—2010)第30部分, 对各梯度玉米叶片中的老(O)、 中(M)、 新(N)3种叶片分别测量3次后取平均值作为该梯度叶片中Pb2+的含量。

3 结果与讨论

3.1 SVD分解结果与分析

对玉米叶片光谱进行SVD处理后获得原始数据的奇异值, 因奇异值从大到小衰减的较快, 在很多情况下, 前10%甚至1%的奇异值之和就占全部奇异值之和的99%以上了, 所以仅需要保留一部分奇异值。 保留奇异值方法为保留矩阵中90%的能量信息, 能量信息的计算, 就是根据所得到的奇异值, 求其平方和, 直到该平方和累加到总值的90%为止, 便可得到想要保留的奇异值。

通过重构处理得到一维光谱信号, 图3即为经过SVD处理后不同Pb2+胁迫梯度下三种叶片对应的奇异值光谱曲线图。 表1为SVD处理前后玉米叶片光谱数据差异性分析结果, 表中皮尔逊相关系数的绝对值大部分都在0.6~0.8之间属于强相关关系, 且Sig值均小于显著水平(0.01)也体现出相关性。 对比图2玉米叶片的原始光谱图并结合表1可知, 经过处理后的光谱在减少冗余度的同时, 基本保留了原始曲线的所有特征, 也达到了对后续ANFIS分析过程中减少网络参数从而简化神经网络的目的。

图3 SVD处理后不同Pb2+胁迫下的奇异值光谱图

表1 SVD处理前后玉米叶片光谱数据差异性分析

3.2 ANFIS建立与分析

ANFIS存在输入选择和输入空间划分的问题, 其预测过程可以看作是从输入空间到输出空间的一个映射过程, 输入变量数目会直接影响模型的预测精度, 选择经SVD处理后各胁迫梯度下的O, M和N叶片对应的奇异值来寻求最佳输入组合。 设计的三种组合分别为: O(单输入)、 O-M(双输入)(因N叶对重金属的富集能力较弱, 所以双输入选择O、 M叶片)、 O-M-N(三输入), 三种输入组合的误差如图4所示, 从图中看出单输入和双输入误差相近且较小, 三输入误差最大, 推测可能是输入变量增多使得系统中相应的控制规则变多, 从而导致模型预测的精度下降。

图4 三种组合输入类型的误差图

在ANFIS模型中, 隶属函数的类型也会影响模型精度, 因此在模糊训练时, 对隶属度函数的类型进行了不同的选择和尝试, 包括三角函数(Trimf)、 高斯函数(Gaussmf)、 高斯2型函数(Gauss2mf)、 钟型函数(Gbellmf)。 隶属度函数类型的误差比较如表2显示, 钟型函数的训练误差和校验误差均最小, 效果最佳, 对模型的预测更准确。

表2 隶属度函数类型的误差比较

根据图4和表2, 选择各胁迫梯度下O和M叶片对应的SVD处理光谱数据作为输入量, 输出量选择O、 M叶片中Pb2+含量的平均值, 隶属函数选择钟型函数, 设定好函数的参数后对初始ANFIS进行训练。 将前75%的光谱数据作为训练集, 余下的25%光谱数据作为测试集, 经过150次训练后得到了很好的预测效果, SVD-ANFIS模型的预测值与实际测定值的比较如表3所示, 由表可知, 各胁迫梯度下玉米叶片中Pb2+含量的预测值与实测值相差均较小, 模型具有很好的预测效果。

表3 玉米叶片中Pb2+含量的SVD-ANFIS模型预测值与实测值比较

3.3 模型优越性验证

为验证模型的优越性, 利用BP神经网络对数据进行处理并与SVD-ANFIS模型对比分析, 两种模型预测值与真实值的对比如图5所示, 从图中可看出, 相比于BP模型, SVD-ANFIS模型对玉米叶片中Pb2+含量的预测值更接近真实值, 预测效果更好。 为更精确的分析两种建模方法的性能, 选取R2和RMSE对BP模型和SVD-ANFIS模型进行对比分析和精度评价, 分析结果见表4, 可见BP模型和SVD-ANFIS模型的R2分别为0.977 6和1.988 7, RMSE分别为2.455 9和0.601 3, 可以看出SVD-ANFIS模型的误差较小, 拟合效果较好, 具有一定的优越性。

图5 玉米叶片中Pb2+含量的BP和SVD-ANFIS模型 预测值与实测值对比图

表4 BP模型与SVD-ANFIS模型的预测精度对比

3.4 模型鲁棒性验证

为检验模型的鲁棒性, 选取2014年同等条件下的玉米光谱数据作为验证组对模型进行验证, 同样选取R2和RMSE作为模型的预测精度评价指标。 验证结果如表5所示, 从表5看出, 验证组R2和RMSE分别为0.986 4和0.887 4, 可看出模型具有很好的鲁棒性, 可以有效预测玉米叶片中Pb2+的含量。

表5 不同时期同类型玉米光谱数据对SVD-ANFIS模型验证

4 结 论

(1)玉米叶片光谱经过SVD分解后, 基本保留了原矩阵的所有特征, 可以压缩光谱数据, 从而减少了ANFIS中的参数量以及数据的冗余度, 降低了网络模型的复杂度, 提高了网络的预测精度和预测效果。

(2)所选用的ANFIS结合了模糊理论和神经网络算法的优点, 通过实时调整隶属函数和模糊推理规则, 可预测玉米叶片中重金属铅的含量; 在模糊训练的过程中选择钟型函数作为隶属函数, 对模型的预测效果最佳, 误差最小。

(3)通过与BP神经网络常规方法预测的优越性进行对比, 得出SVD-ANFIS模型的均方根误差较小, 精确度更高。

利用SVD-ANFIS模型对玉米叶片中受Pb2+污染后的重金属含量变化进行了预测, 得到了较好的预测效果, 为其他作物受重金属胁迫的光谱研究提供了范例, 但仍有一定的局限性, 还需要大范围的污染监测来进一步验证模型的普适性, 从而应用于实际生产, 促进农业的快速发展。

猜你喜欢
光谱重金属叶片
月季叶片“雕刻师”
基于三维Saab变换的高光谱图像压缩方法
两种喷涂方法在TRT叶片上的对比应用及研究
重金属对膨润土膨胀性的影响
测定不同产地宽筋藤中5种重金属
ICP-AES、ICP-MS测定水中重金属的对比研究
再生水回灌中DOM对重金属迁移与保留问题研究
星载近红外高光谱CO2遥感进展
基于CFD/CSD耦合的叶轮机叶片失速颤振计算
苦味酸与牛血清蛋白相互作用的光谱研究