黄良平 杜泽丽 范留军
摘要:玉米是生态农业的关键农作物之一,富含蛋白质、纤维素、脂肪等物质,为实现优质玉米的培养,需要对玉米营养品质进行快速鉴定。同时,针对同一品种的玉米对不同频率的光会产生不同光谱响应数据的特点,为实现利用光谱建模快速鉴定玉米营养品质的目的,提出了基于BP神经网络的平均影响值(BP_MIV)光谱因子筛选方法。利用 BP_MIV法筛选出对玉米营养品质贡献率大的波长对应的光谱响应数据列,同时由于光谱测量过程中受到试验环境、仪器参数配置、光散射效应等因素的影响,光谱响应数据中除包含玉米样品营养品质含量的信息外,同时还存在各种噪音干扰,因此,对该响应数据进行小波去噪处理,最后建立优选波长因子下的小波神经网络玉米营养品质鉴定预报模型。结果表明,筛选出的波长因子能较好地代表众多光谱因子,对玉米蛋白质的预报精度较传统的统计方法要高。
关键词:营养品质;BP_MIV;贡献率;小波去噪;预报精度
中图分类号: TP183;S127 文献标志码: A 文章编号:1002-1302(2020)17-0225-04
河南省地处中原地区,是人口大省,也是我国重要的粮食产区。其中玉米又占其全部粮食产量的近1/5。玉米的营养品质是指玉米中所含的蛋白质、纤维素、脂肪等各种营养成分。为实现优质玉米的培养,首先要对玉米的营养品质进行快速鉴定。而光谱检测法[1]是一种能快速检测物质成分含量的分析方法,它根据物质的光谱响应特征来鉴别物质并确定化学组成和相对含量,而光谱测量受到试验环境、仪器参数配置、光散射效应等因素的影响,光谱响应数据中除了包含样品成分的信息,同时还存在各种噪音干扰,鉴于此,引入了小波分析理论[2-3]对这些响应值进行去噪处理。同时由于不同波长的光谱响应值之间必然存在包含或相关关系,若把这些因子全部引入到预报模型中,不但提高不了模型的预报精度,反而会因超大的数据运算而对模型本身和计算机有很高的要求,因此,本研究提出了基于神经网络的平均影响值(mean impact value based on BP,BP_MIV)光谱因子筛选方法[4]。最终利用该方法筛选出贡献率大的波长因子,经小波去噪处理后建立基于小波神经网络的玉米营养品质鉴定模型,并与传统的统计模型进行比较。
1 不同波长下响应值的小波去噪
不同波长下测量得到的光谱响应数据主要反映的是玉米营养品质含量的信息,同时也不可避免地包含有噪声信息,其基本模型[5]表示为
通过对式(1)中含噪声信号yj进行去噪,进而恢复原始信号Lj′,利用小波对不同波长下的不同玉米样品的响应值进行去噪,主要分为3个步骤:
(1)对各个波长下的不同玉米样品响应值进行分解。确定一个正交小波基函数后对含噪声信号yj进行N尺度的小波分解。
(2)高频系数的阈值选择。对各尺度下的高频信号设定一个合适的门限阈值,通过含噪声信号的绝对值与所选定的阈值进行比较确定信号的取舍。本研究采用几乎硬阈值法对高频系数进行处理。
(3)小波重构。利用几乎硬阈值法对高频信号d1、d2、…、dN处理后得到的d1′、d2′、…、dN′和第N层的低频系数cdN进行一维信号的小波重构。
2 基于BP_MIV法的波长因子筛选
2.1 BP神经网络基本理论
BP神经网络(back propagation neural network)是一种非线性系统辨识工具,通过梯度下降的误差后向传播实现,具有结构简单、操作性强、快速实现模式识别和函数模拟等优点。通常网络有输入层、隐含层和输出层,网络模型结构见图1。
BP神经网络主要分2个阶段进行学习[5-6]:
第1阶段(正向传播):输入层信息经过处理输给隐含层,并由隐含层输出:
输出层计算各单元的输出值并输出:
式中:wkm、wnk分别为隐含层-输入层权值、输出层-隐含层权值,b1k、b2k为隐含层和输出层阈值。
第2阶段(反向传播):计算误差更新权重和阈值。误差计算:
更新权值和阈值计算:
2.2 BP_MIV法对波长因子筛选
笼统地将所有波长因子下的玉米响应值纳入网络模型中,会使得模型运算耗时过长,甚至不能收敛,不利于提高模型的预报精度和可靠性[7],因此要依据贡献率对这些波长因子进行剔除,而本研究采取基于BP神经网络的MIV法对因子进行筛选。基于BP神经网络的MIV法的基本思想:采用214种光波长在4 000~10 000 cm-1 范围内对100种玉米样品对应的光谱响应数据进行分析,同时采用生化方法精确检测出该100种玉米样品的蛋白质、纤维素、脂肪的含量。对光波t对应的100种玉米样品的响应数据分别加10%和减小10%,其他光谱响应数据保持不变,得到2个数据样本P_in(t)和P_de(t),分别进行BP神经网络训练得result_in(t)和result_de(t),计算2次训练结果的差值并求平均值mean[result_in(t)-result_de(t)],直至t从波长1到波长214,即MIV-t。这214种光波长对玉米蛋白质含量的MIV-t如图2所示。
MIV-t值有正有负,其符号代表相关的方向,绝对值大小代表影响程度,图2是由BP_MIV算法运行10次,求得各次结果绝对值的平均值后作出的。可以看出,有142种波长对蛋白質含量的影响在1.5%以下,43种波长贡献率在1.5%~2.0%之间,29种波长的贡献率在2.0%以上,且累计达74%,较好地反映了波长与蛋白质含量贡献率的关系,因此选择这29种波长对应的光谱响应值进行建模。这29种波长的MIV-t如表1所示。
3 建立玉米营养品质的BP神经网络预报模型
3.1 利用小波对光谱响应值进行去噪处理
采用db6小波函数对筛选出的29种波长下的光谱响应值进行尺度为j=3的分解,各层的高频系数利用公式(2)去噪,最后应用Mallat快速重构算法获得光谱响应数据的滤波值。这29种波长对应的光谱响应数据滤波前后的信噪比(SNR)如表2所示。
由表2可知,经过db6小波滤波后29种光谱响应数据的信噪比均有所提高,滤波后的数据能更好地反映波长与玉米营养品质含量之间的关系。
3.2 建立BP神经网络预报模型
筛选出29种波长对应的前80种样品的光谱响应数据训练样本,可见输入层神经元数为29,根据高大启仿真经验公式[8]得出隐含层神经元数为10,输出层为蛋白质含量,从而构建29×10×1的小波BP_MIV模型。利用构建的小波BP_MIV模型对后20种玉米样品的蛋白质含量进行预报,并与多元线性回归模型[9]预报的结果进行比较,结果如表3所示。为更直观地反映3种模型的预报演结果,作残差图(图3)。
由表3和图3可以看出,3种模型对玉米蛋白质预报结果总体上均与生化方法实测值相符,3种模型的均方根误差(RMSE)分别为1.31、1.11、0.86 g;平均相对偏差(RAD)分别为10%、8%、7%,表明基于BP网络的玉米蛋白质非线性拟合模型较多元线性回归模型预报的结果更稳定,且精度更高;同时,经过BP_MIV预先筛选并利用小波去噪处理后所建立的小波BP网络模型的预报精度最高,大部分样品的蛋白质含量与实测值吻合。
4 结束语
本试验主要研究基于BP神经网络的MIV光谱筛选方法,针对光谱响应值测量过程中存在的误差,利用小波进行去噪,最终建立具有较高贡献率波长因子的小波BP网络模型,并应用于玉米蛋白质含量的预报中,结果表明,小波BP网络模型在预报精度和算法收敛时间上均优于不做预先处理和因子筛选的BP网络模型,鉴于该模型在蛋白质含量预报中的高精确性,还可利用该模型预报玉米其他营养物质的含量,如脂肪、纤维素,进而为农作物的营养物质快速鉴定和预报提供一种思路。
参考文献:
[1]周 竹,李小昱,高海龙,等. 马铃薯干物质含量高光谱检测中变量选择方法比较[J]. 农业机械学报,2012,43(2):128-133.
[2]梁 亮,杨敏华,臧 卓. 基于小波去噪与SVR的小麦冠层含氮率高光谱测定[J]. 农业工程学报,2010,26(12):248-253.
[3]胡昌华,李国华,周 涛. 基于MATLAB 7.X的系统分析与设 计—— 小波分析[M]. 西安:西安电子科技大学,2008.
[4]胡纪元,文鸿雁,周 吕,等. 基于IPSO-BP模型的大坝多源监测数据预报与反演[J]. 大地测量与地球动力学,2014,34(4):67-70.
[5]程正兴,杨守志,冯晓霞. 小波分析的理论、算法、进展与应用[M]. 北京:国防工业出版社,2007.
[6]谢国权,戚 蓝,曾新华. 基于小波和神经网络拱坝变形预测的组合模型研究[J]. 武汉大学学报(工学版),2006,39(2):16-19,27.
[7]苏 博,刘 鲁,杨方廷. GM(1,N)灰色系统与BP神经网络方法的粮食产量预测比较研究[J]. 中国农业大学学报,2006,11(4):99-104.
[8]高大启. 有教师的线性基本函数前向三层神经網络结构研究[J]. 计算机学报,1998,21(1):80-85.
[9]李 想,徐伟平,郭永田,等. 信息技术应用对农户农业经营收入的影响研究[J]. 中国农业科技导报,2014,16(1):172-181.