RGB与HSI色彩空间下预测叶绿素相对含量的研究

2018-11-01 06:02孙玉婷王映龙杨红云孙爱珍杨文姬
浙江农业学报 2018年10期
关键词:搜索算法网格叶片

孙玉婷,王映龙,,杨红云,周 琼,孙爱珍,杨文姬,3

(1.江西农业大学 计算机与信息工程学院,江西 南昌330045; 2.江西省高等学校农业信息技术重点实验室,江西 南昌 330045; 3.江西农业大学 软件学院,江西 南昌 330045)

叶绿素是植物进行光合作用的主要色素,它是判定植物光合能力、健康状态以及营养元素含量的重要指标。传统的测定叶绿素含量的方法主要有分光光度法[1-2]和叶绿素测量仪法[3-5]等。但是上述方法存在破坏植株生长、费时费力、重复测量或价格昂贵等缺点,不利于研究工作的开展。不少学者为能简便、准确、快速无损地获得植物的叶绿素值做了大量的研究,分别对水稻、番茄、小麦、苹果等植物叶片进行定量分析,分别构建了植物叶片相对叶绿素值(SPAD)与植物叶色图像分量之间关系模型。如龚刚猛等[6]通过定量分析水稻的叶片颜色特征值RGB组分与SPAD值间的关系,建立水稻叶色模拟模型,得到它们之间呈极显著相关性。张楠[7]通过对获取的水稻图像进行叶色参数提取分析,发现水稻叶片的SPAD值与水稻序列图像对应部位的RGB颜色参量有着显著非线性相关。李艳等[8]通过加工番茄地上部分彩色图像提取RGB及其组合的颜色特征值,与SPAD值做回归分析,根据统计性检验,有相当数量的颜色特征与SPAD呈较高的相关性。程立真等[9]利用图像处理技术,采集苹果叶片图像的R、G、B值,通过运算组合构造颜色特征参数,建立单变量回归模型和支持向量机回归模型估测SPAD值。近些年来,随着人工智能的快速发展,基于统计学习理论的支持向量机方法(SVM)逐渐成为机器学习的研究热点。SVM具有出色的学习和预测能力,不但可用于人脸识别[10-11]、图像分类[12]和故障诊断[13-14]等方面,还在农产品产量[15]、病虫害识别[16]、以及作物氮素营养诊断[17-18]等方面得到了广泛的应用。为此,本文通过试验观测得到的数据,分析水稻叶片SPAD值与叶色图像参数之间的关系,并利用2个彩色空间的6个参数(R、G、B、H、S、I)作为颜色特征指标,构建基于支持向量机的水稻SPAD值预测模型,为机器视觉技术便捷测量水稻等农作物的SPAD值奠定了理论基础。

1 材料与方法

1.1 试验材料

水稻田间试验于2015—2017年在江西农业大学农学试验站和江西省成新农场进行,供试品种为籼型三系杂交水稻品种金优458(JY458)、常规稻品种中早35(ZZ35)、籼型两系杂交稻品种两优培九(LYP9),每个品种设计4组不同的氮素水平。金优458和中早35的氮肥施用量为N1,CK(0);N2,225 kg·hm-2;N3,150 kg·hm-2;N4,75 kg·hm-2。两优培九的氮肥施用量为N1,CK(0);N2,210 kg·hm-2;N3,300 kg·hm-2;N4,390 kg·hm-2。分别采集金优458水稻品种740组叶片,中早35水稻品种640组叶片以及两优培九水稻品种1 860组叶片作为观测样本。

1.2 数据获取与分析

1.2.1 水稻叶片数字图像获取

水稻取样后,扫描3种水稻品种叶片的数字图像。选择平板扫描仪MRS-9600TFU2,图像传感器为CCD,光学分辨率为4 800 dpi×9 600 dpi。植株活体剪下叶片取样后,整齐地平放在扫描仪工作台面上,尽快扫描避免水稻缺失水分枯萎造成叶子卷曲。

1.2.2 水稻叶片SPAD值获取

使用叶绿素测定仪SPAD-502测量3种水稻品种叶片的SPAD值,由于测定部位对SPAD值读数影响较大,测量时应尽量保持一致并避开叶脉[19]。分别测量每个水稻品种的叶尖,叶中以及叶基3个位置的SPAD读数,并取其平均值作为本文的试验数据。

1.3 叶片图像颜色特征提取

扫描仪扫描叶片图像,背景白色,单一简单,对叶片图像特征提取影响不大,但由于扫描仪自身传递和转换的原因,获取的水稻数字图像质量会随之下降,为避免分析误差产生,在提取叶片图像特征前,对图像背景进行消噪处理。本文选取面向硬件设备的RGB和色彩处理的HSI两个颜色空间实现作物数字图像特征提取。

1.4 RGB到HSI的转换

RGB颜色空间适合于图像的采集和显示,但由于R、G、B三分量间的高相关性[20],不适合于图像分割与分析,在进行彩色测量时,也不能靠设置R、G、B的值对图像进行阈值分割,而将RGB图像转换灰度图像再进行阈值分割[21],这样做会损失图像的色彩特征。但利用各种变换,可以由RGB空间推导出其他颜色空间[22]。其中HSI颜色空间是从人的视觉系统出发,用色调、色饱和度和亮度来三种基本特征量来描述色彩[23],便于色彩处理和识别,可以大大简化图像分析和处理的工作量。RGB色彩空间到HSI色彩空间的转换[24]如公式(1)所示。

(1)

1.5 数据预处理

为了减少数值变化范围,加快模型计算的速度以及提高模型的精度,原始数据在进行模型训练的时候都进行了归一化处理[25]。将不同量纲的数据归一化到[0,1]范围内,归一化处理采用式(2),即

(2)

式(2):中x表示样本数据;xmax和xmin分别表示样本数据中的最大值和最小值;y表示归一化后的数据;ymax和ymin分别表示归一化后数据的最大值和最小值。

1.6 支持向量机(SVM)参数的选定

合理选取SVM的参数对于模型的回归预测问题尤为重要,尤其是核函数的参数g以及惩罚系数c对SVM的性能有着很大影响[26],所以快速选择合适的SVM参数,对减少训练和预测时间有着很重要的实际意义。

目前,对于支持向量机参数选择的方法有:遗传算法[27-28]、粒子群算法[29-30]以及网格搜索算法[31]等等。前两种算法在选择SVM参数的过程中具有搜索速度快,效率快的优点,但是均容易陷入局部最优,网格搜索算法是让c和g在一定的范围划分网格并遍历网格内所有点进行取值,对于选定的c和g利用K-CV方法得到此组c和g下训练集验证分类准确率,最终选择使训练集交叉验证分类准确率最高的那组c和g作为最优参数组合。传统的网格搜索算法虽然能找出最优参数组合c和g,但是搜索效率低。而本文采用改进的网络搜索算法对支持向量机(SVM)参数进行选定,其算法原理是先采用大步距大范围的粗搜选择最高的一组c和g,再在这组参数附近确定一个小区间,再在此区间内进行小步距精搜,达到减少参数寻优时间的目的。

2 结果与分析

2.1 不同方法优化支持向量机参数

以试验观测到的金优458(JY458)水稻数据为分析样本,分为两组,每组均有740个样本,其中第一组的输入变量为水稻叶片图像的RGB分量,输出变量为水稻SPAD值,第二组的输入变量为水稻叶片图像的HSI分量,输出变量为水稻SPAD值。

采用改进的网格搜索进行寻优,设定网格搜索的变量c和g的初始范围为[2-8,28],搜索步距设为1,采用K-CV方法对训练集进行测试,其中K=3,得到局部最优参数组合,根据得到的局部最优参数,在其附近选择不同的区间进行二次寻优,搜索步距设为0.1。本文分别采用了传统网格搜索算法,改进搜索算法进行测试,比较各自性能,比较结果见表1。

表1不同方法进行参数寻优结果的比较

Table1Comparison of different methods for parameter optimization

试验组别Test group传统的网格搜索Traditional grid search methodcgR2/%t/s改进的网格搜索Improved grid search methodcgR2/%t/sRGB0.353668.5983.6614258.272.4623482.624212.58HSI0.43531683.714241.201.14874 83.762215.35

由表1看出,在RGB色彩空间下传统的网格搜索算法参数寻优时间大约是改进的网格搜索算法参数寻优时间的21倍,而在HSI色彩空间下传统的网格搜索算法参数寻优时间大约是改进的网格搜索算法参数寻优时间的16倍,寻优时间明显更高。但由于其在二次寻优的区间的选择上含有较多的经验成分[32],所以在平方相关系数上要低于传统的网格搜索,即这种改进的网格搜索法相当于牺牲了平方相关系数,来减少了大量的搜索时间。在回归模型的评价指标上,当回归模型的平方相关系数达到了80%,则判定该模型是有效的。经试验证明,采用改进的网格搜索算法能够满足本文的需求。

2.2 叶片色彩分量与水稻叶片SPAD值之间的关系模型

本文以试验观测到的3种不同水稻数据为依据,采用参数优化后的支持向量机算法对水稻叶片SPAD值进行训练和预测。采用归一化法将观测数据处理到(0,1)区间,金优458(JY458)水稻品种选取555组数据为训练样本,185组数据为预测样本,中早35(ZZ35)水稻品种选取480组数据为训练样本,160组数据为预测样本,两优培九(LYP9)水稻品种选取1 395组数据为训练样本,465组数据为预测样本。

2.2.1 叶色图像RGB分量与水稻叶片SPAD值之间的关系模型

本模型以水稻叶片图像RGB分量作为水稻叶片SPAD值预测模型的输入参数,叶片SPAD值作为模型的输出参数,其样本的训练过程见图1。从图1上看,3种不同水稻品种的模型在样本训练过程中表现出了良好的数据泛化能力,水稻叶片SPAD值基本稳定在20~55,基于参数优化后的支持向量机回归对于不同水稻品种训练样本的平方相关系数分别为82.624 2%(JY458)、86.290 0%(ZZ35)以及86.011 4%(LYP9),学习效果较好,为了测试该3种模型的精度,利用所建立模型对预测样本数据进行预测,其预测结果图如图2所示。

从图2可以看出,基于参数优化后的支持向量机预测模型能够有效地预测水稻的SPAD值,3种水稻品种SPAD值的浮动范围不大,预测效果良好。为了定量地分析本文的预测效果,文中引入均方根误差和平均相对误差两个评价指标,评价结果如表2所示。从表2看出:3种水稻品种基于SVM预测水稻SPAD值的误差都较小,其中中早35(ZZ35)的预测结果与观测结果的均方根误差和平均相对误差最大,其值分别为3.021 4和5.667 0%。

2.2.2 叶色图像HSI分量与SPAD值之间的关系模型

本模型以水稻叶片图像HSI分量作为水稻叶片SPAD值预测模型的输入参数,叶片SPAD值作为模型的输出参数,其样本的训练过程见图3。从图3可知,3种水稻品种SVM的回归曲线围绕观测值小幅度浮动,和观测值的拟合效果较好,其训练样本的平方相关系数分别为83.762 2%(JY458)、86.431 7%(ZZ35)以及86.303 5%(LYP9)。为了测试该3种模型的精度,利用所建立模型对样本数据进行预测,其预测结果图如图4所示。

图1 不同水稻品种SPAD值的训练结果(RGB)Fig.1 Training results of SPAD values for different rice varieties(RGB)

图2 不同水稻品种SPAD值的预测结果(RGB)Fig.2 Predicted results of SPAD values for different rice varieties (RGB)

图3 不同水稻品种SPAD值的训练结果(HSI)Fig.3 Training results of SPAD values of different rice varieties (HSI)

图4 不同水稻品种SPAD值的预测结果(HSI)Fig.4 Predicted results of SPAD values for different rice varieties (HSI)

从图4可知:本文提出的模型的预测结果与观测数据吻合良好,定量地分析本文的预测效果,均方根误差和平均相对误差如表2所示。表2中3种水稻品种基于SVM预测水稻SPAD值的误差都较小,其中中早35(ZZ35)预测结果与观测结果的均方根误差和平均相对误差最大,分别为3.001 4和5.533 5%。

表2SPAD观测值和模型预测值比较

Table2Comparison of actual SPAD values and model predictions

品种VarietyRGB均方根误差RMSE平均相对误差MRE/%HSI均方根误差RMSE平均相对误差MRE/%JY4582.01273.78801.94523.7038ZZ353.02145.66703.00145.5335LYP91.98883.84411.83463.6059

3 讨论

水稻叶片SPAD值预测结果表明,水稻叶色组分与水稻叶片SPAD值之间显著相关。常丽英等[33]研究利用二次曲线方程描述了水稻叶片含氮量对叶色变化的调控过程,发现水稻叶片的R、G与SPAD值显著相关,并构建了水稻叶片SPAD值和叶色组分单变量(R、G)的定量关系模型。本文不同于上述研究,以R、G、B值构成一个三维的输入变量,并采用一种处理高度非线性分类、回归等问题的计算机新方法支持向量机对水稻SPAD值进行预测,不同水稻品种预测值与观测值之间的均方根误差平均值分别为2.012 7、3.021 4和1.988 8。支持向量机的参数对于模型的性能也十分重要,目前关于支持向量机参数寻优的方法有遗传算法[27-28]、粒子群算法[29-30]以及网格搜索算法[31],遗传算法和粒子群算法相比于网格搜索法更为复杂,且容易陷入局部最优。本文通过对比传统网格搜索算法和改进后的网格搜索算法,RGB色彩空间下参数的寻优时间从258.27 s缩减至12.58 s,HSI色彩空间下参数的寻优时间从241.20 s缩减至15.35 s,大幅度地减少了参数的寻优时间,所建立的模型也具备很好的泛化能力,改进后的网格搜索算法虽然牺牲了平方相关系数,但对于大量的水稻样本数据,提高了模型的性能,为水稻叶片SPAD值预测提供了一定的实时性。

龚刚猛等[6]和张楠[7]研究指出,水稻叶片的SPAD值与采集得到的水稻叶片图像的RGB参量有着显著相关。本文不仅证明了上述结果,同时还发现了HSI色彩空间与水稻叶片SPAD值之间存在着显著性相关。从研究结果中还可以分析出,3种不同水稻品种在2个不同色彩空间下在训练样本中,对于模型的平方相关系数,每个水稻品种在HSI色彩空间上所构建的模型均高于RGB色彩空间上所构建的模型,而在预测样本中,比较水稻SPAD值的观测值与模型预测值的均方根误差和平均相对误差,3种水稻品种在HSI色彩空间上预测值的均方根误差均低于RGB色彩空间,均方根误差分别减少了0.067 5(JY458)、0.020 0(ZZ35)和0.154 2(LYP9),平均相对误差比RGB色彩空间下分别减少了0.084 2(JY458)和0.133 5(ZZ35)和0.238 2百分点(LYP9)。结果表明,水稻叶片在两种不同色彩空间下的分量和水稻叶片SPAD值之间存在显著的相关性,利用改进的网格搜索算法优化支持向量机的方法建立水稻叶片SPAD值预测模型,预测结果误差小,说明本文提出的模型对于利用叶色数据进行水稻SPAD值的预测是有效的,从而为计算机视觉技术快速精准获取SPAD值提供了理论基础,也为植物SPAD值的预测提供了一种新的可靠方法。本文还存在一定的不足之处和局限性,为研究所需,本文通过破坏剪取水稻叶片,扫描图像获取稳定的(与光线强度无关)叶片色彩分量。而叶片色彩分量受光照强度影响,因此有必要将不同拍摄设备在不同光线强度下获取叶片色彩分量作为下一步的研究对象,以得到更为实用的机器视觉作物叶片SPAD值获取方法。

猜你喜欢
搜索算法网格叶片
一种基于分层前探回溯搜索算法的合环回路拓扑分析方法
改进的非结构化对等网络动态搜索算法
改进的和声搜索算法求解凸二次规划及线性规划
两种喷涂方法在TRT叶片上的对比应用及研究
我的植物朋友
追逐
基于莱维飞行的乌鸦搜索算法
重叠网格装配中的一种改进ADT搜索方法
基于CFD/CSD耦合的叶轮机叶片失速颤振计算
单叶片失谐整体叶盘响应分析