杨红云,罗建军,孙爱珍,万 颖,易文龙
(1.江西农业大学 软件学院/江西省高等学校农业信息技术重点实验室,江西 南昌330045; 2.江西农业大学 计算机与信息工程学院,江西 南昌330045)
氮素是植物生长所需的必要元素之一,缺氮会造成植株叶片面积减小,降低光合作用、叶绿素含量和生物产量[1]。施氮过量则会在土壤中残留大量的氮元素,不仅造成氮肥的浪费,而且会对环境造成一定的污染[2]。利用图像处理技术进行水稻氮素营养诊断,高效、便捷、无损。Lee等[3]指出绿光深度绝对值(G)与地上部生物量、氮素累积量和叶面积指数均可用指数方程进行拟合,R2分别为0.830、0.830和0.860;李岚涛等[4]研究表明,红光标准化值(normalized redness intensity,NRI)与植株氮素营养指标(叶片含氮量、植株全氮含量、生物量、氮素累积量和冠层归一化差值植被指数)的相关性最高,可建议作为水稻氮素营养诊断的最佳冠层图像色彩参数指标;Yuan等[5]利用图像处理技术所提取的水稻生长期的NRI、色度(hue,H)、深绿色指数(dark green color index,DGCI)等颜色特征与SPAD值具有良好的线性相关性。除提取图像中的颜色特征进行水稻氮素营养研究以外,顾清等[6]、周琼等[7]还同时选用了水稻颜色和几何形态等多类特征进行水稻氮素营养识别分类研究。由上可知,水稻叶片颜色和几何形态特征是能够有效的进行水稻氮素营养诊断研究的。支持向量机(support vector machine,SVM)具有非线性处理能力和高维处理能力,能在小样本的情况下达到很好的效果,且已广泛应用于农业生产[8]、病害识别[9]及作物氮素营养诊断研究[6,10];BP 神经网络(BP neural network,BPNN)是一种误差反向传播算法的学习过程,被广泛运用于模式识别、图像处理、智能控制、故障检测等领域[11-12]。同时潘圣刚等[13]研究表明,水稻进行氮素高效吸收及快速累积的主要时期是幼穗分化期和齐穗期。周琼等[7]以这两个时期顶部3种叶位的水稻叶片作为研究对象,采用图像处理技术和机器学习方法探寻水稻氮素营养诊断识别的最佳模型,但该研究未考虑建模时多种图像特征的选取,所采用的机器学习建模方法未与传统的建模方法进行对比,且所建诊断识别模型仅能判定水稻氮素营养缺失。孙小香等[14]采用高光谱技术和BP神经网络建立了水稻叶片氮素浓度估算模型,较优于传统的多元线性回归模型,BP神经网络对氮素虽然具有很好的预测能力,但高光谱技术的成本较高且操作较繁琐。因此,本研究仍以幼穗分化期及齐穗期顶部3种叶位的水稻叶片图像作为研究对象,并采用图像处理技术提取出多项水稻特征。考虑到氮胁迫时水稻会表现出叶鞘褪绿、叶片均匀黄化的特异性症状,叶鞘首先失绿呈淡黄或橙黄色,中部叶片的叶尖也开始发黄[11],不仅选取了叶片的9项颜色特征,而且还选取了叶鞘的9项颜色特征;考虑到水稻在受到不同类型不同程度的氮营养胁迫时,叶片和叶鞘产生的反应症状不仅仅体现在叶面积的大小、叶长或者叶宽,而且也会在叶片是否狭细,叶尖角的大小,整个叶片的弧形度等方面体现出差异[11],不仅选取了长度、宽度、面积、周长等传统几何形态特征,还选取了长宽比、面积长度比以及面积周长比等相对值几何形态特征。本研究将所提取的各项特征与叶片全氮含量进行相关性分析,选择出模型的输入特征,采用传统建模方法(多元线性回归)以及机器学习方法(支持向量机和BP神经网络)建立水稻叶片全氮含量估测模型,对比分析各模型精度,以期探寻能够有效预测水稻叶片全氮含量的图像特征、叶位,以及建模方法。
水稻试验于2017—2018年在江西省南昌市成新农场(116°15′E,28°92′N)进行,稻田土壤pH值5.3,含有机质24.4 g·kg-1、全氮1.4 g·kg-1、有效磷12.7 mg·kg-1、速效钾123.0 mg·kg-1[15]。
以超级杂交稻两优培九作为供试品种,其最佳施氮量为纯氮210~300 kg·hm-2[15],以其高施氮量(270 kg·hm-2以上)为基础,设置4个梯度,氮肥(纯氮)施用量分别为0、210、300和390 kg·hm-2,3次重复试验。小区随机区组排列,小区面积30 m2,各小区间均作埂并用塑料薄膜包裹在上面, 以防各小区间互相影响。氮肥使用尿素(含N 46%),按基肥∶分蘖肥∶穗肥体积比4∶2∶4施用;磷肥使用钙镁磷肥(含P2O512%),按分蘖肥∶穗肥体积比7∶3施用;钾肥使用氯化钾(含K2O 60%),做基肥一次施用。各区间磷、钾肥施用等量,分别为P2O5225 kg·hm-2、K2O 300 kg·hm-2。人工移栽前1d施用基肥,人工移栽后7 d施用分蘖肥,在叶龄余数1.5左右时施用穗肥[16]。2017年5月25日播种,6月14日人工移栽;2018年5月21日播种,6月10日人工移栽,栽插密度为13.3 cm×26.6 cm,其他管理按照一般的高产栽培处理。
分别于水稻幼穗分化期(2017年7月24日和2018年7月20日)和齐穗期(2017年8月23日和2018年8月20日)进行水稻叶片取样(田间各个位置都获取)。水稻数字图像获取的设备选用MICROTEK平板扫描仪,型号MRS9600TFU2L,图像传感器为CCD,分辨率为600 ppi。水稻试验叶片共计4 800片,2017年和2018年各2 400片,每年的各个时期均获取1 200片,其中每个叶位下各400片,每个叶位下的四种施氮水平各100片。采样后立即扫描,以防止叶片变形、变色,影响实验效果[17]。叶片器官包括叶鞘和叶片,叶鞘包裹在主茎上(叶节到叶枕部分为叶鞘),叶片过长,从叶中位置剪断为两部分(叶中和叶尖)。将叶鞘、叶中和叶尖三个部位平铺在同一大小的白色纸张上,放置一个已知大小的参照物,以便后续实验的处理。参照物中包含8个黑色小方格,每个小方格的实际边长为2.5 cm。
1.3.1 特征选择
通过采用图像处理技术从水稻叶片图像中提取18项颜色特征和7项几何形态特征,颜色特征包括叶片R、叶片G、叶片B、叶片红光标准化值(NRI)、叶片绿光标准化值(NGI)、叶片蓝光标准化值(NBI)、叶片H、叶片S、叶片I、叶鞘R、叶鞘G、叶鞘B、叶鞘NRI、叶鞘NGI、叶鞘NBI、叶鞘H、叶鞘S、叶鞘I,几何形态特征包括叶片的长度、宽度、面积、周长、长宽比、面积长度比以及面积周长比。
1.3.2 水稻叶片颜色特征提取
叶片扫描图像以白色纸张作为背景,且水稻叶片呈绿色或深绿色,目标物体与背景颜色区分较为明显。因此,省去图像分割步骤。本研究采用Matlab工具将RGB图像转换成HSI图像,获取R、G、B、H、S、I共6种分量的图像,如图1所示。通过对6种分量的对比发现,H分量下的水稻叶片和叶鞘与背景有较大差异,而G分量下的参照物与背景有较大差异,因此,对H分量图像和G分量图像进行二值化,分别提取出水稻叶片和参照物,再采用cat函数去除图像中的小面积干扰区域,如图2所示。将去除杂质后的图像与原图进行点乘操作,获取黑色背景的水稻图像。同时使用regionprops函数对水稻叶片与叶鞘定位,分割出水稻叶片和水稻叶鞘,黑色背景下的水稻图像如图3所示。对黑色背景下的水稻图像进行叶片及叶鞘的R、G、B、H、S、I均值计算。并计算出水稻叶片和叶鞘的NRI、NGI和NBI,计算公式如式(1)所示。
图1 六种通道分离的对比图像Fig.1 Comparison image of six channel separation
(1)
式(1)中VNRI、VNGI、VNBI分别表示NRI、NGI、NBI的值。
1.3.3 水稻叶片几何形态特征提取
图2 水稻扫描图像二值化及去除杂质前后对比图像Fig.2 Binary image of rice scanning image and image comparison before and after impurity removal
图3 黑色背景下的水稻图像Fig.3 Rice image in black background
图4 水稻图像最小外接矩形图像Fig.4 Minimum circumscribed rectangle image of rice image
图5 水稻叶片及参照物轮廓图像Fig.5 Contour image of rice leaves and references
通过计算参照物实际周长与图像中参照物轮廓像素点总个数的比值作为计算水稻几何形态特征的系数,该比例系数如公式(2)所示。叶片实际长宽、周长和面积的计算方法如公式(3)~(6)所示,并计算出长宽比、面积长度比以及面积周长比。
(2)
L=k·(ML+TL)。
(3)
W=k·max(MW,TW)。
(4)
C=k·(MC+TC-MW-TW)。
(5)
S=k·(MS+TS)。
(6)
式(2)~(6)中:k,比例系数;Creal,8个参照物的实际周长;Cpixel,8个参照物轮廓总像素数;L,叶片实际长度;ML,叶中最小外接矩形长度总像素数;TL,叶尖最小外接矩形长度总像素数;W,叶片实际宽度;MW,叶中最小外接矩形宽度总像素数;TW,叶尖最小外接矩形宽度总像素数;C,叶片实际周长;MC,叶中轮廓总像素数;TC,叶尖轮廓总像素数;S,叶片实际面积;MS,叶中轮廓内总像素数;TS,叶尖轮廓内总像素数。
水稻叶片扫描后,将叶片样品置于烘箱,设置105 ℃杀青1 h,在80 ℃下进行48 h烘干至恒重。烘干后密封于干燥处保存,所有样本处理完后,将干样品粉碎、过筛、混匀,采用H2SO4-H2O2进行消煮,凯氏定氮法测定叶片全氮含量[21-23]。
将25项图像特征与叶片全氮含量进行相关性分析,并采用多元线性回归进行水稻叶片全氮含量估测建模,筛选出水稻两个时期的水稻叶片全氮含量估测敏感叶位。同时采用机器学习方法分别对两个时期的敏感叶位进行水稻叶片全氮含量估测建模,且与多元线性回归建模进行实验对比。各模型试验数据均为水稻叶片中所提取的图像特征数据(各模型均为800组数据),随机选取80%作为建模集数据(640组),20%作为验证集数据(160组)。
1.5.1 主成分分析降维
主成分分析是将多个具有相关性的原始特征转化为少数几个不相关的综合性特征[24]。本研究对图像特征进行相关性分析筛选后,特征数目仍然较多,为提高算法的运行效率,达到理想试验效果,对25项水稻图像特征中与叶片全氮含量显著和极显著相关的特征进行主成分分析降维。
1.5.2 归一化处理
由于水稻每种特征量纲有所不同,为能够提高模型运行速率和模型准确率[25],试验采用mapminmax函数对主成分分析降维后的数据进行归一化处理,归一化公式为
(7)
式(7)中:x,样本数据;xmax、xmin,原始特征数据中的最大值和最小值;y,归一化后的数据;ymax、ymin,归一化处理后的最大值和最小值,ymax=1,ymin=0。
1.5.3 支持向量机
在实际应用中,SVM能否建立理想的水稻氮素营养诊断模型,主要取决于惩罚参数C、核函数参数g以及核函数类型的选取[26]。采用支持向量机对敏感叶位进行建模,核函数选用径向基核函数[27],径向基核(RBF)函数如公式(8)所示。采用网格搜索算法对误差惩罚参数C和核函数参数g的优选,网格搜索算法设定网格搜索的变量C和g的初始范围为[2-8,28],搜索步距设为1,采用K-CV方法对训练集进行测试,其中K=3[17]。模型输入为主成分分析降维后的数据,模型输出为叶片全氮含量。
(8)
式(8)中δ>0,为高斯核的带宽。
1.5.4 BP神经网络
采用BP神经网络对敏感叶位进行建模,其隐含层传递函数、输出层传递函数以及训练函数分别设置为tansig、purelin和trainlm[14]。经过多次试验调参,选取出最优的参数值,其中学习速率、精度、动量因子分别设置为0.05、0.1和0.9,最大迭代次数为1 000次,选择Levenberg-Mar-quardt优化算法作为模型训练函数[28]。模型输入层节点为主成分分析降维后的主成分个数,输出层节点为1(叶片全氮含量),隐含层节点数通过经验公式(9)[29]确定。本试验BP神经网络模型拓扑结构如图6所示。
图6 BP神经网络模型拓扑结构图Fig.6 Topological structure of BP neural network model
n2=2n1+n3。
(9)
式(9)中:n1,输入节点数;n2,隐含层节点数;n3,输出节点数。
为评判应用图像处理技术提取的几何形态特征的准确性及可行性,本研究从样本数据中随机选取500片叶片,进行人工测量叶长和叶宽,并与图像处理所提取的叶长和叶宽进行对比分析。但由于数据量过大,仅列出20片叶片样本测量的长宽值,两种方法提取叶长和叶宽的误差分析分别如图7-a、b所示。人工测量的水稻叶片长度在42.000~60.500 cm,图像处理提取的叶片长度误差在0~0.300 cm,最大相对误差为0.650%,平均相对误差为0.328%;人工测量的水稻叶片宽度在1.700~1.900 cm,叶片宽度误差在0~0.100 cm,最大相对误差为5.850%,平均相对误差为3.404%。由此说明,通过图像处理进行水稻几何形态特征的提取是可行的,能够替代人工测量水稻叶片几何形态特征。
图7 水稻叶长叶宽误差分析图Fig.7 Analysis table of rice leaf length and leaf width error
本研究将25项图像特征与叶片全氮含量进行相关性分析,如图8所示。幼穗分化期顶1叶、顶2叶和齐穗期顶1叶的25项图像特征的相关系数绝大多数都在-0.500~0.500,且均未达到0.010和0.050水平上相关。幼穗分化期顶3叶有19项特征达到0.010和0.05水平上相关,齐穗期顶2叶和顶3叶的几何形态特征相对叶片和叶鞘的颜色特征的相关系数较低,均未达到0.010和0.050水平上相关,叶片和叶鞘的颜色特征中分别有16项和10项特征达到0.010和0.050水平上相关。由此表明,采用水稻颜色特征和几何形态特征进行水稻叶片全氮含量估测是可行的。
表1 多元线性回归建模自变量选择及模型检验结果
表2 水稻敏感叶位叶片全氮含量估测模型验证结果对比
a,支持向量机模型;b,BP神经网络模型。图10同。a, Support vector machine model; b, BP neural network model.Same as Figure 10.图9 基于机器学习的幼穗分化期顶3叶模型实际值与预测值拟合结果Fig.9 Fitting results of actual value and predicted value of 3rd leaf at the young panicle stage based on machine learning
图10 基于机器学习的齐穗期顶2叶模型实际值与预测值拟合结果Fig.10 Fitting results of actual value and predicted value of 2nd leaf at the full heading stage based on machine learning
本研究分别对水稻幼穗分化期、齐穗期两个时期内的顶1叶、顶2叶、顶3叶进行水稻叶片全氮含量估测研究。通过水稻图像特征相关性分析和多元线性回归建模,发现幼穗分化期以顶3叶最易于估测水稻叶片全氮含量,这与周琼等[7]研究的结果一致,且与水稻拔节期顶3 叶最能体现其氮素营养状况相似。采用机器学习方法对幼穗分化期顶3叶、齐穗期顶2叶进行水稻叶片全氮含量估测建模,其研究结果与孙小香等[14]的一致,机器学习方法优于多元线性回归,且以BP神经网络建模最佳。研究结果还表明,幼穗分化期顶3叶模型明显强于齐穗期顶2叶,可能是由于超级杂交稻生育后期容易出现早衰现象,叶片氮含量衰减快速,不易于进行水稻氮素营养诊断[30]。基于机器学习的水稻叶片全氮含量估测模型建立的过程中,特征降维处理仅简单地选用了前5个主成分。在后续研究中,将进行深入研究,选取各模型建立的最佳主成分个数,并引入更多的特征数据降维方法、建模方法以及模型优化算法,以提高水稻叶片全氮含量估测模型的泛化能力。
本研究将图像处理所提取的叶长叶宽与人工测量进行对比分析,其叶片长宽平均相对误差分别为0.328%、3.404%,能够满足本试验的需求。在前期研究结果[18]中,由于其图像扫描时选择分蘖期叶片较多,可以整片平铺扫描,且参考物方格数较多,因此与本次研究相比,误差相对小一些。研究中所选用的水稻图像特征大多为常用颜色和几何形态特征。在后续试验中,将继续研究更为快捷的机器视觉获取水稻图像特征数据方法,以便高效准确地获取水稻器官特征数据,并引入水稻植株的其他特征,如叶茎夹角、纹理特征等。
本研究仅以两优培九作为供试品种,所建立的水稻氮素营养诊断模型在其他水稻品种中的应用性还需要进一步研究。研究中所获取的样本数目相对较少,各叶位仅有800组。为使得水稻叶片全氮含量估测模型更具有通用性与实用性以及提高样本的容错率,在未来的研究中,将获取更多水稻品种及生长时期的水稻图像特征进行研究,并提高模型建立的样本总量。同时,本研究选用的数据是从水稻扫描叶中所获取的,虽然基本排除了环境干扰等的影响,但扫描仪不便携带到大田实地测量,且需破坏性采用,不利水稻正常生长和连续观测取样。若在多样性的大田环境下,环境干扰等因素是无法避免的。因此,在后续研究中将探寻无损、便捷的方式获取水稻叶片图像。