芦 兵, 孙 俊, 毛罕平, 杨 宁, 武小红
(1.江苏大学电气信息工程学院,江苏 镇江 212013;2.江苏大学现代农业装备与技术教育部重点实验室,江苏 镇江 212013;3.江苏大学信息化中心,江苏 镇江 212013)
生菜因其营养丰富,便于搭配及烹制便捷的特点,深受消费者喜爱,是目前种植比较广泛的主要经济类蔬菜之一。由于生菜生长周期较短,若病害的诊治不及时将造成重大的经济损失。生菜病害的防治方法与其病害所处时期紧密相关,如霜霉病早期只需适时浇水施肥,而到中后期则需喷洒浓度为 45.0%~72.2%的普力克液剂[1],因此精准识别生菜的病害类型及其所处病害时期可以快速制定出最佳治理方案,提高农药喷洒的合理性,减少不必要的浪费和环境污染,对生菜病害防治具有重要意义,同时也是实现农业精细化管理中病害自动防治的关键。
高光谱技术具有高效、无损的特性,近年来在农产品分级、品种识别、病害检测等领域得到越来越广泛的应用[2-3]。杨赛等[4]利用联合偏度算法对玉米种子的近红外高光谱信息进行分析,实现对玉米种子品质的分级,识别精度达到了96.28%。岳学军等[5]通过采集柑橘叶片4个重要生长时期的反射光谱信息对柑橘叶片的磷含量进行预测,通过Isomap-SVR建模为柑橘树营养诊断提供依据,模型预测集的决定系数为0.894 9。曹文涛等[6]利用光谱测量技术,对土壤氯化钠含量进行了监测,模型决定系数为0.859。在病害诊治方面,Bravo等[7]分别使用可见光和近红外波段光谱信息对小麦早期黄锈病展开研究,并取得了较好的预测效果,模型预测集最佳相关系数为0.9,王斌等[8]通过线性逐步判别分析法和非线性的偏最小二乘支持向量机(LS-SVM)建立分类模型,利用高光谱信息对腐烂、病害及正常梨枣进行分类,准确率达到99.12%。以上研究结果表明,通过高光谱技术能够较准确地判断作物的病害信息。
由于植物叶片的纹理和颜色比较直观,其病害特征也相对易于提取,因此很多学者通过植物叶片的纹理和颜色特征进行病害的识别,如谭峰等[9]通过多层BP神经网络模型对大豆叶片的色度值进行研究,进行大豆叶片的病害识别,识别率为92.1%。Zhang等[10]利用图像分割技术对玉米叶片病斑进行分割,提取病斑的纹理、颜色等特征,利用KNN(K-nearest neighbor)分类算法取得了更好的病害识别效果。孙俊等[11]利用卷积神经网络对多种植物叶片的不同病害进行识别,将基于视觉特征的病害识别向人工智能领域又推进了一步。但是由于基于视觉的特征有时不能完整表征植物叶片的病害信息,植物叶片可能出现细胞级病变,病变特征也可能表现为粉状物等,这使得病斑的分割以及图像纹理、颜色特征的提取变得异常困难[12],且以上研究均过多关注于病害特征提取及病害类型的分类,而忽视了对病害时期的分析。因此本试验提出了一种基于高光谱和图像特征相融合的病害识别方法,分别从近红外光和图像特征两个域采集生菜叶片的病害信息,并通过SVR分类模型对病害类型和所处时期进行分析,为生菜叶片的病害诊治提供依据。
本试验所用病害生菜样本采摘自句容市白兔镇果蔬种植基地。在雨停后,空气较为湿润的早晨进入生菜种植大棚,寻找发生病害的生菜植株,选择大小为 8 cm×12 cm左右的叶片进行采摘,对采摘的病变叶片按病害类别和病害时期进行分类后装入保鲜袋密封,并放入置有冰块的便携式保温箱中保存,然后迅速送往实验室进行试验。通过筛选最终得到炭疽病叶片样本58个、菌核病样本72个、白粉病样本64个及健康叶片样本60个(图1)。
图1 部分试验样本Fig.1 Partial experimental samples
高光谱图像的采集设备是由芬兰Spectral Imaging公司生产的ImSpector N17E型高精度光谱图像采集套件,分辨率5 nm×1 129 nm,CCD相机[Xeva-FPA-2.5-320(100 Hz),Xenics Ltd.,比利时],镜头(OLES30 f-2.0/30 mm,Xenics Ltd.,比利时),光源(150 W卤钨灯,Dolan Jenner Industries,美国),电控平移台(SC30021A,Zolix公司,北京)。
为减少环境噪声和暗流对光谱采集的影响,先提前打开光源进行预热,对实验台进行黑白标定[13]。将生菜叶片样本均匀平铺在一块 10 cm×15 cm的黑板上,然后慢慢推送到移动台上进行高光谱图像的采集,设定相机曝光时间为20 ms,移动台速度为1.25 nm/s,光谱范围为 875~1 700 nm。为近一步降低噪声干扰,去掉高光谱图像数据首尾部各15个波段信息,最终得到波长范围为 903~1 750 nm,共226个波长的高光谱数据。将测得的光谱数据按照 3∶2的比例进行划分,共得到校正集样本120个,预测集样本80个。
为提取病害叶片的完整光谱信息,根据采集样本病斑特征分布较均匀的特点,以叶片主脉为中心,选取靠叶尖部位的250像素×250像素的区域作为光谱信息采集的感兴趣区域[14](Region of interest,ROI)。最终采集的生菜样本原始光谱信息如图2所示。
图2 原始光谱信息Fig.2 Information of the original spectra
从图2可以看出,在850 nm和1 000 nm附近出现2个波谷,在1 100 nm和1 300 nm处出现2个波峰,在1 400~1 700 nm处反射率趋于平稳,1 700 nm后反射率陡峭上升,基本符合绿色叶片“红谷”、“绿峰”、“蓝边”和“高台阶”的光谱分布特点[15]。
生菜病害对生菜叶片叶色、可溶性蛋白等成分有显著的影响,且不同病期的表征不同。为了研究不同病期叶片光谱信息的差异,选取白粉病叶片3个不同病期的叶片样本,取每组样本反射率的平均值,得到平均光谱反射率曲线。从图3可看出,生菜白粉病叶片不同病期的光谱反射率曲线存在差异。通过对其他2种病害类型不同病期平均光谱的分析,发现其光谱反射率曲线同样存在差异,说明不同病期的光谱反射率信息可以作为生菜病害病期诊断的依据。
图3 白粉病各病期平均光谱图Fig.3 Average spectrum of powdery mildew in different disease stages
利用ENVI软件采集到的病害生菜叶片高光谱数据中共含256个波长的光谱信息,需要从中提取最具有代表性的特征波长信息,从而提高后期建模的效率。在Matlab2012a中利用多项式平滑(Savitzky-Golay,SG)算法[16]对原始光谱数据进行降噪平滑处理,然后运行连续投影算法[17](Successive projections algorithm,SPA)对特征波长进行选择,设定预选择的波长数量6≤N≤50,以不同波长数量下均方根误差(RMSE)为选取依据,确定最优波长数,如图4所示。
图4 均方根误差验证最优波长个数Fig.4 Optimal wavelength number verified by root mean square error
从图4可以看出,健康叶片波长个数大于8个时,RMSE趋于稳定,而炭疽病、顶烧病、白粉病的波长个数分别大于9、11、12时RMSE趋于稳定,最终选定的各类型叶片的光谱特征值如表1所示。
表1各病害类型叶片特征波长
Table1Characteristicwavelengthsforeachtypeofdisease
病害类型特征波长 (nm)健康叶片对照890、925、970、1 080、1 135、1 258、1 482、1 650炭疽病900、980、1 130、1 220、1 325、1 389、1 521、1 596、1 685菌核病925、960、1 050、1 125、1 196、1 265、1 328、1 385、1 428、1 521、1 668白粉病930、955、996、1 065、1 108、1 176、1 254、1 305、1 384、1 465、1 558、1 632
1.3.1 纹理特征提取 病斑区域的准确分割能够为特征数据的提取提供有效依据,针对不同的病害特征,应采取不同的特征分割方法,常用的特征分割方法有基于边缘检测的Roberts算子、Sobel算子等[18],基于灰度的Ostu算子及k-means算子等[19]。本试验采用Sobel和Ostu算子对生菜病害特征进行提取,提取效果如图5所示。
图5 不同类型病斑区域分割图Fig.5 Different types of lesion segmentation picture
观察图5可以看出,炭疽病和菌核病的病害特征提取较完整,而白粉病的特征很难提取。同时由于叶脉的存在,对特征的提取存在一定干扰,因此在特征值的量化过程中需要对中间叶脉部分进行进一步滤波,以提高特征值的精度。
局部二值模式(Local binary pattern,LBP)是一种图像局部纹理特征提取的非参数线性算子[20],具有旋转不变性,能较好地表征图像的纹理信息,其表达式如下:
(1)
U(LBPP,R)=|s(gp-1-gc)-s(g0-gc)|+
(2)
其中g0为中间点灰度值,gc表示以中间点为圆心,R为半径的像素点的灰度值,P表示圆周上选定的像素点数量。试验设定采集像素点的数量为8,由于采用的是LBP混合模式,算子维度由原来的256(2p)个,减少到56个[21],经多次试验,确定R通道的LBP值具有最佳分类效果,图6是R通道LBP值统计图。
图6 R通道LBP值统计图Fig.6 Statistical graphs of LBP values under R channel
1.3.2 颜色特征提取 颜色矩能有效表征图像中颜色的分布,颜色矩包含表示均值的一阶矩,表示方差的二阶矩和表示斜度的三阶矩等。图像颜色信息主要体现在低阶矩中[22],试验利用一到三阶矩来表征病害图像中的颜色特征,计算公式如下:
(3)
(4)
(5)
其中N代表像素数量,Pij表示第i个像素的第j个颜色分量。式(3)、(4)、(5)分别表示图像中的颜色强度、均匀性及对称性信息。
支持向量机(SVM)通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化[23],在统计样本量较少的情况下,也能获得良好统计规律的目的。本试验在Matlab 2014a仿真平台中利用LibSVM工具包对生菜病害样本进行分类,为提高分类模型的线性相关性选择支持向量回归机(SVR)对生菜病害进行分类预测,选用径向基(RBF)[24]为核函数。
为了检验高光谱信息在生菜病害类型及病害时期的预测效果,本试验尝试通过2种特征向量的组合在SVR模型下进行验证。组合1为纹理信息加颜色信息,即56个维度上LBP统计值信息和一到三阶矩表示的颜色能量、对比度和相关度信息,组合2在纹理信息和颜色信息的基础上再加入高光谱反射信息。按1∶1∶1的比例分别选取病害早期、病害中期及病害晚期炭疽病样本36个、菌核病样本48个、白粉病样本45个及健康叶片样本39个作为训练集,剩余样本作为预测集。为了能够精准地预测病害时期,按病害类型定义输出标签,健康叶片标签的取值范围设为[0,1],炭疽病设为[1,2],菌核病设为[2,3],白粉病设为[3,4],标签数值区间的变化方向和病害时期之间成正相关。通过训练和预测,最终得到SVR模型下验证数据(表2)。
表2不同组合下模型验证结果
Table2Verificationresultsunderdifferentcombinations
组合病害类型样本集决定系数均方根误差病害时期识别率(%)组合1炭疽病训练集0.868 20.038 582.35预测集0.846 90.072 5菌核病训练集0.854 20.042 184.56预测集0.812 50.063 2白粉病训练集0.805 60.065 372.83预测集0.782 50.075 8健康叶片训练集0.882 50.025 888.57预测集0.872 60.042 1组合2炭疽病训练集0.928 50.032 591.27预测集0.902 10.042 5菌核病训练集0.931 70.047 890.61预测集0.891 70.074 5白粉病训练集0.888 50.054 289.23预测集0.866 90.062 1健康叶片训练集0.964 80.024 794.86预测集0.921 30.042 9
组合1:纹理信息+颜色信息;组合2:颜色信息+纹理信息+高光谱反射信息。
从对比数据可以看出,基于颜色、纹理和高光谱反射信息组合的病害类型及病害时期预测效果要明显好于基于颜色和纹理的组合方式,组合1和组合2对炭疽病和菌核病的识别率均高于白粉病,说明病害特征的分割效果在病害诊断上起到关键作用。组合2的白粉病预测集相关系数达到了0.866 9,比组合1的白粉病预测集相关系数提高了10.79%,说明高光谱反射信息的加入可有效改善病害特征不易分割的病害预测精度。在病害时期预测上,由于传统颜色加纹理的方法只能从病斑形状、大小变化以及颜色变化上对病害所处时期进行判断[25],准确率不够理想,而高光谱反射信息对植物叶片内生物元素变化较为敏感,能较好地体现不同病害及不同病害时期的叶片变化,通过不同病害时期的光谱特征值对病害时期进行量化,因此在加入高光谱反射信息后,生菜各类型病害所处时期的判断准确率均得到大幅提升。由于SVR模型通过非线性映射到高维特征空间后仍存在少量样本游离在线性范围外[26],模型的预测集在这些点的干扰下平均决定系数(R2)只有0.895 6,不是十分理想。因此,通过工具包中svmtrain函数的P标签引入松弛变量εi降低间隔阈值[27],再通过meshgrid函数采用交叉验证法调整目标函数中惩罚因子c及核函数方差g对游离点进行过滤。当εi=0.36,c=28,g=0.15时,训练集R2=0.932 5,RMSE=0.021 7,预测集R2=0.928 6,RMSE=0.034 2,病害时期综合预测准确率92.23%,说明模型此时达到最佳性能,没有出现“欠拟合”和“过拟合”的情况。图7为调优前后SVR模型预测结果,相较于优化前,预测结果的分布更加集中于高决定系数、低均方根误差、高病害时期识别率区域,说明松弛变量的引入确实提高了模型的预测精度,达到了预期效果。
图7 模型优化前后预测效果对比图Fig.7 Comparison chart of prediction effect before and after optimization
本试验通过高光谱信息和图像特征相融合的技术对生菜的病害及所处时期展开研究,利用光谱特征值、图像颜色和纹理信息通过SVR模型进行病害、病害时期的预测。
试验结果表明,基于高光谱、颜色及纹理特征的组合,在病害类型及时期预测精度上明显优于基于纹理和颜色的组合,尤其在白粉病这种病害特征难以分割的病害类型预测上,其预测集决定系数达到0.866 9,相较于颜色和纹理的组合方式预测精度提高了10.79%。
由于光谱特征值、LBP值以及基于一到三阶矩提取的颜色信息和病害类型及病害时期之间的映射是一个非线性关系,在SVR模型中转换到高维线性空间后,部分游离在线性空间外的样本严重干扰了模型的预测精度,通过引入松弛变量降低间隔阈值的方式可有效改善SVR模型的预测能力,模型精度指标(R2)及模型稳定性指标(RMSE)分别达到0.928 6和0.034 2,病害时期准确率为92.23%,基本达到预期效果。
试验结果表明,通过高光谱和图像特征相融合的方式,能够较好地实现对生菜病害及其时期的预测,可为生菜病害的自动防治提供技术参考。