白雪冰, 余建树, 傅泽田, 张领先, 李鑫星
中国农业大学信息与电气工程学院食品质量与安全北京实验室, 北京 100083
光谱成像技术集成了传统成像技术和光谱学方法的优势, 能够同时获取目标的空间信息和光谱信息。 根据光谱分辨率、 波长范围和连续性, 光谱成像技术可分多光谱、 高光谱和超光谱[1]。 对光谱图像信息的处理主要是将光谱图像转化成数据矩阵, 用计算机进行分析, 并代替人脑完成处理和解释。 光谱成像技术研发的初衷是为了增强遥感在气象、 地质和军事领域的应用[2]。 光谱成像技术作为一种无损、 直观、 快速的检测方法, 在作物病害识别领域的研究成为近六年的研究热点。
据联合国粮农组织统计, 因作物病害导致农作物减产年均高达10%[3]。 我国每年作物病害爆发的耕种面积均高于3.5亿km2, 造成难以估量的经济损失[4]。 传统的病害诊断方法主要依靠作物专家的经验, 具有较强的主观性; 而利用理化实验检测作物病害较为客观准确, 但是检测环境局限性强[5]。 光谱成像技术的特点与作物病害诊断快速、 直观、 无损等需求的契合, 成为光谱成像技术在作物病害领域深入研究与广泛应用的基础。
本文简述了光谱成像技术的特点和局限性, 重点聚焦在光谱成像技术在作物病害诊断中的研究进展, 分别从光谱图像分割、 特征信息提取和作物病害识别三个方面分析了光谱成像技术的应用现状及存在的问题。 最后展望了光谱成像技术在作物病害领域的研究趋势。
基于光谱成像的作物病害诊断方法可以同时获取病害的图像信息和光谱信息, 在大幅度降低了作物病害诊断成本同时提高了诊断效率, 具备无损、 直观、 实时和准确性。 但是作为一种新兴技术, 光谱成像技术在作物病害领域的应用依然存在局限性。
(1) 无损性。 传统的理化检测会严重损害作物的叶片, 影响作物正常生长, 因此无损检测是作物病害诊断领域迫切需求的诊断方式。 光谱成像检测技术获取病害图像信息和光谱信息的同时, 并不会对作物造成损伤, 为作物病害无损检测提供了实现基础。
(2) 直观性。 光谱成像获取的并非传统的RGB图像或某一点的光谱信息, 而是一个数据立方。 在获取的图像上对每个像素解析光谱维度上的信息, 不仅能直观观测图像的空间信息, 同时可以获取目标像素点的光谱信息。
(4) 准确性。 由于不同病害对光的吸收作用不同, 在病害的光谱反射率曲线中出现吸收峰的波段也不尽相同。 根据患病区域的光谱反射率和图像特征(形状、 颜色、 纹理)识别病害具有较高的准确率。 例如, AlSuwaidi等[8]提出的纹理特征增强光谱分析框架对不同作物病害表现出高精度的诊断结果。
(1) 复杂背景。 从田间或温室实地采集的作物病害光谱图像一般具有复杂的环境背景, 空间信息中包含较多的干扰物质, 增加了光谱图像信息分析的难度。 大多数研究采用手动删除背景[9]或在患病叶片下放置纯色背景板[10]。
(2) 光照条件。 相比实验室的理想环境, 光谱图像实地采集环境较为恶劣, 采集时间的不同、 天气状况的差异都会对光谱图像采集结果造成影响。 Guo[11]和Ye[12]等利用机器学习建立自然光照条件下小麦和玉米叶片病害的可见光谱图像分割模型, 虽然获得较好的结果, 但是依然存在较大的局限性。
(3) 拍摄角度。 目前对作物病害光谱图像的最佳采集角度尚无定论, 大多数研究认为叶片垂直于图像传感器的中心轴是最理想采集条件, 因为取样角度倾斜可能会导致病斑特征信息变化。 但Oberti等[13]研究表明取样角度在40°~60°之间最适宜于葡萄叶片白粉病的特征信息分析。
基于光谱成像的作物病害诊断方法主要涉及到图像分割技术、 光谱特性及空间特征提取技术和分类识别技术。 首先, 从光谱图像中分割出患病区域; 然后, 分析病斑的空间信息特征和光谱信息特征; 最后, 基于作物病害特征建立分类器诊断病害类型。
光谱图像分割的目标是将病斑区域从实地采集的作物病害光谱图像中分割出来, 分割结果的准确性直接影响病害空间特征和光谱特征的分析结果。 利用图像分割技术获取作物病斑的难点在于: a平衡光谱图像质量, 像素较低无法完整分割病斑, 像素过高会降低运行效率; b混淆病斑与类病斑, 将颜色或形状类似于病斑的背景误分割; c分割粉状形态的病害时, 病斑边缘信息较难保留。 目前较为成熟的作物病害分割算法包括聚类分析、 边缘检测、 阈值以及形态学等, 它们在图像分割中各有优劣, 如表1所示。
表1 光谱图像分割技术特点分析
边缘检测技术是获取光谱图像中变化显著的点, 将这些点拟合的轮廓组成分割区域, 从而大幅度提出冗余信息, 保留目标区域的结构属性, 适用于褐斑病等边缘辨析度高的病害。 Singh和Misra[21]利用层分离技术提取图像的R, G和B分量图层, 并采用Canny算子的边缘检测在单图层上分割棉花叶斑病的病斑。 赵斌等[22]对Sobel算子算法进行优化, 将方向模板由2个增加到8个, 克服了Sobel只能检测水平和垂直方向的边缘, 并结合分块阈值成功提取了豆角叶片轮廓。 边缘检测技术能快速高效地获取目标区域, 但这是建立在图像简单且质量较高的基础上。 虽然在近年的研究中边缘检测技术对光强的适应范围有所提高[22-23], 但不适用于实地采集的作物病害光谱图像。
阈值算法因直观、 实现简单且计算速度快而成为光谱图像处理中的研究热点。 近年的研究集中在结合特定理论的阈值技术在作物病害领域的应用。 Lalitha[24]针对不同病害的特点和病期变化设定自适应阈值, 建立了有效、 快速、 准确地柠檬叶病害检测系统。 傅泽田等[25]以油菜可见光谱图像为研究对象, 结合HSV颜色空间不受亮度影响的优势, 提出了一种自适应双阈值病斑分割方法, 准确率较高, 但渐变检测效果不佳。 阈值算法不受病斑边缘连续性的限制, 适合作用于背景简单或预处理去除背景的作物病害光谱图像。 在处理背景较复杂的光谱图像时, 实际结果获取的阈值与最佳阈值依然存在一定误差。
基于区域的分割算法主要包含由种子点向周围具有相似性质光谱像素扩散的生长法和不同区域基于光谱像素性质的相似与差异而进行的聚合与裂变法。 Yun等[26]设计了一个N×(N+2)的矩阵来储存相邻区域的统计数据, 根据种子区域及邻域的颜色差异自动选取种子点区域, 从而实现黄瓜叶片病斑的分割。 卢夏衍等[27]提出了一种多算法混合的区域生长法, 采用最小二乘椭圆拟合种子选择准确度和生长效率, 从温室实地采集的光谱图像中成功分离出莴苣幼苗。 区域分割法最大的局限在于种子的选取或区域的划分对分割结果起决定性影响, 对研究人员的专业性要求较高。
聚类分割方法是一种融合聚类分析理论的图像处理技术, 通过分类光谱图像中相似的数据集获取目标区域, 被称之为无监督学习。 Moghadam等[28]提出了一种无监督K-means聚类算法, 依据正常叶片与病斑的光谱轮廓差异确定聚类中心, 成功从番茄褐斑病高光谱图像中确定了病斑的位置。 Bai等[5]提出了融合空间信息的模糊C-means聚类算法, 重新定义了像素与聚类中心的欧式距离, 较为准确地分割了黄瓜霜霉病的病斑。 与传统的分割算法相比, 聚类分割算法在作物病害诊断领域应用的优势在于其自适应性较强, 特别是处理实地采集的具有较高不确定性光谱图像, 聚类分割算法在对光谱图像适应范围、 抗噪性和准确性等方面都表现出良好的性能[29]。 由此可知, 将特定理论与分割算法融合必将成为光谱图像分析技术的研究重点。
作物因病原体侵染或是其他因素而产生的病斑与健康部分相比会表现出不同特征, 选取适当的病害特征能提高病害识别模型的准确率和效率。 基于光谱成像技术获取的病害信息主要包括空间特征和光谱图像, 其中空间特征主要包括病斑的颜色、 形状和纹理, 光谱特征则是通过反射率曲线表现出来[30]。
Barbedo[31-34]提取了玉米等12类作物82种病害的H, S, V, L, a, b, C, M, Y和K等10种颜色特征, 建立基于颜色变换的作物病害分类系统, 但在结论中表明该系统的适用范围有限。 吴露露等[35]采用线编码Hough变换获取白粉病等四种病害的形状特征, 对病斑的半径和圆形拟合精度达到87.01%, 但不适用于非圆形病斑。 Arivazhagan等[36]研究发现对比度、 能量、 局部稳定性、 聚类隐藏性、 聚类显著性等五种纹理特征的加权组合能准确表征玫瑰的白粉病。 不同的作物病害在空间特征上可能会表现出一定的相似性, 特别是颜色和形状特征; 纹理特征经过多参数加权组合在一定程度上能唯一表征病害, 但模型的复杂度较高[37]; 因此空间特征只能作为辅助参数参与建模。
与空间特征相比, 作物病害的光谱特征具有较强的唯一性[38], 表2对几种主要病害的光谱特征进行了分析。 从表2可知, 每种病害的光谱反射率曲线出现特征吸收峰的波段位置不同, 通过多个特定吸收峰波段的加权组合进行反向推导, 可实现病害检测。 光谱成像技术在病害特征的分析方面结合了空间特征的直观性和光谱图像的唯一性, 为病害诊断模型提供了全面的数据基础。 Ashourloo和Mobasheri[45]提取了小麦叶锈病的颜色和病斑面积比以及605、 695和455nm波长的反射率进行光谱混合分析, 开发了用于检测叶锈病的光谱疾病指数。 Yu等[46]采用竞争性自适应加权算法确定433, 469, 519, 555, 575, 619, 899, 912, 938, 945, 970和998 nm等12个波段为枇杷内部损伤的最佳检测波段, 并结合损伤部分的颜色特征预测了内部损伤的比例。 Li等[47]利用主成分分析桃子425~1 000 nm的高光谱图像, 确定了463, 555, 687, 712, 813和970 nm等特征波段与纹理特征结合可以区分炭疽病和机械损伤。
表2 几种主要病害的光谱特征
作物病害识别主要依据光谱图像的特征信息对作物进行分类, 包括基于光谱植被指数的检测方法和基于机器学习的检测方法。
光谱植被指数是通过多个波长范围内的光谱反射率组合, 增强作物病害的光谱特性, 从而实现作物病害的检测。 Mahlein等[48]和Huang等[49]使用RELIEF-F算法从单一波段的加权组合和两个波段的归一化波长差推导出甜菜和冬小麦的病害光谱指数; Mahlein开发的疾病光谱指数对甜菜白粉病、 黄锈病的分类准确率分别为85%和87%。 Huang开发的病害光谱指数对冬小麦白粉病、 黄锈病的分类准确率分别为85.2%和91.6%。 Abdulridha等[50]采用决策树和多层感知器神经网络融合方法计算出23个光谱植被指数, 对牛油果枯萎病的检测准确率为85%。 大量的研究已经证明了光谱植被指数可以作为间接检测方法对作物病害进行分类[51], 但作物个体、 环境和发病阶段不同会导致光谱图像信息的细微差异, 从而降低光谱植被指数对病害检测的准确率。
机器学习是通过自动分析方法从作物病害光谱图像中发现规律, 并按照规律对未知的图像进行预测。 Zhang等[52]采集了高光谱成像技术获取油菜菌核病的384~1 034 nm波段范围光谱信息, 利用线性判别分析评估患病叶片的SSR检测指数, 建立了偏最小二乘病害识别模型准确率高达85%。 Knauer等[53]采用线性判别分析对葡萄白粉病400~2 500 nm光谱图像数据集进行维数约简, 结合纹理特征建立了基于随进森林算法的葡萄病害诊断模型, 准确率高达94.1%。 Ye等[54]采用连续投影算法从桃子400~1 000 nm的光谱图像中选择了6个最优特征, 并分别采用深度置信网络对桃子腐烂的三个阶段进行分类, 准确率分别为82.5%, 92.5%和100%。 郑志雄等[55]和黄双萍等[56]采用BoSW模型分析水稻穗瘟病400~1 000 nm的光谱图像, 并根据光谱包络词典建立Chi-SVM分类器, 不仅实现了病害诊断, 还对病害严重程度进行精确的分级。 机器学习模型解决了反射系数轻微变化而导致作物疾病检测困难的问题[57], 通过改进算法和优化参数可以获得具有良好推演、 泛化能力的作物病害检测模型。
与传统的实验室理化指标检测相比, 光谱成像技术作为一种快速无损检测方法, 在不损害植物组织的同时提高了检测效率; 与图像处理相比, 光谱成像技术从光学角度出发, 将光谱特性与图像分析相结合, 提高了作物病害检测的准确率, 光谱成像技术已经成为作物病害检测领域中最具发展前景的研究方向之一。
(1) 光谱图像分割技术的精度、 效率和适应性将不断提高。 传统的分割算法对光谱图像采集环境、 光照强度、 拍摄角度等影响因素的适应能力较差。 随着分割算法的不断创新与发展, 应更加注重分割算法对实地采集环境的适应能力, 提高算法处理实地采集的光谱图像的准确率和效率。
(2) 作物病害光谱图像在近红外波长范围的光谱特性分析将成为重点研究方向。 目前对作物病害光谱图像的分析主要集中在400~1 000 nm波段, 而近红外光谱波长范围的病害信息尚未被挖掘。 在未来的研究中, 通过扩展作物病害光谱特性的检索波长范围, 提高光谱特征对病害表达的唯一性是具有一定可行性的。
(3) 更加注重作物病害空间信息与光谱信息的融合。 随着光谱成像技术在作物病害诊断领域应用的不断深入, 应更加注重优化光谱特征和空间特征的加权组合的优化, 减少冗余特征, 增强病害信息表达能力, 提高病害检测模型的效率。
(4) 机器学习方法将在作物病害检测模型中广泛应用。 反观光谱植被指数在作物病害检测应用中的局限性日益突出, 机器学习模型不仅实现了对作物病害的稳定检测, 还展现出识别同一病害不同发展阶段的能力, 将作物病害检测技术引向精细农业、 智慧农业领域。