刘红芸 吴雪梅 张富贵 李德仑 叶 磊 蒋柏春
(1.贵州大学机械工程学院 贵阳 550025)(2.贵州省烟草农业科学研究院 贵阳 550081)
烟叶成熟度是影响烘烤后烟叶质地的中心因素,全面了烟叶成熟特征,正确辨别和判断烟叶成熟度,把握好适熟采收标准,采摘适熟一致的烟叶,对于烘烤和烤后烟叶质地好、级别高、香味好等具有重要意义[1~5]。目前生产上一般为烟农依照烟叶外观特征来判断其成熟度,确定采收成熟烟叶,具有较强的主观性。因此,研究一种快速、客观、无损的方法来判别烟叶的成熟度,具有重大的意义。
高光谱技术是发展迅速的一种遥感技术,高光谱植被光谱指数及光谱参数包含的信息大。因此高光谱技术广泛应用于农业的各个领域,例如在哈密瓜[6]、草莓[7]和李果实[8]等。在烤烟上,也有许多学者利用光谱参数开展了烟叶化学成分含量估测、烟叶的分类和烤烟的生长监测等方面的研究。孙志伟等[9]利用可见光谱参数与叶绿素之间的相关性,构建鲜烟叶的叶绿素快速估算模型。X N Wei等[10]采用逐步多元回归方法建立了烟碱含量的光谱预测模型。Peng Jiyu等[11]采集集鲜叶和干叶颗粒烟草样品光谱信息,并使用PLS-DA建立基于全光谱分类模型。余志红等[12]利用烟叶的比值植被指数RVI,构建回归模型能够很好地监测田间烟叶成熟度,完成了不同成熟度中、上部田间鲜烟叶RVI范围的初步确定。综上所述,已有学者利用光谱技术对烟叶的色素含量、水分含量和氮含量等建立了预测模型但目前尚未有利用偏最小二乘法判别分析法对鲜烟叶成熟度进行判别分析。
针对以上问题,本文提出了偏最小二乘法判别分析模型,并通过实验验证了该模型在烟叶成熟度判别分析研究领域中的可行性。首先,搭建了户外高光谱图像信息采集系统,采集了烟叶高光谱数据信息。然后,建立了PLS-DA的烟叶成熟度判别模型。最后,对模型训练结果进行了可视化分析。实验结果表明,该模型具有良好的判别精度。
2.1.1 实验图像采集系统
本实验采用高光谱成像仪(四川双利合谱)搭建的户外高光谱图像信息采集系统。高光谱图像采集系统图,如图1所示,包括GaiaSky-mini2机载高光谱成像仪、三脚支架、显示器、置物板和便捷式大功率移动电源等组成。
图1 高光谱图像采集系统
2.1.2 实验样本
实验以2019年贵州省息烽县(黔中地区)、安龙县(黔西南地区)、道真县(黔北地区)和威宁县(黔西北地区)四个地区的的云烟87中部烟叶为研究对象,于7月~8月采集烟叶样本,采集了未熟、成熟、过熟烟叶样本总数共308个,由贵州省烟草科学研究院专家对烟叶样本及其成熟度进行判别。
在烟叶采摘期,选择天气晴朗、无风的天气进行拍摄,适宜拍摄时间为每日10:00-14:00之间。高光谱相机的摄像头与置物板距离为5m~6m,拍摄时将标准白板与烟叶样本拍入高光谱图像中,标准白板数据作为白帧数据,每天拍摄结束时盖上镜头盖采集黑帧数据。
2.2.1 研究方案
本文旨在使用高光谱成像技术判别烟叶成熟度。设计其判别流程图,如图2所示。主要步骤:1)搭建实验户外高光谱图像信息系统,拍摄烟叶的高光谱图像并对图像黑白校正;2)选取鲜烟叶样本的高光谱图像感兴趣区域(Region of Interesting,ROI)并计算ROI平均光谱曲线,进行Savitzky-Golay卷积平滑预处理;3)计算光谱参数,建立PLS-DA模型。
图2 鲜烟叶成熟度判别流程图
2.2.2 高光谱图像校正
高光谱相机采集的光谱图像数据,取决于镜头透过率、光源的强度、光源的光谱、相机的光谱响应效率、光谱仪的衍射效率以及被测物体的光谱反射率。为了消除光照强度不均匀以及成像仪镜头中暗电流所伴随噪声的影响,需要对采集到的高光谱鲜烟叶图像进行黑白校正。黑白校正算法如下式(1)所示:
式中,Sci表示原始样品数据,Dci表示暗背景数据,也称黑帧数据,Wci表示白板数据也称白帧数据。
2.2.3 提取光谱数据及预处理
将经过校正完成的鲜烟叶叶片高光谱图像导入ENVI5.3软件中,利用ENVI5.3软件,对鲜烟叶的感兴趣区域(Region of Interesting,ROI)进行绘制。提取每个样本ROI内所有像素点光谱反射率的平均光谱作为该样本的光谱,统共得到了308个样本,其中未成熟90个,成熟117个,过熟样本101个。
为了消除光谱信息中噪声的影响,在建模前应用Matlab2016a对原始光谱曲线进行预处理来提高模型的精确度。本次采用SG卷积平滑处理,可减小由于随机因素产生的误差,更好地体现出烟叶光谱特征。从308样本中随机抽取208个(60个未成熟、79个成熟、69个过熟)作为模型的训练集,其余的100个(未成熟30个、成熟38个、过熟32个)作为测试集。
2.3.1 光谱指数
从现有的烟叶成熟度研究表明,随着烟叶的成熟程度的提高,烟叶中的叶绿素含量、胡萝卜素与总氮含量会降低,但类胡萝卜素占色素总量的比例会提高,烟碱含量、水分含量等随着成熟度的不同也会存在差异。由不同成熟度鲜烟叶生化成分的不同[13~15],参考文献[16]关于植物光谱指数的论述,指出不同成熟度鲜烟叶中叶绿素含量、类胡萝卜素含量和水分含量的差异,应用文献中的6个光谱指数(Spectral Indices,SIs)作为成熟度判别的参数,如表1所示。研究6个光谱指数与鲜烟叶成熟度间的相关关系,经对比分析后,优选出最相关的3个参数作为判别模型的输入参数。
表1 光谱指数定义和功能描述
2.3.2 可见光光谱参数
对三种成熟度鲜烟叶的光谱在可见光波段不同成熟度的烟叶有明显的区分效果。选取可见光波段红光波段中650nm波段、绿光波段中550nm波段及蓝光波段中450nm波段的光谱信息,建立4个可见光光谱参数用于烟叶的成熟度的判别分析:
偏最小二乘法判别分析(PLS-DA),是一种用于别分析多变量统计分析方法,结合了偏最小二乘回归的属性和分类分析技术的判别能力。在处理时,将样本判别向量(样本有m个类别)转换为n行(n个样本)和m列的虚拟矩阵Y(n×m)。本研究中m为3,代表3个成熟度,每一个样本的判别向量Y为一行三列,即Y=[Y1,Y2,Y3],其中Y1,Y2,Y3分别为未成熟、成熟、过熟烟叶三类烟叶的判别元素。本研究参考文献[17]的PLS-DA方法,通过将虚拟的等级值1、2、3分配给未熟、成熟、过熟烟叶来建立PLS-DA判别模型,并将预测样本的数值代入Y中,其中Y的最大值所对应类别即为该样本的成熟度类别的归类规律,进行预测分类判别,即Y中Y2的数值最大,即判断该样本为成熟烟叶。
3.1.1 预处理
图3为三种不同成熟度鲜烟叶的原始光谱曲线图(图3(a))与SG卷积平滑处理后的光谱曲线图(图3(b))。如图3(b),在SG平滑处理后,光谱曲线在可见光波段去除噪声无明显效果,但近红外波段(780nm~1000nm)去除噪声的效果较好,原始光谱曲线由噪声引起的曲线抖动迹象有了很好的改善,尤其在900nm~1000nm波段消除了大量的噪声。
图3 原始光谱预处理
三种成熟度的鲜烟叶平均在400nm~735nm有明显的区分效果,其中450nm、550nm和650nm光谱反射率统计如表2。从表中可以看出,在450nm、550nm和650nm处不同成熟度鲜烟叶光谱反射率范围间反射率略有交叉,平均值随着成熟度增加而增大。
表2 烟叶可见光谱波段反射率统计
3.1.2 鲜烟叶平均光谱
由图4可以看出,三种成熟度鲜烟叶的平均光谱曲线在400nm~680nm可见光波段具有显著的识别效果。鲜烟叶光谱反射率随着烟叶成熟度的增加而增加,特别在550nm~680nm之间的最为显著。因此,不同成熟等级的烟叶在叶绿素、类胡萝卜素、含水量等存在的差异所造成光谱的不同,可利用鲜烟叶成熟度的判别。
图4 三种不同成熟度鲜烟叶的平均光谱曲线
如图5所示,将6个光谱指数与4个可见光光谱参数进行归一化处理,归一化处理后光谱参数。可以看出三种烟叶样本的10个参数均存在差异,说明了这些参数用于烟叶的成熟度的判别具有可行性。选出mNDVI705、SIPI、VOG3、I1、I2、I3、I4用于鲜烟叶不同成熟度的判别,这7个参数的数值随着鲜烟叶成熟度变化具有一定的线性变化规律,将它们组合为多光谱参数,作为PLS-DA判别模型输入变量的自变量X,分别为X1、X2、X3、X4、X5、X6、X7,即X=[X1,X2,X3,X4,X5,X6,X7]。
图5 归一化后光谱多参数均值统计
以光谱指数(mNDVI705、SIPI、VOG3)和可见光光谱参数(I1、I2、I3、I4)组成的多光谱参数作为烟叶成熟偏最小二乘法判别分析模型(PLS-DA)的特征向量组,将三种不同成熟度作为PLS-DA模型输入变量因变量Y(判别向量)。图6为烟叶样本的判别结果,可以看出30个未熟烟叶中,有29个Y1数值最大,但第7个样本的Y2数值最大,将该样本被误判为成熟烟叶,正确率为96.67%;图6(b)为测试集中38个成熟烟叶中,均为Y2数值最大,38个都判为成熟样本,未出现样本判断错误,正确率为100%;图6(c)为预试集中32个过熟烟叶中,有31个Y3数值最大,但第6个样本的Y2最大,将该样本被预测为成熟烟叶,正确率为98%。
图6 鲜烟叶样本的判别结果
本文利用高光谱成像技术实现了对三种不同成熟度(未熟、成熟、过熟)烟叶分类判别。主要结论如下:
1)烟叶成熟度不同,反映其光谱特性也不相同,植物光谱指数(mNDVI705、SIPI、VOG3)和可见光段参数(I1、I2、I3、I4),用于烟叶的成熟度判别,有良好的判别效果,减少了输入全光谱波段数值的计算量。
2)通过PLS-DA判别方法结合多光谱参数建立了烟叶的成熟度的判别模型和回归方程,分类识别的准确率良好,训练集和测试集判别效果分别为98.56%与98%,说明了PLS-DA算法可实现三种不同成熟度的烟叶的判别。
3)本研究实现了快速、无损地判别烟叶的成熟度,建立了基于高光谱技术的烟叶成熟度判别模型,结合高光谱遥感技术可实现田间烟叶成熟度判别,适熟采收烟叶,提高烤后烟叶的质量。