路晓崇,杨 超,王松峰,鄢 敏,杨 洋,彭玖华,郑小雨,杨懿德*
1.河南农业大学烟草学院,郑州市金水区文化路95号450002 2.中国烟草总公司重庆市公司,重庆市江北区五江路20号400023 3.中国农业科学院烟草研究所 农业部烟草生物学与加工重点实验室,山东省青岛市崂山区科苑经4路11号266101 4.四川省烟草公司宜宾市公司 四川省宜宾市叙州区南岸街道戎州路4号644000
烤烟采收成熟度的判别是烤烟品质彰显的重要前提,而当前成熟度的判断主要通过个人经验进行,由于每个人的判断标准不同,因此在烤烟田间采收成熟度判别的准确性方面存在差异[1-3]。此外上部叶烘烤难度大[4-5],更需对烤烟上部叶的田间成熟度进行研判。有关烤烟采收成熟度判断已有一些研究报道[6-8],李佛琳等[8]利用SPAD-502叶绿素计研究烤烟鲜烟叶的成熟度量化判别,建立了烟叶成熟度的叶绿素计读数模型TMDSPADV,利用该模型的判别分类与人工判断的成熟度分类符合率达到91%;汪强等[9]构建了烟叶图像HSV颜色特征值与烟叶成熟度之间的关系模型TMDHSV,所建立模型判断的准确率较高;王杰等[10]利用稀疏自编码器对烟叶成熟度进行分类,测试数据分类准确率达到98.63%;刘剑君等[11]针对烤烟田间成熟度指数提出了一种基于数字图像处理的计算方法,用该方法计算出的成熟度指数与人工感官识别烟叶成熟度关联度较高;梁寅等[12]基于烤烟田间成熟度的光谱特征,运用支持向量机建立了识别烟叶成熟度的数学模型,分类精度均在90%以上。而这些研究通常是通过将样本采集后带回实验室,再对烤烟图像进行采集处理,图像采集需要固定光源提供拍摄照明,由于多数试验田与实验室有一定距离,天气温度、田间滞留时间、环境湿度等对烟叶的形态与颜色均会产生一定影响。为此,以烤烟上部叶为研究对象,在烟叶采收前对田间烟叶图像进行采集分析,并提取颜色特征值和纹理特征值,建立基于BP神经网络的烟叶成熟度鉴别模型,以期为烤烟成熟度的智能化判断提供依据。
试验于2018年在重庆市彭水县润溪乡烟草基地单元进行。供试土壤为黄壤土,移栽期为4月15号,土壤基本理化性状:pH 5.48,有机质11.45 g/kg,全氮0.72 g/kg,碱解氮55.00 mg/kg,速效磷15.01 mg/kg,速效钾160.00 mg/kg。试验田前茬作物为油菜,供试品种云烟87。按当地优质烟叶生产技术规范进行栽培管理。
上部叶烤烟图像的采集位置为从上至下第4叶位,拍照时选择晴朗的天气,为避免阳光光照强度太强对图像质量的影响,图像采集时间为上午5∶30—8∶30和下午17∶00—19∶00,选取能代表当地种植水平的烟田670 m2。以行为单位,从田边第1行第1株起到最后1株止,舍弃没有烘烤价值的病叶和衰老叶,由当地长期从事生产的专业技术人员鉴别烟叶成熟度并记录结果。利用Nikon D850相机对不同成熟度上部叶烤烟的图像进行采集,图像采集时相机模式采用P(Program)档。共采集图像样本385份,其中欠熟样本117份,尚熟样本179份,适熟样本68份,过熟样本21份,并随机编号,不同成熟度烤烟的外观特征见表1。
表1 不同成熟度烤烟的叶面特征.Tab.1 Leaf surface characteristics of flue-cured tobacco with different maturity
用MATLAB2018b图像处理工具箱对所采集图像的L*、a*、b*、C*和H*等颜色特征值[14]与纹理能量、纹理相关度、纹理惯性矩以及纹理熵等纹理特征值进行获取[15]。为了方便建立神经网络模型,将欠熟档次烤烟样本定义为“1”,尚熟档次烤烟样本定义为“2”,适熟档次烤烟样本定义为“3”,过熟档次烤烟样本定义为“4”。此外随机选取总样本中的320份样本作为训练集,余下65份样本作为模型验证,建立神经网络模型。
烤烟的颜色特征值采用国际照明委员会(Commission Internationale de l´Eclairage,CIE)CIE-L*a*b*色度空间指标进行表征[16]。明度值(L*)表示图像的明亮程度,从纯黑到纯白,取值范围是0~100;红度值(a*)表示从红色到绿色,取值范围是-128~127;黄度值(b*)表示从黄色到蓝色,取值范围是-128~127;饱和度(C*)表示颜色的浓淡程度,取值范围为0~100%;色相角(H*)表示各类色彩的相貌,取值范围为-π~π。
烤烟的纹理特征值包括纹理能量:反映图像灰度的分布程度与纹理粗细度,能量越大,纹理越细腻光滑;纹理熵:反映图像中纹理的非均匀程度或混乱程度,值越大混乱度越高;纹理惯性矩:反映图像灰度复杂程度,其值越大,图像沟纹越明显;纹理相关度:反映图像纹理的一致性,值越大一致性越好[17]。
计算公式:
式中:μ表示灰度共生矩阵所有元素的均值;σ表示灰度共生矩阵所有元素的方差;N表示图像灰度级数;pij表示归一化后的灰度共生矩阵元素,i,j=1,2,…,N。
试验数据采用Origin2019b软件做出不同成熟烤烟各参数的分布图,采用MATLAB2018b进行颜色特征值与纹理特征值的采集以及BP神经网络的建立。
图1 烤烟上部叶纹理特征值的变化Fig.1 Changes in texture characteristic values of upper flue-cured tobacco leaves
由图1可知,上部叶的纹理能量、纹理惯性矩以及纹理相关度均表现为过熟>适熟>尚熟>欠熟,而纹理熵则表现为欠熟>尚熟>适熟>过熟。欠熟烟叶的纹理能量在0.138~0.172之间,纹理惯性矩在0.145~0.176之间,纹理相关度在0.283~0.302之间,纹理熵在2.78~3.42之间;尚熟烟叶的纹理能量在0.168~0.199之间,纹理惯性矩在0.166~0.213之间,纹理相关度在0.301~0.324之间,纹理熵在2.43~3.21之间;适熟烟叶的纹理能量在0.185~0.223之间,纹理惯性矩在0.188~0.237之间;纹理相关度在0.322~0.346之间,纹理熵在1.533~2.743之间;过熟烟叶的纹理能量在0.184~0.355之间,纹理惯性矩在0.223~0.254之间,纹理相关度在0.331~0.369之间,纹理熵在1.584~2.473之间。且各成熟度烤烟纹理特征值范围均有一定程度的交叉,尤其是成熟档次的纹理熵与过熟档次出现较多的重合,表明不同成熟度间的纹理特征值存在一定的相似之处,但总体上表现为纹理能量、纹理惯性矩、纹理相关度随着成熟度的提高而增加,纹理熵随着成熟度的提高而降低,且不同成熟度烤烟纹理特征值的差异较大。
由图2可知,不同成熟度烤烟的颜色特征值均表现为过熟>适熟>尚熟>欠熟,其中上部叶欠熟烟叶的L*值在38.6~39.8之间,a*值在-7.3~-6.0之间,b*值在42.7~43.8之间,C*值在29.7%~30.8%,H*值在-0.28~-0.22之间;而尚熟烟叶的L*值在39.6~41.1之间,a*值在-6.3~-4.9之间,b*值在43.6~44.7之间,C*值在30.7%~32.1%之间,H*值在-2.0~-0.12之间;适熟烟叶的L*值在40.7~41.2之间;a*值在-2.2~-4.0之间,b*值在43.7~45.8之间,C*值在31.8%~32.8%之间,H*值在-0.16~-0.6之间。过熟烟叶的L*值在41.5~44.1之间;a*值在-3.9~-1.9之间,b*值在45.1~47.8之间,C*值在31.2%~33.8%之间,H*值在-0.16~-0.8之间。可见,不同成熟度间的各颜色参数的差异较大,表明随着烤烟田间成熟度的提高,烤烟的颜色特征值逐渐增加,且不同成熟度烤烟的颜色特征值存在较大差异。
图2 烤烟上部叶颜色特征值的变化Fig.2 Changes in color characteristic values of upper flue-cured tobacco leaves
2.3.1神经网络的拓扑结构
以不同成熟度烤烟上部叶的L*、a*、b*、C*和H*等5个颜色特征值以及纹理能量、纹理熵、纹理惯性矩和纹理相关度等4个纹理特征值作为网络模型的输入值,以对应的烤烟田间成熟度的成熟档次作为输出值。经过反复训练将网络模型的隐含层的单元数确定为11,采用MATLAB2018b建立拓扑结构为9-11-1的BP神经网络模型,见图3。
2.3.2 神经网络的训练过程及误差分析
由图4可知,当所建立的网络模型迭代次数为5时,模型开始收敛,网络训练下降梯度达到0.005 542,权值误差保持在1×10-5,动量达到1×10-6,可知所建立的网络模型在迭代5次之后,便趋于稳定,各指标误差保持在较低水平,以上表明所建立的网络模型在甄别不同田间成熟度烤烟上部叶方面有较好的效果。
2.3.3 BP神经网络模型训练效果
由图5、图6可知,训练样本的预测值与实际值的决定系数均达到0.985 5,验证样本的预测值与真实值的决定系数达到0.981 6,表明所建立的网络模型能够很好地对烤烟的田间成熟度进行分类识别,在烤烟生产中可以运用此网络模型对烤烟的田间成熟度进行鉴定与识别。
图3 烤烟田间成熟度神经网络模型拓扑结构Fig.3 Topological structure of neural network model for field maturity of flue-cured tobacco
图4 烤烟田间成熟度BP神经网络模型训练结果Fig.4 Training results of BP neural network model for field maturity of flue-cured tobacco
图5 训练样本模拟值与真实值对比Fig.5 Comparison of simulated and real values of training samples
图6 验证样本模拟值与真实值对比Fig.6 Comparison of simulated and real values of verification samples
本试验中发现,烟叶颜色特征值与纹理特征值是烤烟成熟度判断的主要依据,尤其是颜色特征值中,L*值、a*值以及b*值差异最为明显,随着成熟度的提高,L*值与b*值均表现为逐渐增加的趋势,这与宋朝鹏[18]的研究结果一致;此外虽然本研究中a*值同样表现为随成熟度的增加而逐渐增加的趋势,但与宋朝鹏[18]的研究结果存在差异,这可能是由于选取样本的部位不同所致。在纹理特征值中,除纹理熵随着烤烟成熟度的增加逐渐降低外,其余3个纹理指标均随着烟叶成熟度的提高而逐渐升高,这与史龙飞等[19]的研究结果一致。
BP神经网络模型在模拟人脑思维的基础之上,以其较好的自适应性在多个行业广泛应用[20-23]。本研究中发现,以烤烟上部叶颜色特征值与纹理特征值为输入并以成熟度为输出值所建立的网络模型,能较好地识别烤烟上部叶的成熟度,训练样本的预测值与实际值的决定系数达到0.985 5,验证样本的预测值与实际值的决定系数达到了0.981 6,与谢滨瑶等[24]等的研究结果相比,虽然所选取的表征颜色特征值的色度空间不同,但同样得到了较高的准确率,可见依据烤烟颜色对田间成熟度进行判断效果较好。然而由于本试验中样品图像的采集是由一台相机在晴天上午5∶30—8∶30和下午17∶00—19∶00进行的,而实际生产中光照、空气湿度、采集时间等因素均会对图像品质产生一定影响,因此还需要进一步优化算法,减少或修正外界因素的影响。
烤烟上部叶的颜色特征值随着田间采收成熟度的提升逐渐增加,纹理特征值中除纹理熵随着成熟度的增加逐渐降低外,其余3个纹理指标均随着成熟度的增加而逐渐升高,且不同成熟度烟叶各指标差异较大;建立的成熟度识别网络模型训练样本的预测值与实际值的决定系数达到0.985 5,验证样本的预测值与实际值的决定系数达到0.981 6。因此,利用烤烟颜色特征值与纹理特征值建立的BP神经网络模型能够较好地识别烤烟上部叶的田间成熟度。