基于图像信息的烤烟烘烤过程中烟叶含水率预测

2021-12-31 05:23陈飞程杨懿德李常军江厚龙汪代斌
西南农业学报 2021年11期
关键词:标准差烟叶纹理

陈飞程,杨懿德,李常军,杨 洋,冉 茂,鄢 敏,江厚龙,汪代斌*

(1.河南农业大学烟草学院,河南 郑州 450002;2.四川省烟草公司宜宾市公司,四川 宜宾 644000;3.中国烟草总公司重庆市公司,重庆 400023)

【研究意义】含水率是烟叶烘烤过程中的重要指导参数,为烟叶烘烤过程中的变化预测和工艺参数调控提供了重要依据[1]。由于烘烤过程中烟叶含水率具有非线性和时空多变性,且干燥过程受多种参数共同控制,仅靠单一固定模型进行拟合,其适应性和预测精确性的局限性较大[2-6]。【前人研究进展】目前,烟叶含水率测定的方法可分为两类:一类是基于时间序列和统计理论的结合,主要包括烘箱法[7]、快速水分测定法[8]、卡尔费休法[9]和气相色谱法[10]等。另一类是通过物理学微粒性质和运动原理形成的一些新的检测方法,包括微波法[11]、核磁共振技术法[12]和图像技术处理[13]等。近年来,BP神经网络对物料含水率无损预测时,具有较强的适应性和较高的拟合效果,白竣文等[14]基于BP神经网络构建了葡萄气体射流冲击干燥过程中含水率预测模型,实现了葡萄干燥过程中含水率的预测,有效提高了葡萄干燥效率。张利娟等[15]利用小麦真空干燥中的工艺参数作为输入层,构建以小麦含水率为输出层的BP神经网络预测模型,并且该BP神经网络模型能较好地反映小麦真空干燥工艺参数与含水率之间的非线性关系。孙俊等[16]以大米的高光谱数据建立MEA_BP神经网络预测大米的水分含量。宋华鲁等[17]基于双介电参数和变量筛选构建支持向量回归机的预测模型实现对玉米含水率的快速无损检测。【本研究切入点】本研究以烟叶为研究对象,对从鲜烟叶到烘烤结束各关键温度时段烟叶图像进行采集分析,通过提取颜色特征和纹理特征,利用BP神经网络建立烟叶含水率预测模型。【拟解决的关键问题】通过对烟叶含水率进行预测,精准把控烘烤过程中烟叶含水率的变化,为烟叶烘烤过程中含水率的在线预测提供数据参考。

1 材料与方法

1.1 试验材料

本试验于2018—2019年在四川省宜宾市兴文县大坝乡烟草科技园进行。供试烟叶为云烟116品种成熟采收的中部叶。

1.2 试验设计

共采集云烟116烟叶的图像样本196份。鲜烟叶采摘后采集1次图像,然后将其装入密集烤房,按照三段式烘烤工艺烘烤,分别于变黄前期(36 ℃)稳温结束、变黄中期(38 ℃)稳温结束、变黄后期(42℃)稳温结束、定色前期(46℃)稳温结束、定色后期(54 ℃)稳温结束、干筋期(68 ℃)稳温结束时取样(每次取颜色变化均匀一致的烟叶28片)。利用最高分辨率为8256×5504像素水平的Nikon/尼康D850对烟叶的图像进行采集,图像采集时相机模式采用P(Program)档,选用白色背景(方便使用最大类间方差法(Ostu)[18]进行图像分割)拍照时将相机固定在三脚架上,镜头位于样品1 m正上方,同时为了保障光线环境的一致,将采集时将样品置于黑暗环境中以两根40 W的日光灯为照明光源,运用图像处理软件Adobe Photoshop CC 2018手动去除冗杂的信息(图1)。

图1 采集图像的预处理Fig.1 Preprocessing of the acquisition of images

1.3 指标参数

1.3.1 烟叶的颜色参数 采用WSC-3型全自动色差计,参考贺帆等[19]的方法测定烟叶的颜色参数,以横向距离烟叶主脉5 cm处的对称点为测量点,每半片叶等距离测量3个点,测量鲜烟叶这6个点亮度值(L*)、红度值(a*)、黄度值(b*)、饱和度(C*)和色相角(H*)的平均值作为该叶片的颜色指标参数(图2)。

1.3.2 烟叶的纹理特征 用Matlab2018b图像处理工具箱处理所采集的图像样本[20-21],获取图像样本的纹理均值(m)、标准差(σ)、平滑度(R)、三阶矩(μ3)、一致性(U)以及纹理熵(e)等纹理特征值。

(1)

(2)

图2 烟叶颜色特征值测量位点Fig.2 The position of measuring color characteristics

平滑度(R)=1-1/(1+σ2)

(3)

(4)

(5)

(6)

1.3.3 烟叶的含水率 参照行业标准YC/T 311—1996用烘箱法[7]测定烟叶的含水率。

1.4 数据统计分析

采用Excel对数据进行处理分析,采用MATLABR2018b中NEWFF神经网络工具箱进行BP神经网络模型的构建和运行工作。选取决定系数R2和均方根误差RMSE作为拟合评价指标[14],R2越大、RMSE值越小,则拟合越好。

(7)

(8)

式中,FWexp,t为烘烤试验实测的第t个含水率;FWpre,t为利用神经网络预测的第t个含水率;N为试验测得数据的个数。

2 结果与分析

2.1 不同时段的烟叶颜色特征变化

由表1可知,鲜烟叶的红度值为负值,表明鲜烟叶的主体颜色是绿色,随着烘烤的推进,烟叶的红度值逐渐由负值转为正值,这是因为烟叶的主体颜色由绿色转为黄色,所以烟叶在变黄期黄度值逐渐增加,并且在变黄后期色相角由负值突跃为正值,代表人眼对颜色的感觉由绿色转成了黄色。烟叶图像亮度值变化介于40~73,在变黄前期达到最大值后逐渐减小,在定色前期亮度值先增大后减小;烟叶图像红度值变化介于-14~14,且在变黄阶段快速上升;烟叶图像黄度值和饱和度变化介于35~55,在变黄后期达到最大值后逐渐减小;烟叶图像色相角变化介于-85~88,负值为人眼对绿色的感觉,从鲜烟叶到干筋结束的推移过程中,负值减小转为正值的过程即为烟叶颜色由绿转黄,在变黄后期达到最大值后逐渐减小,这是因为烟叶在变黄后期变黄程度达到最高后红度值与之增加与黄度值混合形成橙色的过程。

2.2 不同时段的烟叶纹理特征变化

如表2所示,平滑度是图像灰度的均匀性,值为0-1代表平滑-不平滑,烟叶在变黄阶段和定色前期叶片表面相对光滑、纹理较细,鲜烟叶纹理较清晰,定色后期至干筋期烟叶皱缩粗糙,所以烟叶烘烤前期平滑度比鲜烟叶和烘烤后期小。纹理熵是图像所具有的信息量的度量,表示图像中纹理的非均匀程度或复杂程度,值越大纹理越混乱、粗糙,烘烤后期烟叶纹理不规则、混乱度大,所以纹理熵值明显大于烘烤前期。纹理平均值灰度反映了图像灰度整体的亮暗,值越高代表越亮,标准差反映了该图像的亮暗差异。在烘烤定色后期和干筋期,烟叶卷曲与皱缩程度最大,所以这2个阶段的纹理平均值、标准差最大。三阶矩反映直方图偏斜度的度量,对称为0,右偏斜为正,左偏斜为负;一致性反映度量一致性,值越大越好。不同时段间的三阶矩和一致性差异显著。由此可知,以上6个纹理特征数据均可对不同时段的烟叶图像的纹理信息进行了描述,能较好地反映烟叶的纹理特征。

表1 不同时段烟叶的颜色特征

表2 不同时段烟叶纹理特征的变化

2.3 BP神经网络模型的设计

2.3.1 训练样本集的选择 为了加速BP神经网络的运算效率,利用因子分析的主成分法从烤烟颜色特征指标L*、a*、b*、C*、H*及纹理特征指标平均值、标准差、平滑度、三阶矩、一致性和熵11个表观指标中筛选出烤烟表观特征的6个代表性影响因子L*、a*、b*、平均值、标准差和纹理熵(表3)。从因子的载荷值可以看出,因子1主要反映了烟叶变黄程度的影响,可以用黄度值b*为代表;因子2主要反映了烟叶表面纹理复杂程度,可以用纹理熵为代表;因子3主要反映了烟叶表面褐变程度,褐变反映于红度值的深浅程度,因此选取a*为代表;因子4主要反映了烟叶纹理标准差的变化;因子5主要反映了烟叶纹理均值的变化;因子6主要反映了烟叶亮度值L*的变化。

表3 烟叶的表观特征值的因子载荷

表4 隐含层神经元个数及其仿真训练结果

图3 烟叶含水率的BP神经网络模型网格结构Fig.3 Grid structure of BP neural network model of tobacco moisture content

2.3.2 BP神经网络数据分析与模型设计 根据因子分析从11个颜色和纹理特征值中筛选出的L*、a*、b、平均值、标准差和纹理熵6个优度因子作为输入向量层,输入层神经元个数即为6个。输出层是不同时段烟叶的实时含水率,因此输出神经元个数即为1个。通过premnmx函数对输入样本数据和输出样本数据进行归一化以消除量纲影响。网络的输入层与隐含层之间的传递函数为正切S型函数,为了逼近网络的精度隐含层与输出层的传递函数为线性传递函数,因此本研究选择tansig-purelin组合作为该网络的传递函数。为了避免神经网络训练一定程度出现网络麻痹现象,采用LM算法的trainlm作为网络训练函数,提高网络的收敛速度和泛化能力。

2.3.3 隐含层节点数的选择 隐含层神经元个数会影响到网络精度和训练时长。隐藏层的节点数一般采用Kolmogorov定理(隐藏层=2×输入层个数+1)和多次尝试的方式获得,本文分别选取了5、7、9、10、11、13、15作为隐含神经元个数,对所建预测模型进行训练,通过对比训练精度和训练时间,具体如表2所示。隐藏层节点数为13时有最优的训练效果。综合以上分析,采用6-13-1结构的BP神经网络模型对烤烟含水率进行预测,网络模型结构图如图3所示。

2.3.4 模型的训练与测试 按照上述神经网络结构和参数,学习速率设置为0.001,随机选择的165组数据作为训练样本,经过15次训练停止,均方误差值达到0.0031。用得到模型对余下的31组测试样本集进行测试。经对比,预测含水率与实测含水率最大偏差为0.0459(图4),决定系数R2为0.9886,均方根误差RMSE为0.0191。

2.3.5 模型的验证 为进一步验证模型的准确性,测量从鲜烟叶到干筋结束的干燥曲线,并与BP神经网络预测值进行对比,。除干燥初始预测值与实测值稍有偏差外,其余预测值(特别是干筋期)几乎与实测值重合(图5)。经计算,预测值与实测值之间的决定系数R2为0.9987,均方根误差RMSE为0.0118,其较高的预测精度说明BP神经网络模型能够较好地预测烟叶在不同时段的含水率。

3 讨 论

本研究利用机器视觉技术定量烟叶的表观特征,通过烟叶的色差参数和纹理特征指标量化烟叶的外观特征。烟叶的颜色、纹理特征的变化不仅可以判断烟叶的成熟度和烘烤特性的重要依据[2,22-23],同时也是衡量烟叶水分变化的重要指标[24]。本研究量化烟叶颜色指标采用的是CIE- L*a*b*图像模式,相较于RGB图像模式,其色域广,能更大程度地体现图像颜色信息,并且做到明度与色度的有效分离,有效避免因环境的亮暗变化影响样品图像色彩信息,能更好反映不同时段烟叶图像变化的颜色敏感性。

图4 烤烟测试组含水率预测Fig.4 Water content prediction of flue-cured tobacco test group

烟叶的L*、a*、b*、C*和H*值均在变黄阶段出现不同程度的上升,其原因主要是烟叶的主体颜色在变黄阶段颜色由绿色转变为黄色,亮度值L*因为主体颜色的转变,在变黄前期烟叶表面的浅色系对光的吸收减少且反射增加,故而L*值达到最大值,并随着表面黄色系的加深逐渐减小,黄度值b*在变黄阶段呈现剧烈的上升,故而饱和度C*的值在变黄阶段逐渐上升,红度值a*和色相角H*由代表绿色的负值向代表黄色的正值转变;在定色前期烟叶进一步变黄后将黄色固定,在此阶段烤烟叶片失水较少,烟叶表面较为光滑且黄色也较为鲜亮,因此在定色前期烟叶L*、a*继续增大并且H*达到最大值;定色后期烟叶失水程度增加,烟叶表面出现不同程度的皱缩,烟叶黄色变得较为暗淡,因此烟叶除了a*值继续增加,L*、b*、C*和H*值均有所减小;干筋期烟叶主脉失水,叶片全干,烟叶皱缩最为严重,叶片颜色进一步变暗转变为橙色系,所以干筋期烟叶a*值继续增加逐渐接近红色系范围,L*、b*、C*和H*值均再次减小。

烟叶纹理特征中的平滑度呈现出不平滑、叶片的直方图偏斜度从总体左偏移逐渐对称再向右偏移和烟叶纹理度量值相一致的结果与张丽[25]的研究结果一致。本研究中烟叶纹理特征的灰度平均值和标准差这两个关键指标,可以有效减小和校正测量烟叶色差参数时因环境光线的多变性对所测定的指标数据的误差,减少BP神经网络模型训练过程中的逆传播修正,加快模型的运行的速度,其重要性在因子分析的因子能荷得以体现。

a、b、c、d、e、f、g分别为鲜烟叶、变黄前期、变黄中期、变黄后期、定色前期、定色后期、干筋期a,b,c,d,e,f and g were fresh tobacco leaves,earlier stage of yellowing,middle stage of yellowing,later stage of yellowing,earlier stage of set color,later stage of set color,and stem-dry stage,respectively图5 烤烟含水率预测值与实测值比较Fig.5 Comparison of predicted and measured values of flue-cured tobacco moisture content

鲜烟叶颜色为绿黄相间,图像混乱度较高,沟纹明显;在变黄阶段烟叶逐渐由绿转黄,烟叶失水程度不高,叶面相对平滑,亮暗差异较小,纹理度量简单且均匀,故而平滑度趋于平滑范围,纹理标准差、一致性和纹理熵值较小且随着失水程度增加逐渐增大;变黄后期烟叶接近或达到全黄,此时烟叶一致性达到最大值;定色前期,烟叶叶片失水增加,叶片卷曲皱缩,图像亮暗差异明显,纹理度量相对复杂,因此烟叶纹理均值减小,标准差和纹理熵逐渐增大,平滑度趋于不平滑,三阶矩表现为不同程度的偏移;定色后期之后烟叶含水率较少,叶形皱缩卷曲,叶面粗糙图像纹理复杂,沟纹逐渐明显,因此,烟叶图像标准差、平滑度和纹理熵逐渐增大,纹理平均值逐渐减小。

常规的线性分析模型很难准确地建立作物表观信息与含水率间的关系[26],本研究通过提取烟叶的颜色指标和纹理特征,并将其作为BP神经网络的输入层对烟叶的含水率进行模拟,在样本训练与验证过程中模型的均方根误差分别为0.0191和0.0118,其输出的模拟值准确度优于甘露萍[24]和段史江等[27]对烟叶含水量无损检测结果。含水率预测模型的拟合程度和输出的预测值与真实值的决定系数说明该模型可以实现对含水率的精确估测,这与詹攀等人[27-28]研究结果一致。

4 结 论

为了精准预测不同时段烟叶中含水率,本研究以烟叶颜色和纹理特征指标为输入层构建了结构为“6-13-1”的BP神经网络模型,以因子分析筛选优度因子,以tansig-purelin组合作为该网络的传递函数,采用L-M算法为训练函数,结果表明BP神经网络模型能够很好预测烟叶含水率。BP神经网络可以将表现烟叶含水率的指标包含于1个模型之中,具有较好的便捷性和精确性。受限于本研究所采集的样本品种部位单一,网络的覆盖面和适应性有所影响,因此本研究还需要进一步优化品种和部位研究,以进一步提高模型通用性。

猜你喜欢
标准差烟叶纹理
河北烟叶含青率偏高的原因分析及应对措施
上部烟叶一次性采摘按叶位分置烘烤对烟叶质量的影响
贵州主产烟区烤烟上部烟叶质量的差异
订正
基于BM3D的复杂纹理区域图像去噪
浅谈提高罚没烟叶利用率的途径
肺纹理增多是病吗?
过程能力指数法在改进中小学教学质量中的应用
TEXTURE ON TEXTURE质地上的纹理
消除凹凸纹理有妙招!