张富贵 叶 磊 李德伦 吴雪梅
(1.贵州大学机械工程学院 贵阳 550025)(2.贵州省烟草科学研究院 贵阳 550025)
油分是我国烟叶分级的主要评价因子之一,烟叶油分含量高低将直接影响烟草商品的好坏。长期以来,传统的烟叶油分特征评价形式都是依靠烟叶分级人员及手摸、眼看、鼻闻的方式来进行,其中“手摸”即利用手指表面与烟叶表面接触,通过烟叶表面局部纹理对皮肤的振动刺激来获取烟叶的表面特征,然后通过烟叶分级人员的感官感受结合自身经验对烟叶油分特征指标进行评价。由于在收购环节全部采用人工评判,存在标准不一、受烟叶分级人员自身经验影响较大等问题,给烟草分级行业的发展带来了不良影响[3]。
目前对于烟叶油分指标的研究大部分集中于烟叶物理形态以及化学成分的定性评估。李章海等[4]探讨了烤烟的油分对烟叶外观品质的影响,指出油分含量的多少对其物理形态影响显著;蔡宪杰等[5]利用一系列数据分析手段对烤烟外观质量与烟叶油分进行分析,结论显示烟叶油分对烟叶外观质量的贡献率高达35.536%;袁奎[6]利用机器视觉手段,基于烟叶的颜色特征间接建立了烤烟油分分级模型;周汉平等[7]采集了不同波长范围的NIR 烟叶的光谱数据,创建了烟叶的NIR 预测模型,并指出油分预测模型在16 阶时,预测模型的准确率最高,上述方法虽然可以实现烤烟油分的定性分析,但是无法给出准确的油分等级预测结果。在实际分级应用中局部纹理往往是影响油分指标评判结果的关键。鉴于此,建立烤烟叶面微观纹理与油分特征之间的关系模型,利用更为细致的纹理特征对油分特征等级进行评价,对进一步推进烤烟多品质因数融合分级有重要意义。
现代社会人工神经网络的发展迅速,对于复杂非线性问题的处理,BP 人工神经网络具有相对优势,因其具有的自学习、快速寻优解等优点被广泛应用[8]。本研究以贵州安顺平坝烟区烤烟样品为研究对象,基于LBP—GLCM 融合算法提取烤烟表面纹理特征,并创建烟叶微观纹理特征库,联合MATLAB2018 提供的BP 人工神经网络模型,对烤烟油分等级进行预测,旨在为烤烟油分等级评价提供一种新方法。烤烟油分等级预测方法流程图如图1所示。
图1 烤烟油分等级预测方法流程图
采集2019 年贵州安顺平坝烟区初烤烟叶样品,品种为云烟87。按照我国烤烟标准(GB/T2635-1992)规定由分级专家进行严格挑选,从采集的样品中选出符合国家标准的油分含量为“多”的烟叶15 张,含量为“有”的烟叶60 张,含量为“稍有”的烟叶30张,共计105个样本。
在待测烟叶样品的相同位置(烤烟叶面总长1/2 处,距离主脉1cm~2cm)截取面积大小为1cm2的叶片区域,为避免烟叶支脉对后续纹理特征提取的影响,截取样本时应避开含有支脉的区域。通过光学显微镜观测烟叶样品表面纹理,放大倍数为100倍,并利用上海奋业光电有限公司型号为ISH1000的1000W 像素彩色摄像机,扫描模式为逐条扫描,帧率为3fps,图像保存格式为TIF,图像分辨率为3648×2748。
采用Matlab2018 软件进行图像特征的提取以及BP神经网络建模分析。
1)LBP算子
LBP 算子具有灰度不变性和旋转不变性等优点,常常被用来描述灰度图像局部纹理特征[9]。LBP 算子的基本原理是在灰度图像中3*3 个像素的矩形图像区域内,将像素区域中心点的灰度值视为该矩形区域阈值,并与四周8 个像素点区域的灰度值做差运算,若差值大于零则记为1,反之为0,然后将得到的8 位二进制数值顺时针读取,作为该局部区域的纹理值[9]。
由于传统LBP算子的像素范围是不能变化的,因此当图像旋转或大小变化时,传统LBP算子往往不能满足不同区域的纹理特征提取。Ojala 等提出了以圆形代替矩形区域,该圆形区域允许包含无限个像素点,它是指当一个LBP算子的二进制特征值被视为首尾相连环形时,至多可以存在两次由0 到1 或者是1 到0 的跳变,该算子被称为LBP 算子均匀模式[10]。均匀化LBP 算子不但可以降低灰度图像的特征向量的维数,防止内存空间的浪费,而且可以提高运算速度,减少纹理信息的损失。
2)灰度共生矩阵(GLCM)
20 世纪70 年代初R.Haralick 等提出一种描述灰度图像的纹理特征统计方法—灰度共生矩阵(GLDM),其原理就是统计灰度图像中某个固定像素点的灰度值与相隔距离为d,位置方向为θ的像素点的灰度值在图像区域内出现的概率Pij,其中θ取值为0°,45°,90°,135°[11]。
灰度共生矩阵本身是不能用来描述纹理特征的,需要利用数学计算方法从矩阵中得到一些反映矩阵状况的参数。本文采用能量,熵,对比度,同质性这几种典型参数的均值和标准差来表征纹理特征,从而达到简化计算,提高分类精度[12]。参数说明计算公式如下:
(1)能量:灰度共生关系矩阵元素值的平方和,反映一个灰度图像灰度值分散程度是否均匀,以及纹理的粗细程度,较大的能量值表明,目前的纹理较为稳定,变化相对有规律。其计算公式为
(2)熵:用来表示灰度图像像素的随机性,因此熵值表明了图像灰度分布的复杂程度,当熵值较大时,图像往往较复杂。其计算公式为
(3)对比度:反映图像的清晰度和纹理的起伏差异。纹理越深,对比度越大,越清晰;反之,对比度值小,则纹理浅,就越模糊。其计算公式为
(4)同质性:反映图像的灰度级同一方向上的相似程度,局部灰度相关性的差异依靠同质性值反映,值越大,相关性也越大。其计算公式为
其中:
3)LBP-GLCM特征提取
首先将烤烟微观纹理图像中的每个像素点进行LBP 算子处理,获得LBP 图像,如图2 所示,再对得到的LBP 图像进行灰度共生矩阵运算(GLCM),得到d=1,θ取值分别为0°、45°、90°、135°,4个不同方向灰度共生矩阵,最后计算各个灰度矩阵的能量、对比度、熵、同质性的均值和标准差,得到8 个LBP-GLCM纹理特征[13]。
图2 原始图像与LBP图像
BP 神经网络是一种多层前馈神经信息网络,包括输入层,隐含层和输出层。神经元信号通过正向传播从输入层进入隐含层,经过各级隐含层处理后向输出层传递,其中隐含层的与输出层节点为上级节点的输出的加权和。将输出层的输出值与期望值相比较,若产生的误差不满足模型所设置的精度要求,则误差反向传播,经原路返回并逐层修改各层神经元权值,降低输出误差,循环上述过程直至输出层的结果符合精度要求为止。且隐含层同层级之间的神经元与其上下层级的所有神经元相互连接,同层级神经元之间相互独立[14]。激励函数的选择决定每个神经元节点的激励程度,常用的激励目标函数主要是Sigmoid激励函数。其网络拓扑结构如图3所示。
图3 BP神经网络拓扑结构模型
设输入样本特征为(Xq1,Xq2,…,Xqn),其中q =1,2…m 表示样本数量;输出为O。对于这m 个样本,定义误差函数为e,其计算公式为
式中O(i)为样本X(i)的网络输出值,Y(i)为期望输出值。
BP 神经网络经过一次迭代后根据反馈的误差值来更新网络的权值和阈值。
式中α为学习速率,取值范围为0~1之间。
当预期的误差e达到期望的要求时,BP神经网络模型为最优模型。
1)输入层
本模型采用的输入变量为不同油分含量共105 组烤烟样本微观图像的能量、对比度、熵、同质性的均值和标准差等8个特征。
2)输出层
对样本烟叶的油分指标多、有、稍有分别定义标签为3、2、1,如表1 所示。数值的大小代表烟叶油分含量对应的等级,数值越大,油分含量等级越高,反之越低。因此输出端神经元节点数为1个。
表1 油分含量等级表
3)隐含层节点数
由以上分析可知输入层神经元节点数为8 个,根据Kolmogrov 定理[14],BP 神经网络隐含层神经元节点的数可以选择为2n+1,其中n为输入层神经元节点的个数,故隐含层神经元节点数为17个。
烤烟油分预测的神经网络模型构造如图4,输入变量分别对应上述描述的8 个烟叶样本微观纹理特征,输出变量的值对应烟叶油分含量等级多、有、稍有的标签值。
图4 预测模型结构
4)数据归一化
考虑到隐含层激励函数的输出范围是0~1 之间,而输入数据的单位量级不一,会导致数据范围差异很大而忽略某一特征对输出值的贡献,导致预测结果不准确。数据范围差别较大时,也会导致网络收敛速度慢,训练时间长等问题[15]。因此,对原始数据进行归一化处理是十分必要的。归一化公式为
式中,Xn为原始输入数据;Xmin为原始输入数据最小值;Xmax为原始输入数据最大值;Yn为原始输出数据;Ymin为原始输出数据最小值;Ymax为原始输出数据最大值。
实验中采用LBP-GLCM 算法提取第2 节中的105 组烤烟样本的纹理特征,并将样本数据随机分成75 组训练集,30 组测试集,导入BP 神经网络模型中进行仿真训练,根据网络输出值对烤烟油分预测。其中规定输出值小于1.5 时属于油分含量“稍有”的烟叶,即油分标签值为1;输出值大于1.5,小于2.5 时属于油分含量“有”的烟叶,即油分标签值为2;输出值大于2.5 时属于油分含量“多”的烟叶,即油分标签值为3。图5为本文方法提取的纹理特征经BP神经网络模型训练后取得的预测值与实际值对比,横坐标表示测试样本数量共30 组,纵坐标表示油分类别标签,结果表明基于本文方法的预测准确率为93.33%。
图6 为两种特征提取算法提取的纹理特征经BP 神经网络训练完成后模拟值与目标值之间的回归分析统计图,其中横坐标表示目标值,纵坐标表示预测网络模型的模拟值,虚线为Y=X,即模拟值与目标值一致的情况,实线表示测试数据目标值与模拟值之间的拟合程度。结果表明基于本文方法的相关系数R=0.91486。由此可见基于本文预测模型的模拟值与目标值十分近似,模型模拟效果较好。
图6 基于本文方法的目标值与模拟值回归分析
本文针对烤烟分级中烟叶油分特征等级评判问题,利用LBP-GLCM 算法对烤烟表面微观纹理图像进行特征提取,以BP人工神经网络为分类器,对105 组烟叶图像进行分析,建立了烤烟烟叶表面微观纹理与油分之间的预测模型。结果表明:采用LBP-GLCM 结合BP神经网络进行烟叶油分等级预测的准确率为93.33%,且模型拟合效果较好,在烤烟油分预测应用中具有一定的参考价值,为进一步推进烤烟多品质因数融合分级提供了理论基础。