魏甲欣,李琪,马飞,丁美宙,靳亚伟,王艺斌,许文武,王小明
1.河南中烟工业有限责任公司 许昌卷烟厂,河南 许昌 461000;2.河南中烟工业有限责任公司 技术中心,河南 郑州 450000;3.南京焦耳科技有限责任公司,江苏 南京 210000
烟丝是卷烟配方的重要组成部分,烟丝结构及烟支中薄片丝、梗丝、叶丝的组分含量是评价卷烟烟丝物理特性的重要指标[1-2]。目前烟草企业对烟丝结构的检测仍普遍采用振动分选筛,生产实践中烟丝组分的鉴别也依然依靠手工分选和人为判读,这种人工识别法采样周期长,数据实时性差且步骤复杂,不同人员的检测结果之间存在较大误差,随着工作量的增加,测量效率和精度已经难以适应现代化的检测需求和高品质卷烟的生产要求。此外,人工识别法中有机溶剂的使用也增加了实验过程中的防护难度,不利于检测人员的身体健康。因此,快速准确地测定烟丝结构和烟丝组分,对鉴别真伪烟草制品、考查配方设计特性、稳定烟丝混合工艺质量及同质化生产具有重要意义。
近年来有学者通过图像识别技术来检测烟丝结构和烟丝组分[3-6],楚晗等[4]研究了烟丝结构分布及其对物理品质的影响差异,实验结果表明,通过控制长丝率和碎丝率,适当增加中长丝和短丝比例,可提升短支卷烟的物理品质;郭三刺等[5]采用中值滤波对烟丝图像进行预处理,通过边缘提取计算烟丝的各个特征值进而实现烟丝结构检测,证明了图像处理技术用于烟丝结构检测的可行性;钟宇等[6]提出一种基于残差神经网络的烟丝组分分类识别的方法,但该方法对于宏观差异不明显的烟丝组分识别效果较差。
由于加工方法和原料本身特性的差异,烟丝不同组分间存在颜色、形态的差异,为图像识别方法检测各组分提供了特征参数。鉴于此,本文拟基于图像识别技术,建立烟丝面积与质量的拟合模型,统计烟丝结构参数,利用烟丝轮廓在饱和度(Saturation, S)通道上的颜色方差及HSV颜色模型的颜色矩,构建薄片丝、梗丝、叶丝的烟丝组分分类模型,以提高烟丝结构检测和烟丝组分分析的准确率,实现对烟丝掺配精度的快速准确判断。
主要材料:黄金叶品牌某型号卷烟的成品烟丝A,混合烟丝B、C、D,河南中烟工业有限责任公司提供。混合烟丝组分构成如表1所示。
表1 混合烟丝组分构成Table 1 The composition of mixed cut tobacco g
主要仪器:JB285型电子天平,瑞士METTLER TOLEDO公司产;YQ-2型烟丝振动分选筛,郑州烟草研究院提供;烟丝结构图像检测装置,南京焦耳科技有限公司产。
烟丝结构图像检测装置主要由光源、高速线阵CCD相机、采集卡和工控机组成。为了满足大视场高分辨率的要求,采用的线阵CCD相机有8192个感光单元,像元尺寸达到7.04 μm×7.04 μm,当镜头的放大倍率为0.7倍时,检测装置的最小测量值为0.01 mm,以满足烟丝长度的测量要求。
《卷烟工艺规范》[8]规定,烟丝长度>2.5 mm为整丝,烟丝长度<1.0 mm为碎丝。烟丝的测量精度要求非常高,采用线阵CCD相机拍摄烟丝图像时,得到的烟丝图像较大(每幅80 mm×80 mm的图像大小约为80 M),因此需要对烟丝图像进行相应的处理,烟丝图像处理过程如图1所示,首先对原始图像(图1a))进行预处理,将采集到的烟丝图像灰度化后进行除噪,得到图1b)。除噪方式选用中值滤波法[9],采用 3 × 3 的滤波窗口,以尽可能地保存图像的细节信息。再利用阈值分割[10]对烟丝进行二值化(图1c)),提取烟丝连通区域。最后对烟丝连通域图像进行细化(图1 d))[11],细化后的烟丝轮廓的中心线即为烟丝骨骼[12]。
图1 烟丝图像处理Fig.1 Image process of cut tobacco
通过计算细化后的烟丝轮廓长度可得到烟丝的长度,再统计出烟丝的表观总面积。从同一批烟丝A中,分别称取质量为5 g、10 g、15 g、20 g、25 g的5个样品进行图像采集,每个样品重复测量5次,建立表观总面积和烟丝质量的拟合模型,如图2所示。由图2可知,线性方程的相关系数达到0.999 6。将烟丝表面积数据代入拟合模型中获得烟丝质量预测值,其与实际值的比较结果如表2所示。由表2可知,拟合得到的烟丝质量数据相对误差<2.34%,变异系数<3%,模型准确性和重复性均能满足测量要求。根据模型预测得到的整丝和碎丝质量,计算获得烟丝的整丝率及碎丝率,获得烟丝结构。
图2 样品烟丝表观总面积与烟丝质量拟合模型Fig.2 Fitting model between the apparent total area of cut tobacco and the quality of cut tobacco
表2 烟丝质量预测值与实际值比较结果Table 2 Comparison between predicted value and actual value of cut tobacco quality
烟丝各组分本质上均为烟草在制品的一部分,只是通过不同的加工处理技术形成不同结构特征的烟草在制品。肉眼观察3种烟丝(薄片丝、梗丝、叶丝)组分,其结构特征存在一定的差异。薄片丝较为细长,宽度和颜色较为均匀,变化的程度较小[13];梗丝形状较为多样,宽度和颜色的变化程度最大[14];而叶丝在宽度和颜色变化方面介于薄片丝和梗丝之间[15]。
图3 通过最小内切圆计算烟丝宽度Fig.3 Calculation of cut tobacco width by minimum inscribed circle
烟丝颜色特征的提取过程是先将烟丝原图进行图像增强[18],如图4所示,再将其转换为HSV图像[19],分别统计出薄片丝、梗丝、叶丝在H通道、S通道、V通道上的灰度平均值,如表3所示。
图4 图像增强后的薄片丝图像Fig.4 The tobacco flakes image after image enhancement
表3 3种烟丝图像增强后在HSV三通道灰度平均值Table 3 Average gray values of three kinds of cut tobacco images in HSV three channels after enhancement
除颜色方差之外,本文还加入了颜色矩。低阶矩通常已经包含了图像的大部分颜色信息,所以经常采用一阶矩、二阶矩和三阶矩来表达图像的颜色分布,其数学定义分别如下所示。
其中,Pij为第i个通道的第j个像素的强度值;M为图像中的像素个数。
首先提取烟丝形状特征中的宽度、宽度方差,以及颜色特征中的颜色方差和颜色矩,再通过SVM分类器进行训练,即可得到薄片丝、梗丝、叶丝的识别分类模型。
为验证本文图像识别法检测烟丝结构的可行性与效果,将其与YQ-2烟丝振动分选筛(振筛法,参照文献[21])进行对比实验,实验样品为同一批次的烟丝A,取样量为符合卷烟工艺规范的标准烟丝(1 000.0±100.0)g/次,样品含水率为11.0%~14.0%,两种方法均重复测量5次,取平均值。
不同方法的烟丝结构测量结果如表4所示。由表4可知,相对于振筛法,本文图像识别法检测烟丝结构的标准差和变异系数均明显减小,且均小于5%,说明本文方法测量精度较高,稳定性较好,比传统振筛法更快捷、更有效。
表4 不同方法的烟丝结构测量结果Table 4 Measurement results of cut tobacco structure under different methods %
为了验证本文图像识别方法分析烟丝组分的可行性与效果,将其与人工识别法、卷积神经网络法、残差神经网络法作了对比实验,实验样品为烟丝B、C、D。4种方法的取样量均为(50.0±0.1)g,含水率为11.0%~14.0%。
传统烟丝组分的分类为人工识别法,主要靠人工完成,人工进行薄片丝、梗丝、叶丝的分类后,再用天平进行称重,统计烟丝组分。
采用深度学习的方法,建立基于卷积神经网络[22]的烟丝组分识别模型,使用体现烟丝微观结构特征的局部特征图片作为神经网络的输入,分析识别出每个特征图片对应的输出结果,通过统计方法得出烟丝的组成成分。
利用各类烟丝图像特征差异,以残差神经网络[6]为基础构建烟丝类型识别模型,通过设定样本对应的神经网络的输出张量预测烟丝的组成成分的概率值。
不同方法烟丝组分分析结果如表5所示。由表5可知,人工识别法的平均相对误差较大,卷积神经网络法和残差神经网络法的平均相对误差较小,但仍>5%,本文方法的平均相对误差≤5%,准确性更高。主要原因是人工识别法本身操作过于复杂,在多次测量时容易产生较大的误差。而卷积神经网络法在实际操作中,训练集的正确率与测试集的准确率相差较大,存在一定的过拟合现象,模型泛化能力较低,易导致最终的识别率不理想。残差神经网络法对比卷积神经网络法在识别的准确率上确实有了明显的提升,但是对于区别程度不大的烟丝,比如部分薄片丝和叶丝,其外观肉眼很难区分,使用该方法进行识别准确率存在一定的局限性。本文方法中对薄片丝、梗丝、叶丝样本图像通过SVM分类器进行训练,对于错误识别的样本图像,通过降低它们的分类权值以提高烟丝识别的准确率。
表5 不同方法烟丝组分分析结果Table 5 Analysis results of tobacco components by different methods %
本文利用图像识别技术,对烟丝轮廓进行细化,提取烟丝骨骼,得到烟丝长度,建立烟丝表观总面积与烟丝质量的拟合模型,实现了烟丝结构的图像识别;提取烟丝的形状、颜色两个特征,运用SVM分类器构建了薄片丝、梗丝、叶丝的分类模型,实现了薄片丝、梗丝、叶丝的图像分类识别。与传统振筛法相比,基于图像识别的烟丝结构检测标准差更小,与人工识别法、卷积神经网络法和残差神经网络法相比,基于图像识别的烟丝组分分析相对误差更小,本文方法的准确性及可行性更高,能够对烟丝掺配精度做出快速准确判断。后续将针对薄片丝和叶丝误识别的情况训练一个二分类器进一步提高识别准确率。