基于深度神经网络的卷烟燃烧锥落头检测和分类识别

2022-11-21 10:25:40钟宇周建良徐燕刘德祥王宏强徐羽鹏周明珠董浩刘勇胡清源

烟草科技 2022年10期

钟宇，周建良，徐燕，刘德祥，王宏强，徐羽鹏，周明珠，董浩*,，刘勇，胡清源

1.新疆维吾尔自治区烟草质量监督检测站，乌鲁木齐经济技术开发区天柱山街55号 830026 2.上海新科乾物联技术有限公司，上海市松江区洞泾镇长兴东路1586号 201619 3.国家烟草质量监督检验中心，郑州高新技术产业开发区翠竹街6号 450001 4.中国科学院合肥物质科学研究院，合肥市蜀山湖路350号 230031 5.中国科学技术大学，合肥市金寨路96号 230026

卷烟纸参数、烟丝结构、烟丝密度等因素会对卷烟燃烧过程中的燃烧锥落头倾向造成影响［1-3］，进而影响消费者的抽吸体验。通过测定卷烟燃烧锥落头倾向，可以考察卷烟燃烧时出现落头的概率，从而为低落头倾向卷烟的原辅材料选择和产品设计提供依据［4］。为此，李斌等［5］研究了落头测试时燃烧锥的受力情况和影响因素，提出了一种落头倾向检测方法。桑瑶烁等［6］基于红外测温、图像识别等技术设计了一种燃烧锥落头倾向测试装置，实现了对燃烧锥落头的自动检测。梁志平［7］通过模拟人抽吸卷烟、弹落烟灰的过程设计了一套燃烧锥落头倾向测试装置，实现了对卷烟燃烧锥落头倾向的批量测试和准确判断。

卷烟燃烧锥落头倾向测试行业标准［8］规定了仪器设备要求、测试条件和测试步骤，但存在以下问题：①现有的仪器设备通过温度探测和边界识别的方式对烟支是否落头进行判定，测试结果容易受到烟支角度、颜色以及落头状态等因素的影响。②落头倾向测试样品量大、测试时间长、人工判定落头结果效率低。以神经网络为代表的深度学习是机器学习的一个重要分支，能够使计算机自动学习模式特征，并将特征学习融入模型建立过程中，从而减少人为设计特征的不完备性，在语音识别、计算机视觉、自然语言处理等领域有着广泛应用［9］。在烟草检测方面，计算机视觉技术已应用于真伪卷烟包装鉴别［10］、烟丝组分识别［11］、爆珠缺陷识别［12-13］等依赖于人工主观判断的指标检测中，但在卷烟燃烧锥落头倾向的判定中则鲜见报道。为此，基于深度神经网络构建了卷烟燃烧锥落头检测和分类识别模型，以期提高现行标准中落头检测的判断效率和准确性，对卷烟燃烧锥类别进行更加细致的分类识别，为卷烟表观燃烧性能的研究提供支持。

1 材料与方法

1.1 样品

卷烟样品为2019—2021年间市售产品，共100种规格样品，包含圆周设计值24.20、20.00、17.00 mm的卷烟各40、30、30种规格。

1.2 仪器

CFP800A卷烟燃烧锥落头倾向测试仪（合肥众沃仪器技术有限公司）。

1.3 模型构建

1.3.1 图像采集和标注

采用CFP800A卷烟燃烧锥落头倾向测试仪，依照烟草行业标准方法［8］测试100种规格卷烟样品的燃烧锥落头倾向，每个规格样品测试40支，共采集图像4 000张（单个图像大小为600 px×300 px），剔除有缺陷图像后保留3 519张。如图1所示，按照落头倾向测试要求对图像进行标注，得到正常燃烧、落头以及未点燃图像各2 296、1 007、216张。其中，落头图像进一步划分为燃烧锥完全掉落（583张）和燃烧锥未完全掉落（424张）两类。

图1 不同类别卷烟燃烧锥图像Fig.1 Images of different kind combustion cones of cigarettes

1.3.2 图像预处理

为丰富样品数据集，提高模型泛化性和鲁棒性［14］，通过增强或减弱图像特征（亮度、对比度、色度、锐度等）的方式对卷烟燃烧锥图像进行处理，将图像扩充至25 309张，包含正常燃烧11 565张、燃烧锥完全掉落7 972张、燃烧锥未完全掉落5 772张、未点燃图像2 350张。

1.3.3 数据集构建

为确保各类图像数量相当，提高图像分布的均匀性，采用正常燃烧图像和落头图像建立落头检测数据集，采用全部未点燃图像和部分正常燃烧、燃烧锥完全掉落、燃烧锥未完全掉落的图像建立落头分类识别数据集，见表1。将两个数据集均按4∶1的比例划分为训练集和测试集。

表1 落头检测和落头分类识别数据集的样品分布Tab.1 Distribution of samples in dataset of cone-falling detection and dataset of cone-falling classification-recognition （张）

1.3.4 模型建立与训练

基于卷烟燃烧锥落头图像特征，选取3类主干网络ResNet［15］、MobileNet［16］和ViT（Vision Transformer）［17］进行模型构建。为加快训练速度，在初次训练时迁移已初步训练好的神经网络权值对网络进行初始赋值［18-21］，落头检测任务和落头分类识别任务中图像传入批大小分别为32和16。所有模型输出后，根据公式（1）由交叉熵损失函数得到损失值，通过梯度下降算法逐步更新权值以降低损失值，优化算法为Adam（Adaptive Moment Estimation）［22］，学习率为0.001，学习率衰减因子为0.000 5。

式中：L为损失值；N为样品数；M为类别数；c为某类别；yic为样品i的真实类别标签；pic为样品i预测为某类别c的概率。

1.4 模型评估

通过混淆矩阵对3个模型进行评估，采用精确率（P）、召回率（R）、f1分数（精确率和召回率的调和平均）以及模型容量评估模型表现［23-25］。

1.5 模型运行环境

图像处理、模型建立、数值计算代码均采用python语言，神经网络构建采用开源的pytorch1.10.0，图像处理单元（Graphic Processing Unit，GPU）采用NVIDIA GeForce GTX 970（美国NVIDIA公司）。

2 结果与分析

2.1 模型训练结果

2.1.1 落头检测任务

如图2所示，在落头检测任务中，随着训练轮数的增加，3个模型训练集和测试集的损失值均显著降低，最后逐步收敛。以ResNet和MobileNet为主干网络的模型初始损失值较低，仅通过3～4轮训练即可快速下降至一个较低值，经过10轮训练曲线已较为平稳；以ViT为主干网络的模型初始损失值较高，经过8轮训练损失值迅速下降，然后趋于平稳。经过50轮训练，3个模型的损失值分别为0.033、0.049和0.041。

图2 不同模型对落头检测数据集的训练结果Fig.2 Training results of cone-falling detection dataset by different models

2.1.2 落头分类识别任务

如图3所示，与落头检测训练过程相似，在落头分类识别任务中上，随着训练轮数的增加，各模型损失值均呈现极为明显的下降趋势然后趋于平稳；然而ViT模型在测试集上的损失值一直未能收敛，并呈现一定的波动性。经过50轮训练，ResNet、MobileNet模型训练集和测试集损失值均收敛至较低值（ResNet模型训练集0.312、测试集0.267；MobileNet模型训练集0.285、测试集0.265），且训练集与测试集差异较小，说明这两个模型表现出较好的泛化能力。

图3 不同模型对落头分类识别数据集的训练结果Fig.3 Training results of cone-falling classification-recognition dataset by different models

2.2 模型效果评估

各模型在落头检测和落头分类识别任务中的表现见表2。可见，3个模型对燃烧锥落头检测任务的平均精确率分别为99.74%、99.64%、99.87%，平均召回率分别为99.74%、99.64%、99.87%，差异不明显。在燃烧锥落头分类识别任务中，ResNet模型和MobileNet模型的平均精确率、平均召回率差异也较小，均优于ViT模型。ViT模型对燃烧锥落头分类识别任务中未点燃类别的识别精确率最低，仅为51.72%。

表2 不同模型在落头检测和落头分类识别任务中的表现Tab.2 Performances of different models on cone-falling detection and classification-recognition

f1分数是模型精确率和召回率的调和平均，兼顾了模型的精确率和召回率，可以用来衡量模型的准确度，其数值（范围为0～1）越接近1表示模型准确度越高。因此，选取f1分数作为模型准确度的评价指标，同时考虑模型运行速度，结合模型容量对3个模型进行筛选。结果表明：①在落头检测任务中，MobileNet模型的f1分数（0.996 3）最小但与其他两个模型差异较小，而模型容量（8 940）明显小于其他两个模型。因此，该模型具有准确度高、运算速度快等优势，适合在移动端部署。②在落头分类识别任务中，MobileNet模型的f1分数（0.883 9）最高且模型容量（8 950 kb）最小，为最优模型。但该模型对燃烧锥完全掉落、燃烧锥未完全掉落两种类别的f1分数较低，分别为0.829 1、0.875 9，后续可通过调整学习率、优化算法、迁移模型等参数来提高准确度。

3 结论

基于卷烟燃烧锥落头倾向测试中燃烧锥图像的特征差异，以MobileNet、ResNet和ViT为主干网络构建3个卷烟燃烧锥落头检测和分类识别模型，并对模型进行训练和评估。结果表明：①3个模型在落头检测任务中均具有较低的损失值（L＜0.05）和较高的准确率（P＞99%，R＞99%），而ViT模型在落头分类识别任务中的准确率较低（P=86.05%，R=76.04%），在测试集上的损失值也未能收敛。②MobileNet模型具有准确度高、运算速度快等优势，适合在移动端部署，但在落头分类识别任务中对燃烧锥完全掉落（f1分数=0.829 1）、燃烧锥未完全掉落（f1分数=0.875 9）两种类别的准确度较低，未来可通过调整学习率、优化算法、迁移模型等参数提高准确度。