烟草香级智能集成分类方法

2016-11-14 00:11邓晨曦
电脑知识与技术 2016年24期
关键词:智能算法烟草

邓晨曦

摘要:针对烟草化学成分与卷烟制品香级之间确定的数学模型难以建立的问题。该文提出了一种基于智能算法的烟草香级集成分类方法。对比实验结果表明,该文算法在分类准确度上具有较大的优势,证明了该文算法的有效性。从而为烟草的香级分类提供了可靠依据。

关键词:智能算法;烟草;香级分类

中图分类号:TP273+.21 文献标识码:A 文章编号:1009-3044(2016)24-0006-02

Abstract: The problem of establishing the mathematical model of the cigarette chemical composition and cigarette product fragrance grade is difficult to establish. In this paper, a tobacco aroma ensemble classification method based on intelligent algorithm is proposed. Finally, the classification results are obtained by majority voting. Experimental results show that the algorithm has a large advantage in the classification accuracy, and the effectiveness of the proposed algorithm is demonstrated.. Thus it can provide the reliable basis for the tobacco aroma classification.

Key words: intelligent algorithm; tobacco; aroma classification

在人们生活水平和消费水平不断提高的今天,优质和高档香烟的市场在不断地扩大,就我国而言就有3.5亿多烟民,所以如何提高烟叶品质和竞争力是各个烤烟厂商迫切需要解决的问题。2015年,我国的烟草行业每年的税收超过11000亿元,大约占到国民收入10%以上。烟草品质的高低是决定其市场竞争力,对烟草品质的评价与分级国内外已经开展了不少研究[1,2]。

目前对烟草的内在质量评价,行业所采用的标准是靠感官评吸,具有较大的人为因素和不确定度。因此,烟草的内在质量评价,作为目前卷烟行业技术工作而言,是一项急需解决的问题。对于烟草内在质量评价体系的研究方面,目前的研究基本上是集中在常规化学成分的定性和定量分析以及部分化学成分的定性分析,对于影响烟草内在质量的各种化学成分的定性和定量分析以及系统的评价,尚未有全面的报道。由于烟叶的质量是经过燃烧后进行评价的,对于烟叶中各种成分在燃烧后对内在质量的影响,是一个非常重要的内容,如何建立起完善的内在质量评价体系,来通过化学成分的变化,对烟草包括烟叶、卷烟进行完整和系统的质量评价,是非常重要和紧迫的。如何寻找一种可行而且合理有效的方法,可否采用化学成分的含量规律和变化来判断烟草的质量[3],这样便可以克服人为的因素,对烟草行业提高产品质量,会起到积极的意义。

在烟草质量的评价体系中,烟草质量评价涉及外观、物理、化学、感官和烟气等多个指标体系,众多的指标增加了评价的难度。烟草的外观、感官、烟气等是化学成分的外在表现,用化学成分评价烟草质量相对较为客观,也含有较丰富的烟草品质信息。特别是红外线分析技术的发展,烟草中化学成分的测定也变得更加简便和快速,这也正是今后烟草质量评价的发展趋势。目前烟草质量评价方法主要有外观质量评价法、常规化学成分评价法、感官评吸评价法等[4-6]。

卷烟制品的香级是根据人受到烟草致香成分刺激后产生的主观感受来制定的,这一过程具有弱随机性。这需要计算机辅助烟草香级评定解决两个方面的问题,一方面,传统数理统计方法只能分析影响卷烟香级的相关因素,无法建立烟草化学成分与香级之间明确数学模型。另一方面,由于评吸专家的感受存在一定的随机性,导致单一的分类方法,往往存在弱学习特性,分类结果容易受到影响,导致偏差。

集成学习是跨学科的综合数据挖掘理论,近年来被越来越多的应用到国防、金融、工业等各个方面。其本质是利用多个版本得其学习算法结果综合解决同一个问题,可显著提高学习系统的泛化能力。针对烟草品质评定这类复杂问题,能够有效地提升单一弱学习算法的评估准确率。

基于以上分析,本文提出了一种基于智能模糊聚类的烟草品质集成分类方法。

1 烟香级分类原理及系统结构

烟草燃烧产生的香味是其内部各种化学物质的相互作用的结果,因此烟草的香型和香味决定于各种致香成分含量及比例。而烟草化学成分极为复杂,目前已分离鉴定的就达到5000多种,这必然给计算机辅助感官评价带来巨大的复杂度。因此需要分析决定烟草品质的主要成分。

本文选用烟叶中总糖、还原糖、总氮、烟碱、蛋白质、氧化钾、氯离子的含量作为烟草品质主要评价依据,采用多种烟草样本以及专家评价结果建立测量集[40],通过分类算法对样本烟草化学成分进行分析,来评价烟草的内在品质的差异性。

卷烟制品的品质是根据人受到烟草致香成分刺激后产生的主观感受来制定的,这一过程具有弱随机性。这需要计算机辅助烟草品质评定解决两个方面的问题,一方面,传统数理统计方法只能分析影响卷烟品质的相关因素,无法建立烟草化学成分与品质之间明确数学模型。另一方面,由于评吸专家的感受存在一定的随机性,导致单一的分类模型,往往存在弱学习特性,分类结果容易受到影响,导致偏差。

针对这一情况。本文提出了一种基于智能优化算法模糊聚类的烟草品质评价方法。该方法首先以烟叶样品的化学成分的差异性为依据,以评价结果与评吸专家的评定结果一致性为综合目标,利用萤火虫群优化算法(Glowworm Swarm Optimization,GSO)对现有的模糊聚类算法进行优化改进,建立烟草品质的评价方法;在此基础上,利用AdaBoost将基分类器对于不同样本集的多个分类结果进行集成,形成最终的烟草品质评价模型。

2 系统总体架构

烟草数据库和评价方法数据库是本系统的两大核心部分,其中烟草数据库为系统提供了数据的支持,评价方法数据库为系统提供了评价方法的支持。在这两大核心部分基础之上,设计了三个模块:烟草数据管理、烟草业务处理和系统管理。烟草数据管理模块是为烟草业务处理模块提供处理数据的,主要实现了烟草品种与烟草化学成分的管理。烟草业务处理主要实现了烟草品质的评价,还包括数据的预处理以及其他部分。系统管理模块相对而言是一个比较独立的模块,主要实现了用户、权限的管理,提供系统信息查询功能。系统总体架构设计如图2所示。

3 仿真分析

为了验证本文方法的有效性,本文首先采用真实的烟草样本数据对基于萤火虫群优化模糊聚类算法,和基于AdaBoost集成分类算法进行仿真实验;然后采用实验对比的方式,对本文方法的效果进行分析。

实验用的烟草样本选自山东、山西、云南、四川、陕西、广西、贵州和江西8省的130组烟叶。通过光谱分析和萃取方法,获取各烟叶样品中总糖、还原糖、总氮、烟碱、氧化钾、氯离子、蛋白质7种主要化学成分含量,并与多位评吸专家给出的品质评定结果组成实验样本集。随机抽取其中的30组样本作为验证样本,其余的100组作为学习样本。

为了说明方法的有效性,将本文算法与神经网络、模糊聚类算法进行比较,其误检率对比实验及结果如表1所示,因此在样本条件相同的条件下,对30个烟草验证样本进行分析,本文提出的分类算法的误检率指标远小于其它三种缺陷辨识算法。

4 结论

本文在对决定烟草致香成分充分分析的基础上,针对烟草化学成分极其复杂,传统数理统计无法建立烟草化学成分与卷烟制品香级之间确定的集成分类方法。以及在卷烟制品香级评定过程中,评吸人具有一定的主观随机性,影响最终的评定结果两个问题。提出了一种基于智能优化算法的烟草香级集成分类方法。将本文算法与现有的算法进行对比实验,结果表明,本文算法在分类准确度上具有较大的优势。

参考文献:

[1] 姜茱,谢胜利.烤烟叶片大小与烟叶化学成分的关系研究初报[J].中国烟草,1991(2):36-40.

[2] 韩锦峰,林木森,王瑞新.优质烤烟规范化栽培技术[M].郑州:河南科学技术出版社,1990.

[3] 宫长荣,于建军.烟草原料初加工[M].北京:中国轻工业出版社,1993.

[4] 王毅,李胜群,胡立中, 等.烟草混合均匀度评价方法的研究[J].中国烟草技术2006年年会报告集,2006:7-79.

[5] 杜文,谭新良,易建华,等.用烟叶化学成分进行烟叶质量评价[J].中国烟草学报,2007,13(3):25-31.

[6] Li J L,Yin G Y,Zhang G H.Evaluation of tobacco mixing uniformity based on chemeical composition[C].Proceeding of the 31st Chinese Control Conference, 2012: 7552-7555.

猜你喜欢
智能算法烟草
烟草具有辐射性?
神经网络智能算法在发电机主绝缘状态评估领域的应用
基于超像素的图像智能算法在矿物颗粒分割中的应用
从鸡群算法看群体智能算法的发展趋势
烟草依赖的诊断标准
烟草中茄酮的富集和应用
烟草品种的SCAR标记鉴别
烟草叶绿体密码子的偏好性及聚类分析