基于聚类分析的3种新香型烤烟烟叶质量特征与香型评价

2023-06-11 22:10李宽汪金玲赵勇李玉秀朱晓兰
安徽农业科学 2023年10期
关键词:聚类分析主成分分析烤烟

李宽 汪金玲 赵勇 李玉秀 朱晓兰

摘要 [目的]建立國产烤烟烟叶新香型风格特征的评价体系,为国内优质特色烟叶识别归类和卷烟生产提供参考。[方法]分别选取清甜香型、蜜甜香型和焦甜焦香型3种不同新香型C2F等级烤烟共60份样品,对其外观质量指标、感官质量指标、常规化学成分及中性香气物质分别采用主成分分析筛选能够有效区分不同香型风格的关键质量指标,最后通过聚类分析利用3组样品进行验证。[结果]主成分分析筛选出了区分3种新香型风格的4类主要质量特征指标,分别为2项外观质量指标(色度和油分)、4项感官质量指标(香气量、感官总分、浓度、刺激性)、3项常规化学成分(氯、总糖、钾)和5项中性香气物质(茄酮、二氢大马酮、巨豆三烯酮、二氢猕猴桃内酯、新植二烯)。筛选的14项质量特征指标能够较为准确地将验证组A组15个样品聚为3类,B组8个样品聚为5类,C组23个样品聚为4类,分类正确率分别为93.33%、87.50%和100%。[结论]筛选出的这14项指标可以准确判别不同烤烟香型风格,并可有效区分这3种不同新香型风格的烟叶。

关键词 烤烟;香型风格;聚类分析;质量特征指标;主成分分析

中图分类号 TS47  文献标识码 A  文章编号 0517-6611(2023)10-0156-06

doi:10.3969/j.issn.0517-6611.2023.10.035

Abstract [Objective] To establish an evaluation system for the new aroma style characteristics of domestic fluecured tobacco leaves, provide reference for the identification and classification of highquality and characteristic tobacco leaves and cigarette production in China. [Method] A total of 60 samples of C2F grade fluecured tobacco with three different aroma types, namely clear sweet aroma type, honey sweet aroma type, and burnt sweet burnt aroma type, were selected. The appearance quality indexes, sensory quality indexes, conventional chemical components and neutral flavor substances were selected using principal component analysis to screen key quality indicators that can effectively distinguish different aroma styles. Finally, cluster analysis was used to verify the effectiveness of three sets of samples.[Result]Principal component analysis screened out four main quality characteristic indicators to distinguish three new flavor styles, namely, two appearance quality indexes(chroma and oil content), four sensory quality indexes (aroma quantity, sensory total score, concentration, irritation), three conventional chemical components (chlorine, total sugar, potassium) and five neutral aroma substances (solanone,damascone,tabanone, dihydroactinidiolide, neophytadiene).The fourteen selected quality indexes could accurately gather group A of 15 samples into three categories, group B of 8 samples into five categories, and group C of 23 samples perfectly into four categories with classification accuracy of 93.33%, 87.50% and 100%, respectively.[Conclusion] These 14 selected quality characteristic indexes can be used to accurately distinguish different flavor styles of fluecured tobacco, especially the three new different aroma style types of tobacco leaf.

Key words Fluecured tobacco;Aroma style;Cluster analysis;Quality characteristic indexes;Principal component analysis

烟叶是烟草行业生存和发展的基础,其质量和类型直接影响到卷烟产品的感官质量和风格特征。我国幅员辽阔,各种自然条件、种植方式和工业技术不同,因此烤烟香型也有所差异[1-2]。根据2017年《全国烤烟烟叶香型风格区划的通知》,全国烤烟烟叶产区划分为八大生态区,不同生态区的烟叶在外观质量、化学成分、香气物质、感官质量方面均存在一定的差异,相应的烟叶风格划分为8种香型,分别为清甜香型、蜜甜香型、醇甜香型、焦甜焦香型、焦甜醇甜香型、清甜蜜甜香型、蜜甜焦香型和木香蜜甜香型[3]。研究烟叶各类质量特征与香型评价的关系以及烤烟香型分类的关键性指标,对中式卷烟原料的选择以及优化设计产品配方有重要意义。

肖明礼等[4]研究表明不同香型风格、不同部位烟叶的重要致香成分物质总量有一定的差异,还原糖、致香成分对感官综合质量有显著影响。杨佳玫等[5]研究表明不同生态区烟叶化学成分差异显著。郭东锋等[6]采用随机森林建立了基于化学成分、香味成分2类指标的烤烟香型分类模型,分类正确率分别为87.50%和82.35%。许永等[7]基于烟叶致香成分采用7种方法建立了烤烟香型分类模型,从中筛选出了烤烟香型判断准确率高于90%的线性判别法和高斯混合模型。詹军等[8]基于化学成分和致香物质建立了Fisher判别函数对烤烟上部叶香型进行判别分析。主成分分析(PCA)是将多重数据有效降维的一种统计方法[9],聚类分析(CA)是研究分类问题的多元数据分析技术,目前已经在医药、经济、食品、环境等领域得到广泛应用[10-12],但利用聚类分析对烤烟烟叶香型评价的研究较少。虽然烟叶质量特征与香型评价一直都是烟草行业的研究关注点,但多数研究只是以单项指标来进行分类,难以客观地反映烟草质量整体的异同点,更不能全面准确描述多类别、多变量指标的综合差异,而且此前研究多是以清香型、浓香型、中间香型烤烟作为研究对象,自2017年烤烟烟叶风格被划分为8种香型后,关于对烤烟烟叶质量和新香型评价的研究更是鲜有报道。

该研究通过对国产3种新香型(清甜香型、蜜甜香型和焦甜焦香型)C2F等级烤烟样品外观质量指标、感官质量指标、常规化学成分和中性香气物质进行主成分分析,筛选出区分香型风格的不同类型质量特征指标,建立新香型综合评价方法,为不同香型烟叶风格的关键质量因素剖析提供依据。

1 材料与方法

1.1 试验材料

试验中筛选2019—2020年度西南高原、黔桂山地和黄淮平原3个生态区的3种香型(清甜香、蜜甜香和焦甜焦香)C2F等级烤烟各20份(共60份)样品进行PCA;另外选取8个2019—2020年4种不同香型的烤烟样本作为CA外部验证样,包括清甜香型、蜜甜香型、焦甜焦香型和取自武夷丘陵生态区的清甜蜜甜香型样品。制备每份烟叶样品3.0 kg,样品在温度(22±1)℃和相对湿度(60±2)% 的恒温恒湿箱中平衡水分48 h。

1.2 测试方法

烟叶外观质量参考郑州烟草研究院制订的烤烟外观质量评价标准进行打分。烟叶常规化学成分总糖、还原糖、烟碱、总氮、氯、钾、淀粉7项指标分析分别依据YC/T 159—2002、YC/T 159—2002、YC/T 468—2013、YC/T 161—2002、YC/T 162—2002、YC/T 217—2007、YC/T 216—2013的方法测定。烟叶感官质量评价依据标准方法YC/T 530—2015,由中国烟草总公司郑州烟草研究院组织7名全国评烟委员会专家对烟叶质量进行评价。

烟叶中性香气物质采用气相色谱-质谱(GC-MS)法进行定性定量分析,前处理采用同时蒸馏萃取(SDE)[13-15],具体如下:称取25.0 g烟样于500 mL圆底烧瓶中,加入350 mL饱和氯化钠溶液和0.5 mL内标溶液(芳樟醇),摇匀后放进电热套,在另一250 mL烧瓶中加入40 mL二氯甲烷,60 ℃水浴。两边同时加热,水蒸气沸腾后计时,共同沸腾2.5 h,收集二氯甲烷提取液加适量无水硫酸钠干燥后浓缩至1 mL,进行GC-MS鉴定和GC分析。GC-MS条件:Turbo-Mass型气相色谱-质谱联用仪(美国PERKEM ELMER公司,配置分流/不分流进样口),进样口温度250 ℃,毛细管柱为DB-5(30 m×0.25 mm,0.25 μm),载气为氦气(纯度为99.999%),柱头压68.95 kPa;柱升溫程序:初温40 ℃,保持2 min,以4 ℃/min升温至250 ℃,保持10 min;EI能量70 eV,光电倍增器电压(EMV)350 V;分子量扫描范围为33~350 au;传输线温度250 ℃,离子源温度170 ℃,进样量2.0 μL,进样方式为分流进样。

1.3 数据分析

PCA和CA之前,需对数据进行标准化处理,以消除不同量纲带来的影响。采用Excel 2010对数据进行标准化处理,采用统计学软件SPSS Statistics 23对数据进行相关分析、主成分分析、聚类分析,SPSS软件FACTOR模块提供了PCA的功能。权重的大小代表着某一指标在整体评价中相对重要程度,根据各类指标的权重大小筛选出关键性指标,再通过CA进行回判验证,最终确定在烟叶香型分类中起关键作用的指标。权重计算方法主要依据PCA的方差贡献率和成分矩阵(在因子分析中被称为因子载荷阵),由各个主成分的特征值对应的开根值和载荷矩阵中的系数进行计算,具体计算公式如下[14]:

其中i表示第i个原始指标,共有m个原始指标;j表示第j主成分,共提取了n个主成分;λj为第j主成分的特征根;Yj为第j主成分的方差贡献率;θij为成分矩阵中第j主成分对原指标变量Xi的载荷数;uij为第j主成分线性组合中原始指标Xi的系数;di为原始指标Xi在综合模型中的系数;wi为原始指标Xi的权重归一化后的结果。

2 结果与分析

2.1 外观质量指标比较与权重分析

3种香型烤烟烟叶样品的外观质量指标(颜色、成熟度、叶片结构、身份、油分、色度)数据归一化预处理结果如表1所示,3种不同香型烟叶的外观质量指标数据存在一定差异,其中蜜甜香型有4项指标较高,焦甜焦香型各项指标数据(除身份)略低于其他2类,规律非常显著。

外观质量指标数据PCA特征值、方差贡献率结果如表2所示,6个主成分变量承载了全部样本外观质量的所有信息,考察特征值λ>1并结合方差贡献率确定最优的主成分数[15],一共提取了2个主成分,累计方差贡献率是74.33%,可以解释总体样本的绝大部分外观信息,表明PCA结果比较可靠。权重计算结果显示色度(25.87%)>油分(22.79%)>身份(13.52%)>颜色(13.45%)>叶片结构(13.02%)>成熟度(11.35%),其中前2项权重相对较大,说明色度和油分这2项指标可能对烤烟烟叶香型分类影响较大。

2.2 感官质量指标比较与权重分析

3种香型烤烟烟叶样品的7项感官质量指标(香气质、香气量、浓度、杂气、刺激性、余味和感官总分)数据归一化预处理结果如表3所示,不同香型烟叶样品的这7项感官质量指标间差异并不明显,3种香型的这7项指标互有高低,其中香气质、杂气、余味、刺激性和感官总分都显示清甜香型得分略高于另外2种香型。

感官质量指标数据PCA特征值、方差贡献率结果如表4所示,7个主成分变量承载了全部样本的所有信息,考察特征值λ>1共提取了2个主成分,累计方差贡献率高达79.10%。权重计算结果显示香气量(18.00%)>感官总分(17.99%)>浓度(16.33%)>刺激性(15.91%)>杂气(12.86%)>香气质(10.78%)>余味(8.13%),其中前4项权重相对较大,说明香气量、感官总分、浓度、刺激性可能对烟叶的香型影响较大。

2.3 常规化学成分指标比较与权重分析

3种香型烤烟烟叶样品的7项常规化学成分(总植物碱、总氮、还原糖、总糖、钾、氯、淀粉)数据归一化预处理结果如表5所示,不同香型烟叶样品的7项常规化学成分含量存在明显差异,总植物碱、钾和氯3项指标呈现焦甜焦香型最高,而钾和氯在蜜甜香型含量最低的特征。

常规化学成分指标数据PCA的特征值、方差贡献率结果如表6所示,7个主成分变量承载了样本的所有信息,根据特征值并综合考虑方差贡献率和碎石图提取前3个主成分,累计贡献率高达87.24%,能够解释总体样本的绝大部分信息,表明PCA结果比较可靠。权重计算结果显示氯(17.20%)>总糖(16.91%)>钾(16.79%)>还原糖(15.33%)>总植物碱(15.28%)>总氮(11.03%)>淀粉(7.46%),不同指标间差异不是特别明显,剔除存在相关性的指标后本着指标简化的原则,取权重排前3的指标(氯、总糖和钾),探讨其对烤烟烟叶的香型分类判定结果的影响。

2.4 香气物质指标比较与权重分析

采用SDE提取GC-MS方法鉴定出的中性香气物质有糠醛、糠醇、2-乙酰基呋喃、5-甲基糠醛、苯甲醛、6-甲基-5-庚烯-2-酮、苯甲醇、苯乙醛、2-乙酰基吡咯、苯乙醇、茄酮、大马酮、二氢大马酮、β-紫罗兰酮、香叶基丙酮、二氢猕猴桃内酯、巨豆三烯酮(包括异构体1、2、3、4)、新植二烯、西柏三烯二醇、棕榈酸和法尼基丙酮等。该研究在文献研究[16-17]的基础上,对这些指标进行相关性分析和显著性检验,最终保留了含量较高且对香型有重要影响的糠醛、糠醇、茄酮、大马酮、二氢大马酮、巨豆三烯酮、二氢猕猴桃内酯、西柏三烯二醇、棕榈酸、新植二烯这10项香气物质指标。3种香型烤烟烟叶样品的10项香气物质的数据归一化预处理结果如表7所示,不同香型烟叶样品的10项香气物质含量存在明显差异,同类化合物具有类似的规律,如酮类化合物(茄酮、二氢大马酮、巨豆三烯酮)都是焦甜焦香型最高而蜜甜香型最低,醇类(糠醇、西柏三烯二醇)和新植二烯则是清甜香型最高。

对这10项香气物质指标数据进行PCA,其特征值、方差贡献率结果如表8所示,10个主成分变量承载了样本的所有信息,考察特征值λ>1一共提取了3个主成分,累计方差贡献率高达82.37%,基本上解释了样本的香气物质信息。权重计算结果显示茄酮(16.08%)>二氢大马酮(15.46%)>巨豆三烯酮(15.41%)>二氢猕猴桃内酯(12.38%)>新植二烯(11.10%)>大馬酮(9.48%)>西柏三烯二醇(9.15%)>棕榈酸(5.45%)>糠醇(4.63%)>糠醛(0.86%),其中前5项指标的权重相对较大,说明茄酮、二氢大马酮、巨豆三烯酮、二氢猕猴桃内酯、新植二烯可能对烤烟烟叶的香型分类有重要影响。

2.5 不同香型烤烟在单类别指标下的分型分析

该试验考察了单类别质量特征指标的差异性对不同香型烤烟烟叶的区分程度,并以此来验证关键指标选择的合理性。图1为4类不同类型质量特征指标PCA的散点图,由图1a可知,除去个别样品外60个样品可以很好地分到3个区域,这说明可以通过外观质量指标提取的主成分来区分烟叶的不同香型风格,可保留权重较大的油分、色度为外观差异指标。从图1b可以看出,蜜甜香型与另外2个香型分布存在个别样本的重叠交叉,说明不同香型的烤烟烟叶在感官质量得分上界限不明显,考虑到感官质量一直是烟叶质量的重要评价标准,先保留权重相对较大的香气量、感官总分、浓度、刺激性4项指标为感官质量差异指标。由图1c可知,60个样品有着显著的“同类聚集,异类分散”现象,这说明可通过化学成分指标提取主成分来区分烤烟烟叶的香型,保留权重排前的氯、总糖、钾3个指标为差异指标。由图1d可知,3种香型的样品可以很完美地聚集到3个空间区域,这说明可以通过香气物质提取的主成分区分烤烟叶的不同香型风格,保留茄酮、二氢大马酮、巨豆三烯酮、二氢猕猴桃内酯、新植二烯5项权重相对较大的指标为差异指标。综合这4类指标中筛选出的14项差异性指标,共同用于后续聚类分析验证。

2.6 关键质量特征指标聚类分析验证

为了对以上所筛选的14项烤烟烟叶香型风格判别指标进行验证,设立了3组验证样:A组是从原样本集60个样本中随机抽取15个样品(编号1~5为清甜香型,6~10为蜜甜香型,11~15为焦甜焦香型);B组为从原样本集外部另取8个4种不同香型的验证样本(编号16~17为清甜香型,18~19为蜜甜香型,20~21为焦甜焦香型,22~23为清甜蜜甜香型);C组是由前2组合并的一个含有23个样品的新组。收集3组样品的上述14项指标数据再进行CA。

该试验采用的是个案系统聚类法,依照香型特性依次对A组、B组、C组样品个案进行CA,聚类结果如图2所示。从图2a自身验证结果可以看出,当组间距略大于5时,用以回判验证的15个样品能被较好地划分为3个类组,第一類是全部的焦甜焦香型样本(11~15号),第二类是全部的清甜香型样本(1~5号)和一个8号蜜甜香型样本,第三类为4个蜜甜香型样品,回判准确率为93.33%。从图2b可以看出,在组间距离为5时,8个外部验证样被分成了5类,第一类为蜜甜香型样品,第二类为清甜蜜甜香型样品,第三类为2个清甜香型样品;而2个焦甜焦香型样本(20、21号)被分成了两组,分类正确率为87.50%。从图2c可以看出,当组间距约为7时,23个烤烟叶样品样本被区分成4类,第一类样品为所有的焦甜焦香型样品(11~15、20~21号),第二类样品为所有的清甜香型样品(1~5、16~17号),第三类样品为外部验证样中清甜蜜甜香型样品(22~23号),第四类样品是全部的蜜甜香型样品(6~10、18~19号),分类正确率为100%。3组样品的整体聚类正确率为93.61%。

3 讨论

烟叶质量特征指标不仅变量多,而且类别也较多,其与香型的关系分析一直都是烟草行业的研究关注点。陈健等[18]研究西南清甜香烤烟风格质量指出,烟叶外观特征中的厚度、蜡质感、叶面叶背光差、颜色深浅是影响清甜香型烟叶风格及质量的关键外观质量特征指标,这些外观特征与该研究中的油分和色度指标关系密切。蒋美红等[19]建立了基于多源信息应用随机森林算法的分类模型,得出影响烤烟香型分类的重要变量为氯离子、总糖、宽度、厚度和钾离子,其中化学成分类各指标的重要性排序与该研究的关键性化学成分指标结果相一致。中性香气物质指标比较多,含量差异也较大,不同的指标对烟叶的质量和香型分类也有不同程度的影响。邬帅帆等[16]、李玲燕等[17]采用PCA法筛选出的不同生态区烤烟关键香气物质其中包括巨豆三烯酮和茄酮;许洪庆等[20]利用Fisher逐步判别法所筛选出的对不同香型分类具有重要贡献的16项指标中包括二氢猕猴桃内酯、巨豆三烯酮、新植二烯、西柏三烯二醇等,这些关键性指标均与该研究结果相一致。

虽然此前关于烟草质量特征和香型分类的研究较多,但大都是以单类型某几项指标来进行分类,难以客观地反映烟草质量特征的综合差异[6-7]。该研究从各类质量指标提取主成分得分绘制出的散点图结果显示,不同香型烤烟的各类质量指标存在程度不同的差异,从PCA提取的主成分计算的权重排序后,综合4类指标筛选出14项关键性指标用于后期的聚类分析,结果显示3组验证样品基本实现了同类聚集且异类分离,回判验证A组、外部验证B组和混合验证C组的聚类分析准确率分别为93.33%、87.50%和100%,整体聚类效果较好,由此说明了关键指标的可靠性。

4 结论

通过主成分分析从4类质量特征指标中共筛选出对烤烟香型贡献较大的14项关键指标,分别为2项外观质量指标(色度、油分)、4项感官质量指标(香气量、感官总分、浓度、刺激性)、3项常规化学成分(氯、总糖、钾)、5项中性香气物质(茄酮、二氢大马酮、巨豆三烯酮、二氢猕猴桃内酯、新植二烯)。

筛选的14项质量特征指标能够较为准确地将验证组A组15个样品聚为3类,B组8个样品聚为5类,C组23个样品聚为4类,分类正确率分别为93.33%、87.50%和100%。

聚类分析显示所筛选的14项关键性指标可以准确判别不同烤烟香型风格,并有效区分这3种不同新香型烟叶。

参考文献

[1] 常乃杰,刘青丽,李志宏,等.典型清香型烟区生态因子与烤烟品质灰色关联度[J].西南农业学报,2017,30(8):1754-1759.

[2] 张霞,张涛,段沅杏,等.烤烟香型与产区及品种的关系研究[J].烟草科技,2015,48(2):37-42.

[3] 罗登山,王兵,乔学义.《全国烤烟烟叶香型风格区划》解析[J].中国烟草学报,2019,25(4):1-9.

[4] 肖明礼,尹智华,战磊.3种香型风格烟叶化学成分与其感官质量的关系[J].西南农业学报,2015,28(6):2750-2755.

[5] 杨佳玫,陈颐,王玉平,等.不同生态区烟叶化学成分和营养元素特征与感官质量的关系[J].湖南农业大学学报(自然科学版),2015,41(4):364-368.

[6] 郭东锋,胡海洲,汪季涛,等.基于随机森林的烤烟香型分类研究[J].中国农学通报,2015,31(6):241-246.

[7] 许永,张涛,吴亿勤,等.基于烟叶致香成分建立烤烟香型分类模型方法研究[J].中国农学通报,2016,32(25):181-187.

[8] 詹军,周芳芳,邓国宾,等.基于化学成分和致香物质的烤烟上部叶香型判别分析[J].湖南农业大学学报(自然科学版),2013,39(3):232-241.

[9] 何晓群.多元统计分析[M].5版.北京:中国人民大学出版社,2019:106-132.

[10] LI H Y,BAOYIN H X.Sequence optimization for multiple asteroids rendezvous via cluster analysis and probability-based beam search[J].Science China technological sciences,2021,64(1):122-130.

[11] 史卫东,梁劲,张力,等.菜心和芥蓝表型多样性的主成分分析与聚类分析[J].西南农业学报,2020,33(12):2726-2735.

[12] 赵奇,罗青,陈丽培,等.中部地区农业经营主体收入的差异分析:基于SPSS聚类、主成分分析和灰色关联分析[J].安徽农业科学,2021,49(9):221-224.

[13] 任可,李天福,杨雪彪,等.云南德宏烤烟品种KRK26烟叶质量特征分析[J].西南农业学报,2019,32(10):2438-2444.

[14] 周亚辉,毛可亲.基于主成分分析的 CBA 球队综合评估指标权重计算[J].湖南理工学院学报(自然科学版),2020,33(4):18-21.

[15] 张朝明,赵坤,唐胜,等.6个豇豆品种农艺性状的相关性、主成分及聚类分析[J].西南农业学报,2021,34(3):501-507.

[16] 邬帅帆,刘百战,余苓,等.闭环回路气提法的烟叶香气成分特征判别研究[J].计算机与应用化学,2015,32(4):496-502.

[17] 李玲燕,徐宜民,刘百战,等.不同生态区域烤烟烟叶香气物质分析[J].中国烟草科学,2015,36(3):1-7.

[18] 陈健,蔡宪杰,郭文,等.西南部分清甜香型产区烤烟外观特征及其与常规化学成分和感官质量的关系分析[J].烟草科技,2020,53(8):7-14.

[19] 蒋美红,李晓婷,张晓龙,等.基于多源信息的烤烟香型分类[J].贵州农业科学,2017,45(3):115-119.

[20] 许洪庆,吕大树,张亚恒,等.二氯甲烷提取物致香成分GC/MS指纹图谱在烤烟香型鉴别中的应用[J].烟草科技,2017,50(1):30-40.

猜你喜欢
聚类分析主成分分析烤烟
烤烟上炕机械研制
不同追肥对烤烟品质的影响
主成分分析法在大学英语写作评价中的应用
农村居民家庭人均生活消费支出分析
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究
烤烟漂浮育苗和移栽改进方法研究进展