闫铁军,陈思蒙,周红审,许自成,庞 哲,刘文锋,潘婷婷,邵惠芳
(1.湖北中烟工业有限责任公司,武汉 430040;2.河南农业大学烟草学院,郑州 450002)
卷烟感官质量评价是烟草工业产品质量控制的依据和基础,卷烟感官舒适性是其中重要的评价内容[1]。研究发现,消费者在抽吸卷烟时,对产品感官舒适度的关注程度普遍较高,因此,维持并提高卷烟感官的舒适性是目前行业内面临的重要研究课题[2]。
卷烟感官舒适性具体体现在刺激性、干燥感和生津感3 个方面,其在很大程度上取决于烟叶的内在化学成分是否协调,以及致香物质是否代谢、积累完全[3]。化学成分与感官质量之间存在着复杂的线性及非线性关系,学者们对其做了大量研究[4],常见的方法有典型相关性分析[5]、聚类分析[6]等,其他方法,如主成分分析[7]可以对多个指标进行降维处理,得到数量较少、相关性较低的新变量,且新变量能够有效解释原始变量的信息;偏最小二乘回归分析[8]可以有效解决试验样本的数量限制和数据间具有共线性等问题;逐步回归分析[9]可以通过逐个引进变量,根据变量的显著性及贡献率对其进行保留,建立拟合度最高的方程。朱保昆等[10]采用复相关系数方法分析并验证了烤烟主要内在化学成分与感官舒适性间的相关程度。胡建军等[11]基于广义可加模型对化学成分与感官指标间的非线性关系进行了研究。张强等[12]运用相似距离分析法对卷烟感官特征进行分析,对拥有相似内在品质的不同卷烟间进行了量化比较,消除其差异性。
截至目前,相关研究的分析指标较少,并且分析方法多为单一分析方法,仅分析了化学成分与感官指标间的相关性,少有预测模型[13]。当遇到大量具有自相关性或多重共线性的样本数据时,若建立预测模型时也会大大降低模型的有效性和稳定性[14]。本试验根据本次样品指标的特性,并对比不同分析方法间的特点与优点,选取主成分分析和逐步回归分析相结合的方法,对复杂数据体系进行有效降维,将相关性较高的变量转换为相关性较低的主成分,再根据其显著性和贡献率逐一引入回归方程中,由此建立最优回归方程[15]。结合测定指标与主成分之间的逐步回归分析模型,可以较为准确地预测烤烟的感官舒适性,为进一步提升卷烟产品感官舒适性提供技术支撑。
试验样品包含国内云南、四川、贵州、湖北、重庆、湖南、福建、广东、江西、河南、安徽、山东、陕西、黑龙江、辽宁、吉林、湖南等地区的不同等级烟叶,由湖北中烟工业有限责任公司提供。其中,上部叶包含B2F 等级的烟叶43 份,中部叶包含C3F 等级烟叶44 份、C3L 等级烟叶40 份、C4F 等级烟叶42 份、C4L 等级烟叶1 份,样品数量共170 份。
1.2.1 化学成分指标 选取烟草行业关注度较大的烟叶内在化学成分指标进行测定,包括烟碱、还原糖、总糖、总氮、氯、钾以及多酚类化合物绿原酸、莨菪亭、芸香苷。烟碱参考YC/T 160—2002 方法测定,还原糖、总糖参考YC/T 251—2008 方法测定,总氮、氯、钾分别参考YC/T 161—2002、YC/T 162—2002、YC/T 217—2007 方法测定,多酚类化合物参考YC/T 202—2006 方法测定。
1.2.2 感官舒适性评价指标 烟叶感官质量舒适性评价指标包括香气指标透发、甜润、清晰,烟气指标流畅、圆润、醇和,口感指标干净、清爽、湿润,由评吸专家根据评分标准(表1)进行评吸打分,根据评分权重(表2)以及式(1)计算单项平均得分,结果精确至0.1。
式中,∑Xi为某单项得分加和;N 为参加评吸人数;Ki为某单项权重;Xi为某单项平均得分。
表1 烟叶感官质量舒适性评价各项指标评分标准
表2 烟叶感官质量舒适性评价各项指标评分权重
样本数据以8∶2 建立训练集与测试集,运用随机取样法选取136 个数据用于建立感官舒适性预测模型,其余34 个数据用于验证该模型。
1.3.1 简单相关性分析 简单相关性分析采用Pearson 相关分析对全部170 个样本进行分析。Pearson 相关分析是一种运用相关系数对变量间进行线性关系分析的方法,通过对样本相关系数(r)的计算,对其线性关系显著程度进行推算[16],数学公式如下。
式中,n 表示样本数量,xi、yi表示两样本间的变量值。
显著性检验采用t 检验法,公式如下。
1.3.2 主成分分析 主成分分析法(Principal component analysis,PCA)是一种通过线性降维来解决具有较多变量且高维复杂体系的数据分析方法。PCA在尽量保留原始数据信息的基础上,将原始相关性较强的变量转换为数量较少且不相关的变量,可以对原本相关性较高的变量信息有效地降维[17]。转换公式如下。
式中,Xi为原始变量,i=1,2,…,p,p 为原变量个数;Fj为主成分,j=1,2,…,m,m 为线性合成的主成分个数。式中需满足m 小于或等于p,且系数lj1+lj2+ lj3…+ lji= 1。
1.3.3 逐步回归分析 逐步回归分析是通过分析自变量对因变量(y)的作用、贡献率以及显著程度,保留影响显著、剔除影响不显著的自变量,并且每一次都对拟合优度(R2)进行检验,将拟合优度减小的引入变量筛除,由此建立满足两点要求的最优回归方程[18]。
选取R2最大的变量Zj建立模型。
若R1<R2、F1<F2且Zj表现为显著,表明引入Zi可优化方程,则引入Zi,否则删除Zi。反复重复该步骤,直至所有变量全部经过筛选。
运用SPSS 21.0 统计学软件对烟碱、还原糖、总糖、总氮、氯、钾、绿原酸、莨菪亭、芸香苷9 个指标进行描述性分析、简单相关性分析、主成分分析以及逐步回归分析,建立基于化学成分的烟叶感官舒适性预测模型。
化学成分指标的相关描述性统计见表3。如表3 所示,除还原糖、总糖、绿原酸和芸香苷含量的标准差大于1 外,其他指标含量的标准差均小于1。其中,还原糖与总糖含量的偏度小于0,表现为左偏峰,其余化学成分指标均大于0,表现为右偏峰;所有指标峰度皆为正数,呈尖峭峰分布。
化学成分与感官舒适性的简单相关分析见表4。结果表明,除透发外,烟碱含量与其他舒适性指标均呈负相关,大部分达显著或极显著水平。还原糖、总糖含量与所有舒适性指标呈正相关,大部分达显著或极显著水平。总氮含量与透发呈正相关,与其他指标均呈负相关;氯含量与圆润呈正相关,与其他指标均呈负相关。钾含量与所有舒适性指标均呈正相关,与圆润、干净、清爽、湿润均呈显著正相关。绿原酸含量与各指标均无显著相关。莨菪亭含量与干净呈显著负相关,芸香苷与透发呈显著正相关,二者均与其他指标无显著相关性。
表3 各化学成分含量描述性统计结果
表4 各化学成分含量与感官舒适性的Pearson 相关分析
采用主成分分析方法对化学成分指标进行因子提取,并运用最大方差旋转方法进行旋转,以便找出因子和研究项的对应关系。根据KMO 和Bartlett 的检验,可知KMO 为0.686,大于0.6,说明变量间存在相关性,可以进行主成分分析;Bartlett 球形度检验中的P 为0.000,小于0.001,说明本组数据进行主成分分析是有意义的。主成分分析解释的总方差如表5 所示。为了使公因子间差距尽可能大,进行公因子旋转。可知主成分的累计贡献率达90% 以上时认为提取的变量较好,故针对主成分提取情况进行分析。本次主成分分析共提取出6 个主成分,6个主成分旋转后的方差解释率分别为28.294%、17.479%、12.603%、11.848%、11.589%、11.341%,累积方差解释率为93.155%。旋转后因子载荷系数矩阵如表6 所示。
表5 解释的总方差
表6 旋转后因子载荷系数矩阵
主成分分析成分得分系数矩阵见表7。主成分分析中解释的总方差为93.155%,生成6 个新的解释变量F1、F2、F3、F4、F5、F6,利用成分得分系数矩阵求得解释变量与各指标之间的关系式如下:
表7 成分得分系数矩阵
式中,X1为烟碱,X2为还原糖,X3为总糖,X4为总氮,X5为氯,X6为钾,X7为绿原酸,X8为莨菪亭,X9为芸香苷。
根据权重得到综合评分F 的计算结果如下。
F=0.304F1+0.188F2+0.135F3+0.127F4+0.124F5+0.122F6
综合评分的得分越高,说明烟叶品质越好。
将主成分分析提取出的6 个新解释变量作为自变量,将感官舒适性评价指标透发(Y1)、甜润(Y2)、清晰(Y3)、流畅(Y4)、圆润(Y5)、醇和(Y6)、干净(Y7)、清爽(Y8)、湿润(Y9)得分作为因变量进行逐步回归分析,筛选出对因变量具有显著性的变量。
建立的逐步回归模型如表8 所示。在逐步线性回归的模型中,Y 表示因变量,用F1、F2、F3、F4、F5、F6表示自变量。模型通过F 检验,F 变化量的显著性均小于0.05,说明模型有效。另外,针对模型的多重共线性进行检验发现,模型中VIF 均为1,意味着不存在共线性问题;并且D-W 均在2 附近,表明样本数据之间没有关联,模型不存在自相关性,说明模型较好。
表8 逐步回归模型
由表9 可以看出,主成分-逐步回归分析预测感官舒适性评价的预测模型的平均相对误差最高为7.3%,最低为1.1%,均在误差允许的范围之内,因此采用主成分分析方法对烟草的化学成分指标进行选取,然后采用逐步回归分析法进行优化选取,建立感官舒适性的预测模型,能够较好地预测烟草的感官舒适性。
表9 感官舒适性真实值与预测值的误差
烟叶感官质量拥有复杂的评价体系,体系的科学构建对烟草原料的采购以及卷烟配方的应用具有重要的指导意义。由于烟草品类繁多,内在化学成分也具有多样性,因此,构建体系需要由简到繁来逐步进行,提取与感官舒适性相关性较大的化学成分,进而构建评价模型。
烟叶内各化学成分会对烟叶感官舒适性产生不同的影响,从而影响烟叶的感官质量评价。烟碱在烟叶内呈游离态和结合态两种形态,经燃烧进入烟气后,会引起口腔中明显的苦味刺激,进而影响感官舒适性。本研究的结果也表明了这一点,除透发外,烟叶烟碱含量与所有感官舒适性评价指标均呈负相关,这与王明锋[13]的研究结果一致。烟叶内的糖类物质,特别是还原性糖在烟支燃吸时能起到使烟气酸碱平衡,从而降低刺激性。在本研究中,还原糖、总糖含量与所有指标均呈正相关,说明在一定范围内,还原糖、总糖含量对烟叶感官舒适性有积极作用。钾与氯也是影响烟叶质量的重要物质,在本研究中,钾与圆润、干净、清爽和湿润呈显著正相关,而氯仅与流畅呈显著负相关。烟叶多酚类物质会在烟叶燃吸通过蒸发等途径直接进入烟气,因此对感官舒适性产生直接影响。在本研究中,莨菪亭与干净呈显著负相关,芸香苷与透发呈显著正相关。而王明锋[13]认为酚类化合物与卷烟舒适性呈负相关,与本研究结果不完全一致,可能是因为对透发等指标的判定标准有差异。
本研究根据本次样品指标的特性,通过采用主成分分析和逐步回归分析相结合的方法,对复杂数据体系进行了有效降维。烟草化学成分指标的原始参数总共有9 个,运用主成分分析方法,选取前6 个累积贡献率达到90% 以上的主成分。既降低维度,减少了原始变量个数,又尽可能多地反映了原始变量的信息,并且各个主成分之间彼此相互独立,为建立逐步回归预测模型奠定了基础。基于主成分分析所得的6 个变量,利用测试集的数据通过逐步线性回归的方法,对透发、甜润、清晰、流畅、圆润、醇和、干净、清爽、湿润9 项指标分别建立了预测模型。利用测试集的数据对预测模型进行验证,发现预测误差较小,表明该预测模型具有可行性。