李华杰 ,王道铨 ,朱叶梅 ,林志平 ,张建平 ,杨盼盼 ,罗登炎,邱昌桂∗
(1.福建中烟工业有限责任公司,厦门 361021;2.云南瑞升烟草技术(集团)有限公司,昆明 650106)
配方是产品质量的决定因素[1]。卷烟配方由多种不同单等级片烟以一定比例配伍而成[2]。卷烟配方识别可为卷烟配方维护、卷烟产品质量稳定性评价奠定基础。传统的卷烟配方识别往往依赖感官质量、烟草常规化学和物理指标[3],这些方法检测周期长,评价结果反馈较实际生产相对滞后,不适用于卷烟生产线中批量样品的大规模评价。
烟草作为一种天然产物,含有大量的-CH、-OH和-NH 等官能团,会在近红外光区产生吸收[4]。近红外光谱技术具有快速、无损的优势,结合化学计量法被广泛用于烟草定量及定性分析[5]。定量分析方面,该技术被用于测定烟草常规化学成分[6]、关键致香成分[7]的含量;定性分析方面,该技术被用于识别烟叶原料产地和等级、卷烟品牌和真伪[5]。并且,该技术还可被用于卷烟配方替代[8]和产品质量稳定性评价[9-10],但相关报道中的研究对象多为粉末状的烟草样品[11-12],而粉末状烟草样品无法适用于卷烟生产过程的监测分析。
鉴于此,本工作以卷烟配方调整成品烟丝样品为研究对象,采用不同的光谱预处理方式,考察了主成分分析-马氏距离(PCA-MD)[13]、偏最小二乘法-判别分析(PLS-DA)[14]和正交偏最小二乘法-判别分析(OPLS-DA)[15]等3种模式识别方法对卷烟配方调整成品烟丝样品的分类效果,以期为卷烟配方替代和卷烟产品生产过程的质量稳定性评价奠定基础。
Nicolet Antaris Ⅱ型近红外光谱仪,配RESULTTM光谱采集软件;光谱预处理及识别模型的建立采用TQ analyst 8.6 和SIMCA 14.0分析软件。
2019年9月至10月某公司生产的X 牌号卷烟成品烟丝。
光谱扫描范围4 000~10 000 cm-1;分辨率8 cm-1;扫描次数64次。
1.3.1 配方调整成品烟丝样品的制备
在X 牌号卷烟成品烟丝中添加A 模块烟丝,得到A模块烟丝质量分数分别为0,2.0%,4.0%,6.0%,8.0%的配方调整成品烟丝样品。各比例样品制样120个,随机挑选其中的20个样品作为外部验证集,剩下的100个样品作为建模集。
1.3.2 近红外光谱的采集
在生产线上取烟丝样品(30 g·个-1),用自封袋密封,避光保存备检。开机预热近红外光谱仪2 h,将烟丝样品装入5 cm 石英杯中,置于旋转台上,按照1.2 节仪器工作条件采集样品的近红外光谱。
1.3.3 识别模型的建立
采用一阶求导+Savitzky-Golay平滑的方式对样品的近红外光谱进行预处理,选择主成分数为4,用OPLS-DA 建立识别模型。
1.3.4 感官评价
参照《卷烟工艺测试与分析大纲》所述方法,分别采用同一牌号的空烟管将配方调整成品烟丝卷制成成品烟支。根据YC/T 497-2014《卷烟 中式卷烟风格感官评价方法》,组织9名专业卷烟感官评吸专家对添加不同比例A 模块烟丝的成品烟支进行三点检验评吸。
采用求导法(一阶求导、二阶求导)和平滑法(Savitzky-Golay平滑、Norris平滑)对5 种不同比例的配方调整成品烟丝样品的近红外光谱进行预处理。以一阶求导+Savitzky-Golay 平滑和二阶求导+Norris平滑为例,原始光谱及预处理后的光谱如图1所示。
由图1可知,不同样品的原始光谱经求导和平滑处理后,部分波数范围内的吸光度差异性增强。
图1 原始光谱及预处理后的光谱图Fig.1 Original spectra and spectra after pretreatment
以原始光谱和经一阶求导+Savitzky-Golay平滑预处理后的光谱为例,当主成分数为4(PCAMD),6(PLS-DA),8(OPLS-DA)时,比较了PCAMD、PLS-DA 和OPLS-DA 等3种模式识别方法对5种不同比例的配方调整成品烟丝样品的分类效果,结果见图2和图3。
图2 原始光谱结合3种模式识别方法对样品的分类效果Fig.2 Classification effect of original spectra combined with 3 pattern recognition methods on samples
图3 一阶求导+Savitzky-Golay平滑结合3种模式识别方法对样品的分类效果Fig.3 Classification effect of first-order derivative+Savitzky-Golay smoothing combined with 3 pattern recognition methods on samples
通过对比可知:OPLS-DA 识别模型对5 种不同比例的配方调整成品烟丝样品的分类效果较好,其次是PLS-DA、PCA-MD;而一阶求导+Savitzky-Golay平滑预处理方式优于原始光谱。试验进一步对比了一阶求导+Norris平滑、二阶求导+Savitzky-Golay平滑、二阶求导+Norris平滑等预处理方式结合OPLS-DA 识别模型的分类效果,如图4所示。
图4 不同光谱预处理方式结合OPLS-DA 模式识别方法对样品的分类效果Fig.4 Classification effect of different spectral pretreatment methods combined with OPLS-DA pattern recognition method on samples
通过对比可知,分类效果最好的光谱预处理方式及模式识别方法组合为一阶求导+Savitzky-Golay平滑结合OPLS-DA。
根据模型的光谱变量解释能力(R2X)、光谱变量累计解释能力(R2Xcum)、分类变量解释能力(R2Y)、分类变量累积解释能力(R2Ycum)、特征值、交叉有效性(Q2)、累计交叉有效性选择最优的主成分数[10]。其中,(PRESS A、SS A-1为在主成分数A和A-1 下模型预测的残差平方总和)。当时,此时Q2≥0.097 5,增加主成分数可显著改善模型预测能力;当时,此时Q2<0.097 5,增加主成分数对模型的预测能力无明显改善。不同主成分数下一阶求导+Savitzky-Golay 平滑结合OPLS-DA 识别模型的参数见表1。
由表1可知,当主成分数从4增加到5时,Q2由0.229降至0.002,小于0.097 5,表明增加主成分数对模型预测能力的改善不显著,因此选择主成分数为4。
表1 不同主成分数下一阶求导+Savitzky-Golay平滑结合OPLS-DA识别模型的参数Tab.1 Recognition model parameters of first-order derivative+Savitzky-Golay smoothing combined with OPLS-DA on different principal component numbers
为进一步考察OPLS-DA 识别模型是否存在过拟合,对样本顺序进行随机置换,在模型中随机排列分类变量200次,并将单独的模型适用于所有排列的y变量,提取出与原始y矩阵相同的分量,以4个主成分数下200次随机排列的R2或Q2值为横坐标,原始和排列后y变量间的相关系数为纵坐标绘制关系曲线。当R2和Q2线性回归方程的斜率大于1,且Q2线性回归方程的截距小于0时,可判定模型稳定可靠,未出现过拟合现象。
以一阶求导+Savitzky-Golay平滑结合OPLSDA 识别模型为例,该识别模型的置换验证结果如图5所示。
由图5可知,R2和Q2线性回归方程的斜率均大于1,且Q2线性回归方程的截距小于0,表明该模型稳定可靠,未出现过拟合现象。
图5 一阶求导+Savitzky-Golay平滑结合OPLS-DA 识别模型的置换验证结果Fig.5 Substitution verification results of the recognition model of first-order derivative+Savitzky-Golay smoothing combined with OPLS-DA
利用不同模型,对5个不同比例的各20个外部验证集样本进行识别,进一步考察模型的稳定性和准确度,结果见表2。
表2 识别模型的外部验证结果Tab.2 External validation results of the recognition model
由表2 可知:不同识别模型对添加6.0%和8.0%样品的识别率整体优于2.0%和4.0%样品的;一阶求导+Savitzky-Golay平滑结合OPLS-DA 识别模型的整体识别率为99%,其次是一阶求导+Norris平滑结合OPLS-DA 识别模型和二阶求导+Norris平滑结合OPLS-DA 识别模型。基于模型的内部评价和外部验证结果可知,识别不同比例配方调整成品烟丝样品的最佳光谱预处理方式和模式识别方法为一阶求导+Savitzky-Golay 平滑结合OPLS-DA。
按照1.3.4节试验方法对5种不同比例的配方调整成品烟丝样品进行感官评价,结果如表3所示。
表3 感官评价结果Tab.3 Results of sensory evaluation
由表3可知:9名人员对4个添加不同比例的配方调整成品烟丝样品感官评价的识别率均低于一阶求导+Savitzky-Golay平滑结合OPLS-DA 识别模型的;当A 模块烟丝添加比例为2.0%时,与对照样(A 模块烟丝添加比例为0)感官评价无差异;当添加比例为4.0%时,样品整体品质特征有差异;当添加比例为6.0%,8.0%时,样品整体品质特征差异显著。以上结果表明,近红外光谱结合模式识别方法对不同卷烟烟丝配方的识别效果更好。
本工作采用近红外光谱法采集配方调整成品烟丝样品的近红外光谱,通过一阶求导+Savitzky-Golay平滑的方式对光谱进行预处理,结合OPLSDA 建立了卷烟烟丝配方比例的识别模型,可用于监测卷烟配方调整成品烟丝的品质和卷烟配方的维护。