烟用爆珠内液质量稳定性检测
——基于紫外光谱技术结合SVR算法

2019-07-10 03:12朱玲唐杰许嘉东胡兴锋彭忠谭广璐朱立军
中国烟草学报 2019年3期
关键词:牌号光谱样本

朱玲,唐杰,许嘉东,胡兴锋,彭忠,谭广璐,朱立军

重庆中烟工业有限责任公司技术中心,重庆市南岸区南坪东路2号 400060

烟用爆珠是一种颗粒状胶囊,里面包裹了由多种香精香料和适量溶剂调和制成的特色香味液体[1],埋于成品卷烟滤棒丝束内,是用于卷烟香气补偿的技术手段之一[2]。近年来,随着爆珠卷烟在国内外市场的快速发展,各烟草企业也逐步重视并加大了对爆珠卷烟的研究,同时爆珠相关研究也是中国烟草行业科技规划重大专项的分项之一。目前,关于烟用爆珠的研究报道多见于爆珠产品的研发制备和安全性考察[3-6],而对于烟用爆珠质量评价多见于物理指标的相关专利,如粒径大小、颗粒圆度、有无、位置偏移量、破损情况等的测定[2,7]。对于影响爆珠卷烟整体香味和品质的化学指标研究较少,目前仅见于何媛等[1]采用GC/MS法对爆珠内含物的测定。虽然物理指标能够体现爆珠的部分外观性状,却无法与内液的质量产生直接相关性;而GC/MS能够较准确检测内液的成分及含量,但由于成本较高,操作相对复杂,难以大面积推广。而烟用爆珠的错、混、浓度改变及质量波动将极大程度地影响爆珠卷烟质量。因此,亟待建立一种快速便捷的烟用爆珠质量判别方法。

支持向量机算法(SVM)是Vapnik等提出的建立在统计学理论基础上的一种机器学习算法[8],基本思想是寻找线性分类器中的最优分类面,其在对于小样本数、非线性和高维数据空间的模式识别问题上有一定的优势[9]。支持向量机回归(SVR)是建立在SVM基础上的回归算法,是从解决分类问题的SVM分类方法发展而来的,把变量选择和建立回归模型相结合,以期得到最佳分析效果[10]。紫外光谱技术因其灵敏可靠、简便快捷、易于推广等特点已经在烟用香精香料质量控制中得以应用[11-12],因此,本文以紫外光谱技术作为分析手段,建立一种基于SVR算法的烟用爆珠质量判别方法,旨在为烟用爆珠的质量判别提供参考。

1 材料与方法

1.1 仪器、试剂与材料

Cary60光纤紫外光谱仪(美国Agilent公司);7697-7890B-5977B型顶空气质联用仪(美国Agilent公司);XSE204电子天平(感量0.000 1 g,瑞士Mettler Toledo公司)。

无水乙醇(分析纯,≥99.7,上海国药集团)。

四种(编号A~D)不同牌号烟用爆珠样品由重庆中烟工业有限责任公司技术中心提供。

1.2 实验方法和条件

1.2.1 烟用爆珠样品的准备

A~D四种不同牌号烟用爆珠样品,每月抽样,连续抽样12个月。采用电子天平称量,精确到0.001 g,选择质量和粒径[2]偏差均不大于±5%的烟用爆珠样品。

1.2.2 样品溶液的制备

在10 mL 试管中加入2~3 mL无水乙醇,取烟用爆珠1~3粒加入到试管中,同一牌号烟用爆珠样品料液比相同。压破烟用爆珠,使得爆珠内液释放,充分摇匀,静置,待测。

1.2.3 紫外光谱仪测定

设定光纤紫外光谱仪测定波长范围为190~350 nm,吸光度记录范围为-0.1~3.5,波长间隔0.5 nm,光程为10 mm,测定时将光纤探头完全浸没在溶液中,无水乙醇作为参比液调零,以连续波长扫描3次的光谱数据平均值作为样品最终紫外光谱数据。

1.2.4 顶空-GC/MS测定

将定性滤纸在90 ℃烘2 h,裁剪成2 cm×1 cm的小块。对折小块定性滤纸;选取一种爆珠样品,取1颗放入小块定性滤纸中,置于20 mL的顶空瓶中,压破爆珠,加盖,平行制作3个样品。顶空-GC/MS分析条件:

顶空瓶:20 mL;样品环:1.0 mL;样品平衡温度:70 ℃;样品环温度:160 ℃;传输线温度:180 ℃;样品平衡时间:15.0 min;样品瓶加压压力:138 kPa;加压时间:0.20 min;充气时间:0.20 min;样品环平衡时间:0.05 min;进样时间:1.0 min;色谱柱:HP-5型毛细管柱(30 m×0.25 mm×0.25 μm);进样口温度:180 ℃;升温程序:。载气:氦气,1.0 mL/min;进样模式:分流进样;分流比:20:1;传输线温度:250 ℃;溶剂延迟时间:6 min;离子源温度:230 ℃;电离能量:70 eV。

1.3 SVR算法

支持向量机回归(SVR)是建立在SVM基础上的回归算法[8,13],其目标是寻求回归函数:

对于非线性问题,可以通过非线性变换转化为某个高维特征空间的线性问题,并在高维空间中进行线性求解。在高维特征空间中,线性问题中的内积运算可用核函数K(xi,xj)来代替,回归函数为:

目前,支持向量机算法的核函数有十多种,其中最常用的函数有以下几种:

径向基核函数(Radial basis function,RBF):

线性核函数(Linear):

多项式核函数(Polynomial):

Sigmoid核函数:

SVR模型优先确定核函数,核函数选择得适当与否,将直接影响SVR分类效果,另外核函数的参量对模型也会产生一定影响。

SVR分类算法将光谱数据与分类变量进行回归分析,其基本判别过程如下:首先建立校正集样本的分类变量,将分类变量与光谱数据进行SVR分析,建立分类变量与光谱数据的SVR模型,并计算预测集的分类变量值(y)。对于未知样本类型判别规则[16]是:①当y>0,判定样本属于该类;②当y ≤0,判定样本不属于该类。

根据正常样本的分类变量值(y)作质量控制图,中心线为样本统计的平均值,控制上限(UCL)为平均值加三倍的标准偏差,控制下限(LCL)为平均值减三倍的标准偏差,对于未知样本稳定性判别规则是:①当LCL≤ y ≤UCL,判定样本稳定性较好;②当y>UCL或y<LCL,判定样本稳定性差。

1.4 数据处理

采用Orange软件(3.16.0版)和R软件(3.5.1版)进行数据处理与统计分析。

2 结果与讨论

2.1 SVR模型的建立

2.1.1 变量分类赋值及校正集、验证集样本的选取

SVR分类是基于SVM方法建立的样本分类变量与样品紫外光谱的回归模型,根据烟用爆珠样本不同牌号进行分类变量和赋值[15-16]。以A牌号烟用爆珠内液SVR模型为例,对于选定的爆珠样本,随机选取100个样品,设定y值为1,再从B、C和D牌号烟用爆珠样本中各随机选取多个样品,设置y值为-1,将上述选取的样品作为校正集样本。A、B、C和D牌号烟用爆珠各自剩下的20个样品作为验证集。

表1 烟用爆珠样本分类变量Tab.1 Classification variables of breakable capsules in cigarette

2.1.2 特征波长区间的选择

样品化学成分和浓度不同时,其在不同波长处的吸光度值也不同,光谱图随之出现差异。本研究采用的四种不同牌号烟用爆珠内液的紫外光谱图如图1所示,各牌号烟用爆珠内液的紫外光谱峰型和吸收强度存在明显区别。为避免波段过宽造成光谱矩阵含有大量冗余信息和噪音干扰,导致后续分析的效率和准确度降低,本研究首先对紫外光谱波段进行了优化提取。烟用爆珠内液在190~230 nm区域存在较强的末端吸收,噪音较大,不适合模型的建立,而在波长大于330 nm区域吸光度小,曲线相对平滑,可利用信息少[17],光谱信息最为丰富的区域在230~330 nm范围内,因此选择波段230~330 nm作为优选谱区。

图1 不同牌号烟用爆珠内液紫外光谱图Fig.1 UV spectra of different brands of breakable capsules for cigarette

2.1.3 紫外光谱数据预处理方法的比较

紫外光谱数据通过预处理可以减少噪音和干扰,提高信噪比,提取出更多有效光谱信息,从而增强光谱的稳定性和分辨率[17]。本研究中首先采用 Gaussian Filter 平滑法对光谱进行平滑处理,平滑窗口为5,后对比了平滑后归一化(Normalize)、多元散射校正(MSC)、标准正态变量变换(SNV)、一阶导数和二阶导数预处理方法对SVR模型的影响,依据校正均方根(RMSE)和相关系数(R2)值考察数据预处理效果,其中RMSE越小,R2值越大,模型的拟合度越高、稳定性越好[9]。不同预处理方式RMSE和R2值如表2所示。无预处理时,除C牌号外,其他三个牌号烟用爆珠内液SVR模型R2值均大于0.95。平滑后Normalize、MSC、SNV和一阶导数预处理均能提高C牌号烟用爆珠内液SVR模型R2值,仅二阶导数预处理显著降低了C牌号烟用爆珠内液SVR模型R2值,可能是因为光谱数据中带有少许随机噪声,采用导数方法时放大了这些噪声信号,从而导致信噪比降低。综合比较平滑后归一化、MSC、SNV和一阶导数预处理方法,其中归一化法预处理结果略优于其他预处理结果。因此,平滑加归一化被选为最优预处理方法。

表2 不同预处理方法不同牌号烟用爆珠内液SVR模型RMSE和R2值Tab.2 RMSE and R2 values of the SVR models for different brands of cigarette breakable capsules under different preprocessing methods

2.1.4 SVR类型和参数的确定

不同核函数构建不同牌号烟用爆珠内液ε-SVR模型的RMSE和R2值以及最优参数如表3所示,选用RBF核函数和Polynomial核函数时,ε-SVR能得到较好的拟合,选用Linear核函数时其次,而选用Sigmoid核函数时,RMSE值明显高于其他核函数,而R2明显低于其他核函数,尤其是C牌号烟用爆珠内液ε-SVR模型,R2值仅有0.2540。不同核函数构建不同牌号烟用爆珠ν-SVR模型的RMSE和R2值以及最优参数如表4所示,选用不同核函数对ν-SVR模型的影响表现出与ν-SVR相似的结果,SVR模型效果最优的是RBF核函数,然后依次是Polynomial核函数和Linear核函数,最差的是Sigmoid核函数。对比同种核函数,不同SVR模型时RMSE和R2值,选用RBF核函数和Polynomial核函数时,ν-SVR模型优于ε-SVR模型;选用Linear核函数时,ε-SVR模型优于ν-SVR模型;选用Sigmoid核函数,ε-SVR模型和ν-SVR模型拟合效果均不大理想。综合考虑SVR类型和核函数类型,RBF核函数构建的ν-SVR模型拟合效果最好,RMSE达到最小,R2值均≥0.9993。因此,本研究选用ν-SVR模型,并选用RBF作为SVR的核函数。

表3 不同核函数构建不同牌号烟用爆珠内液ε-SVR模型的RMSE和R2值以及最优参数Tab.3 RMSE,R2 values and optimal parameters of the ε-SVR models with different kernel functions for different brands of breakable capsules

表4 不同核函数构建不同牌号烟用爆珠内液ν-SVR模型的RMSE和R2值以及最优参数Tab.4 RMSE,R2 values and optimal parameters of the ν-SVR models with different kernel functions for different brands of breakable capsules

2.2 SVR模型的验证

2.2.1 对校正集样本的验证结果

四种不同牌号烟用爆珠内液样品ν-SVR模型校正集样本的验证结果如表5所示。由表5可知,四种牌号烟用爆珠内液样品自身分类变量校正集样本的预测值分散在1附近,其他分类变量的预测值分散在-1附近,相对标准偏差均在5%以内。因此,根据判别规则该模型对校正集样本中四种牌号的烟用爆珠内液均能准确判别,正确判别率为100%,说明该模型有较高的判别能力。

表5 不同牌号烟用爆珠内液ν-SVR模型校正集预测结果Tab.5 The predicted values of the calibration set in ν-SVR models for different brands of cigarette breakable capsules

2.2.2 SVR模型对验证集样本的预测效果

利用四种不同牌号烟用爆珠内液的ν-SVR模型对未参与建模的验证集样本进行分析预测,结果如图2所示。由图2(a)可知,A牌号烟用爆珠样品分类变量验证集样本的预测值分散在1附近,其他分类变量的预测值分散在-1附近。因此,根据判别规则该模型对验证集样本中A牌号的烟用爆珠内液均能准确判别,对A牌号烟用爆珠内液样品的正确判别率为100%。B、C和D牌号烟用爆珠内液ν-SVR模型对其样本同样具有较好的判别能力,正确判别率均为100%。

图2 不同牌号烟用爆珠内液ν-SVR模型验证集样品预测结果Fig.2 Predicted values of the validation set in ν-SVR models for different brands of cigarette breakable capsules

2.3 烟用爆珠内液的稳定性判别

以A牌号为例,基于紫外光谱图谱和ν-SVR模型,选取正常6个批次,每批次16个样品,共计96个样品的 值建立A牌号质量控制图,并选取48个样品对控制图进行测试,其中正常样品(W1)、其他牌号样品(W2)、混有其他牌号的A样品(W3)、浓度降低的A样品(W4)以及浓度增加的A样品(W5)各12个,其中样品浓度增减通过调节无水乙醇的体积实现,增减幅度依次为5%、10%、20%、30%、40%、50%,平行两次。对96个正常样品检测结果按照批次顺序依次编为1~96号,W1类样品的检测结果编为97~108号,以各样本编号对应的y值作单值控制图,如图3(a)所示,中心线为1.0070,控制上限和控制下限分别为1.0293和0.9846。对W2和W3类样品的检测结果进行编号,依次编为1~24号,W4和W5类样品的检测结果按照浓度改变幅度由小到大进行编号,依次编为25~48号,同样作图,如图3(b)所示,W2和W3类样品较正常样品成分发现改变,检测结果均在模型控制限外。随着浓度变化幅度增大,W4类样品分类变量值逐渐减小,同样的浓度变化幅度,W5类分类变量值的变化幅度不明显;当浓度变化幅度在5%时,W4和W5类样品检测结果均在控制限以内;当浓度变化幅度大于10%时,检测结果均在控制限外;因此当浓度变化幅度超过10%时即可检测出样品浓度的变化。以上结果表明,基于烟用爆珠内液样品ν-SVR模型的分类变量值建立的质量控制图可以有效地监控爆珠内液的质量变化,提示样品错、混以及浓度改变等问题,对烟用爆珠产品质量进行判别。

图3 A牌号烟用爆珠内液质量控制图Fig.3 Quality control chart for liquid in breakable capsules of brand A

2.4 UV方法与顶空-GC/MS方法的比较

对A牌号正常样品以及W1~W4类样品分别进行顶空-GC/MS分析,结果图4所示,其中样品浓度的增减通过调节GC分流比实现。W1类样品谱图(图4b)与正常样品谱图(图4a)一致,W2~W4类样品谱图(图4c~4e)与正常样品谱图不同,出现少峰、多峰、响应信号变化等问题,判断样品稳定性改变,结果与UV方法一致,支持了UV图谱结合SVR算法的准确性。

GC/MS方法可以对爆珠内液成分进行分析,得到更多化学信息,且能分析出现异常样品质量问题的具体原因。而UV方法则相对更为简便快捷,仪器及操作要求低,易于推广,适用于大规模工业生产中对烟用爆珠内液质量稳定性的日常监测。因此可将GC/MS方法和UV法的优势相结合,为烟用爆珠内液质量稳定性的判别提供一种指导性方法。烟用爆珠内液作为多种香精香料调和制成的混合体系,若其稳定性发生变化,将一定程度影响感官评吸结果,而烟用爆珠内液稳定性变化幅度对感官评吸的影响程度还需进一步研究与探讨。

图4 A牌号烟用爆珠内液的GC/MS图谱Fig.4 The GC/MS spectra of liquid sample in breakable capsule of brand A

3 结论

(1)通过无水乙醇稀释烟用爆珠内液,紫外光谱扫描获得烟用爆珠内液紫外光谱数据,光谱数据经平滑和归一化预处理后,建立四种不同牌号烟用爆珠的SVR模型。

(2)采用径向基核函数,四个牌号烟用爆珠内液ν-SVR模型的校正集分类变量的预测值与实测值的相关系数均≥0.9993,ν-SVR模型对于参与建模的400个烟用爆珠内液样本(校正集)和未参与建模的80个烟用爆珠内液样本(验证集)的判别准确度均为100%,模型拟合性好,预测精度高,判别能力强。以烟用爆珠内液样品ν-SVR模型的分类变量值建立的质量控制图可以有效地判别爆珠内液的稳定性,且判定结果与GC/MS检测结果一致。

(3)紫外光谱技术结合SVR算法可对不同牌号烟用爆珠内液质量进行有效判别,提示样品错、混以及浓度改变等质量问题,且方法快速、准确、经济环保、易于推广。

猜你喜欢
牌号光谱样本
基于三维Saab变换的高光谱图像压缩方法
GB/T 3620.1—2016《钛及钛合金牌号和化学成分》标准解析
聚丙烯装置排产优化
高光谱遥感成像技术的发展与展望
用样本估计总体复习点拨
四刀五片技术在卷烟制丝切片中的应用
规划·样本
随机微分方程的样本Lyapunov二次型估计
基于GPU的高光谱遥感图像PPI并行优化
苦味酸与牛血清蛋白相互作用的光谱研究