许嘉东 唐 杰 朱 玲 朱立军 谭广璐 彭 忠 胡兴锋
(重庆中烟工业有限责任公司 技术中心,重庆 400060)
烟用爆珠是一种脆性胶囊,里面包裹了由多种香精香料和适量溶剂调和制成的特色香味液体[1],埋于成品卷烟滤棒丝束内,是用于卷烟香气补偿的技术手段之一。香精香料化学成分中无论是小分子易挥发的酯、醛、酮、不饱和醇、不饱和烃类,还是芳香族化合物以及生物大分子化合物,在紫外可见光谱区绝大部分都有吸收[2,3]。样品化学成分和/或浓度发生改变,其在不同波长处的吸光度值将发生变化,光谱图随之改变。紫外可见光谱技术具有灵敏度高、仪器价格低、操作简单及分析快捷等优点,方法便于普及与应用[4]。因此可选用紫外可见光谱技术检测烟用爆珠内液。
在应用紫外光谱技术检测复杂体系时,其核心是光谱数据的预处理和模型的建立。光谱数据的预处理方法主要有平滑、导数、归一化、多元散射校正(MSC)及标准正态变量变换(SNV)等[5,6]。偏最小二乘判别分析(PLS-DA)方法是基于PLS回归的一种判别分析方法,PLS算法与主成分分析(PCA)算法基本思想相近,但PLS算法将光谱分解和回归同时进行,将浓度矩阵的信息引入到光谱矩阵的分解过程中,从而可以最大程度地利用光谱数据与主成分浓度之间的线性关系[7],因此具有高效的鉴别能力。目前对烟用爆珠的研究主要集中在不同类型爆珠的研发[8]、爆珠外观质量检测[9]、爆珠对卷烟有害成分及特性的影响[8,10]、爆珠安全性[11]及其内液化学成分的检测[12]等,尚未见到烟用爆珠判别分析的研究,而烟用爆珠的错、混和稳定性改变将极大的影响爆珠卷烟制品的质量。因此,本实验以3种不同牌号的烟用爆珠样品紫外可见光谱为基础,采用PLS-DA算法建立烟用爆珠判别模型,旨在为烟用爆珠判别分析提供快速简便的参考方法。
烟用爆珠样品由重庆中烟工业有限责任公司技术研发中心提供。
无水乙醇(分析纯,≥99.7,上海国药集团)。
Cary60光纤紫外光谱仪(马来西亚安捷伦公司);XSE204电子天平(感量:0.1 mg,瑞士Mettler Toledo公司)。
1.2.1烟用爆珠样品的准备
A、B、C3种牌号烟用爆珠样品,每月抽样,连续抽样12个月,每批次每个牌号随机抽取不少于60颗。采用电子天平称量,精确到0.001 g,筛选质量和粒径偏差均不大于±5%的烟用爆珠作为测试样品。
1.2.2样品溶液的制备
在10 mL 试管中加入2~3 mL无水乙醇,取烟用爆珠1~3粒加入到试管中(由于不同牌号烟用爆珠样品内液的浓度差异较大,因此需根据不同烟用爆珠样品内液的浓度调整烟用爆珠和无水乙醇的料液比,使得样品在250~330 nm范围内的最高峰吸收值在0.2~1.0范围内)。压破烟用爆珠,使得爆珠内液释放,充分摇匀,静置,待测。
1.2.3紫外光谱测定
设定光纤紫外光谱仪测定波长范围为190~350 nm,吸光度记录范围为-0.1~3.5,波长间隔0.5 nm,光程为10 mm,测定时将光纤探头完全浸没在溶液中,无水乙醇作为参比液调零,以连续波长扫描3次的光谱数据平均值作为样品最终紫外光谱数据。
PLS-DA算法将光谱数据与分类变量进行线性回归,其基本判别过程如下:首先建立校正集样本的分类变量,将分类变量与光谱数据进行PLS分析,建立分类变量与光谱数据的PLS回归模型,并计算预测集的分类变量的值(y)。具体的判别规则是[13]:①当y>0.5,且偏差<0.5,判定样本属于该类;②当y<0.5,且偏差<0.5,判定样本不属于该类;③当y的偏差≥0.5,判别不稳定。
根据正常样本的y值作质量控制(QC)图,中心线为样本统计的平均值,控制上限(UCL)为平均值加3倍的标准偏差,控制下限(LCL)为平均值减3倍的标准偏差,对于未知样本一致性判别规则是:①当LCL≤y≤UCL,判定样本一致性较好;②当y>UCL或y 采用Orange软件(3.16.0 版)和R软件(3.5.1版)进行数据处理与统计分析。 2.1.1变量分类赋值及校正集、检验集样本的选取 PLS-DA模型是基于PLS方法建立的样本分类变量与样品紫外可见光谱的回归模型,根据烟用爆珠样本不同的牌号进行分类变量和赋值。以A牌号烟用爆珠PLS模型为例,对于选定的爆珠样本,随机选取100个样品,设定Y值为1,再从B和C牌号烟用爆珠样本中各随机选取105个样品,设置y值为0,将上述选取的样品作为校正集样本。A、B、C牌号烟用爆珠各自剩下的20个样品作为验证集。 表1 烟用爆珠样本分类变量 2.1.2特征波长区间的选择 不同烟用爆珠内液的紫外可见光谱峰型和吸收强度存在差异,如图1所示。为避免波段过宽造成光谱矩阵含有大量冗余信息和噪音干扰,导致后续分析的效率和准确度降低,本研究首先对紫外光谱波段进行了优化提取。烟用爆珠内液在190~230nm区域存在较强的末端吸收,噪音较大,不适合模型的建立,而在波长大于330nm区域吸光度小,曲线相对平滑,可利用信息少[6],光谱信息最为丰富的区域在230~330nm范围内,因此选择波段230~330nm作为优选谱区。 图1 不同牌号烟用爆珠样品紫外可见光谱图 2.1.3紫外可见光谱数据预处理方法的比较 紫外光谱数据通过预处理可以减少噪音和干扰,提高信噪比,提取出更多的有效光谱信息,从而增强光谱的稳定性和分辨率[14]。本实验对比了紫外光谱原始数据、平滑、平滑后标准归一化、多元散射校正(MSC)、标准正态变量变换(SNV)、一阶导数和二阶导数预处理方法(表2)对PLS-DA模型的影响,依据校正均方根(RMSE)和决定系数(R2)值,判别数据预处理效果,其中RMSE越小,R2值越大,模型的稳定性越好。当主成分数均设置为7时,PLS-DA建模,不同预处理方式RMSE和R2值如表2所示。归一化预处理对烟用爆珠PLS-DA模型没有优化作用,1阶导数处理对于B牌号、2阶导数处理对于B和C牌号PLS-DA模型均起到负作用,可能是因为光谱数据中带有的少许随机噪声,采用导数方法时放大了这些噪声信号,从而导致信噪比降低。平滑加MSC以及平滑加SNV均能优化PLS-DA模型,其中SNV预处理结果略优于MSC预处理结果。因此,平滑加SNV被选为最优预处理方法。 表2 不同预处理方法不同牌号烟用爆珠PLS-DA模型RMSE和R2值 2.1.4最佳主成分数的确定 PLS-DA建模中最主要的问题就是确定最佳主成分数,主成分数的选择直接影响模型的实际预测能力。本实验通过不同主成分数下所建模型的RMSE和R2值的大小,综合确定模型的最佳主成分数值[15]。从3个不同牌号烟用爆珠的PLS-DA模型的RMSE和R2值随主成分变化图(图2)可知,随着主成分数增加,3个模型的RMSE值均逐渐减小,R2值逐渐增加;当主成分数分别达到3、6、5时,A、B、C牌号烟用爆珠PLS-DA模型RMSE和R2值分别趋于稳定。而当主成分数过大时,将可能出现模型过拟合的现象[13]。因此,A、B、C牌号烟用爆珠PLS-DA模型的最佳主成分数值分别为3、6、5。 图2 主成分数对PLS-DA模型RMSE和R2值的影响 (a):RMSE值;(b):R2值 3种不同牌号烟用爆珠样品PLS-DA模型校正集样本的预测结果如表3所示。A牌号烟用爆珠样品分类变量校正集样本的预测值分散在1附近,其他分类变量的预测值分散在0附近,偏差均小于0.2。因此,根据判别规则该模型对校正集样本中A牌号的烟用爆珠均能准确判别,识别准确度为100%,模型的校正集相关系数(R2)为0.9862,校正集预测均方根误差(RMSEP)为0.0550,说明该模型有较好的拟合性和较高的预测精度。B和C牌号烟用爆珠PLS-DA模型对其样本同样具有较好的判别能力和预测精度,预测准确度均为100%,R2分别为0.9562和0.9586,RMSEP分别为0.0994和0.0980,可用于判别和预测新的样本。 表3 不同牌号烟用爆珠PLS-DA模型校正集预测结果 T 利用3种不同牌号烟用爆珠的PLS-DA模型对未参与建模的验证集样本进行分析预测,结果如表4所示。A牌号烟用爆珠样品分类变量验证集样本的预测值分散在1附近,其他分类变量的预测值分散在0附近,偏差均在0.2以内。因此,根据判别规则该模型对验证集样本中A牌号的烟用爆珠均能准确判别,对A牌号烟用爆珠样品的预测准确度为100%。模型的验证集相关系数R2为0.9686, RMSEP为0.0835,说明该模型判别准确度高。B和C牌号烟用爆珠PLS-DA模型对其样本同样具有较好的判别能力和较高的预测精度,预测准确度均为100%,R2分别为0.9411和0.9560, RMSEP分别为0.1146和0.1063。B和C牌号烟用爆珠PLS-DA模型也具有较好的判别能力和较高的预测精度。 表4 不同牌号烟用爆珠PLS-DA模型验证集预测结果 图3 烟用爆珠内液单值控制图 (a):A牌号;(b):B牌号;(c):C牌号 (1)通过无水乙醇稀释烟用爆珠内液,紫外可见光谱扫描获得烟用爆珠内液紫外光谱数据,光谱数据经平滑和SNV预处理后,建立了3种不同牌号烟用爆珠的PLS-DA判别模型。 (2)3个牌号烟用爆珠PLS-DA模型的校正集分类变量的预测值与实测值的相关系数均≥0.9562,PLS-DA模型对于参与建模的310个烟用爆珠样本(校正集)和未参与建模的60个烟用爆珠样本(验证集)的预测准确度均为100%,模型拟合性好,预测精度高,判别能力强。且基于PLS-DA模型的分类变量值建立的单值控制图可以对烟用爆珠内液的一致性进行快速判定。 (3)紫外可见光谱技术结合PLS-DA算法可对不同牌号烟用爆珠进行有效判别,且方法快速准确、经济环保、易于推广。1.4 数据处理
2 结果与讨论
2.1 PLS-DA模型的建立
2.2 PLS-DA模型对校正集样本的验证结果
2.3 PLS-DA模型对验证集样本的预测效果
2.4 烟用爆珠内液一致性分析
3 结论