李石头,廖 付,何文苗,张立立,帖金鑫,李永生,郝贤伟,田雨农,毕一鸣,吴继忠,王 辉,徐清泉
浙江中烟工业有限责任公司技术中心,杭州市西湖区科海路118 号 310024
卷烟的品质和风格特色是产品设计人员通过对不同产地、品种、等级的烟叶进行配比而形成的。在某种原料用完后,需通过单料烟评吸、配方评吸等环节来确定替代烟叶或替代配方。烟叶替代及配方工作强度大、主观性强,主要依赖于配方人员的经验积累及评吸判断。若能通过仪器检测方法,利用客观数据来辅助配方,对提高卷烟质量稳定性有重要意义[1-4]。
近年来,近红外光谱检测技术以其快速、无损和低成本等优点,在农业、化工、食品等行业有广泛的应用[5]。利用近红外光谱结合化学计量学方法,可以实现烟叶常规化学[6]、部位[7]、产地[8]的识别及风格特征分析[9]。然而,无论是化学指标模型或者光谱投影,仅能从部分角度对烟叶进行评价,在辅助配方工作中时有发生计算结果与配方人员的感官评价不符且难以解释的现象。相似度是一种从整体上刻画两个图谱一致性的方法,在化学领域常用于利用中红外光谱或气质联用色谱对化合物进行鉴定。
近红外光谱没有显著的特征峰,且图谱受基线、散射、噪声等影响,因而对近红外光谱相似方面的研究鲜有报道。本研究中,提出一种基于近红外光谱相似表征烟叶相似的烟叶替代方法,通过光谱预处理与光谱相似算法的结合,抑制光谱中干扰因素的影响,旨在建立基于光谱相似的片烟相似、片烟组合相似的卷烟配方维护技术。
2015—2017 年用于卷烟配方的复烤片烟,包括我国的云南、四川、河南、湖南、湖北、贵州、山东、广西、福建以及巴西、津巴布韦等产区,共计400个(由浙江中烟工业有限责任公司技术中心提供)。
片烟样本取样后在低于50 ℃下烘干4 h 左右,直到可以用手指捻碎为准。利用Foss Cyclotec 1093旋风磨(丹麦福斯公司)进行磨粉,样本粉末过60目(孔径250 μm)筛。取适量烟末放入样品杯中,取一固定质量砝码放置在样品上方,使其自然压实后进行近红外扫描。近红外光谱由美国TheromFisher公司Antaris II型傅里叶变换近红外光谱仪采集,采集范围为10 000~4 000 cm-1,光谱分辨率为8 cm-1;扫描次数为72次。为避免散射的影响,近红外光谱进行了Savitzky-Golay(SG)平滑和标准正态校正处理。
1.3.1 光谱预处理
仪器采集的近红外光谱受基线、散射等影响,需进行适当的预处理才可计算光谱相似度[10]。常用的预处理方法有导数法[11]、多元散射校正(Multiplicative Scatter Correction,MSC)[12]、标准正态变量校正(Standard Normal Variate Correction,SNV)[13]等算法。一阶导数谱和二阶导数谱是红外光谱预处理中的常用方法。通过求一阶导数可以消除光谱中的常数项差异,例如常数性基线;二阶导数谱可以消除光谱的一次项差异。MSC 和SNV 方法是常用的散射校正算法。两种方法均假定光谱中含有一个乘性和一个加性干扰项,通过全谱来估计校正参数。这类方法的缺点是光谱中由物质含量变化导致的光谱形变同样被引入到校正参数的估计中,致使参数估计不准确。为此,使用局部校正(Localized Standard Normal Variate Correction,LSNV)来估计校正参数,从而得到更灵活的模型和更好的校正效果[14]。局部校正模型可以表示为:
其中:xj为第j 个波段的原始光谱;xjcorr表示第j个波段校正后的光谱;aj、bj分别代表第j 个波段的校正参数,j=1,2,…,k,k表示光谱波段数。图1展示了局部校正效果,其中,a1…a5表示加性校正参数,b1…b5表示乘性校正参数。
图1 局部校正算法(LSNV)示意图Fig.1 Schematic diagram of localized standard normal variate correction algorithm
1.3.2 光谱相似度算法
(1)光谱相关映射Spectral correlation measure(SCM)[15]
光谱相关映射表征光谱形态的相似性,以相关系数的形式计算两条光谱的相似度。
其中:n为光谱变量数;xi,yi为两条光谱第i波数的吸光度值,i=1,2,…,n为光谱平均值。
(2)欧几里得距离Euclidean distance measure(EDM)[16]
欧几里得距离直接计算了欧氏空间中两条光谱幅值(吸光度)的差异。将光谱假定为欧氏空间中的向量,光谱相似性转化为向量之间距离大小。
其中:n为光谱变量数;xi,yi为两条光谱第i波数的吸光度值,i=1,2,…,n。
(3)光谱信息散度Spectral information divergence(SID)[17]
散度源自于信息测度理论,每个光谱向量均可以视为具有概率统计特性的信息源,两条光谱的概率pi、qi可以描述为:
两条光谱的相对熵为:
其中:n为光谱变量数;xi,yi为两条光谱第i波数的吸光度值,i=1,2,…,n;X,Y表示两条近红外光谱。
最后,根据两条光谱之间的相对熵可得到光谱的信息散度(SID):
SCM表征了光谱形态的相似性,相关性越大,说明光谱独立程度越弱,相似性越高;EDM 衡量了光谱间的距离差异,距离越小,则光谱之间相似性越高;SID 将光谱看作是概率分布,通过衡量光谱之间的互信息大小确定两条光谱之间的相似程度,散度越小,光谱相似度越高。相关性、距离和散度是相似性度量的几种不同的表现形式,通过研究,采用涵盖3 种度量的方式表征相似度(Spectral similarity,SS)[18],SS越小,相似性越高。
近红外光谱主要是对含氢基团X-H(X=C、N、O)振动的倍频和合频的吸收光谱,其中包含了烟叶中大多数类型有机化合物的组成和结构信息,而烟叶风格和品质特点主要由这些化学物质及其含量决定的。近红外光谱作为烟叶中各有机物的一种表征形式,基本可以从整体上反映烟叶的综合品质;基于光谱的物质基础,再通过合理的样本选择、光谱处理、特征波数选择以及相似度算法,达到以光谱相似来表征烟叶相似的目的。
利用光谱相似进行烟叶替代分为两个步骤,对于由多个片烟组成的被替代目标,不是直接求解一个多片烟拟合光谱与目标光谱相似,而是针对目标中的每一个片烟,用光谱相似的方式确定若干个备选片烟,再通过拟合光谱的方式找出与目标最相似的组合。
这种方式的优点在于遵循了配方中“相似替代”的常用原则。对于目标中的每个片烟,都以光谱相似的形式,约束了其候选样本在化学、部位、香型等方面与目标片烟的差异程度,从而保障了目标叶组与替代叶组在烟叶“配伍性”等方面的接近程度,最大限度地避免了计算相似但感官评价不相似的问题。在第二步中,通过计算机可以根据各个片烟候选集模拟出大量配方,再以相似度为依据筛选出与目标烟叶组合最接近的替代烟叶组合。
1.5.1 三点评吸方法(Triangular Test)[19]
由10位从事烟叶原料及配方工作的评吸人员组成评价小组(10人均为男性,均获得国家烟草质量监督检验中心颁发的感官评吸证书,并具有5年以上卷烟感官评吸经验)。通过人工卷制烟支,选取单支质量为(860±70)mg 的烟支在平衡箱(湿度(60±2)%、温度(20.0±0.5)℃)内平衡24 h,然后采用三点评吸的方法进行感官评价。
1.5.2 描述评价方法
评吸人员组成和烟支样品制备方法同1.5.1。采用企业烟叶质量感官评价方法,由评价小组采用定量打分和文字描述相结合的方法对香气质、香气量、刺激性、余味、成团性、杂气、柔和性等方面进行评价打分,评分范围为0~10 分。在每个样本评价结束后,以10人评价小组的平均值作为该样本各指标的分值。
首先考察在不同预处理方式下,光谱相似与烟叶相似间的关系。对库存片烟进行相似度的计算,利用公式7,对任意一个片烟,计算其与库存所有片烟的光谱相似度。然后将计算结果按相似度大小排序,统计与目标片烟最接近的片烟在产地、部位、化学等指标的相似程度。
从表1 中可以看出,在不进行任何预处理时,相似片烟与目标片烟的产地、部位符合度分别只有57.3%和52.3%,主要化学成分总糖和烟碱的相对偏差分别为6.1%和9.9%。几项指标的差异性都高于人的感官差异阈值。经过预处理后,得到的相似片烟与目标片烟在各项指标的一致性都有提升,其中,使用一阶导数+局部校正LSNV 的预处理方法结果最好,产地与部位符合度分别达到82.0%和75.7%。经分析发现,产地不匹配的样本常分布于云南、四川、贵州交界处,部位不匹配的样本常由C4F等级构成,其相似片烟为下部模块。在化学成分含量方面,所提出的方法计算的相似片烟与目标片烟差异最小,因此,经过恰当的预处理和计算,光谱相似可以在产地、部位、常规化学等方面表征烟叶相似。
表1 不同预处理方法下光谱相似与烟叶相似的关系Tab.1 Relationship between spectral similarity and tobacco similarity under different pre-processing methods (%)
将2.1 中的相似度计算应用于烟叶替代过程中。对某季度二类卷烟牌号A 进行库存测算后,确定7 个需要替代的片烟(配方占比为35%)。对于每一个目标片烟,分别计算库存400个片烟与其的光谱相似度,按相似度大小进行排序,分别给出一定数量的片烟候选集合。
通过设定一个经验的相似度阈值,可以筛选出每个目标片烟所选出的相似片烟。由于云南、贵州等地片烟较多,经验表明,7 个备选片烟基本能满足替代要求。因此在相似片烟多于7个时,仅选择相似度最高的7个片烟作为候选。经统计,与目标片烟产地相符的比例为52.9%,部位相符的比例为76.5%。对于产地不符的相似片烟,往往来自于目标产地的相邻省份。相邻省份有着相近地理及气候,其烟叶在风格及品质上较为接近。
表2 中根据光谱相似筛选出片烟ZW15TLS 的相似片烟为2017 年和2015 年的津巴布韦片烟。通过调查发现,2016年津巴布韦由于气候异常,导致烟叶生产异常,烟碱偏高,香气减弱,刺激增大。因此,在相似度筛选中,算法判定2016 年津巴布韦烟叶与目标烟叶不在相似范围内。对于相似度算法筛选出的跨产区(省份)烟叶,如GZ14CDE 的备选烟叶CQ14CAQ。通过查阅片烟配方发现,GZ14CDE 烟叶主要来自贵州省德江县,CQ14CAQ烟叶主要来自重庆酉阳县,两个县区相距仅150千米,在环境气候等方面较为相似。
表2 目标片烟及筛选出的相似片烟①Tab.2 Target strips and selected similar strips
在单一烟叶替代实际应用中,配方人员对光谱相似筛选出的烟叶还会进行验证,如表2 中YN16CDC 筛选出的第一相似片烟为GX17XBI,通过评吸发现,除劲头和烟气浓度外,在香气量和香气质等方面,两个样本均有一定的差异,在配方人员的建议下,将GX17XBI删除。这种通过光谱相似筛选片烟,然后经过配方专家调整确认,删除不恰当的推荐目标的形式,可为下一步通过片烟组合模拟配方提供客观合理的片烟原料。
实验中,对表2中的相似片烟按目标片烟在卷烟配方中的使用比例进行模拟,在形成多个模拟配方后,按公式7计算模拟片烟组合与目标片烟组合间的相似程度并排序。实验发现,单一片烟中相似度排序第一的候选片烟在片烟组合中并没有出现在最接近的替代组合中。需替代的目标烟叶组合及筛选出的替代烟叶组合见表3。从结果看,除ZW15TLS 出现了多个候选外,其他片烟的候选基本确定且产地、部位与目标较为接近。其中,CQ14CAQ 替代GZ14CDE 的原因已在2.2 节中进行了分析,而SC16CDE 主要构成为四川凉山烟叶,其备选的YN16CHA 主要构成为云南烟叶,GZ17CEQ 主要构成为贵州毕节烟叶。目标及备选烟叶产区相邻,且都呈现清香型风格。
各个替代烟叶组合和目标烟叶组合的主要化学成分差异见表4。由表4可知,目标烟叶组合与替代烟叶组合的主要化学成分均较为接近,在总糖、烟碱、钾、氯等指标上基本相同,仅在还原糖上略有差异。
表3 目标烟叶组合及筛选出的替代烟叶组合Tab.3 Target blended tobacco and selected substituted combination
表4 目标烟叶组合及筛选出的替代烟叶组合的主要化学成分差异Tab.4 Differences in main chemical components between target blended tobacco and selected substituted combination (%)
根据2.3节分析,综合考虑相似度排序及化学差异,选取了近红外模拟配方中与目标接近的1号和2号模拟样本,分别与目标样本进行三点评价。三点评价中的原假设为:不可能根据特性强度来区别这两个样本。在这种情况下正确识别出单个样本的概率为P=1/3。备择假设:可以根据特性强度来区别这两个样本。在这种情况下正确识别出单个样本的概率为P>1/3。在两组实验中,正确识别出两个相同样本的人数均为3 人,利用二项式模型计算p 值为0.701,远大于0.05。因此,接受原假设,认为评吸小组无法识别2个样本间的差异。
对目标组合及两个替代组合进行感官评价,结果见表5。评价结果表明:1号、2号样本与目标样本相比,感官质量基本保持一致,个别指标略有变化,相比目标样本,1 号样本在香气质、香气量上略有提升,柔和性略欠;2号样本在香气量上略欠,但成团性和柔和性较好。两个样本的差异均在感官质量管控范围内,这个结果也与三点评价的结果相符。
表5 目标样本和模拟样本感官评价分析结果Tab.5 Sensory evaluation results of target samples and simulation samples
①提出了一种基于近红外光谱的烟叶替代方法。通过局部校正预处理及集成光谱相似度算法,排除了光谱中的基线、散射等干扰因素,实现了从光谱相似到烟叶相似的转化。目标烟叶与相似烟叶的产地、部位符合度分别为82.0%、75.7%,总糖、烟碱等主要化学成分的平均差异小于5%。②基于上述算法,提出一种片烟相似+组合相似的卷烟配方维护方法,所选择的替代配方在化学、感官方面与原配方无显著差异。