基于近红外光谱技术与优化光谱预处理的陈皮产地鉴别研究

2021-01-29 06:38李尚科蒋立文
分析测试学报 2021年1期
关键词:陈皮产地校正

余 梅,李尚科,杨 菲,郑 郁*,李 跑,3*,蒋立文,刘 霞

(1.湖南农业大学 食品科学与技术学院 食品科学与生物技术湖南省重点实验室,湖南 长沙 410128;2.湖南 师范大学 医学院,湖南 长沙 410013;3.湖南省农业科学院 湖南省农产品加工研究所,湖南 长沙 410125)

陈皮源自芸香科植物橘(Citrus reticulate Blanco),是由成熟柑橘果实皮经长时间干燥贮藏而制成的一种中药材,素有“千年人参、百年陈皮”一说。陈皮中含有丰富的黄酮类、挥发油类、多糖和微量元素等物质,在抗炎、抗氧、抗肿瘤、抗病毒及抗动脉粥样硬化等方面发挥着重大作用[1]。受生长环境(气候、雨水、光照及土壤等)的影响,不同产地的陈皮在药理作用和化学成分的积累上均有差别。通过对不同产地陈皮的调查研究发现,广东新会陈皮在临床应用与药效功能方面与其它陈皮有显著差别,其市场价格也远高于一般陈皮。近年来,在以市场利益为主导的大环境下,有不少商家利用陈皮在外观上的相似性,以次充好、以假乱真,严重损害了消费者的利益。当前对于陈皮产地的鉴别手段主要有感官检测与理化分析法。前者主要是靠经验丰富的工作人员根据颜色、形状、气味等差异对不同陈皮进行鉴别,该方法虽然操作简便,但易受主观条件及客观环境因素的干扰,其准确度有待提高。理化分析方法主要是通过检测陈皮中各成分含量进行鉴别,Liu等[2]将高效薄层色谱法(HPTLC)与高效液相色谱法(HPLC)结合,对陈皮中的邻氨基苯甲酸二甲酯进行测定,实现了不同产地陈皮的鉴别分析。Lv等[3]采用顶空/气相色谱-离子迁移谱法(HS/GC-IMS)测定了陈皮中挥发性有机酸的含量,实现了不同产地陈皮的鉴别。但是此类分析法操作繁琐、样品前处理复杂、实验周期较长、检测成本高,且对样品进行了破坏性前处理,影响了产品的二次销售[4]。因此开发一种快速、准确的陈皮产地鉴别方法至关重要。

近红外光谱技术是一种光谱波长介于可见光谱区和中红外光谱区之间的电磁波技术,波长在780~2 500 nm 范围,波数为4 000~12 000 cm-1,可直接实现复杂样品成分的定性与定量分析。与传统分析方法相比,近红外光谱技术具备操作简单、检测成本低及分析速度快的优点,被广泛应用于食品、石油、医药、烟草等相关领域样品的分析[5-7]。目前有关近红外光谱检测技术对陈皮的研究以成分检测、产地鉴别与品种识别为主,本课题组[8]通过近红外光谱技术采集了不同年份陈皮的光谱,利用单一预处理及优化预处理方法对光谱数据进行处理,最后结合线性判别分析方法成功实现了不同年份陈皮的鉴别分析。孙素琴等[9]利用傅里叶变换红外光谱法对7个产地陈皮中的挥发油进行分析,根据不同成分峰高比值的不同实现了新会陈皮和广西陈皮的鉴别分析。然而不同产地陈皮在颜色、形状、厚度等方面的差异较小,目前有关不同产地陈皮无损鉴别的研究也相对匮乏。此外,在采集光谱过程中,由于受仪器或样品自身的干扰,原始光谱中存在谱峰重叠、基线漂移等干扰,建立的模型稳定性差,精确度不高[7],通常需要结合合适的化学计量学方法如去趋势校正(DT)[10]、去偏校正(De-bias)[11]、标准正态变量变换(SNV)[12]、多元散射校正(MSC)[12]、最大最小归一化(Min-Max)[13]、一阶导数(1st)[14]、二阶导数(2nd)[14]和连续小波变换(CWT)[15]等对光谱进行预处理。每种预处理消除的干扰不同,如DT主要用于消除光谱中存在的基线漂移等现象;De-bias可消除仪器状态、测试环境、光程变化等对光谱造成的干扰;SNV与MSC主要用于消除光谱中的光散射干扰问题;Min-Max用于消除光谱的绝对吸收值及多余信息,以增加样品之间的差异,提高模型的稳健性和预测能力;而1st、2nd及CWT常用于消除光谱中存在的背景干扰等。褚小立等[16]对常见的近红外光谱预处理方法进行了详细总结,并给出了这些方法的具体算法以及一些应用实例。但由于近红外光谱的复杂性,仅用一种预处理方法难以达到理想的效果。卞希慧等[17-18]发现,采用合适的预处理组合方法可以提高建模效果,对于不同数据集,得到的最佳预处理组合也不相同,对已有预处理方法按照预处理目的进行分类再排列组合是选择最佳预处理方法的一种有效途径。

为了实现不同产地陈皮的无损鉴别分析,本研究利用近红外光谱技术采集了四川、福建及广东新会陈皮内侧和外侧的近红外光谱数据,以8种单一预处理及预处理组合的形式对光谱数据进行处理,结合主成分分析法(PCA)建立了陈皮产地的鉴别模型。通过考察单一预处理与组合预处理的鉴别结果,筛选出陈皮产地鉴别的最优预处理方法并建立可靠的鉴别模型,实现了不同产地陈皮的快速无损鉴别。

1 实验部分

1.1 仪器与材料

赛默飞世尔科技Antaris Ⅱ傅里叶变换近红外光谱仪,光谱预处理与鉴别分析由MATLAB R2010b(The Mathworks,Natick,USA)软件实现。

于药店购买广东新会、四川及福建3个地区的陈皮样品,以一片完整陈皮为1个样本,每个产地的陈皮取10个样本,共计30个样本,依次为新会(黑)、四川(红)、福建(蓝)。

1.2 光谱采集

本次实验在常温条件下进行,采用的近红外波数范围为4 000~10 000 cm-1,最小间隔约为4 cm-1,共采集1 557个数据点。为保证光谱测量的准确性,每一样本重复测量3次,取平均值作为该样本的原始光谱。

表1 3类预处理方法Table 1 Three types of pretreatment methods

1.3 聚类分析与光谱预处理

将3个地区的陈皮样品数据按照Kennard-Stone方法以8∶2的比例分组选取校正集和预测集。将DT、De-bias、SNV、MSC、Min-Max、1st、2nd和CWT 8种预处理方法按功能分成3类(表1)。采用单一预处理、两个预处理组合及3个预处理组合的方法共计119种方法对光谱进行处理,其中CWT采用范围为20的“haar”小波基;1st和2nd方法采用Savitzky-Golay平滑求导,结合鉴别率选取最优窗口参数为17。表2给出了119种预处理方法。最后结合PCA分析计算对应的鉴别率,实现对不同产地陈皮的无损鉴别分析。

表2 119种预处理方法Table 2 119 pretreatment methods

(续表2)

2 结果与讨论

2.1 不同产地陈皮原始光谱分析

为了实现不同产地陈皮的快速无损鉴别,采集了不同地区陈皮的近红外光谱。图1A为对不同产地陈皮样品的外侧测量3次取平均后得到的原始光谱图,可以清楚地看到光谱曲线趋势一致,且大多具有相同或相似的吸收峰,但大部分谱线有重叠现象,同时光谱存在较为严重的背景干扰和基线漂移问题。其原因可能是,陈皮外侧表皮凹凸不平导致其光谱在采集的过程中出现了明显的散射干扰。由于谱峰重叠且背景干扰严重,故较难从原始光谱中找到不同产地陈皮的差异信息。

为了消除这些由样品自身或仪器引起的背景以及基线漂移等干扰,分别对图1A的原始光谱数据进行多种单一光谱预处理。图1B~I分别为采用DT、De-bias、SNV、MSC、Min-Max、1st、2nd及CWT预处理后的光谱图。可见,经DT与De-bias方法预处理后,基线干扰得到明显消除(图1B,C),SNV与MSC方法处理后可消除光散射及基线漂移的干扰(图1D,E);Min-Max预处理后的光谱消除了数据尺度差异过大带来的不良影响,但仍存在明显的谱峰重叠问题(图1F);采用1st与2nd进行预处理可以消除光谱中的背景干扰,但同时在10 000~7 000 cm-1范围引入了一定的噪声干扰(图1G,H);运用CWT方法对光谱进行预处理后,背景干扰得以消除,谱峰信息更加明确,在7 000、5 500 cm-1两处有明显的吸收峰(图1I)。

2.2 基于单一光谱预处理的不同产地陈皮鉴别分析

图2给出了陈皮内、外侧光谱校正集和预测集的鉴别率。从图2A(内侧校正集)可见,内侧原始光谱数据的鉴别率只有12.5%,光谱数据经DT、De-bias与Min-Max预处理后的鉴别率均提高至83.33%;采用SNV、MSC、1st、2nd和CWT预处理后鉴别率均提高至91.67%;图2B(内侧预测集)中,经1st与2nd预处理后的鉴别率分别为83.33%和66.67%;运用DT、De-bias、SNV、MSC、Min-Max与CWT预处理后鉴别率均达到100%。图2C与图2D分别为陈皮外侧校正集与预测集的鉴别结果,其原始数据的鉴别率均在50%以上,校正集与预测集在经DT、De-bias、1st、2nd与CWT方法处理后的鉴别率均略有下降,SNV与MSC预处理后的鉴别率与原始光谱结果一致,仅通过Min-Max预处理后的校正集与预测集鉴别结果得到了提高,鉴别率分别为70.83%和66.67%。以上结果说明,采用合适的预处理方法可以扣除多种干扰,进而挖掘到光谱中隐藏的有用信息,提高鉴别准确率。但预处理选择不当可能会扣除光谱中的有用信息,导致鉴别率降低。由于陈皮内侧和外侧光谱中存在的干扰情况不同,且不同预处理方法只能解决光谱中某一类干扰问题,故选用的最佳预处理方法有所差异。同时结果表明仅用单一预处理方法无法实现对陈皮产地的准确鉴别分析。

2.3 基于两种预处理方法组合的不同产地陈皮鉴别分析

采用两种预处理方法组合方式以进一步消除光谱中的干扰,提高鉴别率。表2详细介绍了38种不同的组合方式。图3A、图3B分别为陈皮内侧光谱经两种预处理组合处理后校正集和预测集的鉴别结果,在38种组合中,DT+Min-Max组合预处理(No.32)的鉴别结果最优,其鉴别率为95.83%。同时,考察了同一种预处理不同组合顺序对鉴别结果的影响,采用Min-Max+DT的组合对光谱数据进行预处理,其鉴别率为91.67%,表明预处理的组合顺序不同鉴别结果也会有所差异。其余37种组合中除Min-Max+DT、Min-Max+SNV、Min-Max+MSC与CWT+De-bias 4组组合的鉴别率与单一鉴别结果一致外,其他组合的鉴别率相对于单一预处理结果均降低。图3C与图3D分别为陈皮外侧光谱经两种预处理组合处理后校正集和预测集的鉴别结果。校正集与预测集中共有9组组合(SNV+1st、1st+MSC、CWT+SNV、1st+SNV、SNV+CWT、Min-Max+1st、Min-Max+CWT、MSC+CWT与CWT+MSC)鉴别率达到100%,这是由于SNV与MSC有效扣除了由颗粒大小引起的散射现象,1st与CWT消除了基线漂移和背景干扰。

由于采用多种组合方法对光谱数据进行处理时扣除掉了光谱中更多无用的信息,使有效信息被提取出来,从而提高了鉴别率。对于陈皮外侧光谱数据,仅用两个预处理组合的形式即可实现100%鉴别,但内侧光谱数据中由于存在较多相似信息,仅用现有的两个组合形式无法达到100%的鉴别;同时,同一种预处理方法的不同组合顺序得到的结果也不相同。

2.4 基于3种预处理方法组合的不同产地陈皮鉴别分析

在两个组合预处理之后,基于内侧数据仍无法实现陈皮产地的准确鉴别分析,可能是因为不同产地陈皮的内侧光谱相似性较大,且光谱中存在多种干扰,仅用两个组合预处理方法无法得到理想的效果。因此以求导+散射+尺度化等形式进行3种预处理方法组合,并对光谱数据进行预处理,表2中给出了72种不同的组合方式。图4A、图4B为3种预处理方法组合对陈皮内侧光谱数据预处理后的鉴别结果,由图4A(陈皮内侧光谱校正集)可知,在72种组合中以1st+Min-Max+MSC、CWT+Min-Max+MSC、Min-Max+1st+MSC和Min-Max+CWT+MSC 4种组合预处理后的结果最佳,鉴别率均为87.50%,与单一预处理结果的91.67%和两个组合预处理结果的95.83%相比,其鉴别率有所下降。出现这种情况的原因可能是采用多种预处理时扣除了光谱数据中的有用信息,导致鉴别率降低。由图4B(陈皮内侧光谱预测集)可知,CWT+Min-Max+MSC、Min-Max+1st+MSC等19种组合实现了100%的鉴别。

通常认为采用多种预处理组合会消除光谱中存在的多种干扰,得到更好的结果,但从陈皮内侧数据结果来看,过多预处理在去除无效信息的同时也扣除了有用信息,从而降低了鉴别准确率。

2.5 基于优化预处理方法的主成分分析

图5给出了原始光谱及最优组合预处理的PCA结果,可见基于PC1与PC2的累计方差贡献率在80%以上,因此选用PC1及PC2进行PCA分析。从陈皮内侧(图5A)和外侧(图5B)原始光谱图的PCA结果可见,图5A中只有四川陈皮校正集中的3个样本得到了准确鉴别,其余产地陈皮的置信椭圆呈相互交错状态,其内侧数据的鉴别率仅为12.5%。图5B中新会陈皮校正集4个样本、四川陈皮校正集4个样本及福建陈皮校正集3个样本得到了准确鉴别,陈皮外侧数据得到的鉴别率仅为45.83%,故仅用原始光谱数据无法实现陈皮产地的准确鉴别分析。图5C和图5D分别为基于DT+Min-Max预处理的内侧数据结果以及经SNV+1st预处理后的外侧数据结果。由图5C可以明显看到,福建陈皮与新会陈皮、四川陈皮的置信椭圆呈完全分离状态,而新会陈皮与四川陈皮的置信椭圆存在一定的重叠情况,四川陈皮中有2个校正集样本落入新会陈皮的置信椭圆内,陈皮内侧数据的鉴别率为95.83%。在图5D中,经SNV+1st预处理后3个产地陈皮外侧数据的置信椭圆完全分开,实现了陈皮产地的100%鉴别分析。

3 结 论

本文利用近红外光谱技术采集四川、福建及广东新会陈皮的内侧和外侧光谱,以单一预处理及预处理组合的形式对光谱数据进行处理,筛选出最佳的预处理方法,最后结合主成分分析法建立了陈皮产地的鉴别模型。结果表明:使用预处理方法可以消除光谱中存在的干扰;预处理方法组合顺序不同,鉴别结果也会不同;过多预处理在进行无效信息去除的同时也扣除了有用信息,从而降低了鉴别准确率。近红外光谱技术结合光谱预处理可以实现不同产地陈皮的无损鉴别分析,其中陈皮产地外侧光谱数据经两个预处理组合优化处理后即可实现100%鉴别分析。

猜你喜欢
陈皮产地校正
卡西米罗·吉塞拉的诗
推动产地农产品追溯进入下游流通消费环节
一两陈皮一两金 陈皮养生很省心
陈皮很养生 但不宜久服
基于串联校正原理的LTI 系统校正实验综述报告
劉光第《南旋記》校正
印尼燕窝产地探秘
警惕“洗产地”暗礁
食物离产地越远越好
一种具有自动校正装置的陶瓷切边机