陶益,沈丽莎
浙江工业大学 药学院,浙江 杭州 310014
近年来,随着中医药的快速发展,中药质量安全控制引起了广泛的关注,中药质量评估体系对保证中药安全性和有效性至关重要。品种、产地、种植环境、加工贮存方式等都会对中药材的药效产生极大的影响。目前,中药材质量控制与检测的常用方法有高效液相色谱法(HPLC)、气相色谱法(GC)、气相色谱-质谱法(GC-MS)、高效液相色谱-质谱法(HPLC-MS)、超高效液相色谱串联质谱法(UPLC-MS/MS)等[1],虽然上述方法较薄层色谱法(TLC)等传统质量检测技术更为直观、精确和方便,但操作仍比较复杂,因此需要能够实现快速、实时质量控制的检测技术。近年来,微型质谱仪、近红外光谱、高光谱成像技术、激光诱导击穿光谱法(LIBS)、拉曼光谱等已逐渐应用于中药产品质量控制,实现了在线获取并快速分析产品数据,对产品质量进行全面控制。本文讨论LIBS在中药质量控制中的应用,为推动中药质量控制体系走向快速化和在线化提供参考。
LIBS 检测仪主要由激光器电源、激光头、耦合镜、光纤、电动旋转样品台、剪式升降台和数据处理系统组成,见图1。
图1 LIBS检测仪光谱装置图
LIBS 作为一种发射光谱法具有快速、在线分析、对样品损害小、可同时测定多种元素、可实现原位或远程在线操作等优点[2-3]。自1962 年Brench 首次提出等离子体可以作为一个光源以来,LIBS 光谱发展至今,从开始的材料元素分析,到现在已逐渐发展成为一种能够实现多种材料在线检测的技术[4]。LIBS 主要是通过高能脉冲激光烧灼样品表面,当激光到达样品表面的能量超过样品的击穿阈时,激光灼烧区的微粒会出现多光子电离现象,从而产生初始自由电子,这些电子不断重复着初始自由电子的行为,使微粒、分子、原子等不断被电离,从而产生激光诱导等离子体,等离子体在冷却时会发出材料中存在的化学元素特定的辐射[5],光收集器有效地收集等离子体光以后,进入检测器,并产生对应的谱图,最后经过数据处理,由发射位置和强度得到定性、定量的结果。其中,等离子体产生、演化和辐射需满足以下3 个条件:激光化学计量烧灼的条件;等离子体达到局部热平衡状态,即因电子碰撞激发的原子数等于激发原子的碰撞消激发数、原子的碰撞电离数等于撞击粒子间的复合数、辐射等于吸收;光谱线满足光学薄条件,即无自吸收效应发生。
LIBS 检测过程中会受到很多因素的干扰,如光线、样品、检测环境等,会出现检测灵敏度低[6]、分辨率低、难以量化[7]、非线性现象[8]等问题。为了改善LIBS的灵敏度和分辨率,研究者指出可以采用一些辅助手段来改进LIBS,如放电辅助LIBS[9]、双光束LIBS[10]、大气压辉光辅助LIBS[11]、双脉冲LIBS[12]、电极富集LIBS[13]、微波辅助LIBS[14]等。李文平等[15]借助BaCl2溶液对单脉冲(SP)与正交双脉冲(DP)LIBS 的灵敏度进行比较,结果发现,DPLIBS 的灵敏度远高于SP-LIBS,同时检测限下降到了1.78×10-6。另外,目前使用的各种机器学习方法LIBS 定量分析的准确性仍然不高,Song 等[16]将领域知识结合到机器学习中以实现光谱的量化,提出将发射光谱的领域知识与核极限学习机(K-ELM)结合,即主导因子的K-ELM(DF-K-ELM),提高了LIBS 量化模型的可解释性和准确性。此外,研究者们还发现在数据量化的过程中回归模型和提取类型的选择是数据量化分析的关键方面,以最佳方式对数据进行量化处理,可以表现出色的分析性能[17]。在此之前,若光谱信息未经任何处理就对物质定性和定量分析,噪声和基质效应会严重掩盖有用信息。因此,在定性和定量测定之前,常需要对光谱进行去噪、基线校正和谱峰校正处理[18]。
2.1.1 去噪 原始信号相对来说是低频、稳定的信号,噪声更多的是高频信号,因此原始信号常会被高频信号所淹没,通过信号去噪法对含噪声信号进行分解转化,得到去噪信号[19]。常用LIBS 信号去噪法包括傅里叶变换法、小波阈值变换去噪法、平滑去噪法等。
2.1.2 基线校正 LIBS 在某些情况下的检测结果并不理想,主要原因是连续介质背景和光谱暗电流会影响光谱信号,发射谱线通常与光谱背景重叠。基线校正常用的方法有小波变换法、中值滤波法、多项式拟合法等。Liu 等[20]开发了一种LIBS 基线校正的新方法,即波长人工移减法,该方法在单个光谱上对波长进行偏移,将移位和未移位的频谱进行减法处理以后,信号基线得到很好的校正。
2.1.3 谱峰识别 光谱上特定位置的信号常表示为某一对应化学物质或元素及其含量,因此信号的形状、大小、出峰时间、高矮等对物质的定性定量会产生极大的影响,谱峰的准确识别是获取物质关键信息的重要方法。但目前,针对LIBS还尚无公认的较好的算法,目前常用的算法包括三点寻峰算法、蒙特卡罗算法、七点比较法等。
在LIBS 光谱图中,每种元素都会有很多强度不同的谱线,这些谱线相互重叠构成了复杂的谱图,且样品中所含元素越多,结果越复杂[21],因此从LIBS 数据中提取最有用的特征数据能够提高模型预测的准确性。样品的定性和定量分析大多都是通过LIBS 数据中某些元素的发射谱线或借助主成分分析和偏最小二乘法回归(PLSR)等多元分析方法,使用LIBS的全谱图数据建立分类或回归模型,这就会导致非特征性数据降低模型的性能。Huang 等[22]提出了一种特征数据提取的新方法,即完整变量和特征变量之间的交叉计算(CCFCV),用于LIBS 数据的特征提取。该方法使用1889 个全变量和排放变量来选择重要特征,快速筛选出30 个特征变量进行铬(Cr)分析。其中,18 个特征变量与Cr 参考含量的相关值>0.90,利用这30 个特征变量分别建立PLSR和最小二乘支持向量机(LS-SVMs)模型,CCFCVPLSR 和CCFCV-LS-SVM 模型的平均残差预测偏差(RPD)为3.762,高于连续预测算法(SPA)和竞争性自适应重加权抽样(CARS)模型。此外,使用线性和多项式2 个拟合函数,分别建立Cr 和铜(Cu)的特征变量预测模型,结果显示:基于425.46 nm 处变量建立的Cr 多项式模型,其决定系数(R2)和均方根误差(RMSE)分别为0.643 5 和211.462 3。基于324.77 nm 变量建立的Cu线性拟合模型R2和RMSE 分别为0.746 和714.284 4,单变量模型对Cr 和Cu 的准确率均低于相应的CCFCV 提取特征所建立的模型,结果表明CCFCV是一种有效的LIBS数据特征提取方法。
基于特征数据提取获得的一组光谱集可通过建模方法构建相关预测模型,由于激光与物质相互作用的复杂性和样品本身的异质性,常需要建立各种预测模型,通过比较预测均方根误差(RMSEP)和分类率的高低选择最准确的预测模型[23]。LIBS 特征数据分析模型包括定性分类模型和定量分析模型。Palásti等[24]使用3 种特征模型方法(分类树、线性判别分析和二次判别分析)对煤气溶胶进行定性判别,经对比,具有归一化和未归一化的分类树模型均较其他2 种分析模型的判别准确性高,分别为74.0%和74.2%。此外,使用未进行压缩的数据可以使分类树分析法达到最佳整体精度,类似的定性模型还包括三层堆叠算法[25]、卷积神经网络(CNN)和偏最小二乘法判别分析(PLS-DA)等。CNN 作为近年来使用最广泛的深度学习模型之一,在LIBS定性分析中表现出优异的分类性能[26]。Xu 等[27]将CNN 应用于土壤的LIBS 数据分析,采用改进潜结构投影(MPLS)算法消除基线漂移,然后用归一化方法对基线校正的光谱进行处理,使得每一个样品生成代表性光谱,将算术平均光谱转换成二维光谱矩阵,将光谱矩阵输入CNN 模型进行预测,4 种CNN 模型分类精度均达到0.960 以上,土壤类型的过拟合指数分别为3.472%、4.167%、3.472% 和4.167%,这表明CNN 模型在LIBS 光谱数据建模方面具有很好的优势。在定量分析模型中化学计量学方法是对各类数据进行分类和定量分析的重要工具,其主要是利用LIBS光谱作为输入数据,譬如原始光谱及多个波长的发射谱线相对强度[28],随后对每个样品的平均光谱数据集进行压缩和降维处理[29],优化机器学习分类器模型参数,以获得较好的分类效果。常用的机器学习分类器包括距离算法、决策树算法、贝叶斯算法等[30]。张冉冉等[31]建立主成分-相关向量机结合分析模型(PCA-RVM)对土壤中的Cr 元素含量进行定量分析,并与单纯的RVM 模型进行对比,结果发现,PCA-RVM预测结果的精度和稳定性均明显高于RVM 模型,说明PCA-RVM 能更好地应用于LIBS 的定量分析。LIBS 的某些数据模型也可同时发挥定性和定量的功能,如利用PLSR 对钢合金元素进行定性和定量分析,以提高预测结果的稳定性和准确性[32]。
不同产地的中药材因其生长环境不同,药材中活性成分含量不同,疗效也不同,因此,中药产地溯源尤为重要,不仅能够获知中药道地产区,解决中药同名异物的问题,更是中药质量全链条控制中的重要一环。蔡羽等[33]采用LIBS 对山药饮片产地进行溯源,通过光谱预处理、特征提取,将光谱信号以1∶2 划分为测试集和训练集,以5 次交叉验证的K 最邻近分类(KNN)模型测试集的准确率作为评价优化预处理参数的指标,结果发现不同产地山药饮片平均光谱所含谱峰基本一致,但强度不同,道地产区对钾(K)、钠(Na)、钙(Ca)、镁(Mg)、铝(Al)等金属元素的富集能力较非道地产区的能力要强,由此可以区分不同产地山药饮片的质量优劣。Li等[3]利用LIBS-CNN 实现对野生龙胆产地的快速鉴别,为了解决变量过多导致的分析时间延长和准确度下降的问题,提出减少变量及将光谱转换为光谱矩阵2种方法,在对龙胆实际检测的过程中2种方法的预测最佳准确率均能达到92%以上,结果表明,LIBS-CNN 可以有效地实现对野生龙胆产地的快速溯源。Liu 等[34]使用LIBS 快速鉴定了不同来源的葛粉,结果表明,采用特征波长代替LIBS全谱可快速鉴别不同产地的葛粉,减少输入数据、简化模型、提高速度、改善分类效果,不同产区葛粉判别模型的预测精度均达到98%。
董鹏凯等[35]采用LIBS 结合神经网络和SVMs 对人参产地进行快速识别,分别采集了大兴安岭、集安、恒仁、石柱、抚松5 个产地657 组人参的LIBS数据,对碳(C)、Mg、Ca 等8 条特征光谱进行PCA,发现C、Mg、Ca 这3 个主成分贡献率达92.50%,且表现出较好的聚集分类,将这3 个元素主成分进行降维后,以1∶2 随机分为测试集和训练集,结果表明,该方法的识别率达到了99.08%和99.5%,为快速识人参产地提供了有效的方法。罗雅文等[36]通过LIBS 结合化学计量学对淫羊藿产地进行快速识别,获取6 个产地淫羊藿LIBS 数据,对光谱进行预处理,采用PCA 对数据进行降维处理,其中,PCA 结合SVMs 的分类效果最好,测试集分类准确率达99.17%,且采用随机森林模型(RF)进行计算,表明硅(Si)元素的含量是区分不同产地淫羊藿的重要标志。利用LIBS结合图像融合技术能够精准识别白芍的地理起源,LIBS 消融图像能够反应白芍的表面和内部的物理信息,结合卷积神经网络深度学习方法将数据融合后,一维深度残差网络(1D-ResNet)与2D-ResNet 模型提取的图像在特征水平上融合在SVM 上识别准确率可达97.78%,在决策水平上融合准确率高达98.89%,这表明LIBS消融图像结合数据融合及深度学习法可对白芍产地进行有效区分鉴别[37]。
传统的中药饮片真伪鉴别手段包括经验鉴别、显微鉴别和浸出物鉴别,但这些方法操作繁琐,对操作人员的要求较高。目前,中药质量控制技术的快速发展有利于传统中药质量等级分类更加完善,同时提高了中药真伪鉴别的准确度,简化操作步骤。Xia 等[38]采用LIBS 和近红外光谱(NIR)结合PLSDA 检测40 个东阿阿胶样品和38 个来自不同厂家的阿胶样品。对于LIBS,当潜变量(LV)数量设置为11 时PLS-DA 模型的分类精度最大,仅有2 个样本分类错误,PLS-DA 模型对不同类样品训练集的准确率、灵敏度和特异性均为100%,而测试集分别为85.18%、95.67%和92.30%。将LIBS 和NIR 数据融合后,用多元散射校正法(MSC)和标准正态变量法(SNV)预处理可获得完美的分类效果,可达100%,并且该数据模型显示出良好的预测能力,实现对东阿阿胶准确鉴别。川贝母是润肺止咳化痰良药,浙贝母与其具有相似功效,但润肺功能较弱,由于价格相差悬殊,常会将浙贝母的粉末掺入川贝母中以谋取利润。为了快速鉴别川贝母中是否掺假,Wei等[39]利用LIBS,采用PLSR为定量分析模型,对21 种不同掺假水平的川贝母进行分析,最终确定基于LASSO-PLSR-SVR 的残差校正模型分析准确性最高,测试集的平均绝对误差(MAE)下降至5.039 6%,RMSEP下降至7.249 1%,拟合曲线线性系数上升至0.998 3,表明LIBS 能够快速有效检测川贝母粉末的掺假程度。目前,一些商家会在山药粉末中掺入翅山药或木薯粉等以谋取利润,这会导致山药粉本身生物活性和营养价值下降,甚至会导致中毒或过敏等危害人体健康的现象出现,Zhao 等[40]利用LIBS结合随机森林-支持向量机(RF-SVM)模型对山药掺假粉末进行分析,识别准确率可达100%,随机森林高斯过程回归模型(RF-GPR)在掺假预测中准确性最高,预测相关系数(R2p)为0.957 0,RMSEP为7.624 3%,说明LIBS 技术结合化学计量学方法能够准确识别山药粉末掺假。
LIBS 光谱检测快速,能实现在线分析,无需样品预处理的检测手段,目前已逐渐应用于中药有效成分和元素的含量测定。Shen 等[41]采用LIBS 结合化学计量学法对来自8 个不同产区104 种三七药材中20 种元素进行快速定量测定,采用Lasso 权选取的LS-SVM 模型K、Mg、Ca、锌(Zn)、硼(B)的最佳预测R2p值均在0.91 以上,最高能达到0.966 5,预测均方根误差最小可达0.008 mg·g-1,说明该预测模型能够准确测定各批次三七中营养元素的含量,有利于中药营养和药用价值的快速评估。
中药中重金属的含量一直是备受关注的问题,为保证中药质量的安全性及和效性,历版《中华人民共和国药典》都对中药中重金属检测进行了规范,传统重金属检测方法包括比色法、紫外分光光度法、原子吸收光谱法等,此外还有HPLC、电感等离子体耦合质谱法等,快速检测方法包括电化学分析法、免疫分析法和生物传感器法,但这些方法存在价格昂贵、难以实现在线分析、操作繁琐、破坏样品等问题[42]。LIBS 作为一种无接触、破坏性小、同时能够实现快速在线分析的新的光谱技术[43],被逐渐应用于中药质量控制中,特别是中药生产过程中重金属含量的测定。赵上勇等[44]利用LIBS 对人参中重金属含量进行检测,将6 种人参作为光谱数据采集对象,在相同条件下采集10 次光谱数据并进行归一化处理,对人参中的铅(Pb)和Cr 含量进行分析,分别选取405.79、427.40 nm 作为Pb 和Cr 的分析谱线波长,得到标准品R2分别为0.981和0.986,得到人参中Pb 和Cr 元素的检测限(LOD)分别为9.55、10.86 mg·kg-1,留一交互均方根误差分别为0.011%和0.023%,表明LIBS 能够应用于人参中重金属的检测。Zhu 等[45]利用LIBS 检测中成药牛黄解毒片中砷的含量,在<10.0 h 的检测周期内,LIBS结果的相对标准偏差和相对误差均小于3%,满足快速、准确、方便的检测要求。郑培超等[46]采用再加热双脉冲LIBS 对黄连中的有毒重金属物质Cu 和Pb进行含量测定,激光总能量为50 mJ,激光频率4 Hz,对实验参数进行优化,CuⅠ和PbⅠ的激光最佳能量组合为15 mJ:35 mJ,CuⅠ激光脉冲和增强电荷耦合器件(ICCD)相机延时间隔分别为1.4、1.5 μs;PbⅠ分别为1.6、1.7 μs。在上述实验条件下,CuⅠ和PbⅠ双脉冲LIBS 技术检测限分别为1.91、3.03 mg·kg-1,均较单脉冲LIBS 有所下降,且线性拟合度提高,说明双脉冲LIBS较单脉冲有更好的检测性能。
在LIBS 光谱检测过程中,由于仪器本身、样品性质和数据处理方式的不同会导致LIBS系统监测到的信号灵敏度、可重复性、准确度较差等情况的出现。比如针对信号灵敏度较低可以通过光谱预处理的方法去除噪声,又如,对于准确度较差的情况可以通过识别特征性谱峰的方法来解决。此外,LIBS已逐渐应用于液体中痕量元素的检测,但仍存在很多挑战,如液体飞溅、等离子体冷却、检测灵敏度低、测量超低浓度液体中的痕量元素等[47],针对这些问题,可以从仪器设备本身和样品2 个角度考虑,解决液体样品检测中的问题与挑战。比如,可以通过增加激光脉冲数量提高等离子体信号强度,也可将液体转化为固体,以减少样品检测发生飞溅的情况。对于气体样品[48],被测元素易被氧化,发射线位于难以测定的范围,如真空紫外范围。采用LIBS系统与单颗粒气溶胶质谱(SPAMS)系统相结合的实验装置可直接检测气体中的元素。
LIBS 凭借其分析简便、快速、无或少量样品前处理、无损检测、原位或在线监测等优点,已经逐渐应用于中药质量控制。但是,在应用范围逐渐拓展的过程中仍面临着诸多挑战和问题,需要通过样品处理方式、数据处理手段、硬件设施改进等促进LIBS 进一步发展,通过结合人工智能算法、改进设备主体、加强联用技术的开发,可以解决很多问题。LIBS 将会在中药质量控制及其他研究领域有更广泛的应用。
[利益冲突]本文不存在任何利益冲突。