黄玉青 李 茜 李晓辉 曾志坚 赖小平
(1.太赫兹科技应用(广东)有限公司,广东 广州 510000;2.江门市药品检验所,广东 江门 529000;3.广州中医药大学,广东 广州 510000)
柴胡为伞形科植物柴胡(Bupleurum chinense DC.)或狭叶柴胡(Bupleurum scorzonerifolium Willd)的干燥根。按性状不同,分别习称“北柴胡”和“南柴胡”[1]。柴胡始载于《神农本草经》,具有解表退热、疏肝解郁之功效,临床上常用于感冒发热、寒热往来和胸胁胀痛等,制剂有柴胡注射液、小柴胡颗粒等,通常以北柴胡为主。由于北柴胡需求量大,不能满足市场需求,导致多种柴胡伪品进入市场[2],例如以藏柴胡代替北柴胡进行销售,甚至以混伪品的柴胡制成制剂,因此对柴胡的真、伪鉴别具有重要研究意义。
太赫兹波(THz)是指频率在0.1 THz~10 THz的电磁波,在电磁波谱上位于微波和红外线之间,是人类目前尚未完全开发的电磁波谱“空白”区。太赫兹时域光谱技术已成为检测中药的新方法,太赫兹频段作用机制是有机分子间氢键作用、生物大分子骨架振动和分子晶体低频振动等。该研究利用太赫兹时域光谱技术测定锥叶柴胡、北柴胡、南柴胡和藏柴胡,结合主成分分析(PCA)把相关性的变量降维并转化成几个主成分指标,反映事物内部变量之间的规律[3],建立不同品种柴胡的鉴别模型。
该研究采用透射光谱模块,光路系统示意图如图1所示。系统采用780 nm的光纤飞秒激光器作为激发光源,其发射源和探测器均采用太赫兹光电导天线产生和接收太赫兹信号。压片机(HY-12型,天津天光新光学仪器有限公司),多功能粉碎机(BJ-200型,德清拜杰电器有限公司),电热鼓风干燥箱(DHG-9070A型,上海一恒科学仪器有限公司),压片模具(HF-2A型,天津天光新光学仪器有限公司)。
图1 太赫兹时域光谱系统原理图
锥叶柴胡、北柴胡、南柴胡和藏柴胡由江门市药品检验所鉴定、提供。柴胡样品经粉碎过200目筛,可减少散射对太赫兹波的干扰,置60 ℃干燥2 h,以减少样品的水分对太赫兹波的干扰。放冷后精密称定0.2 g,在压强为24 MPa下压制成直径13 mm,厚度为1.0 mm~1.4 mm的圆形薄片。每种柴胡样品各制备10片,共40个样品片。太赫兹脉冲经过样品,测定氮气参考谱线及样品的时域谱。
用Dorney和Duvillaret等人提出的方法处理该文试验获得的数据,得到氮气参考THz时域和样品THz时域信号,通过傅里叶转换,得到相应参考频域信号和样品频域信号,再对样品的吸收系数谱进行分析和研究。经数据处理得到的样品的折射率n(ω)和吸收系数α(ω)分别如公式(1)和公式(2)所示。
式中:ω为频率;φ(ω)为样品与参考信号的相位差;c为光速;d为样品的厚度;A(ω)为频域信号下,样品与参考的振幅比。
大多数中药材主成分的振动和旋转能级处于太赫兹波段内,利用太赫兹技术鉴定中药的代谢产物,如糖类、蛋白质、生物碱和黄酮化合物等,有很好的鉴别效果。太赫兹时域光谱结合化学计量学方法已鉴别出冬虫夏草、红花、牛黄、冰片和西洋参[4-6]等中药材。陈艳江等人[7]用支持向量机对南柴胡和北柴胡的太赫兹光谱进行识别,但未对柴胡其他品种进行鉴别。
因为原始吸收谱数据会受系统噪声、样品不均匀及光散射等因素影响,所以需要截取有效的频谱范围进行分析。4种柴胡的吸收系数谱图如图2所示。从图2可以看出,0.3 THz~2.0 THz没有受到噪声的影响,该有效频谱可以反映出不同品类柴胡间的总体差异,所以选取0.3 THz~2.0 THz作为有效频谱范围进行分析。
图2 4种柴胡的吸收系数谱图
该试验将截取的吸收系数谱进行主成分分析(PCA),因为4种柴胡都没有明显的吸收峰,且每种柴胡的吸收系数谱线均非常相似,所以用SIMCA14.1软件对吸收系数谱原始数据进行主成分分析(PCA)。将截取的吸收系数谱按软件SIMCA需求进行整理,得出主成分数t1、t2等是总结X变量的新变量。分数是正交的,即彼此完全独立。模型中的得分向量与组件一样多。分数t1(第一分量)解释了X空间的最大变化,其次是t2等。因此,t1与t2的散点图是X空间中的一个窗口,显示了X观测值相对于彼此的位置。该图显示了数据中可能存在的异常值、组、相似性和其他模式。SIMCA使用二维分数图,根据Hotelling的T2绘制公差椭圆。同时可以观察到位于椭圆外部的观测值是异常值。可得5个主成分数,各个主成分的特征值和贡献率见表1。主成分1和主成分2的累积贡献率为92.9%,前2个主成分足以反映样品的原始信息。
表1 4种柴胡THz量子指纹图谱主成分分析的特征值和贡献率
4种不同种类柴胡样本的主成分1和主成分2得分图如图3所示。从图3可以看出,锥叶柴胡和藏柴胡能明显区分,而南、北柴胡有少许重叠且在同一片区域内,这2种柴胡可能具有相同成分。
北柴胡的成分主要是柴胡皂苷、醇、挥发油、脂肪酸(油酸、亚麻油酸、棕榈酸和硬脂酸等)和多糖等。南柴胡的成分主要是柴胡皂苷、甾醇、挥发油、脂肪油和茎叶尚含黄酮类。两者的主要成分很多为相同成分,所以两者有所重叠。
药用柴胡以北柴胡为主,分别建立北柴胡与藏柴胡、北柴胡与锥叶柴胡的主成分分析(PCA)鉴别分类模型。根据图3可知北柴胡与藏柴胡分类准确率均为100%。同理从图3可知,北柴胡与锥叶柴胡分类准确率分别为100%和93.3%。
图3 4种柴胡前2个主成分得分图
DModX是训练集中观察到X模型平面或超平面的距离。DModX与X观测的残余标准偏差(RSD)成比例。默认情况下,DModX以标准化单位显示,即绝对DModX除以模型的合并剩余标准偏差。DModX的临界值表示为Dcrit,由F分布计算得出。Dcrit调节围绕训练集数据点的“包络线”的大、小。DModX的观测值是Dcrit的2倍,属于中等异常值。这表明在变量的相关结构方面,这些观测与正常观测不同。贡献图显示所有X变量的残差。具有较大正或负残差的变量是那些与模型捕获的系统结构不同的变量。
将分数看作带有权重的变量的加权平均值,即载荷(p)。第一分量中的p1和第二分量中的p2。p1和p2是每个变量具有一个元素的向量。这些权重(即负载)表示X矩阵的主要相关结构。因此,p1与p2显示了X变量的相互关联。
藏柴胡所含的柴胡皂苷远高于北柴胡及南柴胡,非法商人常用藏柴胡替代北柴胡及南柴胡,其中柴胡皂苷是柴胡重要的化学成分之一,具有镇静、镇痛和抗炎等药理作用,有很强的生理活性作用。藏柴胡与北柴胡得以完全区分将有利于市场对柴胡品种的监管。
不法商家往往在其中掺入无药效的地上部分,甚至用竹叶柴胡、锥叶柴胡等冒充柴胡售卖,获取暴利,搅乱市场,损害消费者健康,更制约着柴胡产业化的发展。当前国内对于柴胡真、伪的鉴别手段主要有感官检测与化学分析法。前者主要是根据外观性状、颜色和气味等差异对不同柴胡进行鉴别,该方法易受主观条件及客观环境因素的干扰,准确度有待提高。化学分析方法主要是通过薄层色谱法、高效液相色谱法和气质联用等方法检测柴胡中各成分物质。然而,这些方法样品前处理复杂、试验周期长、成本较高且步骤复杂,不能快速检测柴胡真、伪。为解决以上问题,该文利用太赫兹光谱技术对不同比例的藏柴胡和北柴胡进行区分。
以北柴胡10%、20%、30%、40%、50%、60%、70%和80%与相应的藏柴胡进行混合,按第1.2节的制样方式,将柴胡样品经粉碎过200目筛,置60 ℃干燥4 h,按相应比例称定总量为0.2 g,在压强为24 MPa下压制成直径13 mm,厚度为1.0 mm~1.4 mm的圆形薄片,每种柴胡样品各制备10片,共80片。开启CCT-1800太赫兹时域光谱仪,打开测试工作站,仪器预热20 min,通入氮气除去样品仓的水汽后获取氮气参考谱线。把制备的样品放置样品架上进行扫描测定,每个样品片测定1次,平均次数100。
因为0.3 THz~2.0 THz没有受到噪声的影响,所以选择该有效频谱,可以反映出不同比例下藏柴胡及北柴胡的总体差异。结合算法对介电常数(实部)谱图、介电常数(虚部)谱图、频域谱图、时域谱图、吸收谱图、吸收系数谱图、相位谱图以及折射率谱图分别进行统计及分析,得到精度平均值为0.9921。结果表明,该方法可以有效区分按不同比例混合的藏柴胡和北柴胡,是一种对柴胡进行掺假检测的快速、高效并准确的方法。
目前,我国野生柴胡数量已严重不足,而人工种植面积增长缓慢,市场上的柴胡数量正逐渐下降。与此同时,柴胡作为新药开发的热门对象,市场价格也在不断上涨,种植前景可观。然而,受种植、采收加工到储存等多方面因素的影响,柴胡的标准化建设滞后。
太赫兹时域光谱技术已成为检测中药的新方法,太赫兹频段作用机制是有机分子间氢键作用、生物大分子骨架振动以及分子晶体低频振动等。利用太赫兹时域光谱技术结合主成分分析方法,可对北柴胡、南柴胡、锥叶柴胡和藏柴胡进行有效、快速的鉴别分类。选取THz吸收系数谱数据,通过主成分得分图即可看出分类效果。其中,北柴胡和藏柴胡分类准确率均为100%,北柴胡与锥叶柴胡分类准确率分别为100%和93.3%。利用KNeighbors Classifier算法区分不同比例的藏柴胡和北柴胡,得到精度平均值为0.9921。结果表明,该方法可以有效区分按不同比例混合的藏柴胡和北柴胡,是一种对柴胡进行掺假检测的快速、高效并准确的方法。