寇天一
(上海理工大学 光电信息与计算机工程学院,上海 200093)
人参和西洋参都是五加科人参属的草本植物,其干燥的根和根茎部位可入药,它们的主要化学成分为皂苷类,化学结构相当复杂,药用价值极高[1-2]。迄今为止,在人参和西洋参中已经鉴定出超过60多种人参皂苷,《中国药典》记载人参中最重要的成分是人参皂苷Rg1、Rb1和Re,西洋参和人参十分相似,唯一的区别就是西洋参含有独有的拟人参皂苷F11。虽然人参和西洋参可以通过传统方法(例如:基源鉴定、性状鉴定、显微鉴定)进行鉴别,但是这些鉴别手段存在主观性、片面性等问题,而记载于《中国药典》的高效液相色谱法(HPLC)是目前最权威、最全面的方法。例如,Wang等[3]在1999年使用高效液相色谱−串联质谱(HPLC-MS/MS),Chan等[4]在2000年使用高效液相色谱-电喷雾质谱(HPLC-ESI-MS),根据人参皂苷的分布来区分西洋参和人参。Ma等[5]在2006年利用高效液相色谱−大气压化学电离质谱(HPLC-APCIMS)对西洋参中F11的含量进行了研究,发现可以用一种基于majonoside异构体和人参皂苷Rd作为标记物来鉴定来自中国和北美的西洋参。然而,高效液相色谱法是基于物质的分离(依赖于吸附特性、表面电荷、配体特异性和蛋白质分子大小的差异),需要复杂的预处理过程,且成本高、耗时长[6-7]。因此,迫切需要寻找一种准确、快速的分析方法来鉴别人参和西洋参。
太赫兹(THz)光谱具有安全、无损、快速,易穿透等特点[8],因此已被应用于物理学[9-10]、生物学[11-12]、化学[13-14]、药物学[15]等多个研究领域。太赫兹波段涵盖了大多数有机分子的振动和旋转运动的特征吸收频率。因此,太赫兹指纹图谱可用于物质的识别和定量分析,并且该技术已被用于检测肿瘤代谢物同分异构体2HG[16]、甲基乙二醛[17]、同型半胱氨酸等[18]。如果THz光谱可以识别人参和西洋参中的特异性皂苷,则有助于人参和西洋参的鉴别。
本文基于人参和西洋参的THz光谱特征,通过主成分分析(PCA)研究了人参和西洋参的鉴别方法。
材料:人参皂苷Rg1(>98%,CAS:22 427-39-0,购买自Sigma-Aldrich,中国上海),拟人参皂苷F11(>98%,CAS:69 884-00-0,购买自PureChem Standard,中国成都),环烯烃共聚物(COC)粉(颗粒大小50~100μm产自上海核研究所)。由于COC在太赫兹区的折射率弥散可以忽略,吸收可以忽略,因此非常适合于太赫兹光谱的分析[19]。实验所用的样本均是人参和西洋参块状根部,且所有样本均未进一步纯化。
在进行太赫兹光谱分析前,被检的人参、西洋参样本需要经过研磨、筛分和压片过程。人参和西洋参在MM400球磨机(Retsch,德国)中研磨成颗粒大小为40~50 μm的粉末状,粉末样品过筛后与COC均匀混合,然后用压片机(4 t压力)将样品压缩成厚1 mm、直径13 mm的片剂。
实验装置为德国Bruker公司生产的傅里叶变换红外光谱仪,型号为Vectex80v。其中远红外模块光源为水冷汞灯,检测器为DLaTGS/聚乙烯检测器,光谱有效覆盖区为30~680 cm−1,信噪比(SNR)优于10 000∶1。仪器的光谱范围为0.9~14 THz、分辨率为2 cm−1、扫描频率为5 kHz,环境室温约为22 ℃,样品仓保持真空以减少水蒸气对实验的影响。
主成分分析法(principal component analysis,PCA)是一种简化数据集的统计抽取方法。PCA基本思路为借助正交变换,将相关联的原变量转为不相关的新变量,即将原变量系统变换成新的正交系统,使之指向样本点散布最开的正交方向,进而对多维变量系统进行降维处理。
设原变量为x1,x2,···,xJ,主成分分析后得到的新变量为z1,z2,···,zm,均是x1,x2,···,xJ的线性组合(m<J,J是原变量的维数,m是新变量保留原变量最大的维数)。变量z1,z2,···,zm构成的坐标系是在原来坐标系经平移和正交旋转后得到的,称z1,z2,···,zm形成的空间为m维主平面。在主平面上,第一主分量z1对应于数据变异最大的方向,对于z1,z2,···,zm,依次有V(z1)≥V(z2)≥∙∙∙ ≥V(zm),V是对应维度变量的主成分得分。因此,z1是携带原数据信息最多的一维变量[20],称为第一主成分(PC1),第二坐标的第二大方差为第二主成分(PC2),等等。基本算法和步骤如下:
(1)数据标准化处理
式中:xij为第i个分区第j个指标的值;xj、Sj为第j个指标样本的样本均值和样本标准差,其中I为数据表的分区数。
(2)计算数据表(yij)I×J的相关矩阵R。
(3)求R的J个特征值λ1,λ2,∙∙∙,λJ,其中λ1≥λ2,···,≥λJ,并求特征向量u1,u2,···,uJ,而u1,u2,···,uJ又称为主轴。
(4)计算主成分
本文提取z1和z2作为PC1和PC2,用于样品的定性分析。
人参皂苷Rg1属于达玛烷家族四环三萜皂苷成员,它的结构中含有30个碳原子,这与甾醇十分相似。人参皂苷Rg1(属于原三醇人参型皂苷,分子量为801.01)具有兴奋中枢神经,防止性功能减退,增强记忆,恢复疲劳,促进DNA、RNA合成,抗血小板凝集等作用。拟人参皂苷F11(一种ocotillol型皂苷,分子量为801.02)是达玛烷家族的三萜皂苷成员,含有四环类固醇刚性骨架,具体很好的治疗心肌缺血、脑缺血和中风的作用[21-22]。
将Rg1和F11这两种标志物皂苷按25%质量分数制备成药片状,在同一天置于相同环境检测8次,以获得这两种纯品皂苷的太赫兹吸收谱及其误差棒。
人参皂苷Rg1和拟人参皂苷F11的太赫兹光谱如图1所示。图1(a)中,人参皂苷Rg1的吸收峰位为8.36 THz和9.54 THz,在较低频段并未发现太赫兹吸收峰。而拟人参皂苷F11则与人参皂苷Rg1大不相同,如图1(b)所示,拟人参皂苷F11在较低频段1.76 THz、2.31 THz、3.11 THz和3.61 THz处均有明显的吸收峰,这些吸收峰相较于人参皂苷有巨大的差异。出现这种现象的原因是,相较于其他皂苷,拟人参皂苷F11中存在单独的不饱和双键(C=C键),主要发生的是非共轭的π轨道的π-π*跃迁,其分子结构中不存在共轭体系,是一种非共轭物质,而人参皂苷Rg1等达玛烷家族四环三萜皂苷中均含有共轭体系,这是两者本质的区别。此外,图1中曲线上非常小的误差棒反映了THz光谱分析的再现性和准确性。
图1 人参皂苷的太赫兹光谱Fig.1 Terahertz spectra of ginsenoside
在证明了太赫兹光谱指纹可用于特异性皂苷的识别后,我们进一步做了人参和西洋参样本的太赫兹光谱测试。图2为人参和西洋参的太赫兹光谱,其中(a)~(c)为3种不同批次的人参样本,而(d)~(f)为3种不同批次的西洋参样本。将这6个样本按上述制备过程制备成同等比例的样本压片,于同一天在相同环境下对每个样本检测4次,以获得人参和西洋参的太赫兹吸收谱和误差棒。
图2 人参和西洋参的太赫兹光谱Fig.2 Terahertz spectra of ginseng and Panax quinquefolium
由图2(a)、(b)、(c)可知,人参的光谱吸收峰与其特异性皂苷Rg1峰位相近,均在8~11 THz范围内,具体峰位为8.96 THz和10.46 THz。由图2(d)、(e)、(f)可知,除了2.31 THz的吸收峰太小无法检测外,所有西洋参样品均出现了拟人参皂苷F11的吸收峰,相较于人参,西洋参与其特异性皂苷的峰位对应更精准。同时,在图2的6张光谱曲线上,非常小的误差棒同样反映了太赫兹光谱在人参和西洋参检测分析上的再现性和准确性。实验证明,通过人参和西洋参的太赫兹光谱吸收峰的位置,可以精准地分辨这2种五加科草本植物。
为了确定人参和西洋参的太赫兹光谱是否还可以作为与其他草本植物和非草本物质的定性鉴别依据,我们基于MATLAB软件,采用主成分分析(PCA)算法进一步进行分类鉴定。
用于定性分析的样本除了上述的三批次的人参和西洋参外,还对其他的草本植物(白芍和赤芍)和一些氨基酸物质(谷氨酸、赖氨酸、同型半胱氨酸、色氨酸)进行了定性分析。
图3 12个样本的主成分得分图。Fig.3 Principal component score of 12 samples.
图3为12个样本太赫兹光谱数据的主成分得分图(PC1值为97.62%,PC1+PC2值为99.31%)。当前p个主成分的贡献率足够大(PC1+PC2+∙∙∙+PCp>85.00%)时,可以用前p个主成分近似代替原始数据集[23]。因此,这些光谱数据可以用PC1和PC2进行近似分析。在主成分分析中,任意2个样本的PC1得分越相似,说明它们之间的相似性越强,反之,样本的PC1得分偏差越大,差异越大[24]。可以从图3看出,人参和西洋参有十分相似的PC1得分,PC1得分集中于80.00%左右。究其原因,是人参和西洋参同为五加科人参属草本植物,具有十分类似的主要成分,例如人参皂苷Rb1、Rg1和Re以及一些多糖等。同理,4种氨基酸物质也有非常相似的PC1得分,这说明它们的主成分相差不大。PC2得分的差异是源于各样本存在不同的物质组成成分,比如西洋参独有的拟人参皂苷F11。人参、西洋参这2种五加科人参属植物与谷氨酸、赖氨酸、同型半胱氨酸、色氨酸这4种非草本植物的物质PC1得分相差很大,位居得分图的两侧,这说明草本植物与非草本物质的差异非常的大,因此可以很容易鉴别。另外,还可以看出,非五加科草本植物赤芍和白芍的PC1得分介于五加科植物和氨基酸物质之间,这说明不同属的草本植物也可以被准确鉴别。对于得分图中的多种物质,完全由不同的成分决定了它们的显著差异。
本文基于太赫兹光谱,采用主成分分析(PCA)对人参和西洋参进行了鉴别。实验证明,采用太赫兹光谱能够快速、准确地区分人参皂苷Rg1和拟人参皂苷F11,而结合PCA算法可更有效地区别同属五加科植物的人参和西洋参。本文鉴别方法还可以应用于其他草本植物和氨基酸物质的区分。