汪泽方
(上海理工大学 光电信息与计算机工程学院,上海 200093)
人体对各种药物的敏感含量不一致[1],药品中各成分的含量过多会导致人体产生许多副作用[2],例如恶心、呕吐、晕厥等,严重的甚至会致人昏迷以及死亡[3]。然而,药品中各种药物成分含量过低,对所需治疗的病症又不能起到医学上的治疗效果,甚至会拖延病人的病情[4]。因此,在药物生产端,对药物主要成分的含量以及各种次要成分的配比都需要严格的控制。在此阶段,用传统的化学方法(如高效液相色谱法[5]等)检测会产生耗时长、药品损耗高、检测方法繁琐、检测精确度低、样品前处理复杂等不足,同时不能及时把控药物各成分的质量分数,会造成生产缓慢,经济成本过高。因此,在药物生产的同时,能够快速地检测药品各成分的质量分数,降低检测成本至关重要。
太赫兹(THz)波是频率在0.1~10 THz范围的电磁波[6-7]。当太赫兹波通过样品时,如果太赫兹频率与样品分子的振动和旋转频率一致,就会发生共振吸收,且这些特征吸收峰谱是唯一的。因此,太赫兹光谱可以鉴别不同的物质,与之相比,NIR/MIR光谱和Raman光谱主要分析化学键和官能团的振动模式,对于来自同一类别的物质(它们的化学键和官能团非常相似)准确度低。太赫兹光谱技术还具有快速、无损、灵敏度高、无接触、信噪比高等优点。基于该技术,已经成功实现了肿瘤代谢物2-HG[8]的同分异构体、同型半胱氨酸[9],心血管高风险因子[10]等生物分子的精准检测。鉴于太赫兹波的特点,使太赫兹光谱技术在材料、生物、安全、通信[11-13]及成像等科学领域有着巨大的应用潜力。
本文采用太赫兹光谱技术,通过检测药物的太赫兹光谱特征峰频点、峰下面积差来定性检测和定量分析药物。以氯雷他定、消旋卡多曲为例,通过分析两者的太赫兹光谱,建立其质量分数梯度曲线,验证了基于太赫兹技术区分药物的有效性和稳定性。
材料:氯雷他定( > 99% ,上海市药品监督管理局提供),消旋卡多曲( > 98% ,上海市药品监督管理局提供)。环烯烃共聚物粉末(COC粉末,颗粒大小为50~80 μm,购买自中国科学院上海原子核研究所),COC在太赫兹波段的折射率弥散可以忽略不计,对太赫兹具有低吸收的特点,因此非常适合用于物质的太赫兹光谱分析。
制备样品时,不对纯品做任何的物理和化学处理,将氯雷他定、消旋卡多曲粉末与COC粉末混合均匀,并压片。压片采用普通压片机,以3 t压力压制3 min,样片的直径为13 mm,厚度为0.8 mm,误差均小于2%。压好的样片放置于太赫兹时域光谱系统中进行检测。
太赫兹时域光谱系统由飞秒激光、光电导天线、时间延迟控制系统、数据采集与处理系统等组成。系统发射频率为0.5~5.0 THz的宽频太赫兹波,选用7.6 GHz的分辨率,单点扫描次数为256次,仪器样品仓的湿度维持在2%以内,以便减少空气中的水蒸气对实验的干扰。在环境温度保持为20 ℃的情况下,测得样品的太赫兹时域信号,并对测得信号进行快速傅里叶变换和计算处理,然后再进行后续的光谱分析。
为了更好地推广应用到多种药品的大数据分析,我们基于上述太赫兹光谱检测方法结合主成分分析法(PCA)对样品进行区分度测试。PCA是一种统计的提取方法,其可以将数据集简化。PCA是一个线性转换,所有主要成分都是不相关且有序的。这种转换是将数据转换为新的坐标系,最大方差位于第一个坐标上,称为第一主成分(PC1),第二大方差位于第二个坐标(PC2)上,依此类推(PCp)(p为≥1的正整数)[14]。当前p个主成分的贡献率足够大时(PC1+PC2+···+PCp>85%),原始数据集可以近似替换为前p个主成分。因此,可以使用PC1和PC2近似分析实验中的光谱数据。在主成分分析中,任意2个样本的PC1得分偏差越小,它们之间越相似。相反,样本的PC1得分偏差越大,它们之间的差异就越大[15]。这些差异是对数据集的差异贡献最大的特征,例如材料成分,光谱幅度等。
首先选取氯雷他定、消旋卡多曲2种药物样品为例,用太赫兹波谱系统检测它们的太赫兹时域波形,再通过傅里叶变换可得到频域光谱E(ω)。样品的吸光度α(ω)则通过以下公式计算:
式中:d(为0.8 mm)是样品的厚度;Isam(ω)是样品的功率谱;Iref(ω)是参考信号的功率谱。通过式(1)计算得到样品的太赫兹吸收图谱,如图1所示。
太赫兹波涵盖多数分子振动频率,当太赫兹波通过样品时,如果太赫兹频率与分子的振动和旋转频率一致,就会发生共振吸收,这些特征吸收峰谱是唯一的,因此,大多数物质在太赫兹波范围内都有其特定的指纹谱。而指纹谱特征峰的频点是最直接的药物检测方法。通过对每组数据4次测量,单点扫描次数为128次,得到测试数据的平均方差<0.01。图1(a)是药物消旋卡多曲的太赫兹吸收光谱图,由图可见,消旋卡多曲在1.18 THz、1.71 THz、3.78 THz 3个频点处呈现出特异性吸收峰,且在3.78 THz处吸收峰强高,因此可以选择此频点吸收峰建立质量分数梯度,进行定量分析。图1(b)是药物氯雷他定的太赫兹吸收光谱图,如图所示,氯雷他定在1.60 THz、1.20 THz、1.70 THz、2.91 THz、4.03 THz 5个频点处呈现出特异性吸收峰,且在2.91 THz处吸收峰强高,因此可以选择此频点吸收峰建立质量分数梯度,进行定量分析。比较图1中消旋卡多曲与氯雷他定的太赫兹吸收光谱,我们可以很清楚地识别出这2种药物。由于2种药物吸光度标准差<0.02,可以说明,太赫兹光谱稳定性极高,但是在1.18 THz和1.71 THz处2种药物的吸收峰十分相近,这可能是药物的其他辅料相同引起的。
图1 样品的太赫兹光谱Fig.1 Terahertz spectrum of sample
通过太赫兹吸收光谱可对药物进行精确的定性识别,但是在药物生产环节,还需要对药物的质量分数进行实时把控。因此,我们通过太赫兹光谱建立药物的质量分数梯度曲线,以解决在生产环节不能快速检测药物质量分数的难题。将样品与COC配比成7种质量分数梯度(消旋卡多曲的质量分数从1.63%~33.3%,氯雷他定的质量分数从1.63%~22.1%),但当质量分数低于1.63%时,由于样品本身的质量分数太低,很难精确识别。测试结果如图2所示,可以看到,随着样品质量分数的升高,其特征峰下面积也都逐渐升高。
图2 药物的质量分数梯度曲线Fig.2 Concentration gradient of drug
为了实现对药物的高精度定量分析,进一步量化吸收峰幅值随着药物质量分数的变化,我们提取了消旋卡多曲在3.78 THz这一处吸收峰(1.18 THz,1.71 THz 2个频点处吸收峰不明显)下面积来分析其与质量分数的函数关系。同样地,我们选取氯雷他定具有比较高幅度的特征峰下面积来分析其与质量分数的函数关系。根据Beer-Lambert定律,我们对数据进行了线性拟合,结果如图3所示。
图3 实验测得消旋卡多曲和氯雷他定不同质量分数下吸收峰幅度随质量分数变化的拟合曲线Fig.3 Fitting curve of absorption peak amplitude with different concentrations of racecadotril and loratadinez
消旋卡多曲相应的线性拟合函数表达式为
其线性拟合度为R2=0.997 62。
氯雷他定相应的线性拟合函数表达式为
其线性拟合度为R2=0.995 84。
由此可以得到,特征峰的下面积随质量分数变化的拟合曲线都具有较好的R2,证明太赫兹光谱定量分析质量分数的准确性平均可达98.1%以上。由于幅度高的特征峰下面积随质量分数变化的直线斜率更大,更有利于低质量分数样本和不同质量分数样本的准确判定。此外,由于太赫兹检测过程是穿透式的物理光谱分析,对样本本身无损耗,与化学检测法相比,太赫兹光谱法具有无损、快速的优势。由于太赫兹波对空气中的水分十分敏感,需要严格控制实验环境的干燥度,目前太赫兹光谱法还没有成熟的实际应用。
由于许多药物都有相似的辅料成分,在太赫兹光谱范围内会有相似的响应。消旋卡多曲和氯雷他定在1.18 TH、1.71 THz处有相似的吸收峰,因此为了验证太赫兹技术检测药物的适用性,将其他的药物与消旋卡多曲和氯雷他定进行定性分析。本文在实验中还增加测量了其他4个药物样品的光谱信息,测量参数与前者保持一致,每个样品的光谱数据测量4次,单点扫描次数为128次。采用MATLAB软件,对消旋卡多曲、氯雷他定、格列美脲、阿莫西林、异丙安替比林和维生素等6种药物样品的太赫兹吸收光谱数据进行PCA(主成分分析法)分类鉴定。首先将氯雷他定、消旋卡多曲等样品的太赫兹吸收光谱数据代入算法中进行计算,得到的结果如图4所示。x轴和y轴分别表示第一和第二PC得分,因此前2个PC,尤其是PC1,代表了大多数样本信息。不同的样品在坐标系中的位置不同。图4显示了样本的太赫兹光谱数据的主成分评分(PC1的值等于96.1%,PC1+PC2的值等于98.4%),由于图中得分偏差较大,能直观地区分实验使用的6种样品。
图4 6个样本的主成分得分图Fig.4 Principal component scores of six samples
本文基于太赫兹光谱技术,对消旋卡多曲和氯雷他定的太赫兹光谱进行了分析,在2种药物的指纹谱基础上成功建立其不同质量分数的太赫兹光谱曲线图,并且分析了不同质量分数下吸收峰下面积的线性变化规律,还结合主成分分析法(PCA)验证了太赫兹光谱法的适用性。研究结果表明,本文采用的方法可对药物实现精准的定性、定量识别,且能快速、准确地识别各种药物。