彭严芳,王 君,吴志生,刘晓娜, 乔延江
1.湖北中医药大学药学院,湖北 武汉 430065 2.北京中医药大学中药学院,北京 100029 3.滨州医学院中西医结合医院,山东 烟台 264003
中药过程质量控制是保证中药临床用药安全性和有效性的重要措施。如何提高中药过程质量控制水平,促进中药现代化、国际化,是中药发展需要解决的关键问题之一[1]。近红外光谱(near infrared spectroscopy,NIR)作为一种快速无损,实时可靠的过程分析技术,已被广泛应用在工业,农业,食品,医药诸多领域[2-6]。然而,NIR吸收强度弱,光谱重叠严重,且NIR易受环境和样品状态等因素的影响[5],使得NIR的应用需借助化学计量学手段进行变量筛选。化学计量学变量筛选方法以结果为导向,所选变量重现性和解释性差。中药成分复杂,如何从NIR中解析出与目标分析物结构相关的信息成为NIR在中药过程质量评价中需要解决的关键问题。二维相关分析(tow-dimensional correlation spectroscopy, 2D-COS)最早用于核磁共振谱中,后Noda提出广义的二维相关谱,将外部扰动从声、光、电拓展到浓度、温度、pH值等,使2D-COS广泛用于紫外-可见,红外,近红外,拉曼光谱中[7]。2D-COS同步谱中自相关峰表示被分析物随外部扰动变化的特征谱带,交叉峰则表示待分析物中关联较大的官能团,二维相关同步谱截取对角线可得二维同步切片谱,从中可获取与被分析物结构相关的特征谱带[8-9]。
丹参酮提取物为唇形科植物丹参SalviamiltiorrhizaBge.的干燥根及根茎经加工制成的提取物[10]。主要含脂溶性二帖类和水溶性丹酚酸。其药理活性主要有抗凝血、抗血小板聚集、调血脂、抗炎、抗肿瘤[11]。目前对于丹参酮提取物的质量控制主要是依靠高效液相色谱法(high performance liquid chromatography, HPLC),如郭龙[12]等采用一测多评法测定丹参酮提取物中二氢丹参酮Ⅰ、隐丹参酮、丹参酮Ⅰ和丹参酮ⅡA 4种丹参酮类成分含量。2020版药典中丹参酮提取物含量测定也采用HPLC法测定丹参酮ⅡA和隐丹参酮。HPLC法具有较好准确性,但费时耗力,不利于中药现代化生产中的质量控制。本工作采用近红外光谱,结合2D-COS解析丹参酮ⅡA和隐丹参酮近红外光谱特征波段,并用于复杂体系丹参酮提取物近红外偏最小二乘(partial least square,PLS)定量模型中,以快速测定丹参酮提取物中丹参酮ⅡA和隐丹参酮含量,提高变量筛选的重现性和解释性。
仪器:丹参酮ⅡA和隐丹参酮对照品采用XDS Rapid Liquid Analyzer近红外光谱仪检测(瑞士万通,中国)。光谱采集方式:以透射模式采集光谱,以仪器内部的空气为背景,分辨率为0.6 nm,扫描范围400~2 500 nm,每个样品扫描32次,每个样品平行测定3次,取平均光谱,二维相关分析软件2Dshige(c)Shigeaki Morita, Kwansei-Gakuin University, 2004—2005。丹参酮提取物采用美国Thermo Nicolet公司的AntarisⅠ傅里叶变换近红外光谱仪进行光谱采集,采用积分球漫反射方式,以仪器内部空气为背景,光谱分辨率为8 cm-1,在4 000~10 000 cm-1波数范围内进行扫描,每个样品扫描32次,每个样品重复测定三次,将三次测定光谱进行平均后用于后续分析。使用Unscrambler 9.7软件进行数据处理。1100型高效液相色谱仪包括四元泵、真空脱气机、自动进样器、柱温箱、二极管阵列检测器(DAD)和HP数据处理工作站(美国Agilent公司)。
材料:氘代氯仿购于美国剑桥CIL公司(纯度99.8%,质谱级,批号13H-456), 丹参酮ⅡA和隐丹参酮对照品购于中国食品药品检定研究院(批号110766-200619和110852-200806),丹参酮提取物共50份,分别购于西安宏森生物科技有限公司、山西惠能达生物科技有限公司、山西安盛生物科技股份有限公司、西安昊轩生物科技有限公司、南京泽朗科技有限公司。甲醇(分析纯,国药集团化学试剂有限公司),磷酸(分析纯,国药集团化学试剂有限公司),乙腈(色谱纯,德国默克公司)。
分别取购买于不同厂家的丹参酮提取物约5 mg, 精密称定,置10 mL量瓶中,加甲醇使溶解,并稀释至刻度,用0.45 μm微孔滤膜过滤,取续滤液得供试品溶液,共50份。以2015版药典为参考,以HPLC测定丹参酮提取物中丹参酮ⅡA和隐丹参酮含量,乙腈为流动相A, 以0.026%磷酸溶液为流动相B,0~20 min内流动相A浓度由0%增加到60%,20~50 min流动相A由60%增加到80%进行梯度洗脱,检测波长为270 nm,柱温为30 ℃,流速0.8 mL·min-1,进样量10 μL,测得丹参酮ⅡA标准曲线为y=44.77x-19.93(R2=0.999 9,n=11,浓度范围为0.010 4~1.83 μg),隐丹参酮标准曲线为y=46.95x-2.506(R2=0.999 9,n=11,浓度范围为0.007 32~0.427 μg)。
分别秤取丹参酮ⅡA和隐丹参酮对照品用氘代氯仿配制成如表1所示浓度。用于后续近红外光谱的采集。
表1 丹参酮ⅡA和隐丹参酮的氘代氯仿溶液浓度分布
氘代氯仿及丹参酮ⅡA和隐丹参酮氘代氯仿溶液近红外原始光谱如图1所示,由于氘代氯仿自身的强吸收,使丹参酮ⅡA和隐丹参酮的特征吸收被掩盖,无法从原始光谱中找出丹参酮ⅡA和隐丹参酮的特征吸收。
图1 氘代氯仿、丹参酮ⅡA和隐丹参酮溶液近红外原始光谱图
采用2D-COS技术,获取丹参酮ⅡA和隐丹参酮二维相关同步谱。氘代氯仿、丹参酮ⅡA和隐丹参酮二维相关同步谱截取对角线得二维同步切片谱如图2(a,b)。由图2可知,丹参酮ⅡA和隐丹参酮氘代氯仿溶液近红外二维同步切片谱分别在1 600~1 800,1 900~2 230和2 300~2 400 nm这三个区域具有特征吸收。丹参酮ⅡA和隐丹参酮分子结构如图3所示,结合丹参酮ⅡA和隐丹参酮结构式,同步切片谱中1 696 nm为甲基伸缩振动二级倍频,1 726和1 740 nm处吸收为环己烯亚甲基伸缩振动二级倍频,2 146和2 220 nm为苯环C—C伸缩振动与C—H伸缩振动的组合频,2 300~2 400 nm处一系列峰为甲基伸缩振动与弯曲振动组合频吸收。丹参酮ⅡA和隐丹参酮结构差异主要在于丹参酮ⅡA分子五元环为呋喃环,而隐丹参酮分子中五元环为四氢呋喃环。丹参酮ⅡA在1 640和2 140 nm处有呋喃环双键一级倍频和组合频吸收,此处吸收为不同于隐丹参酮的吸收特征,以上为丹参酮ⅡA和隐丹参酮特征波段归属[13]。
图2 氘代氯仿、丹参酮ⅡA和隐丹参酮二维同步切片谱(a)和切片谱局部放大图(b)
图3 丹参酮ⅡA和隐丹参酮化学结构式
2.2.1 光谱预处理方法筛选
采集所有不同批次丹参酮提取物粉末的近红外光谱,采用K-S(kenston)样本划分方法,分别选取2/3为校正集,1/3为验正集,用于建立丹参酮提取物NIR定量模型。丹参酮提取物粉末近红外原始光谱如图4所示,由图4可知光谱基线漂移严重,吸收特征不明显。平滑和归一化可以消除由光程差异所带来的光谱变动,平滑可以提高信噪比,导数法使重叠峰的分辨率提高,标准正则变换则可消除固体颗粒散射的影响。考察了不同近红外光谱预处理方法(包括原始光谱Raw, Savitzky-Golay平滑SG,基线校正Baseline,归一化Normalize,标准正则变换SNV,一阶导数加平滑SG 1st,二阶导数加平滑SG 2nd)对PLS建模结果的影响。
图4 丹参酮提取物近红外原始光谱
结果如表2所示,经归一化处理后隐丹参酮PLS模型预测结果最好,交叉验证均方根误差(root mean of square error of cross validation,RMSECV)和预测均方根误差(root mean of square error of prediction, RMSEP)最低,分别为0.004 1和0.001 8 g·g-1。经二阶导数加平滑(SG 2nd)处理后丹参酮ⅡA的PLS模型预测结果最好,RMSECV和RMSEP分别为0.005 5和0.002 0 g·g-1。
表2 丹参酮ⅡA和隐丹参酮不同预处理方法PLS模型预测结果(g·g-1)
2.2.2 2D-COS和SiPLS分别筛选特征波段建模比较
使用化学计量学手段筛选与特征指标相关性最好的光谱信息用于定量模型的建立,可以提高模型的预测性能,删除冗余变量。组合间隔偏最小二乘法(synergy interval partial least squares, SiPLS)将全谱划分成不同间隔数的光谱子区间,将各个子区间按一定窗口大小进行组合,然后建立不同光谱子区间组合模式下的PLS模型,以RMSECV和RMSEP为评价指标筛选最佳子区间的组合用于建模。比较了SiPLS波段筛选方法与2D-COS光谱解析方法建模结果,采用SiPLS进行波段筛选,分别考察了窗口数目为10,12,14,…,26,28,30,组合数为3时的丹参酮ⅡA和隐丹参酮PLS定量模型。
丹参酮ⅡA经SiPLS变量筛选后,当窗口数为10,选取第4,9和10号窗口进行组合,对应波段如图5(a),波长为1 723~1 561和1 135~1 000 nm,潜变量数目为9时,PLS模型RMSECV和RMSEP最小,预测性能最好。隐丹参酮窗口数为10,选取第1,4和9号窗口进行组合,对应波段如图5(b),波长为2 500~2 177,1 723~1 561和1 135~1 063 nm,潜变量数目为9时所建模型预测性能最好。2D-COS筛选波段丹参酮ⅡA和隐丹参酮 PLS模型预测性能与SiPLS筛选波段所建模型相当,其中丹参酮ⅡA在1 600~1 800 nm建模预测性能最好,这与结构中呋喃环特征吸收相关。2D-COS和SiPLS分别筛选特征波段建模结果如表3所示。
图5 SiPLS筛选波段
表3 不同波段筛选方法PLS模型结果(g·g-1)
以氘代氯仿为溶剂,采用2D-COS解析了丹参酮ⅡA和隐丹参酮标准品的NIR光谱,两样品在1 600~1 800,1 900~2 230和2 300~2 400 nm有与浓度相关的特征吸收。丹参酮ⅡA在1 640和2 140 nm处有呋喃环中双键一级倍频和组合频吸收。1 696 nm为丹参酮ⅡA和隐丹参酮分子中甲基伸缩振动二级倍频,1 726和1 740 nm处吸收为丹参酮ⅡA和隐丹参酮环己烯亚甲基伸缩振动二级倍频,2 146和2 220 nm为丹参酮ⅡA和隐丹参酮苯环C—C伸缩振动与C—H伸缩振动的组合频,2 300~2 400 nm处一系列峰为丹参酮ⅡA和隐丹参酮甲基伸缩振动与弯曲振动组合频吸收。采集丹参酮提取物近红外光谱,考察复杂体系下,2D-COS解析特征波段与SiPLS筛选波段PLS建模结果,二者均具有良好的模型预测性能。2D-COS解析的特征波段与结构密切相关,其中1 600~1 800 nm处丹参酮ⅡA的PLS模型预测性能比SiPLS筛波段PLS模型更好,表现出与分子结构相关的高度可解释性。验证了2D-COS这一光谱特征解析方法所得特征吸收峰在中药复杂体系中NIR建模的适用性,且与化学计量学特征波段筛选相比,更具有解释性和稳定性,为近红外特征波段的筛选提供了借鉴和指导。同时,对于丹参酮提取物中结构相似化合物丹参酮ⅡA和隐丹参酮,2D-COS可解析出结构差异特征吸收,一个波段可实现结构类似物的同时定量测定,为中药生产工业化中专业用途NIR仪器的制造提供了可行性论证,未来可以考虑将2D-COS用于NIR专业仪器制造光程的选取中。