冯婉红,邹艳君,麻淑磊*
·药学研究·
基于偏最小二乘法的近红外光谱模型用于丹参口服液提取过程的分析
冯婉红1,邹艳君2,麻淑磊2*
目的探讨丹参口服液提取过程采用近红外光谱(NIR)分析的可能性及其方法。方法制备共122份提取液,采用高效液相色谱法(HPLC)测定原儿茶醛含量,并收集NIR图,用偏最小二乘法(PLS)建立校正模型。结果采用二阶求导及Savitzky-Golay平滑处理后的校正模型交叉验证均方根误差(RMSECV)为3.456,相关系数为0.988,优于其他优化方式。结论基于PLS的原儿茶醛NIR模型可用于丹参口服液提取过程的在线分析。
丹参口服液;质量控制;近红外光谱;偏最小二乘法
丹参为唇形科鼠尾草植物丹参(Salviamiltiorrhiza)的干燥根及根茎,具有祛瘀止痛、活血通经、清心除烦之功。由丹参单味药材煎煮制成的丹参口服液属于医保乙类药,具有较为优良的疗效,且不良反应小,临床上用于治疗心绞痛[1-3]、冠心病[4-5]等心血管疾病。《丹参口服液质量标准》(以下简称“标准”)现收录于国家食品药品监督管理局药品标准,指标性成分为原儿茶醛[6]。
中药提取液的质量直接决定了制剂的质量,因此有必要进行实时监控。在线近红外光谱(NIR)技术提供了一种对提取过程进行检测的方法,可以实时监控提取液中主要成分的变化情况[7-8],并根据这些情况灵活调整提取方案,从而获得质量最优的提取液。本实验按照“标准”中的提取工艺,采用NIR技术对其建模,对提取过程进行质量控制。
AntarisⅡ型近红外光谱仪(Thermo Fisher公司),配备Version 3 SP4 Result and TQ光谱分析软件;LC-20AB高效液相色谱仪[岛津(中国)有限公司];Venusil XBP C18色谱柱(博纳艾吉尔科技有限公司);EL104型分析天平[梅特勒-托利多(上海)有限公司];PHS-3C型精密pH计(上海精科仪器有限公司);RE-52型旋转蒸发仪(瑞士步琦有限公司)。 丹参(批号:141201,产地:山东)购自浙江中医药大学中药饮片有限公司;原儿茶醛(批号:110810-201007,含量:98.2%);氢氧化钠(分析纯,江苏永华精细化学品有限公司),无水乙醇(分析纯,南京化学试剂有限公司);醋酸(分析纯,南京化学试剂有限公司);明胶(药用,青岛市丰乐化工有限公司);液相用甲醇(色谱纯,美国天地试剂公司)。
2.1提取工艺参照“标准”中工艺,称取处方量丹参饮片,加11倍量水,提取2次,第1次2 h,第2次1.5 h,浓缩至相对密度为1.10~1.15,加盐酸调节pH至4.5~5.0,即得。采用此方法,分别于第1次煎煮0.5、1.0、1.5、2.0 h,第2次煎煮0.5、1.0、1.5 h,浓缩后及调pH后等节点取样,重复14组,共得到122份样品(4份样品被弃用),备用。
2.2原儿茶醛含量测定参考文献报道[9],经过试验,最终的HPLC色谱条件为:色谱柱为Venusil XBP C18色谱柱,流动相为甲醇-0.2%醋酸(20∶80),进样量10 μL,柱温35 ℃,检测波长280 nm。理论塔板数按原儿茶醛计算不低于8 000,各组分与相邻色谱峰的分离度均大于1.5,且各组分的色谱峰对称,原儿茶醛及样品色谱图见图1。采用上述方法测定各组样品的原儿茶醛含量。
图1 丹参口服液原儿茶醛含量测定HPLC色图谱
2.3近红外光谱采集取各组样品,置于样品池中,测量其透射光谱,光谱范围12 000~4 000/cm,波长增量为2 nm,扫描次数为300次,每个样本采集3张NIR图谱,取平均值作为样本的NIR图谱,所得光谱图如图2所示。
3.1模型的建立
3.1.1异常点的剔除由于实验人员的操作、实验环境、仪器自身等存在误差因素的影响,导致部分样品的测定结果出现异常,从而使模型精密度下降。通过采用相关性对照检验及参考马氏距离(杠杆值)等方法,可将异常点剔除[10]。线性回归图横坐标为实测值,纵坐标为预测值,离回归线很近或落在回归线上面的点,说明预测值与实际值很接近或者一致,离回归线过远的点则为异常点。马氏距离图在优化建模参数时作为辅助参考指标。见图3。
图2 提取液的近红外光谱图
图3 异常校正点提出说明
3.1.2模型建立去除异常点后,首先运用Version 3 SP4 Result and TQ光谱分析软件进行光谱范围分析,发现谱区的差异主要集中在8 449.9~6 101.7/cm,因此,选定此范围作为PLS建模效果最优的光谱范围。检测过程易受多种因素的影响,从而产生误差。因此需要对光谱进行预处理,以便去除干扰,扩大有效信息,提高模型的精确度及预测效果。采用标准归一化法(SNV)处理及Delaunay三角剖分(DT)处理,分别达到了消除光程差异和消除基线漂移的效果。在比较原始图谱、一阶导数、二阶导数后,增加了SG平滑、Norris平滑两种平滑方式与求导联用,进一步提升优化效果(见表1)。
通过对各组模型进行对比,发现二阶导数+SG平滑组的预处理效果最好,RMSECV最小,R2优于其他模型,故选择该模型作为原儿茶醛的定量模型,其校正曲线如图4A所示。模型的主因子数也是模型建立的一个重要的参考指标,选取的主因子数越多,引入噪声的可能性越大,模型也越不稳定;但主因子数过少时,易造成有效信号的遗漏,使模型的准确性达不到要求,故主因子数选择应适中(通常为8~10)。主因子数的选择主要以预测残差平方和及RMSECV为指标,以两者拐点时的主因子数为最佳主因子数。主因子数-PRESS、主因子数-RMSECV相关图见图4B、4C,由图可知,当主因子数为8时,PRESS和RMSECV均处于拐点,因此,以主因子数为8时的模型为最优模型。
表1 原儿茶醛的校正模型
图4 原儿茶醛含量测定的校正和测试模型
3.2近红外光谱模型的验证
3.2.1精密度考察取1个批次样品重复测量6次近红外光谱,分别用建立的原儿茶醛定量分析模型计算得到原儿茶醛的含量,考察方法的精密度,结果RSD为1.1%。
3.2.2准确性考察校正集样品经外部验证,RMSEV为0.86%,与实际含量相比,NIR测定结果平均RSD为1.35%,最大RSD为2.98%。外部验证均方差为0.137%,与实际含量相比,NIR测定结果平均RSD为1.51%,最大RSD为2.47%。将验证集样品NIR结果与实际含量在95%置信区间内进行配对t检验,NIR检测与参考方法结果无显著差异。
3.2.3稳定性考察取1批次样品,于0、2、4、6、8、12、24、36、48和60 h测定光谱,用模型分析其含量,考察其稳定性,RSD为1.08%。说明模型具有良好稳定性。
3.2.4实际样品含量分析用建立的原儿茶醛近红外模型分析3组样品,并将结果与实际含量比较,结果见表2,NIR方法与实际含量间无显著差异。
表2 三组样品分析结果
PLS通过最小化误差的平方和找到一组数据的最佳函数匹配,易于辨别系统信息与噪声,是NIR建模的常用算法[11]。但是中药提取物成分复杂,即使采用PLS也难以较好地区分系统信息与噪声。通过对NIR图谱共振峰进行求导,可将共振峰锐化,使原本难以分离的峰得以分离,从而减少噪声的干扰;二阶导数是在一阶导数的基础上再进行一次求导,减少噪声的效果更好。SG平滑是利用中心点及其前3个点和后3个点进行最小二乘法拟合,可以减少噪声对结果的影响。根据最终结果,二阶导数联合SG平滑更适用于丹参口服液的NIR图谱处理。
中药提取过程的在线监控,一直都是中药现代化研究的一个重要方面和热点。常规的定量方法,如HPLC、紫外法(UV)、质谱法(MS)等,均无法即时得到测定结果,无法做到在线监控;同时,这三种方法只能分析部分活性成分,无法从整体评价提取液的质量。NIR可以有效解决上述两个问题,且检测方便,在线监控型的NIR光谱仪只需将探头插入提取液中,便可即时得到测定结果,无需对供试液进行处理。因此,NIR可以很好地用于中药提取过程的在线监控。
[1]王侠,李晓庆,吴焕林.丹参多酚酸盐治疗心绞痛的非时机、同期对照临床研究[J].实用医学杂志,2010,26(1):111-113.
[2]王影.注射用丹参冻干对心绞痛患者血液流变学、心电图的影响[J].现代中西医结合杂志,2011,20(17):2128-2129.
[3]周松,范叔清,张喜民,等.丹参在治疗心绞痛中成药组分中的应用分析[J].中成药,2015,37(4):925-928.
[4]刘志宁,赵庆霞,尤莉.丹参多酚盐注射液对猝死型冠心病复苏过程中的心肌保护作用[J].南方医科大学学报,2010,30(3):645-646.
[5]高传长,邹书兵.丹参及其主要成份在冠心病及胰腺炎等疾病中的致病机制[J].中国中西医结合杂志,2010,30(11):1222-1226.
[6]国家食品药品监督管理局药品标准.丹参口服液药品标准[S].2003,71,WS-73(Z-12)9.
[7]陆婉珍,袁洪福,褚小立,等.当代中国近红外光谱技术-全国第一届近红外光谱学术会议论文集[C].北京:中国石化出版社,2006:47-53.
[8]瞿海斌,刘晓宣,程翼宇.中药材三七提取液近红外光谱的支持向量机回归校正方法[J].高等学校化学学报,2004,25(1):39-43.
[9]黄赵刚,刘钢,夏泉,等.HPLC法测定不同厂家丹参注射液中丹参素和原儿茶醛的含量[J].安徽医药,2008,12(11):1055-1056.
[10]张亚非,左翔云,毕宇安,等.近红外光谱技术在热毒宁注射液萃取液浓缩过程中的应用研究[J].中国中药杂志,2014,39(16):3069-3073.
[11]吴志生.中药过程分析中NIR技术的基本理论和方法研究[D].北京:北京中医药大学,2012.
NIR model based on PLS used to analyze the extraction process of Salvia oral
FENG Wan-hong1,ZOU Yan-jun2,MA Shu-lei2*
(1.Hangzhou Xiaoshan Hospital of TCM,Hangzhou 311201,China;2.Yongjia Hospital of TCM,Wenzhou 325401,China)
ObjectiveTo discuss the feasibility and methods of using near infrared (NIR) to analyze the extraction process of Salvia oral.Methods122 extracts were prepared to detect the content of protocatechuic aldehyde by high performance liquid chromatography (HPLC),and the NIR spectrums were collected.Partial least squares (PLS) was used to build the correction model.ResultsWith 2-derivative optimization and Savitzky-Golay smoothing optimization,the RMSECV of the correction model was 3.456,and the correlation coefficient (r) was 0.988,which means 2-derivative optimization and Savitzky-Golay (SG) smoothing optimization were better than other optimizations.ConclusionThe NIR correlation model of protocatechuic aldehyde based on PLS is reliable for quality controlling of Salvia oral on line.
Salvia oral;Quality controlling;NIR;PLS
2016-03-02
1.杭州市萧山区中医院,杭州 311201;2.永嘉县中医医院,温州 325401
永嘉县科技发展计划项目(2015306)
10.14053/j.cnki.ppcr.201609026