常肖,王一潇,赵娜
(石河子大学药学院,新疆 石河子 832000)
药用辅料系指生产药品和调配处方时使用的赋形剂和附加剂[1],药用辅料的加入有利于原料药加工成药品,提高药物稳定性和患者顺应性等,其质量是药品质量的关键因素。另外对于仿制药而言,一致性评价的核心工作之一就是要筛选合适的辅料、确定辅料的比例。在一致性评价语境下,药用辅料的市场需求和质量要求同步提高[2],但是由于我国部分药用辅料生产企业生产资料不重视、部分制剂企业药用辅料质量控制不合格等因素,造成药用辅料质量控制不合格等问题。当今对药用辅料要求愈加严格的市场和政策下,寻求一种快速准确的分析方法[3]。
片剂与颗粒剂是常规剂型,常用辅料包括稀释剂、粘合剂、崩解剂等,其中乳糖和微晶纤维素(MCC)是常见的药用辅料。乳糖常用作填充剂或稀释剂[4],而MCC常用作黏合剂、稀释剂、崩解剂等。以上两种辅料常用分析方法分别是高效液相色谱法(HPLC)和酸碱度分析法,HPLC测定过程较为复杂,且测定周期较长,实际应用中存在一定的局限性;酸碱度检测方法虽过程简单,操作方便,但易受外界环境影响,导致误差。因此,对于以上两种辅料的含测在快节奏的市场检测中难以发挥其相应的作用。
近红外光谱技术(Near infrared spectroscopy,NIRS)在二十世纪80年代后期迅速得以推广,拥有分析速度快、无损、绿色分析、灵敏度高等优势[5-6],目前NIRS结合化学的计量学能够对样品进行快速有效的定性、定量分析,并实现在线实时的过程分析[7]。NIRS在药用辅料含量测定方面也有着许多的应用,如李沙沙等[8]应用NIRS监测硫酸羟氯喹原辅料的混合过程,并建立近红外定量分析模型;律涛等[9]借助NIRS测定金银花-糊精混合粉末中糊精的含量,为辅料糊精含量的在线检测提供技术支持;张智勇等[10]拟将NIRS与智能分析系统的有机结合,实现中药质量及效益最优化的智能化制造;郝远等[11]比较了5种不同的样品集划分方法对建模的影响,建立了叶酸中蔗糖含量的近红外定量偏最小二乘法(Partial Least Squares,PLS)模型,实现了叶酸中辅料蔗糖的快速定量等。而近红外技术在辅料的测定中多是测定一种辅料[12-13]。
本研究采用近红外光谱分析技术检测甘草提取物-乳糖-MCC混合粉末,结合PLS建立定量模型,同时分析甘草提取物中辅料乳糖和MCC含量,实现多种辅料同时测定。
Tango-R.近红外光谱仪(美国Bruker公司);Sartorius BSA224S型电子天平(德国Sartorius公司)。生甘草提取物(西安神农生物科技有限公司型号:SN-034);乳糖(石河子市科伦商贸有限公司,批号:20190109);MCC(石河子市科伦商贸有限公司,批号:20190602)
1.2.1 样品的制备
精密称量甘草提取物、乳糖和MCC,固定甘草提取物的含量为10%,按照辅料中乳糖在混合物中的含量变化量不同进行3个梯度划分,其中65%~67.5%以0.5%的梯度递增,67.5%~75%之间以0.1%的梯度递增,75~85%以0.5%的梯度递增,制备总重约为5 g左右甘草提取物、乳糖和MCC混合样品,共获得101个样品,样品信息见表1。
表1 甘草提取物与辅料的混合物样品含量一览
表1续
表1续
1.2.2 近红外光谱采集
采用Tango-R.近红外光谱仪(美国Bruker公司)采集101分样品的原始近红外光谱,采用积分球漫反射模式采集光谱,以仪器的内置背景做参比,分辨率为8 cm-1,光谱范围选择10 000~4 000 cm-1,扫描次数为32次,进行样品光谱的扫描,每个样品扫描3次,计算平均光谱作为甘草提取物辅料混合粉末原始光谱。
1.2.3 数据处理
采用Kennard-Stone(KS)算法,将乳糖和MCC数据进行样本集划分(2∶1),即67个样品作为校正集,34个样品作为验证集。为提高模型的准确性,选用不同的光谱预处理方法,包括一阶导数(1stderivative,1D)、二阶导数(2ndderivative,2D)、Savitzky-Golay平滑法(S-G)、多元散射校正(Multivariate Scatter Correction,MSC)、标准正则变换(standard Normal Variate transform,SNV),并通过内部交叉验证方法确定原始光谱(raw)及不同预处理方法最佳潜变量因子。
本次研究之所以选择将预处理后的校正集进行PLS建模,是因为PLS所构建的模型稳健并且PLS可对光散射和其它组分带来的干扰进行补偿,而且模型中参与回归的主成分和样品性质相关,亦可适用于复杂体系。因此通过PLS将预处理后的校正集进行建模,进而得到校正模型,以及校正集决定系数(Rcal2)、校正均方根误差(Root Mean Square Error of Calibration,RMSEC)和交叉验证均方根误差(Root Mean Square Error of Cross-validation,RMSECV)、预测值决定系数(Rval2)和预测均方差误差(Root Mean Square Error of Prediction,RESEP)等为评价指标,最后确定最佳建模参数。
甘草提取物与辅料混合物近红外光谱图见图1,由图可知,在所选波长10 000~4 000 cm-1中,样品的原始光谱基本一致,光谱特征性较强,4 500和5 260 cm-1处为水的特征吸收,而在4 800 cm-1附近有一处特征峰,则为乳糖与MCC的ROH特征吸收峰[14],7 000~6 000 cm-1主要为辅料中ArCH特征吸收。从图1能够清楚地看到光谱受干扰和基线漂移的程度较小,噪声和受干扰部分主要在低频部分,高频部分受干扰程度较小。
图1 甘草-乳糖-MCC混合粉末样品的近红外原始光谱图
采用1D、2D预处理,可有效地消除基线干扰,强化谱带特征,克服谱带重叠,减少重叠峰,提高分辨率和灵敏度[15],但是仅采用导数预处理方法会降低信噪比(SIGNAL-NOISE RATIO,SNR),导致预处理效果不佳,继而导致实验结果不准确。所以导数预处理方法通常和平滑预处理方法连用[16],采用S-G预处理,可消除高频随机误差,有效减少光谱噪音的影响,提高SNR[17];MSC和SNV可消除粒度不均匀及颗粒差异对光谱产生的散射影响[18]。
潜变量因子数的大小对PLS模型的预测效果有显著影响,潜变量因子数过多,就会加入噪声,导致模型的实际预测能力降低,影响模型的应用;潜变量因子数过少,则不能充分表达样品的光谱信息[19]。最佳潜变量因子数过多或过少,分别会导致过拟合或欠拟合现象,模型的预测能力从而下降[20]。通过内部交叉验证筛选最佳潜变量因子数,乳糖与MCC不同预处理方法PRESS值结果如图2所示。由图2可知在各预处理方法下,乳糖组和MCC组的PRESS在潜变量因子数为4时都基本不再变化,潜变量因子越大,PRESS值越趋近于零。
图2 乳糖(a)和MCC(b)不同预处理方法下 PRESS随潜变量因子变化图
将各预处理方法处理之后的数据用PLS建立定量模型,乳糖组和MCC组的结果见表2。RMSEC和Rcal2可反映近红外光谱模型的内部稳健性和拟合效果。预测集RMSEP和Rval2可反映所建模型对验证集样品的预测结果[15]。决定系数的值越接近1,表明模型拟合效果越好;RMSEC、RMSECV和RMSEP越小,表示模型定量效果良好,所用方法的误差小[21],RMSEP值远大于RMSEC值时,校正集部分的代表性差,而当 RMSEP 值远小于RMSEC值时,验证集部分的代表性差[22];定量模型性能指数(Ratio of performance deviation,RPD)表示预测标准化程度,当RPD大于3时,值越大,所对应的校正模型的预测性能越好。从表2中可以看出乳糖和MCC最佳预处理方法为2D,潜变量因子为4。
表2 乳糖和MCC的各预处理方法建模结果
预处理方法为2D,潜变量因子为4时,建立乳糖组和MCC的PLS 回归模型,PLS 模型校正集与验证集的预测值和理论值相关关系见图3。
图3 乳糖(a)和MCC(b)校正集与验证集相关关系图
本文通过近红外光谱仪收集甘草混合物与辅料的样品光谱,利用近红外光谱值与实际乳糖含量和实际MCC含量的联系建立PLS回归模型。为了达到消除高频随机误差、有效减少光谱噪音的影响并且提高信噪比的目的,对样品光谱采用S-G预处理,同时,对光谱使用1D、2D进行预处理,有效地消除了基线干扰,克服了谱带重叠的情况,达到强化谱带特征、提高分辨率和灵敏度的目的,而且MSC和SNV可消除粒度不均匀及颗粒差异对光谱产生的散射影响。通过以上预处理方法对样品光谱进行预处理,可以得到校正集和验证集的决定系数和各自均方根误差值,通过比较各预处理方法处理后的校正集和验证集的决定系数和各自均方根误差值,选取模型预测结果相对较好的PLS模型。
2)利用建立的模型对样品进行预测,结果显示近红外光谱检测法应用于甘草提取物中辅料含量的快速定量分析情况良好,预测结果的准确性已经达到了药用辅料测定的要求。
3)研究通过NIRS同时快速测定甘草提取物中MCC和乳糖两种辅料成分,结果真实有效,可信度较高。同时可以反映出近红外分析技术相较于传统分析技术具有十分优越的技术优势,可以快速准确地对多个药用辅料同时进行定量分析,为其他产品辅料提供依据与经验的同时,也为市场定量分析药材辅料提供了一种切实可行的方法。