杨 慧
(江苏省徐州医药高等职业学校,江苏 徐州 221116)
近红外(near-infrared,NIR)光谱技术是一种快速、无损分析方法,光谱波长范围是780~2500 nm(11 000~4000 cm-1),主要谱峰为有机物分子C-H、N-H及O-H等含氢基团的倍频与合频振动吸收所产生的,因其光谱特性稳定,非常适合于药品原辅料及制剂的定性定量分析[1]。近几年来得益于化学计量学、电子计算机及软件的发展,尤其是基于多变量数据分析的化学计量学的发展,使得NIR光谱中的大量信息能够被解释,这一技术得到了广泛应用[2-3]。
利福昔明为利福霉素类衍生物,具有抗菌谱广、抗菌作用强等特点,口服后基本不吸收,以原形由粪便排出,主要在肠道内发挥抗菌作用。利福昔明起效快,作用强,安全性高,是治疗成人急性轻中度感染性腹泻的安全有效药物,国外用于治疗急性感染性腹泻取得了良好的疗效。
本研究应用近红外透射和漫反射光谱结合多种计算药物分析方法,对利福昔明混悬剂中间体粉末建立快速、无损分析模型,对各模型预示结果进行比较,找出较优模型。
德国Bruker MPA型近红外光谱仪,旋转样品杯和积分球漫反射测样器件PbS检测器,利福昔明原料药及辅料糊精、蔗糖、微晶纤维素/羧甲基纤维素。
按利福昔明混悬剂工艺流程制备含主药标示量80%~120%(间隔5%)的中间体粉末样品9×6份,分别记为1(1)~9(6),装入透明塑料袋内。
光谱分辨率为8 cm-1,扫描范围10 000~4000 cm-1,以3.86 cm-1间隔采集光谱数据。将样品装入积分球的测样杯中,采用旋转的方式测量样品近红外数据。
纯组分和样品光谱如下:
图1 各纯组分光谱(1-利福昔明;2-蔗糖;3-微晶纤维素;4-糊精)Fig.1 Spectra of pure components
图2 利福昔明训练Fig.2 Rifaximin training set
图3 利福昔明预示集Fig.3 Rifaximin prediction set
用多元线性回归和偏最小二乘(PLS)法处理数据,所用程序皆用VBA编程。
取标示量80%、90%、100%、110%及120%样本做训练集,取标示量85%、95%、105%及115%样本做预示集。
用多元线性回归程序回归出每个波长处的回归方程,按相关系数从大到小排列,选取前4个波长点,多元回归得预示集浓度。
表1 多元线性回归预测样本中各成分含量结果Tab.1 Prediction of the results of each component content in the sample with multiple linear regression
续表1
由上面数据可知,多元线性回归法预示的结果很不理想,特别是主药利福昔明和辅料糊精的浓度预测值与真实值偏差很大。
分别选用3个波段对训练集进行分析。将波段、最佳主成分数、交互证实均方误及r列表如下:
利用PLC法处理数据,得预示集中利福昔明的浓度。
表2 测量波段及相关信息Tab.2 Measuring band and related information
表3 PLS法预测利福昔明结果Tab.3 Predication results of rifaximin with PLS method
由以上结果可知,PLS法处理数据预示结果准确度及精密度都符合要求。
通过多元线性回归法和PLS法的比较可知,PLS法的建模结果好于多元线性回归法。多元线性回归法[4]即通过多元回归求出吸收系数矩阵后,选取相关系数较大的多个波长点进行多元线性回归求出预测样品浓度。此方法对主药利福昔明来说得到的结果很不理想,主要有以下几个原因:多元线性回归法中将各组分的不同浓度样品在某一波长处的吸收系数假设是一样的,事实上,近红外光谱中物质在某波长处的吸收系数随着浓度的不同而不同,从而产生误差。求回归方程时,杂质未参与回归,所以样品中的杂质,特别是水分的干扰也会产生误差。两次多元线性回归有两次求逆过程,会产生误差。虽然此方法的结果不理想,但是可借此找到回归系数较大的波长段,为采用其他方法处理数据做准备。PLS法实质上是一种建立在主成分分析基础上的多元线性回归法。在对吸收值矩阵进行主成分分解的同时,也对浓度矩阵进行主成分分解,再对二者进行线性相关回归。通过主成分分析可消除一些噪音、杂质等无用信息的干扰。因为各个主成分是相互正交的,使用它们回归不会产生共线问题,可使用全谱,也可使用原始光谱的一部分,因此PLS法回归结果较好[5]。通过多元线性回归法处理数据得到的波长段,结合纯组分的光谱图,确定PLS法处理数据时所采用的波长段。
与常规分析技术不同,近红外光谱是一种间接分析技术,必须通过建立校正模型(标定模型)来实现对未知样品的定性或定量分析[6],它的适用性及推广能力与校正集中样品的代表性有很大关系。根据利福昔明混悬液处方,通过适量的样品建立数学模型之后,可准确快速地确定未知样品含量,尤其适合于对大量重复性样品的快速分析,为近红外光谱技术应用于药品制剂的定量分析及在线质量控制提供可能。