汪义程,郭志永,闫 宇,薛洪宝,*,陈 鹏,宫文武
(1.蚌埠医学院 公共基础学院,安徽 蚌埠 233030;2.安徽宏业药业有限公司 生产技术部,安徽 蚌埠 233045;3.安徽省药品监督管理局第五分局,安徽 蚌埠 233000)
近红外光的发现已有两百余年的历史,随着科技的发展和时代的进步,近红外光谱(Near infrared spectrum,NIRS)分析技术在许多行业中均发挥着重要作用,特别是在药物分析领域中的应用较为广泛[1-2]。NIRS在制药行业中可用于不同状态和不同类型的药物分析,包括原料药纯度检测、包装材料质量的监测以及对药品加工全过程和生产工艺进行在线连续分析、监控,还可对药物流通中的劣药、假药进行鉴别和成分分析。特别是对于一些成分含量较为复杂的药品,使用传统的化学方法进行药品分析时程序繁多且耗时长,而近红外分析技术可根据药物特性进行定性或定量分析,大大提高分析效率。
药品生产时的工序一般较为复杂,要历经混合、加工、成型和包装等步骤才能完成生产,而要对药品生产过程中的质量进行有效的控制,需在药品加工全过程对所有组分进行全面、系统地检测和分析[3],这种检测方法速度慢,效率低,不利于提高企业的经济效益。近红外光主要是C—H、O—H、N—H、S—H等含氢基团振动光谱倍频及合频等的吸收光谱,谱带上不同基团的近红外吸收不同,有机化合物的结构、组成信息可在谱图中进行显示[4-5]。近红外光谱分析技术是对标准样品的光谱进行采集后,运用合适的算法计算,并建立检验分析模型,同时进行相关性验证。当检测样品时,用被检测样品的图谱与标准模型进行比对和分析,可得到检测结果。近红外光谱具有便捷、无损检测、测量及结果传递快等特点[6],避免了液相色谱法和气相色谱法样品预处理复杂、检测时间长、成本高等问题,适合在大规模生产的情况下对药品的质量进行全面监控,其在制药领域的应用前景光明,发展潜力巨大[7]。
本研究通过采集某公司注射用复方甘草酸苷产品70批次的近红外光谱图,基于其中甘氨酸、甘草酸苷、盐酸半胱氨酸3种组分的含量数据,建立了可快速、准确预测这3种组分含量的近红外定量分析模型,优化了模型[8]并进行了可靠性验证。该方法为复方甘草酸苷的质量控制提供了一种参考方法,有望作为生产过程中产品质量控制的辅助手段,实现产品质量监测的全覆盖,最大限度降低产品质量风险,为医药生产企业创造较高的间接经济效益。
Thermo Antaris Ⅱ近红外光谱仪(卤钨灯光源);Agilent Technologies分析型高效液相色谱仪(HPLC,1260 Infinity Ⅲ Prime);Origin8.0专业函数绘图软件、TQ Analyst光谱分析软件、SPSS数据统计分析软件。
样品为注射用复方甘草酸苷(标示含量规格(参考值):每瓶含甘草酸苷40 mg,甘氨酸400 mg,盐酸半胱氨酸20 mg)冻干粉针剂,由10 mL中性硼硅玻璃管制西林瓶包装。
将采集的70批次注射用复方甘草酸苷样品的近红外光谱图及其中甘氨酸、甘草酸苷、盐酸半胱氨酸3种组分的含量数据作为样品集,按照校正集与验证集样品比例4∶1建立分析模型;同时在保证验证集样品含量在校正集样品含量范围内的前提下,选择校正集样品和验证集样品。最终从70批次样品集中选取13批次作为验证集。校正集样品中甘氨酸、甘草酸苷、盐酸半胱氨酸的含量分布范围分别为:0.23% ~ 4.0%、0.40% ~ 5.1%、0.10% ~ 3.9%;验证集中相应为:0.25% ~ 7.2%、0.05% ~ 0.65%、0.05% ~ 1.8%。实验数据处理流程见图1。
图1 实验数据处理流程图Fig.1 The processing chart of experimental data
采用积分球漫反射采样模块直接扫描测定样品的NIRS图谱。光谱采集条件:以仪器内置空白背景为参比,用近红外光谱仪采集所有NIRS及CSV格式的数据矩阵;波长范围10 000 ~ 4 000 cm-1,扫描累加次数32次,分辨率8 cm-1;分别测定各批样品,得到3种组分的原始光谱图(图2A),其一阶和二阶导数光谱图见图2B、C。由图2可见,复方甘草酸苷中3种组分的谱图在9 000 ~ 8 200 cm-1和6 700 ~5 000 cm-1范围内存在较大差异。最终选择8 928.80 ~ 8 776.70 cm-1、6 520.77 ~ 5 134.44 cm-1和8 921.02 ~ 8 411.80 cm-1谱段建立3种组分的定量分析模型。
分别从每个批次的样品中随机选取2组数据,共得到140个红外光谱图作为建模分析用样本,建立注射用复方甘草酸苷的偏最小二乘回归(PLS)[8]定量分析模型。
2.2.1 模型评价以70批次样品为标准样品,随机选取两组样品作为验证样品进行分析,将分析结果与标准值进行比较,根据窗口中模型参数选择,计算其指标特征。其中相关系数(R)反映预测值与参考值的相关性,该值越高则相关性越高;校正均方根误差(RMSEC)、预测均方根误差(RMSEP)作为评价所建定量模型性能的指标,其结果越接近0,说明模型适用性越强,预测结果越准确。根据以上数值对模型的预测效果进行综合评价。
2.2.2 预处理方法的选择光谱预处理方法有平滑、位移校正、导数校正、小波变换等,合适的光谱预处理方法可以有效消除物理因素的干扰,提高NIRS与待测化学成分的相关性。不同预处理方法结合使用有望得到更好的模型效果[9],本研究发现,样品光谱经过一阶导数+S-G(3,3)点平滑处理后,不仅能有效消除光谱漂移和噪音,且8 928.80 ~8 776.70 cm-1、6 520.77 ~ 5 134.44 cm-1和8 921.02 ~8 411.80 cm-1谱段内的曲线波动明显,数据变异性增强,能够最大限度地体现不同品种光谱的差别。以该谱段作为特征区间,考察了全谱段与特征区间谱段的建模效果。由表1可知,一阶导数分别结合S-G(3,5)、S-G(3,4)、S-G(3,3)、S-G(3,2)、S-G(3,1)点平滑处理时的结果一致,为减小实验误差,确保模型的准确性和可靠性,取中间的S-G(3,3)点平滑结合一阶导数作为预处理方法。
2.3.1 建模结果通过优化谱段和选择不同预处理方法,并结合软件自带的光谱离群值剔除功能,剔除影响模型建立的样本[8],确定最终的建模参数为:谱图预处理选择一阶导数+S-G(3,3)平滑,谱段分别选择8 928.80 ~ 8 776.70 cm-1、6 520.77 ~ 5 134.44 cm-1和8 921.02 ~ 8 411.80 cm-1,通过RMSEC对主因子作图优化模型参数,分别得到甘氨酸、甘草酸苷,盐酸半胱氨酸3种组分模型的最佳主因子数为10、3、10,模型相关系数(R)分别为0.999 54、0.947 01、0.999 95,RMSEC依次为0.289、0.098 0、0.001 07(表1)。相关系数值均接近1,表明预测值与参考值之间存在良好的相关性;均方根误差较小,表明预测值与参考值之间产生的误差较小。而模型相关系数0.947 01数值偏离1,可能原因如下:其一,受近红外检测限的影响。国际公认检测限为0.1%,若样品浓度低于该阈值,将导致近红外模型预测误差较大;其二,受建模样本代表性及数量的影响。理论上,建模样本数量越多,统计模型可靠性越高,若建模样本缺乏代表性,将导致化学性质仅分布在一个很小的区间内,使得该模型不具备广泛代表性。
2.3.2 模型验证为确认所建立的定量模型能适应所测样品,并能对实际样品进行准确预测,使用验证集中的13批样品对所建立的模型进行验证。使用验证集的相关系数(R)和均方根误差对模型性能进行评估[9]。3种组分验证集的R分别为0.999 34、0.949 00、0.989 23,RMSEP分别为1.86、0.302、0.191,预测值分别为397.396 2、19.810 0、40.210 8。将模型预测值与参考值进行比较,结果显示,甘氨酸、甘草酸苷、盐酸半胱氨酸的预测值与参考值之间的平均相对误差分别为0.41%、0.72%、0.86%,且预测值与参考值在95%置信区间内无显著性差异(P> 0.05)。
以未用于建模的16批注射用复方甘草酸苷样品及1份不合格样品作为对照,分别扫描其近红外光谱图,利用所建模型预测其中3种成分的含量,表2为NIRS预测值与测定值的比较。测定值为各成分的实际含量[10],其中,盐酸半胱氨酸的检测方法为高效液相色谱法,甘草酸苷为硫代硫酸钠滴定法,甘氨酸为氢氧化钠滴定法。由表2可知,测定值间的全谱段匹配度平均值为:盐酸半胱氨酸99.19%、甘草酸苷99.73%、甘氨酸为98.64%;区段谱图匹配度平均值为:盐酸半胱氨酸为95.28%、甘草酸苷为99.81%、甘氨酸为99.63%;平均误差率:盐酸半胱氨酸为-0.37%、甘草酸苷为2.14%、甘氨酸为0.37%。结果表明,NIRS预测值与测定值间无显著性差异,说明所建立的模型可用于注射用复方甘草酸苷的快速测定[11-13]。
表2 模型预测值与测定值的比较Table 2 Comparison of predicted values and measurement values
由3种成分的全谱图匹配度和区段谱图匹配度可知,所建模型具有一定的精密度和准确度,16批样品的个体误差率值较小,均在± 5%以内,平均误差率在± 2.5%以内,说明预测结果的可靠性和稳定性均较高。不合格对照组中盐酸半胱氨酸和甘草酸苷误差率为3.13%和3.76%,相对较高,但符合要求;而甘氨酸的误差率为6.13%,超出5%范围,定量分析结果不符合要求。由此可见本定量分析方法模型稳定、可靠、精密、准确,可作为医药生产企业对注射用复方甘草酸苷质量控制的有效辅助质量控制手段。
以某公司注射用复方甘草酸苷产品70批次的质量检验数据为基础建立数学模型,由于数据采集的时间跨度较大,仪器稳定性、温度、湿度、样品含水量、pH值等外部因素存在差异,可能会导致实验数据存在差异,使得后期建模过程存在一些问题。因此,应尽量在短时间内采集数据,保证数据的准确性和精度。原始光谱是模型建立的基础,标准样品组分含量测定的准确性和精度是影响NIRS定量分析准确度的最主要因素。光谱采集和数据记录的准确性也决定了模型的真实性[14]。其次,建立定量分析鉴别模型是利用样品的图谱库,因此样本的代表性受图谱库大小的影响,并决定了模型的准确性。一般要求建模的样品量不少于50批,以降低样品预测误差。
通过选择光程类型、导数处理、滤噪、平滑和基线校正等对光谱进行预处理,可以提高模型的稳健性。建模过程中,光谱范围的选择对模型的建立至关重要,可避免其它信息对有效光谱信息的干扰,不同建模波段下模型的性能结果(图2)显示,选择8 928.80 ~ 8 776.70 cm-1、6 520.77 ~ 5 134.44 cm-1和8 921.02 ~ 8 411.80 cm-1谱段得到的3种组分的定量分析模型整体性能较好。因此要根据长期积累的经验和对所分析样品化学性质的了解选择合适的谱段建立模型,确保模型的准确性和专属性[15]。
NIRS定量分析模型的建立是一个反复循环优化的复杂过程,需要不断地检查造成模型精度不合格的原因,并反复进行分析和排除,直至验证结果满意。在模型的反复优化过程中,可选择相关系数(R)和均方根误差(RMSE)作为评价指标对模型的效果进行验证和评估[16]。
本研究建立了注射用复方甘草酸苷中3种组分的定量分析模型,结果显示,该3种组分的预测值与测定值之间存在良好的相关性,所建模型稳定、可靠,能有效地对未知样品成分进行含量预测。通过近红外光谱技术不仅可实现注射用复方甘草酸苷冻干粉针剂生产过程的实时监控,还可简化其检验工序,进一步提升检验精确度,保障注射用复方甘草酸苷冻干粉针剂的质量。