夏 雨
首都医科大学附属北京友谊医院药剂科,北京 100050
美国材料检测协会(ASTM)将780~2526 nm的光谱区定义为近红外光谱区[1],该谱区主要是含氢基团(C-H,N-H,O-H)的倍频与合频的吸收,借助化学计量学及计算机技术可有效地利用近红外光谱信息,反映被测物质的性质,可用于药品原辅料及制剂的非破坏性定性定量分析以及假劣药品的检测[2~4]。《中国药典》2005年版已收载有近红外光谱法[5]。
维生素C是人体需要量最大的一种水溶性维生素,市场上销售的维生素C片包括口服片、含片、咀嚼片、泡腾片等多种片型,且药品规格多样。《中国药典》2010年版采用碘滴定法测定维生素C片中的含量[6],预处理麻烦,分析耗时长。本文以不同厂家生产的维生素C片为分析对象,采用近红外光谱法(near infrared diffuse reflectance spectroscopy,NIR)与偏最小二乘法(partial least square,PLS)结合,对建立维生素C片定量分析模型的可行性进行探讨,为今后类似样品快速检测提供参考。
美国Thermo Fisher AntarisⅡ 型傅里叶变换近红外光谱仪,配有积分球漫反射采样系统,Result操作软件,TQ Analyst 8.0光谱分析软件,瑞士Mettler AL-204型电子分析天平。
维生素C片分别来自南京白敬宇制药有限责任公司、青岛海尔药业有限公司、海南养生堂药业有限公司、北京双鹤药业股份有限公司、郑州维他卡姆维生素有限公司、江苏江山制药有限公司、拜耳医药保健品有限公司、德国史达德大药厂及美国百时美施贵宝公司等9个厂家共60批次样品。
取每个批次的维生素C片5片,精密称定总重量,求得平均重量后,再按照说明书标示规格求得每批次维生素C含量(g/g),其中最大为66.67%,最小为0.83%。
将维生素C片嵌入可调节样品槽内,以空气为参比扣除背景,利用积分球漫反射采样系统及Result操作软件采集光谱图。采集光谱区间:10000~4000 cm-1;扫描次数:32次;分辨率:8 cm-1;温度:(25±2)℃;相对湿度:45%~50%。每批样品取2片,每片正、反面各重复测量3次,取平均值。将60个批次的120张光谱一并纳入后续的模型。维生素C片近红外原始光谱图见图1。
图1 120张维生素C片的近红外原始光谱
将120份样品随机划分为两组,其中110个为校正集(calibration),10 个为验证集(validation),要求校正集样品浓度囊括所有验证集样本浓度。校正集用于建立定量分析模型,验证集用于检验所建模型的性能。将校正集样品的近红外光谱与其说明书标示的维生素C含量(g/g)相关联输入TQ Analyst 8.0光谱分析软件中,结合PLS建立维生素C片的含量测定校正模型。
近红外光谱信号含有随机噪音、基线漂移、信号本底、样品不均匀、光散射等干扰,对模型的预测准确度和稳定性会有很大的影响。因此,利用TQ Analyst 8.0光谱分析软件内嵌的多元散射校正(multiplication scattering correction,MSC)、一阶导数(first derivative,FD)、二阶导数(second derivation,SD)对原始光谱进行预处理,提取近红外光谱的特征信息。多元散射校正可以去除红外漫反射光谱中样品的镜面反射及不均匀性造成的噪声,消除漫反射光谱的基线及光谱的不重复性;一阶导数、二阶导数可以有效地消除样品由于颜色差别引起的基线漂移,强化谱带特征,克服谱带重叠。不同厂家3种含量维生素C片的原始光谱、一阶导数光谱、二阶导数光谱见图2。
多元校正方法要求适当设计校正集与验证集样品,以求达到较好的预测结果。110个校正集和10个验证集样品的原始光谱数据在第1个主成分和第2个主成分上的得分分布见图3。图3示验证集样品较均匀的分布于校正集样品之中。
PLS利用主成分分析将吸光度矩阵和浓度矩阵先分别分解为特征向量和载荷向量,用交叉验证法(cross validation)确定最佳主成分数,然后建立吸光度矩阵与浓度矩阵的数学模型,是目前应用较多的一种多元校正方法。本研究采用偏最小二乘法建模,模型评价指标采用相关系数(correlation coefficient,r),校正均方根误差(root mean standard error of calibration,RMSEC),计算公式同参考文献[1]。在优化模型时,对同一样品集的同一组分,r越接近1,RMSEC越小,则PLS算法所提取的光谱信息与分析组分的相关性越好,所建模型的预测能力和稳定性越高。TQ Analyst 8.0光谱分析软件内嵌有谱区范围计算插件,本研究通过比较软件包建议的谱区范围与自选的谱区范围及全谱区范围,选取较优结果(表1)。可知优化后的预处理方法主要集中于二阶导数,模型的光谱范围在 10000~4000 cm-1,此时 r为 0.9969,RMSEC 为 1.30。
图2 3种维生素C片的近红外光谱
图3 两种主成分的得分
采用PLS法建立校正模型,主成分数的选择直接关系到模型的实际预测能力。在计算的多个主成分中,第一主成分最重要,随着主成分数的增加,重要程度降低,一直到后来的许多主成分反映的是噪音信息。如果建立模型时使用的主成分数过少,就不能反映未知样品被测组分产生的量测数据(如光谱)变化,其模型预测准确度就会降低,这种情况称之为不充分拟合(underfit)。如果使用过多的主成分建立模型,就会将一些代表噪音的主成分加到模型中,使模型的预测能力下降,这种情况称之为过度拟合(overfit)。因此,合理确定参加建立模型的主成分数是充分利用光谱信息和滤除噪音的有效办法之一。
表1 维生素C片的校正模型
本研究通过交叉验证法对所建二阶导数模型进行验证,以预测残差平方和(prediction residual error sum of square,PRESS)和交叉验证均方根误差(root mean square error of cross validation,RMSECV)作为评价标准,选择最佳主成分数,当PRESS和RMSECV的值最小时,所选的主成分数最佳。
将二阶导数光谱数据所建模型的主成分数、PRESS和RMSECV作图,如图4所示,当主成分数为8时,PRESS和RMSECV均为最小,此主成分数即为最佳主成分数。
用建立的最佳校正模型对验证集中样品的维生素C含量进行验证,预测均方根误差(root mean standard error of prediction,RMSEP)为 0.656,验证集结果见表 2。
图4 主成分数对PRESS和RMSECV的影响
表2 验证集中维生素C含量的验证结果(%)
外界环境如温度、湿度等对光谱的重现性都会有影响,因此,在采集样品的近红外光谱时,要尽量保证在相同的环境下进行,以增强各光谱间的可比性。
光谱预处理方法不同,所建模型预测效果存在较大差异。由于市售维生素C片表面多比较粗糙且颗粒度较大,所以通过多元散射校正(MSC)预处理对维生素C片建模效果影响并不明显。但是,常见的维生素C片多添加色素改善外观,市售维生素C片颜色多不相同,由于一阶导数、二阶导数可以有效的消除样品由于颜色差别引起的基线漂移等干扰信息,同时放大了样品本身的特征信号,所以通过一阶导数、二阶导数对光谱进行预处理后所得的预测模型较原始光谱的预测模型准确度大为提高。由实验结果可知无论是校正集还是验证集,二阶导数预处理光谱的应用能获得更好的预测结果。
虽然TQ Analyst 8.0光谱分析软件本身内嵌有谱区范围计算插件,但是由于不同厂家生产的维生素C片成分组成、粒径差异及混合均匀程度相差较大,软件推荐的谱区范围并不能完全代表光谱的有效信息,而在10000~4000 cm-1全谱段内所包含的维生素C片含量信息量最大,受背景干扰最小,所建立的模型预测效果最佳。
本实验直接对市售维生素C片进行光谱扫描,并与药品标示浓度关联建立预测模型,具有通用性。虽然外部验证结果中若干批次药品含量的相对偏差较大,这主要是由于存在不同生产工艺、片剂类型品种(口服片、含片、咀嚼片或泡腾片)、原(辅)料来源或级别、保存条件、批次等影响,药品真实含量与标示含量会存在一定的误差。随着样本量的不断增加,模型的准确性和适应性将进一步增加。
总之,偏最小二乘法法同近红外漫反射光谱结合,对市售不同厂家的维生素C片进行无损非破坏性定量分析是可行的,且具有无需预处理,快速、简便等优点,可作为药物定量分析的常规方法之一,既可用于产品质量控制,也可用于药品快速检验。
[1]陆婉珍,袁洪福,徐广通.现代近红外光谱技术[M].2版.北京:中国石化出版社,2007:1.
[2]Olsen BA,Borer MW,Perry FM,et al.Screening for counterfeit drugs using near-infrared spectroscopy[J].Pharm Technol,2002,6:62-71.
[3]Rodionova OY,Houmoller LP,Pomerantsev AL,et al.NIR spectrometry for counterfeit drug detection[J].Anal Chim Acta,2005,549:151-158.
[4]刘绪平,冯艳春,胡昌勤,等.头孢拉定胶囊剂近红外通用性定量分析模型的建立[J].药物分析杂志,2008,28(5):722-726.
[5]国家药典委员会.中国药典[S].二部.北京:化学工业出版社,2005:附录23-25.
[6]国家药典委员会.中国药典[S].二部.北京:中国医药科技出版社,2010:902.