刘福强,任瑞雪,周慧琴,费强,任瑞冰,王彬,任玉林
(1.解放军208医院药剂科,长春 130036;2.吉林大学化学学院,长春 130023)
近红外光谱分析具有不破坏样品,样品可多次利用,并可对样品实现在线质量检测和成分分析等优点,是快速分析技术之一,目前广泛应用于各个领域[1,2]。化学计量学方法可提取复杂或谱峰重叠的光谱信息,其中偏最小二乘法(PLS)是最普遍使用的定量分析方法,该方法可有效地除去噪声,解决光谱共线问题,有效地提取光谱信息[3]。
本文研究了近红外漫反射光谱同偏最小二乘法(PLS)相结合定量分析甲氧苄啶粉末药品。使用了三种不同的光谱预处理方法:标准归一化(SNV)、一阶导数和二阶导数对样本的原始光谱进行预处理,讨论了主成分数对预测样品中甲氧苄啶含量的影响,建立了最佳的PLS数学校正模型,分别预测了校正集和预测集中甲氧苄啶的含量,并对所得结果做了比较。
岛津UV-3100型紫外可见近红外分光光度计及附件积分球。微机通过接口同分光光度计连接,自动传输、采集光谱数据。所用药品均符合中国药典(2000版)规定。
甲氧苄啶粉末药品由甲氧苄啶和淀粉等组成。共配制甲氧苄啶粉末药品100个,甲氧苄啶的含量在中华人民共和国药典规定值的±10%之间。所有药品被随机分成两组,一组为校正集(The calibration set, 73个),另一组为预测集(The prediction set, 27个)。甲氧苄啶含量按照中国药典(2000版)的含量测定方法测定,计算出每批次中甲氧苄啶的含量[4]。
将甲氧苄啶粉末药品装于积分球样品槽中,压实,压平,测定光谱图。光谱带宽1nm,波长扫描范围1100~2500nm。每个样品扫描4次,取平均值。
由于仪器、样品背景和其他因素的影响,近红外光谱分析中经常出现谱图的偏移或漂移现象,如果不加处理,会直接影响建立模型的质量和未知样品预测结果的准确性。因此,对光谱的预处理是十分必要的,常用的光谱预处理方法为导数处理。
偏最小二乘法利用主成分分析将吸光度矩阵和浓度矩阵先分别分解为特征向量和载荷向量,然后用偏最小二乘法在这些稳变量之间建立相互关系,从而得到吸光度矩阵与浓度矩阵之间的数学校正模型。用交互校验法确定最佳主成分数。所用PLS软件为TQ Aanlyst 6.1.1软件包(美国Thermo Nicolet公司),其它辅助软件自行编制。
评价定量分析结果的误差采用均方根误差(root mean square error, RMSE)[5]:
式中,CNIRi为PLS预报浓度值;CREFi为依据药典标准测得的参考浓度值;n—样本数。
甲氧苄啶粉末药品由活性成分甲氧苄啶和辅料淀粉等组成,由于组成成分复杂,因此NIR光谱重叠非常严重,用经典的光谱分析方法难以定量分析,必须用化学计量学方法才能对其进行准确分析。图1为甲氧苄啶粉末的近红外漫反射SNV光谱、一阶导数光谱和二阶导数光谱。
73个校正集和27个预测集样品的原始光谱数据在第一主成分和第二主成分上的得分分布见图2。由图2可以看出预测集样品较均匀地分布于校正集样品之中,导数光谱的得分图与原始光谱的得分图相似,图略。
使用PLS方法建立校正模型,其中最困难的问题就是如何确定建立模型所使用的主成分数。如果建立模型时使用的主成分数过少,就不能反映未知样品被测组分产生的量测数据(如光谱)变化,其模型预测准确度就会降低,这种情况称之为不充分拟合(Underfit)。如果使用过多的主成分建立模型,就会将一些代表噪音的主成分加到模型中,使模型的预测能力下降,这种情况称之为过度拟合(Overfit)。因此,合理确定参加建立模型的主成分数是充分利用光谱信息和滤除噪音的有效方法之一。
要找到恰当的主成分数来保证既能避免不充分拟合,又能避免过度拟合情况的出现。最常见的方法是采用预测残差平方和[6](Prediction Residual Error Sum of Square,缩写为PRESS)作为评价标准。即使用一定数目的主成分建立一个模型,然后用这个模型对参加建模的每个样品进行预测,求出每个样品的预测值和已知参考值的差。PRESS的数学表达式为:
式中,n为校正集中样品的数目;d为建立模型使用的主成分数目;rp,ij为预报浓度值;rij为依据药典标准测得的参考浓度值。
PRESS值最小,说明建模的预测能力最好。本文分别讨论了校正集样本的两种有效成分在不同主成分数时对PRESS值的影响。图3表明了不同主成分数对PRESS值的影响。从图中PRESS最小可以看出,基于SNV、一阶导数及二阶导数光谱数据所建立的PLS模型的最佳主成分数分别为4、2和5,而且基于一阶导数光谱数据建立的PLS模型具有最小的PRESS值。
数学校正模型建立后,分别预报校正集和预测集样本的浓度,所得到的预测含量值和参考值对应关系的有关参数列于表l。从表1中可以看出,在三种预处理光谱中,以一阶导数处理光谱的线性相关系数R和误差为最小,说明使用一阶导数预处理原始光谱可以得到更加令人满意的结果。
PLS法同近红外漫反射光谱法结合,无损定量分析甲氧苄啶粉末药品是可行的,同常规测定方法相比,速度快而简便。一阶导数预处理光谱的应用可一定程度地降低误差,从而获得更好的预测结果。
[1]李先保,李兴民等,乳酸菌发酵剂在肉制品中的应用,肉类研究,1997,1:19.
[2]Jerome J W Jr. Applied Spectroscopy Review,1996,31:251.
[3]朱尔一,杨芃原,化学计量学技术及应用,北京:科学出版社,2001:11.
[4]中华人民共和国卫生部药典委员会编.中国药典(二)部[M].北京:化学工业出版社,2000: 148-149.
[5]杨辉华,覃锋,王义明,罗国安.NIR光谱的Isomap-PLS非线性建模方法.光谱学与光谱分析.2009.29(2):322-326.
[6]陆婉珍,袁洪福,徐广通.现代近红外光谱分析技术.北京:中国石化出版社,2000.