杨玉凤
(昆明滇池水务环境监测有限公司,云南 昆明 650200)
在环境监测的仪器分析中,绝大多数分析方法都是相对测量方法,需要进行校准,建立分析信号与分析物量值之间的相关关系,即建立校准曲线。因此,正确建立和应用校准曲线是仪器分析获得准确定量分析结果的前提条件[1]。化验检测人员日常工作中使用的校准曲线是以回归分析为理论依据,通过最小二乘法拟合而成,其中最小二乘法分为普通最小二乘法(ordinary least square,OLS)[2]和加权最小二乘法(weighted least square,WLS)[3]。应用普通最小二乘法应满足同方差假设,指的是校准曲线的随机干扰项的方差全部等于一个有限的常数,而异方差则是校准曲线中随机干扰项的方差不再是某一常数,而是随着测定点的变化而变化。当校准曲线存在异方差时,参数估计和假设检验一般都会出现偏离,为避免异方差这种不良影响,人们在对存在异方差问题的模型进行参数估计时引入了加权最小二乘法,这种参数估计方法是解决线性回归模型异方差问题的有效途径[4]。
在涉及分析化学的食品检验、环境检验、农产品检验等领域,应用加权回归方法拟合校准曲线是比较少的[5]。本文应用水质氨氮、水质总磷一年测定过程中分别累计的6条校准曲线数据,首先进行异方差检验,随后应用加权最小二乘法进行曲线拟合,最后对加权最小二乘法拟合曲线与平时工作过程中用普通最小二乘法拟合曲线进行对比。
DR2800可见分光光度计(美国哈希公司),用于氨氮测定;
TU1810PC紫外可见分光光度计(北京普析通用仪器有限公司),用于总磷测定;
氨氮标准溶液(102227#):证书号GSB 05-1145-2000,500 mg/L,相对扩展不确定度 1%,k=2,环境保护部标准样品研究所;
磷酸盐磷溶液(102817#):证书号GSB 07-1270-2000,500 mg/L,相对扩展不确定度 1℅,k=2,环境保护部标准样品研究所。
氨氮的检测方法依据为 HJ 535—2009《水质 氨氮的测定 纳氏试剂分光光度法》[6];
总磷的检测方法依据为 GB/T11893-1989《水质 总磷的测定 钼酸铵分光光度法》[7]。
氨氮、总磷两项目在一年内分别收集的6 条校准曲线各质量浓度点测得吸光度数据,结果见表1,表2。
表1 氨氮各质量浓度点测得吸光度原始数据
表2 总磷各质量浓度点测得吸光度原始数据
在数理统计学中通常认为大样本容量应大于 30[8],当样本容量为30时,样本均值的抽样分布形状基本上没有差别,形成正态分布[9],本文中氨氮校准曲线的测定有 8 个标准质量浓度点,一年累积6 条校准曲线的数据为48个,总磷校准曲线的测定有 7个标准质量浓度点,一年累积6 条校准曲线的数据为42个。为保证各测定数据的独立性,选取的数据来自于一年内不同人员在不同时期于同一仪器上所测得结果,满足校准曲线异方差检验要求。以各浓度点xi为x轴,各质量浓度点处测得吸光度的标准差si为y轴作图,见图1,图2。
图1 氨氮校准曲线各质量浓度点与测得吸光度标准差关系
图2 总磷校准曲线各质量浓度点与测得吸光度标准差关系
图1,图2表明,随着各质量浓度点质量浓度的增加,各质量浓度点处测得吸光度的标准差变大,存在异方差现象。
加权最小二乘法和普通最小二乘法都是通过对校准曲线残差平方求和后,再求此残差平方和的最小值,不同之处是在残差平方求和过程中,加权最小二乘法考虑到了异方差的影响,对残差平方进行加权求和。因为存在异方差情形时,不同质量浓度点对校准曲线的影响作用是不同的,为消除这种不同,在残差平方求和过程中对不同质量浓度点所形成的残差的平方赋予不同的权重,权重通常选择对应质量浓度点所形成的随机干扰项方差的倒数[4]。
依据文献[2],加权最小二乘法回归方程y=a+bx中截距a、斜率b的计算公式分别为式(1)~式(4),权重计算公式为式(5)。表3、表4为加权最小二乘法回归计算具体过程数据。
表3 氨氮曲线加权回归计算
表4 总磷曲线加权回归计算
(1)
(2)
(3)
(4)
(5)
表5 氨氮项目不同方法拟合曲线|δ|计算过程
表6 总磷项目不同方法拟合曲线|δ|计算过程
表7 氨氮项目OLS拟合曲线|δ|值及统计计算
表8 氨氮项目WLS拟合曲线|δ|值及统计计算
表9 总磷项目OLS拟合曲线|δ|值及统计计算
表10 总磷项目WLS拟合曲线|δ|值及统计计算
图3 氨氮项目WLS曲线 与OLS曲线走势图
图4 氨氮项目WLS曲线与OLS曲线|δ|在不同区间出现频次
图5 总磷项目WLS曲线 与OLS曲线走势图
图6 总磷项目WLS曲线与OLS曲线|δ|在不同区间出现频次
1)OLS是以离差平方和最小为原则进行曲线拟合,如图1、图2存在异方差的情况下,平方和中每一项的地位是不相同的,高质量浓度处误差项方差大,其在平方和中的作用就大,低质量浓度处误差项方差小,其在平方和中的作用就小,因而 OLS 估计的回归直线就被拉向方差大的高质量浓度项,而小方差项的低质量浓度项拟合程度就差。WLS 的思路为在平方和中加入一个适当的权重项wi,以调整各项在平方和中的作用,表3、表4中wi项正好体现了这点。
2)根据表1、表2中的数据绘制图7、图8。由图7、图8可以看出两项目在低质量浓度点的相对标准偏差(RSD)均大于高质量浓度点的RSD。按照WLS拟合思路,如果在方差小的低质量浓度点加上较高权重(表3、表4),有可能同时将低质量浓度处较高的不确定度引入拟合曲线。
图7 氨氮校准曲线各质量浓度点与测得吸光度RSD关系
图8 总磷校准曲线各质量浓度点与测得吸光度RSD关系
3)有学者从WLS的实施过程方面分析,指出WLS改变了原始的样本数据和模型的设定形式;从WLS估计量的方差与OLS估计量的方差不相同方面分析,发现WLS可能导致模型参数显著性检验结果的变化;从异方差问题是一个总体问题而非样本问题方面分析,指出根据样本数据发现的所谓的异方差问题来认定总体存在异方差是有风险的[4]。
校准曲线作为将分析信号转换为分析物量值的媒介,其拟合的优劣直接影响到分析物量值的准确度,我们之所以要对存在异方差问题的校准曲线进行加权最小二乘拟合,是为了得到拟合度更优的曲线,从而使计算结果更接近准确数值,从本文以上对比结果来看,针对本实验室水质氨氮、水质总磷两项目,即使校准曲线存在异方差,其OLS估计的参数(截距、斜率)也可能是最佳线性无偏参数。校准曲线满足同方差假定,可以保障OLS估计的参数是最佳线性无偏参数;但如果OLS估计的参数是最佳线性无偏参数,校准曲线未必满足同方差假定。
本文仅是针对分光光度法中水质氨氮、水质总磷两项目进行了WLS曲线和OLS曲线的探讨,校准曲线在化学分析领域应用较广,有可能在其他项目中WLS曲线和OLS曲线的表现又有不同之处,所以还有很多需要探讨和交流的方面。