丘山*,丘丰源,丘星初
(广州市佳朋金属表面处理科技有限公司,广东 广州 511483)
【综述】
一元线性回归在镀液分析中的应用
丘山*,丘丰源,丘星初
(广州市佳朋金属表面处理科技有限公司,广东 广州511483)
简述了镀液分析中校准曲线的绘制方法。阐述了一元线性回归方程的求法,并以实例说明其计算过程和步骤。介绍了相关系数和剩余标准差的计算公式及其意义。给出了试样分析结果的相对误差的求法和比较方法。说明了回归参数的统计检验方法及其计算公式。给出了确定实际分析中2条回归直线可否合并的具体操作步骤及计算公式。
镀液;分析;一元线性回归;校准曲线;相对误差;统计检验
First-author's address: Guangzhou Good Friends Metal Surface Treatment Technology Co., Ltd., Guangzhou 511483,China
在镀液的分析中,除化学分析方法之外,仪器分析方法也获得了广泛的应用。其中应用较多的当属分子吸收分光光度法(简称比色法)和原子吸收分光光度法(简称原子吸收法),其次是选择性离子电极法和电导法。这4类分析方法都要借助校准曲线来求得试样的分析结果。
校准曲线又称校正曲线,包括了标准曲线和工作曲线。前者用标准系列直接测量,应用于试样基体无干扰的情况;后者则在标准系列中加有与试样浓度相近的基体,或经历了与试样相同的前处理步骤,以消除基体和分析过程带来的误差。
凡应用校准曲线的分析方法都是试样在仪器测得响应值之后,在校准曲线上查得其浓度或含量。因此,校准曲线绘制的准确性就直接影响到试样分析的准确性。那么准确的校准曲线该如何绘制呢?下述几点值得注意:
(1) 图纸的选择。对于比色法、原子吸收法和电导法,应选用直角方格坐标纸;对于选择性离子电极法,应选用半对数坐标纸。这两种图纸在文具商店均有出售。
(2) 坐标的选择。应以仪器的响应值为纵坐标[比色法和原子吸收法的响应值为吸光度,电导法的响应值为电导率κ(单位μS/cm),选择性离子电极法的响应值为电极电位φ(单位m V)],以被测物的浓度或含量为横坐标作图。
(3) 图的尺寸。选用的坐标纸的大小应合适。最小分度不应超过实验数据的精度,标记分度所取有效位数应与原数据相同。即仪器响应值的最小分度应与纵坐标的最小分度格相适应,不可任意放大;浓度或含量的小数分度应与横坐标的最小分度格相宜,其整数值应落在大格的粗线上,以便减小读数时的估计误差。
(4) 精确描点连线。根据由实验得来的数据,找到纵坐标与横坐标的相交点,并用铅笔准确地将交点标记在坐标图上。当线性关系良好时,所有实验点基本上都密集在一条直线(或其邻近位置)上,散点群形成一个直线带。此时可用直尺和铅笔在点群中间划一条直线,使得直线两边的点数差不多相等。这条直线就是校准曲线。
以上是传统的校准曲线作图法,一直沿用至今,说明有其优点:
(1) 校准曲线图较为直观,能及时判别曲线的线性状况和存在的缺陷。
(2) 从图上可以直接查出被测物的浓度或含量而无需计算,因而较为简便。
但它也有3个主要缺点:
(1) 凭视觉和手工绘制的校准曲线精度较差。
(2) 无法估计试样分析结果的误差到底有多大。
(3) 难以判定根据实验点所绘制的校准曲线是否合格。
如何才能克服上述缺点而获得精确的校准曲线呢?下述的回归分析便是答案。
一元线性回归只涉及2个变量,即1个自变量和1个因变量,常分别以x和y来表示。以光度分析为例,溶液中待测成分的浓度或含量决定了溶液的吸光度,故溶液中待测成分的浓度或含量为自变量x,吸光度为因变量y。因此在绘制校准曲线图时,用x轴代表被测物的含量,y轴代表吸光度。2个变量的关系常用一元线性回归方程来表示,即
y=bx+a(1)
式(1)中,a是截距,即回归直线与y轴相交处y轴的坐标值。对吸光度而言,它是一个恒定的误差,即空白溶液显示的吸光度。b是回归直线的斜率,也称回归系数。它表示x每改变一个单位时,y的平均改变值。b的正负表示直线的坡向,即正相关或负相关。当通过实验数据的计算求得截距a和斜率b之后,一元线性回归方程及回归直线就完全确定了。
b的计算如式(2)所示[1]224。
式(2)中,Lxx称为x的离均差平方的加和,简称x差方和,由式(3)求得。
同理,yyL称为y的离均差平方的加和,简称y差方和,由式(4)求得。
式(2)中的Lxy表示x和y各自的离均差乘积的加和,简称离均差乘积和,由式(5)求得。
当求得b后,代入式(6),可得到a。
在上述回归方程的计算中,应注意以下4个问题:
(1) 在计算Lxx、Lyy和Lxy时,不宜选用含和的算式。原因是平均值通常不是有限小数,绝大多数都是按数字修约规则获得的近似值,于是各偏差也是近似值,各偏差先平方再加和会累积舍入误差,使得计算结果受到严重影响。
(2) 在Lxx、Lyy和Lxy的计算过程中,都会涉及到两数相减,常会使数字的有效位数减少很多。因此在运算过程中,不可过早地修约数字,应等到获得b和a的具体数值后,才能进行合理的数字修约。
(3) 斜率b的有效数字位数应与自变量x的有效数字的位数相等,或最多比x多保留一位。而截距a的最后一位数,应与因变量y数值的最后一位数取齐,或最多比y多保留一位。
(4) 回归方程的计算过程中数字多而手续烦,很易出错,最好作验算,方法之一是看式(7)是否成立。
下面举例说明回归方程求法的计算过程和步骤。
【例1】笔者用亚硝基R盐作显色剂测定镀液中的钯含量[2]。所得数据如表1所示,其回归分析计算见表2。
表1 用亚硝基R盐测定钯的标准系列实验数据Table 1 Experimental data of palladium content determ ined with nitroso R salt in a series of standard solutions
表2 回归分析计算表Table 2 Chart for regression analysis
将表2最后一行的数据代入式(3)、(4)和(5),可以分别求得
Lxx=3 025-1052÷6=1 187.5,
Lyy=0.924 27-1.842÷6=0.360 003,
Lxy=52.875-(105× 1.84)÷6=20.675。
于是按式(2)和式(6)可分别求出:
b=20.675÷1187.5=0.017 410 5,
a=1.840÷6-0.0174105×(105÷6)=0.002。
故求得回归方程为y=0.01741x+0.002。
(2) 绘图法,即如前述绘制校准曲线。以例1为例,可选择3个含量点(如 x0、 x17.5和 x40),代入回归方程计算其吸光度,分别得 y0=0.002、y17.5=0.307和y40=0.698。将(0,0.02)、(17.5,0.307)和(40,0.698)这3点标记在图上,然后用直尺连一直线,其中(17.5,0.307)是的坐标值,是回归线必经的一个点。此直线对所有实验点来说是误差最小的回归线。当测得试样的吸光度值之后,便可从图上查出试样的浓度或含量。
应该特别指出的是,现在有很多专业的软件(如M initab、SPSS、Origin、SigmaPlot等)可以根据数据绘制曲线并进行包括线性拟合在内的各种拟合分析,自动给出相关系数误差等数据,输出成不同规格的图纸不成问题。换言之,在计算机软件的辅助下,回归分析异常简单。目前在高等院校受过一定实验训练的人员基本上都会使用上述其中一种软件。
在用上述两法求出试样的浓度或含量时,还必须注意以下几点:
(1) 对于比色法来说,测得的吸光度在0.2 ~ 0.8范围内误差较小,当吸光度为0.434时误差最小[3]327。所以,试样测得的吸光度越靠近0.434,其误差也越小。当试样的吸光度过大时,应减少待测液的取量,而当吸光度低于0.2时,应增加待测液的取量。
按式(7)进行验算,即1.84 = 6 × 0.002 + 0.017 41 × 105 = 1.84,表明回归方程的计算无误。
求回归方程的目的在于用它来获得对试样的准确分析结果,为此可用下述两法之一:
(1) 直接计算法。现在能用于一元线性回归分析的电子计算器型号甚多,均可选购。只须把标准系列的浓度或含量与测得的对应吸光度值成对地输入,即能显示回归系数(斜率)b和截距a的值。通过式(8)的计算,能快捷而精确地得到试样的分析结果。
(2) 对于原子吸收法来说,当浓度高时,校准曲线较易弯曲,其最佳测量范围的吸光度为0.1 ~ 0.6[4]114,试样的吸光度也必须控制在此范围之内。
(3) 回归方程和校准曲线的适用范围仅局限于原来观测的数据范围之内,而不能外推。例如在例 1中,端点的吸光度为 0.700,若试样测得的吸光度为 0.800,将此吸光度值代入回归方程,虽然也可求出试样的浓度或含量,但这种做法是错误的。
相关系数是用来描述变量x与y之间线性关系密切程度的一个重要指标,通常用r表示,由式(9)求得[1]238。
式(9)中分子的绝对值永远不会大于分母的值,因此r的取值范围是
相关系数r也可以按式(10)来计算[3]20。
式(9)和式(10)计算的结果是一致的,故可相互验算。
由相关系数的取值范围可看出:
(1) 当y与x存在完全的线性关系,所有的y值都落在回归线上时,r = 1,实验误差为零。
(2) 若y与x之间完全不存在线性关系,则r = 0。
试问例1建立的回归方程是否合格呢?具体计算如下:
可见2种方法计算的结果基本一致,且r > 0.999 0,表明例1建立的回归方程完全合格。
在分析过程中,由于仪器、操作、试剂、环境条件等都会引入误差,因此通过回归方程计算而得的值也不可能是一个准确值,必然包含一定的误差。回归线的精度可用剩余标准差ES作为衡量的标志。换言之,ES是实验点围绕回归线离散程度的一种量度,其值愈小,回归线的精度就愈高。其计算如式(11)所示,它的单位与 y相同[1] 231。
SE也可按式(12)来计算[6]293。
例如,例1的ES计算如下:
按不同公式计算所得的结果基本一致,表明计算无误。
在光度分析中,测定标准系列溶液对应的吸收值y,目的在于求出一元线性回归方程,当回归方程被确立后,就可应用该方程来计算待测物的含量。这时就需反过来,将实测的吸收值y代入式(8)以求得待测物的含量x。
由于吸收值y是带有误差的测量值,所以由y值求得的x值也不是一个准确值,其误差限xE近似地由剩余标准差ES除以回归系数b求得[7]。
通过回归方程计算得到的待测物含量x及其误差限可表示为
故x的相对误差REx为
例如,在例1某镀液试样测得吸收值后按回归方程式算得含钯量为17.5 μg,那么将例1的相关值代入式(13),可得误差限±Ex=±(0.00320÷0.017 41)=±0.184,则其相对误差REx=±[(0.184÷17.5)×100%]=±1.05%。
根据式(15)可以计算出在线性范围内任何一个分析结果的相对误差,这就为电镀分析工作者自我评价分析质量的优劣提供了定量的科学依据,还能从中得到启示,找出提高分析质量的途径。
从式(15)还可看到,相对误差的大小与x本身的大小有关,x越小,其相对误差就越大;反之,x越大,其相对误差就越小。因此,为了比较同一方法不同时间以及不同方法分析的相对误差的大小,就必须规定一个浓度水平作为比较的标准。笔者选用x作为标准是适宜的,既便于比较也便于计算。上例中的17.5 μg就是标准浓度含量值x。
下面再举一个原子吸收法计算试样相对误差的实例。
【例2】笔者用原子吸收法测定镀镍溶液中的镍含量[8],先后两次的实验数据及其回归分析的结果分别列于表3的I和II两列。现在要问的是:就相对误差而言,I和II何者为优?
表3 用原子吸收法测定镀液中含镍量的实验数据及其回归分析计算结果Tab le 3 Experimental data of nickel content in bath determ ined by atom ic absorption spectroscopy and the result of regression analysis
从表3的最后一行看到,II的相对误差(±2.38%)小于I的相对误差(±2.68%),即II优于I。例1和表3的计算数据表明:只有使 r尽可能地接近1,且通过细心的操作使ES达到最小值,才能大大降低相对误差,提高分析的准确度。
通过实验求出的回归方程和绘制的校准曲线因直接影响到试样分析结果的准确与否,故须进行3项检验。
5. 1 线性检验
即检验校准曲线的精密度。检验的方法为计算出相关系数,当r≥0.999 0时判断为合格,否则应找出原因并加以纠正,重新绘制合格的校准曲线。
5. 2 截距检验
即检验校准曲线的准确度。即在线性检验合格的基础上,判定截距a是否为零或与某一定值0a相等。判定的方法是对a作t检验[3]63,其步骤为:
第一步──按式(16)计算出t值[6]295。
第二步──给出置信度(通常以95%的置信度为检验标准,即显著性水准为5%)和自由度f = n - 2。
第三步──查t值表[3]61,若算出的t >ta,f,则认为a与 a0存在显著差异,t <ta,f就判定a与a0无显著差异。
【例3】试问例1中截距0.002与0是否有显著差异?
t的自由度f = 6 - 2 = 4。
查t值表[3]61, t0.05,4= 2.78。因t <t0.05,4,表明截距0.002与0无显著差异,故0.002可作0来处理,回归方程可简化为y = bx,可按来计算试样的分析结果。
【例4】试问表3中I的截距0.028与0是否有显著差异?
t的自由度f = 5 - 2 = 3。
查t值表[3]61, t0.05,3= 3.18。因t >t0.05,3,表明截距0.028与0有显著差异,故0.028不可作为0来处理,因此回归方程不可简化,而应以来计算试样的分析结果。
【例5】将表3中校准曲线I的截距 a1= 0.028视为一定值,试问它是否与校准曲线II的截距 a2= 0.029相等?或者说在置信度95%之下,两者有无显著差异?
将表 3中校准曲线 II的有关数值代入式(16)中可得t=0.140。
t的自由度f = 5 - 2 = 3。
查t值表[3]61, t0.05,3= 3.18。而t <t0.05,3,表明I和II两条校准曲线的截距在置信度95%下无显著差异。
5. 3 斜率检验
即检验方法的灵敏度。校准曲线的斜率常因环境温度、试剂批号和贮存时间而改变。文献[5]指出:“在完全相同的分析条件下,仅由于操作中的随机误差所导致的斜率变化不应超出一定的允许范围,此范围因分析方法的精度不同而异。例如,一般而言,分子吸收分光光度法要求其相对差值小于5%,而原子吸收分光光度法则要求其相对差值小于10%等等。”
在统计上,为判断斜率b是否与某一定值 b0相等,可应用t检验法。
【例6】已知表3中的校准曲线I的斜率 b0为0.009 66。试问与校准曲线II的斜率0.009 52两者是否存在显著差异?
先计算统计量t[6]295:
t的自由度f = 5 - 2 = 3。
查t值表[3]61, t0.05,3= 3.18。因t < t0.05,3,故在置信度95%下,斜率0.009 52与已知值0.009 66不存在显著差异。
式(17)的一个重要应用是检验火焰原子吸收法的基体干扰和背景效应。当b =b0时,则试样不存在基体干扰或背景效应,可用标准曲线法测量。当b≠b0时,说明基体有正干扰或负干扰,应采取标准加入法进行定量[4]110。
在电镀分析的实际工作中,常常需要检验 2条校准曲线有无明显的差异。例如不同人或同一人在不同时间所作的2条校准曲线有无明显差别。如果没有显著差异,两条校准曲线可否合并成一条?
下面通过表3中I和II两条校准曲线的比较来说明相关的计算公式和计算步骤[1]259。
6. 1 用F检验法检验剩余方差(即剩余标准差的平方)有无显著差异
如果剩余方差没有显著差异,可以合并成一个共同的剩余方差。
将表3中的数值(方差较大者为分子,较小者为分母)代入式(18):
则F=0.007 7722÷0.006 8022=1.31。
大方差数据的自由度 f1= n - 2 = 5 - 2 = 3,小方差数据的自由度 f2= n - 2 = 5 - 2 = 3。
查F值表(置信度95%)[3]64,F= 9.28 > 1.31,表明S2与S2没有显著差异,可以把它们合并起来作为共同
3,3E1E2
剩余方差,并可按式(19)计算出共同的剩余标准差SC。
代入得SC==0.007303。
6. 2 用t检验法检验斜率 b1和 b2有无显著差异
如两斜率无显著差异,可将它们联合起来,计算一个共同的b。如有显著差异,说明因变量与自变量的关系在这两种不同情况下已有显著的不同,应该分别采用不同的公式表示,不能用一个统一的回归方程去硬套。
先计算统计量t及自由度f=f1+f2。
将表 3中 I和 II的有关数值代入式(20),可得t=0.429。而f = 3 + 3 = 6。
查t值表[3]61, t0.05,6= 2.45。因t <t0.05,6,故I和II两条校准曲线的回归系数在置信度95%时无显著差异,因而可按式(21)合并计算b。
将表3中的有关数值代入式(21)可得b=(0.00966× 1 000+0.00952× 1 000)÷(1 000+1 000)=0.00959。
6. 3 用t检验法检验 a1和a2有无显著差异
统计量t的计算公式为:
t的自由度f=f1+f2= 3 + 3 = 6。
查t值表[3]61, t0.05,6= 2.45 > 0.092 3,故表3中两条校准曲线I和II的截距在置信度95%时无显著差异,可按式(23)合并成共同的a。
将数值代入式(1),可得合并后的回归方程:y = 0.009 59x + 0.028 5。
该方程的回归参数经计算一并列于表3的最后一列中,与校准曲线I和II比较,合并后的校准曲线III的剩余标准差、误差限和相对误差均有降低,表明合并后的校准曲线的可靠性和稳定性显著优于不合并的两条校准曲线。
由于历史的传承和发展,校准曲线一直沿用至今。然而,准确的校准曲线只有求得回归方程之后才能获得。当今教科书[3]和国家编制的分析方法[5]中所述的校准曲线,实际上所指的都是一元线性回归直线。换言之,校准曲线如今是一元线性回归直线的代名词。随着科学技术的进步,具有一元线性回归功能的小型电子计算器的普及和计算机软件的应用,使复杂而繁琐的回归分析计算已不是一件难事。因此,它的应用必将得到迅速的发展。
一元线性回归的应用是多方面的。除建立校准曲线之外,进行同一试样不同分析项目数据间的相关分析,不同仪器测定同一试样所得结果的相关分析,不同时期物质浓度的相关分析,以及不同测定方法所得分析结果的相关分析等,都离不开它。
值得一提的是一元线性回归的其他妙用。有些镀液仅含有2种主成分,其余成分可视为常数。因此可把2种主成分的含量视为自变量,而把镀液单位体积的质量视为因变量,于是通过实验可建立一元线性回归方程。只要测出其中一种易测成分,另一种难测成分便可计算出来,而不必去直接测定它。这个方法在焦磷酸盐镀铜液的分析中获得了成功的应用[9-10]。类似的方法在广泛应用的酸性镀铜液的分析中同样获得了实际应用[11]。对于常用的普通镀铬溶液,只要一次称量和一次吸光度的测定,便可获得总铬、铬酸酐和三价铬3个项目的分析结果[12]。这类方法的特点是简便快捷,且具有良好的经济效益、社会效益和环境效益,故受电镀分析工作者的青睐。
综观上述,对于电镀分析工作者来说,一元线性回归确确实实是一件精良的锐利武器,努力学习它、熟悉它、掌握它、精通它、应用它,也确确实实能获益良多,一点不假!
[1] 郑用熙. 分析化学中的数理统计方法[M]. 北京: 科学出版社, 1986.
[2] 丘山, 丘星初, 黄曙明. 亚硝基R盐光度法测定钯钴镀液中的钯[J]. 中国电镀材料信息, 2003, 3 (4): 54-55.
[3] 武汉大学. 分析化学(上册)[M]. 5版. 北京: 高等教育出版社, 2006.
[4] 齐文启. 环境监测实用技术[M]. 北京: 中国环境科学出版社, 2006.
[5] 国家环境保护总局《水和废水监测分析方法》编委会. 水和废水监测分析方法[M]. 4版. 北京: 中国环境科学出版社, 2002: 30-31.
[6] 中国环境监测总站. 环境水质监测质量保证手册[M]. 2版. 北京: 化学工业出版社, 1994.
[7] 鲁如坤. 土壤农业化学分析方法[M]. 北京: 中国农业科学出版社, 1999: 616.
[8] 丘山, 郑宗耀, 丘星初, 等. 火焰原子吸收光谱法测定镀镍溶液中的镍[J]. 电镀与涂饰, 2014, 33 (19): 842-844.
[9] 丘星初, 何伟明, 邓千敏, 等. 快速测定焦磷酸铜镀液中焦磷酸钾[J]. 电镀与环保, 2000, 20 (3): 35-36.
[10] 丘山, 丘圣, 梁细妹, 等. 镀铜液中焦磷酸铜和焦磷酸钾的快速分析[J]. 涂装与电镀, 2009 (3): 22-24.
[11] 丘山, 丘星初, 邓千敏, 等. 酸性镀铜液中硫酸铜含量的快速分析[J]. 材料保护, 2001, 34 (11): 37-38.
[12] 丘山, 丘圣, 丘星初, 等. 简便快捷地测定普通镀铬溶液中铬(IV)和铬(III)的方法[J]. 电镀与涂饰, 2014, 33 (13): 569-572.
[ 编辑:温靖邦 ]
Application of simple linear regression to analysis of plating bath
QIU Shan*, QIU Feng-yuan, QIU Xing-chu
The method for draw ing a calibration curve for analysis of plating bath was described. The solution of simple linear regression equation as well as the related calculation and procedure were presented. The calculation of correlation coefficient and residual standard deviation and their meanings were introduced. The methods for calculating relative error of analysis result and for comparison between relative errors were given. The statistical tests of regression parameters and their related calculation equations were explained. The operation procedures and related calculation equations for determining whether two regression lines can be merged or not were provided.
plating bath; analysis; simple linear regression; calibration curve; relative error; statistical test
O651; TQ153
B
1004 - 227X (2016) 12 - 0643 - 08
2016-01-13
2016-04-24
丘山(1973-),男,江西于都人,大专学历,长期从事分析化学和表面处理技术工作,发表研究论文百余篇。
作者联系方式:(E-mail) qiushan0708@163.com。