实验室间比对是通过实验室间测试结果比对评价实验室进行某种特定检测或测量的能力,是一种较好对实验室持续检测能力监控手段[1]。但在对各实验室测试结果评价时,一般应对各实验室测试结果进行判断是否为离群值,若是离群,应剔除后再对剩下的实验室测试结果进行评价。目前,检验实验室间比对活动中测试结果是否离群的方法多种多样,对于不同的测试项目及不同的数据类型应选择一个恰当的方法进行检验。
本文以某次纺织品化学项目检测实验室间比对测试结果为例,介绍曼德尔(Mandel)h/k统计量检验[2]、柯克伦(Cochran)检验[2]、格拉布斯(Grubbs)检验[2]和迪克逊(Dixon)检验[3]在实验室间比对检验离群实验室中的应用。探讨4种检验离群值方法的特点,以期给实验室间比对活动中检验离群实验室提供借鉴。
一般纺织品化学项目检测均会对同一样品进行多次测试,结合具体要求,最终出具测试结果。
本文选择的是某次纺织品化学项目检测实验室间比对,共38家实验室参加比对,各实验室均按要求对同一样品进行了两次测试,测试结果汇总见表1。
针对此次纺织品化学项目检测实验室间比对测试结果,分别用曼德尔h/k统计量检验、柯克伦检验、格拉布斯检验和迪克逊检验进行统计分析。其中,曼德尔h统计量检验、格拉布斯检验和迪克逊检验是对实验室间测试结果的准确度[7]进行检验,而曼德尔k统计量检验和柯克伦检验是对实验室内测试结果的精密度[4]进行检验。
据一些研究表明[5-7],采用曼德尔h/k统计量检验既可以检验实验室间的测试结果准确度,又可以检验实验室内的测试结果精密度,相比其他检验方法更显得直观。
2.1.1 曼德尔h统计量
曼德尔h统计量是实验室间测试结果的准确度,确定是否有实验室的测试数据离群。某个实验室的h值越大,表明其测试结果准确度越低。
假设有p家实验室(i)参加比对,各实验室测试结果为各实验室的h值计算,见公式(1)。
hcrit,α是衡量某个实验室测试结果准确度的检验临界值,由公式(2)[8]计算可得,当h值小于等于5%的临界值时,认为该值为可信值;当h值大于5%的临界值且小于等于1%的临界值时,认为该值为歧离值;当h值大于1%的临界值时,认为该值为离群值。
其中,t值可通过t分布表获得,也可由Excel函数“=TINV(α,v)”获得,t的自由度v=p-2,α为检验水平。
2.1.2 曼德尔k统计量
曼德尔k统计量是检验室内测试结果的精密度,是对各实验室测试结果进行离散性统计分析。某个实验室的k值越大,表明其实验室测试结果精密度越低。
假设有p家实验室(i)参加比对,n是单个实验室内重复测试次数[x1i,x2i,…,x(n-1)i,xni],各实验室的k值计算,见公式(3)。
其中,Si为各个实验室内测试结果标准偏差。
表1 38家实验室测试结果汇总
kcrit,α是衡量某个实验室内测试结果精密度的检验临界值,由公式(4)[8]计算可得,当k值小于等于5%的临界值时,认为该值可信值;当k值大于5%的临界值且小于等于1%的临界值时,认为该值为歧离值;当k值大于1%的临界值时,认为该值为离群值。
其中,F值可通过F-F分布表获得,也可由Excel函数“=FINV(α,v1,v2)”获得,F值的自由度v1=n-1,v2=(p-1)(n-1),为检验水平。
由以上公式,对各实验室测试结果进行首次检验,其分布直方图如图1所示。
图1 各实验室测试结果曼德尔h/k统计量首次检验
从图1中可看出,曼德尔h统计量检验,Lab12为离群值实验室,Lab24和Lab32为歧离值实验室;曼德尔k统计量检验,Lab02与Lab35为离群值实验室。
经过曼德尔h/k统计量检验多次剔除,最终剔除实验室结果见表2。
表2 曼德尔h/k统计量检验结果
该检验是对各实验室内测试结果标准差中的最大值进行检验,属于单侧检验。假设有p家实验室(i)参加比对,各实验室内测试结果标准偏差为,S1,S2,…,Si,…,Sp-1,Sp,各实验室的C值计算,见公式(5)。
Ccrit,α是衡量某个实验室内测试结果精密度的检验临界值,通过与同一显著性水平下的临界值比对,判定最大标准偏差是否为离群值。由公式(6)[8]计算可得,当Cmax值小于等于5%的临界值时,认为该值可信值;当Cmax值大于5%的临界值且小于等于1%的临界值时,认为该值为歧离值;当Cmax值大于1%的临界值时,认为该值为离群值。
其中,F值可通过F-F分布表获得,也可由Excel函数“=FINV(α,v1,v2)”获得,F值的自由度v1=n-1,v2=(p-1)(n-1),α为检验水平。
由以上公式,对各实验室测试结果进行检验,结果见表3。
表3 柯克伦检验结果
表3检验结果表明,此方法检验各实验室内测试结果均无离群值和歧离值。
格拉布斯检验分为单个值循环检验和两个值循环检验。
2.3.1 单个值检验
格拉布斯单个值检验用于判断一组数据中最大值或最小值是否为离群值,属于双侧检验。假设有p家实验室(i)参加比对,先将各实验室测试结果按由小到大的规律排列:x1,x2,…,xi,…,xp-1,xp。然后统计G值,见公式(7)和(8)。
Gcrit,α是衡量某个实验室测试结果准确度的检验临界值,通过与同一显著性水平下的临界值比对,判断最大值或最小值是否为离群值。由公式(9)[8]计算可得,当Gmax或Gmin小于等于5%的临界值时,认为Gmax或Gmin可信值;当Gmax或Gmin大于5%的临界值且小于等于1%的临界值时,认为Gmax或Gmin为歧离值;当Gmax或Gmin大于1%的临界值时,认为Gmax或Gmin为离群值。
其中,t值可通过t分布表获得,也可由Excel函数“=TINV(α/p,v)”获得,t的自由度v=p-2,α为检验水平。
由以上公式,对各实验室测试结果进行检验,结果见表4。
表4 格拉布斯单个值检验结果
表4检验结果表明,Gmax介于G0.05,38与G0.01,38之间,则测试结果最大的实验室(Lab12)为歧离值。
2.3.2 两个值检验
格拉布斯两个值检验用于判断一组数据中最大两个值或最小两个值是否为离群值,属于双侧检验。假设有p家实验室(i)参加比对,先将各实验室测试结果按由小到大的规律排列:x1,x2,…,xi,…,xP-1,xP。然后统计G值,见公式(10)和(11)。
其中,Sx——各实验室间测试结果标准偏差,Sp-1,p——除了两个最大值后余下实验室间测试结果标准偏差,S1,2——除了两个最小值后余下实验室间测试结果标准偏差。
查阅格拉布斯临界表,通过与同一显著性水平下的临界值比对,判断最大值或最小值是否为离群值。当Gmax或Gmin大于等于5%的临界值时,认为Gmax或Gmin可信值;当Gmax或Gmin小于5%的临界值且大于等于1%的临界值时,认为Gmax或Gmin为歧离值;当Gmax或Gmin小于1%的临界值时,认为Gmax或Gmin为离群值。
由以上公式,对各实验室测试结果进行检验,结果见表5。
表5 格拉布斯两个值检验结果
表5检验结果表明,此次测试结果最大的两家实验室(Lab12、Lab24)为离群值。
迪克逊检验根据实验室数量不同,判断一组数据中几个最大值或几个最小值是否为离群值,属于双侧检验。假设有p家实验室(i)参加比对,先将各实验室测试结果按由小到大的规律排列:x1,x2,…,xi,…,xp-1,xp。
根据参加实验室数量不同,应选择不同的计算公式,共分为以下4种情况[3]:
查阅迪克逊临界表,通过与同一显著性水平下的临界值比对,判断最大值或最小值是否为离群值。当Dmax或Dmin小于等于5%的临界值时,认为Dmax或Dmin可信值;当Dmax或Dmin大于5%的临界值且小于等于1%的临界值时,认为Dmax或Dmin为歧离值;当Dmax或Dmin大于1%的临界值时,认为Dmax或Dmin为离群值。
此次参加比对的实验室共有38家,选用第4种情况的公式进行计算。对各实验室测试结果进行检验,结果见表6。
表6 迪克逊检验结果
表6检验结果表明,Dmax介于D0.05,38与D0.01,38之间,则测试结果最大的3家实验室(Lab12、Lab24、Lab25)为歧离值。
由以上检验方法对某次纺织品化学项目检测各实验室间比对测试结果进行检验,其检验结果见表7。
由表7可看出,对此次实验室间比对测试结果准确度的检验,曼德尔h统计量相比格拉布斯检验和迪克逊检验都要严格,检验出的离群值实验室和歧离值实验室的数量相对较多;精密度的检验,曼德尔k统计量相比柯克伦检验严格,检验出的离群值实验室和歧离值实验室的数量相对较多。
一般情况下在组织实验室间比对时,对于一组测试结果,既要检验实验室间测试结果的准确度,也要检验实验室内测试结果的精密度。
上述中,曼德尔h/k统计量检验既可以检验实验室间测试结果的准确度,同时也可以检验实验室内测试结果的精密度,而且可以做出直方图,更简洁明了地看出各个实验室测试结果偏离程度;而格拉布斯检验和迪克逊检验仅是检验实验室间的准确度,柯克伦检验仅是检验实验室内测试结果的精密度。
除了曼德尔h/k统计量检验能满足准确度和精密度均检验外,其余3种检验方法均为单一检验,此3种方法应组合使用,如格拉布斯与柯克伦组合检验,迪克逊与柯克伦组合检验。此外,需根据比对项目的不同及得到的数据特点不同选择恰当的检验方法,建议优先选用曼德尔h/k统计量检验。
表7 各检验方法对检验结果汇总表