用质控图和稳健统计-迭代法评估环境检测实验室测量不确定度

2014-08-01 06:31:58狄一安孙海容孙培琴任立军王婧瑞李斯明李玉武

岩矿测试 2014年1期

狄一安，孙海容，孙培琴，任立军，刘岩，周昊，王婧瑞，李斯明，李玉武*

(1.国家环境分析测试中心，北京 100029； 2.中国合格评定国家认可委员会，北京 100062)

近年来，在中国合格评定国家认可委员会(CNAS)的大力推动下，测量结果不确定度评估越来越受到环境领域各级检测实验室的重视。CNAS要求已获认可的检测实验室应有能力对每一项有数值要求的测量结果进行测量不确定度评估。如果客户有要求，检测报告必须提供测量结果的不确定度。

目前各种标准或指南中测量不确定度的评估方法大致可分为两类：“bottom-up”和“top-down”。“bottom-up”法注重细节，分析、计算分析步骤中每一操作环节所涉及的不确定度分量，计算合成标准不确定度，然后乘以包含因子得到扩展不确定度。此法可完全覆盖物理测量，但对与化学和生物测量相关的特殊问题(例如关于样品前处理步骤)没有特定的规定。虽然对分析程序中的单一步骤(称量、溶液移取等)，标准溶液浓度的计算和校准曲线拟合不确定度的评估，《化学分析中不确定度的评估指南》(GUM)[1]都给予一般原则和指导，但应用于较为复杂的化学测量时仍有一定局限性[2]。“top-down”法利用从方法确认、实验室内质控和实验室间协作定值、能力验证等数据，注重从整体上、通过数月、数年等一段期间反映样品检测全过程的精密度数据直接评估测量不确定度，如精密度法[3]、质控图法[4]、线性校准法[5]和经验模型法[6-7]等。由于使用了长期积累的质控数据,评估过程全面反映不确定度的潜在来源的机率会更大。在评估化学测量结果的不确定度时，“top-down”法比“bottom-up”法更为实用。“top-down”法充分利用了实验室质控数据并将检测方法测量不确定度评估与实验室质控工作紧密联系在一起，促使实验室在进行质控方案“顶层设计”时就能结合测量不确定度评估的需要，将测量不确定度评估基础工作抓实，其意义不可低估。近年来我国已有不少应用方法精密度、实验室能力验证结果来评估测量不确定度的报道[8-11]，这些研究工作将测量不确定度与分析方法的质量参数联系起来，是“top-down”方法的成功探索。

2011年6月6～7日欧洲化学联合会在葡萄牙里斯本召开了测量不确定度最新进展研讨会[12]，两篇特邀报告[13-14]集中反映了测量不确定度评估方法指南第3版结构和内容修订动向，其中最大的变化是增加了“top-down”方法。不少国际组织也发表相关技术文件[2,15-17]。由此可见，在检测实验室推广普及“top-down”理念，将“top-down”法与经典的“bottom-up”法相结合，在国内外均是大势所趋。

基于“top-down”技术理念的计算方法中，质控图法和线性校准法主要用于实验室内实验数据处理。质控图法操作简便，但只涉及一个浓度，并且要求所有数据是非离群测量结果。线性校准法可用于不同浓度样品测量结果不确定度评估，但在建立模型时，要求不同浓度的标准样品测量次数一致，需要完整、成套不同浓度水平标准样品测试数据。实验室以前积累的质控数据很难满足这些要求，这使其推广应用受到一定限制。本文尝试用回收率将同一检测项目不同浓度水平质控数据归一化，然后用质控图方法处理，如果存在离群数据时，用稳健统计法-迭代法计算期间精密度sR′。探讨了下列具体问题：①单一浓度数据归一化前后，同一种计算方法结果比较；②同一套单一浓度质控数据未经任何前处理，稳健统计-迭代法与质控图法结果比较；③多浓度水平数据归一化条件下，稳健统计-迭代法与质控图法结果比较；④不同浓度水平数据归一化后，质控图法、稳健统计-迭代法与线性校准法计算结果是否相符。采用作者所在实验室积累的5套和其他实验室提供的19套环境检测实验室常规项目质控数据验证了该方法的可行性。

1 实验数据来源

氨氮、总磷、COD，土壤中铅、土壤中铜5套数据来源于本文作者所在实验室2010～2012年期间积累的质控标准样品实测数据(参见表1)，标准样品均由环保部标准样品研究所提供。19套其他环境检测实验室实测数据，来源于CNAS组织的用“top-down”技术评估不确定度培训班教材和学员提交的报告，参见表2。

表1 作者实验室不同检测项目质控样品标称值及测定结果

表2 其他实验室提供的质控数据

2 不确定度评估方法

2.1 质控图法[4]

根据相关表格提供的数据，可将wi值换算成正态概率值pi。更方便的方法是利用微软Excel的函数公式NORMDIST(x,mean,std dev,cummulative)语句求出。例如，wi=-0.64，NORMDIST(-0.64，0，1，TRUE)=0.261086，与查表值0.2611完全一致。A值和A*值按下列公式计算：

式中：A*—正态统计量，A的修正值。按s式计算时表示A*(s)，按MR式计算时表示A*(MR)；n—测量次数。

根据A*(s)和A*(MR)数值，可作如下判定。

(a)A*(s)<1.0和A*(MR)<1.0，接受数据的正态性和独立性的假定。

(b)A*(s)>1.0和A*(MR)>1.0，表明测量系统失控。

(c)A*(s)<1.0和A*(MR)>1.0，表明系列结果呈非独立性。

在偏倚受控的期间精密度测量条件下，2×sR′可作为不确定度的评估值。实验室给出的sR′应大于sr，小于sR。

表3以表1中COD归一化数据为例，显示了整个计算过程及结果。表3结果表明，COD归一化数据质控图的计算结果：平均值为1.000，期间精密度为0.023。正态性和独立性均通过AD检验。COD回收率及其扩展不确定度为1.000±0.046。

表3 COD的质控图法计算示例

2.2 线性校准法及数据归一化

线性校准法[5]原理和主要计算步骤如下：通过带基体不同浓度水平的标准物质测定值与标准偏差建立回归模型，根据标准样品浓度与重复测量值标准偏差是否显著相关确定其属于比例模型还是常数模型。若属于前者应进行加权变换。利用单因素的方差分析，检查所拟合模型的偏倚是否处于统计受控。在期间精密度测量条件下，利用较高和较低两个标准物质，通过相应的数据变换给出残差数据，并建立质控图。如果图中的系列数据分布呈随机状态，则测量系统给出均方根误差，即为该实验室获得的不确定度估计值。比例模型计算公式如下：

(1)

为处理不同浓度质控样品测量数据，可将测试结果归一化。期间精密度(测试结果与标准值相对标准偏差的均方根)计算公式(2)与公式(1)完全相同，与计算标准偏差的公式也基本相同：

(2)

式中，m为不同浓度水平样品个数，当回收率平均值约等于1时，式(1)和式(2)基本相同。归一化法计算结果是所有不同浓度标准样品测量值与标准值相对标准偏差的均方根。它与线性校准法计算结果的区别是，后者是模型建立后一段期间同时测定高低两个浓度标准样品测量值与标准值相对标准偏差的均方根。

公式(2)是计算归一化后质控数据sR′的基础。但实际计算时可采用下列两条途径：①如果不存在“离群值”，可用质控图法处理，同时得到sR′和数据正态性和独立性判据；②用稳健统计-迭代法处理，得到归一化数据的稳健性标准偏差sR′。其优点是它不需要对离群值进行识别和剔除，可将离群值对统计结果平均值和标准偏差的影响降低到最小。

2.3 稳健统计-迭代法

稳健统计是指不用事先识别、剔除离群值，直接应用全部测量数据，将离群值对统计分析结果影响降低到最小的统计分析方法。迭代法是近年来ISO标准推荐的稳健统计方法[18-19]，其应用早在20世纪80年代国外分析化学文献中已有报道[20]。它不需要对“离群值”进行人为干预。其原理是对按顺序排列，位于数据排列两端远离中位值的“可疑值”或“离群值”均以较小权重予以保留，与中位值接近的值则以较大权重参与计算，充分利用了全部测量数据的信息。分析化学领域中，有些离群值很明显，容易删去，但有时判断“离群值”的分界线并不明显，不同的判别方法结论可能不同。在这种情况下，稳健统计方法尽量减小了“离群值”对“平均值”和“标准偏差”的影响，给出这两个统计量的估计值。稳健统计-迭代法的特点是它不需要假设数据是标准正态分布。在正态分布基础上，单峰分布，基本对称，存在离群值，即使有严重拖尾(heavy tails)现象时，它也能给出较合理的结果[20]。国内能力验证领域有相关文献报道[21-22]，但在实验室测量数据处理方面应用报道较少。稳健统计-迭代法具体计算步骤如下。

sR′=1.134×s

s*=1.5×sR′

表4 稳健统计-迭代法(方法1)计算示例

初始x1和x2也可以按下列方式得到(方法2，参见表5)：测量结果xi按升序排列后，取数列的中位值。用排序后的测量数据与中位值相减，求出此差值的绝对值数列的中位值作为标准偏差的估计值s0。以此数据为基础计算下列参数：

sR′=1.483×s0

s*=1.5×sR′

表5 稳健统计-迭代法(方法2)计算示例

表4和表5的计算示例结果表明，基于两种不同方法得到的初始参数进行计算的稳健统计-迭代法均得到相同计算结果：平均值为1.000，期间精密度sR′为0.022。COD回收率及其扩展不确定度为1.000±0.044。本示例中，COD数据迭代法与质控图法结果(1.000±0.046)基本相符。质控图法和稳健统计-迭代法计算均在Excel软件上完成，计算示例文件可向本文通讯作者索取。

3 结果与讨论

3.1 “top-down”方法特点、现存问题及解决方案

经典的评估测量不确定度方法仅适用于测量过程模型已知的情况，通过分析不确定度来源并对系列观测值的统计分析(A类评估)或其他方式(B类评估)来完成。方法步骤繁琐，容易造成不确定度分量遗漏或重复计算，某些不确定度分量难以准确量化。大量研究结果表明，化学分析中不确定度的主要分量大多为校准曲线和样品重复测定。但这种重复性测定一般均是当天或短时间内完成，未能反映实验室长期质控状态。“bottom-up”法适合新方法建立或验证期间，实验室结合工作曲线、准确度(回收率)和精密度等实验数据，在短期内完成对分析方法测量不确定度的评估。

用于评估测量不确定度的“top-down”技术核心理念是两个统计量“期间精密度sR′”和“再现性标准偏差sR”。两者分别以实验室内部测量数据和不同实验室协作实验测试数据为基础。利用这两个统计量可以分别评估实验室内测量不确定度和分析方法不确定度。实验室内测量不确定度的大小反映了实验室技术水平，分析方法或样品测量不确定度可用于对同一样品不同实验室测定结果的比较。

基于以上分类原理，质控图法、线性校准法以实验室内部质控数据为基础，可计算实验室测量不确定度。精密度法、经验模型法以能力验证数据等不同实验室统计数据为基础，则可以评估分析方法(或样品不确定度)不确定度。能力验证数据统计结果“稳健标准偏差”是判断实验室上报数据是否合格的尺度，同时也是方法不确定度的有效估计值。常见的能力验证数据稳健统计方法有四分位法和迭代法。四分位数法假设数据分布是标准正态分布，且只考虑了50%的上报数据。如果实际上报数据明显违背分布假设，此时直接套用计算公式，其计算结果稳健标准偏差有时会过于“严格”[18]。迭代法也是一种稳健统计方法，已得到国际标准认可和推荐[19-20]。迭代法对于离群值采取权重小、位于中位附近数据权重大的方式进行计算，稳健性强，已受到国内专业机构关注[21-23]。但国内文献中迭代法在处理实验室测量数据应用很少有报道。

线性校准法可以用于评估不同浓度范围样品的测量不确定度，但在建立模型时对不同浓度样品测量次数严格要求一致，需要成套、完整的实验数据，模型检验理论性强，初学者不易掌握。质控图法虽然只能处理一个浓度，但它可提供数据正态性和独立性判据，用于判断计算结果可靠性和质控数据的有效性，但严格要求测量数据中不能含离群值。如果将不同浓度数据利用回收率进行归一化，这样就可以同时利用质控图和稳健统计-迭代法来处理实验室内长期积累的不同浓度质控数据，得到sR′数据，然后乘以2，可得到实验室扩展测量不确定度。

3.2 单一浓度数据归一化前后质控图法与稳健统计-迭代法结果比较

为检验数据归一化对计算结果的影响，作者首先考察了单一浓度归一化前后同一种计算方法计算结果有无变化。从理论上分析，归一化对结果应该无影响。用表2的实测数据进行了验证。表6显示了单一浓度测试数据归一化前后质控图法和稳健统计-迭代法计算结果，结果分别用绝对值和回收率表示。表6(第1～4套数据)计算结果表明：①与传统的质控图法相比，测量数据归一化后，质控图法与归一化前原结果完全相符。数据归一化前后稳健统计-迭代法计算结果也完全相符；同套数据归一化后，质控图法和稳健统计-迭代法计算结果sR′(相对值)平均偏差为0.46%，两种方法计算结果基本相符；②第3套数据苯并[a]芘第8～10行数据是不同时间段数据合并后计算结果[24]。第8行是sR，合并计算结果，第9～10行是测量数据合并后计算结果。不同方法的计算结果完全一致，但新方法避免了合并计算的繁琐公式。表7是单一浓度质控数据，不经任何处理，质控图法和计算结果比较。从表7(第5～11套数据)计算结果可以看出，稳健统计-迭代法与质控图法结果基本相符，sR′(相对值)平均偏差为0.15%。表6和表7用于方法比较的11套质控数据均通过正态性和独立性检验。这为计算结果的可靠性提供了基本保障。这是质控图区别于其他方法的显著特点。

表6 单一浓度数据归一化前后质控图法及稳健统计-迭代法结果比较

表7 单一浓度数据质控图法及稳健统计-迭代法结果比较

3.3 不同浓度水平数据归一化后质控图与稳健统计-迭代法结果比较

实验室在进行质控时，质控标准样品浓度需要根据样品的大致浓度进行选择。有时一种浓度标准样品用完了，再次采购时，标准样品浓度也不会完全与以前购买的相同。因此，实验室积累了不同浓度标准样品测量数据是普遍现象。不同浓度数据数量不一样，浓度水平分布不均匀。缺乏完整、成套质控数据很难采用线性校准法。充分利用实验室长期积累的质控数据评估实验室测量不确定度是一个非常现实的问题。

本文未涉及偏倚检验。日常工作积累的质控数据已经和标准样品值进行了比较，符合质控要求。

3.4 不同浓度水平归一化数据质控图、稳健统计-迭代法与线性校准法结果比较

为了考察新方法与传统方法线性校准法(比例模型)计算结果的区别，利用不确定度培训班学员为应用线性校准法使用的实验室质控数据进行了验证。表9列出的第17～24套数据的特点是这些数据已有线性校准法(比例模型)计算结果。将测量数据经归一化处理后，这些数据分别采用质控图法和稳健统计-迭代法进行了计算，结果用回收率和相对不确定度表示。表9计算结果表明，质控图法、稳健统计-迭代法与线性校准法结果sR′平均偏差分别为0.43%和0.20%，质控图法与稳健统计-迭代法结果sR′平均偏差为0.26%。三种计算方法结果基本相符，稳健统计-迭代法与线性校准法计算结果更接近。需要指出的是，参与质控图法和稳健统计-迭代法计算的是所有质控数据测量值与标准值相对标准偏差的均方根(见公式2)。它与线性校准法的结果的区别是，后者是模型建立后的质控数据测量值与标准值相对标准偏差的均方根。从数据的数量上来讲，质控图和稳健统计-迭代法利用了全部质控数据。从表9还可以看到，这8套数据中有两套数据用质控图法计算时，没有通过正态性和独立性检验，这些数据可能在短期内完成，不是长期积累的质控数据。注意到质控图计算表中显示可疑数据的个数(可疑数据判别标准参见表3第5列,2

表8 不同浓度水平质控数据归一化后质控图与稳健统计-迭代法结果比较

表9 不同浓度水平质控数据归一化后三种计算方法结果比较

本文建立的方法在用于实际样品测量不确定度评估时，需要注意样品浓度是否在质控数据涵盖的范围内。对于浓度较低，其标准偏差与浓度无关，在线性校准法中属于常数模型的质控数据，不能用本文提出的方法处理，其计算结果可用测定值与标准值的绝对残差的均方根来表示，相关研究工作仍在进行中。

4 结语

利用回收率概念，将实验室长期积累的不同浓度(或含量)水平的水质标准样品和土壤标准样品测量结果等质控数据进行归一化处理，然后用质控图法、稳健统计-迭代法计算期间精密度sR′。用本实验室积累的5套质控数据和其他实验室提供的19套数据验证了新方法的可行性。验证结果表明，对单一浓度质控数据，不经任何处理，稳健统计-迭代法可得到与质控图法基本相符结果，sR′(相对值)平均偏差为0.15%。对于多浓度水平质控数据，经归一化后，质控图法、稳健统计-迭代法与线性校准法结果平均偏差分别为0.43%和0.20%，质控图法与稳健统计-迭代法结果平均偏差为0.26%，三种方法计算结果基本相符，稳健统计-迭代法更接近于线性校准法计算结果。质控图法中正态性和独立性判据可用于判断质控数据的有效性。新方法为充分利用实验室长期积累的质控数据评估实验室测量不确定度提供了有用工具。

本文提出的方法原理简单，计算步骤简便，适用于线性校准法比例模型数据的处理，值得环境检测实验室试用、深入研究及不断完善。

致谢：本文为验证方法的可行性，选用了CNAS组织的“top-down”不确定度评估培训班学员实习报告中部分实验室质控数据，在此向提供数据的学员及实验室表示感谢。

5 参考文献

[1] 中国实验室国家认可委员会.化学分析中不确定度的评估指南[M].北京:中国计量出版社,2002.

[2] National Association of Testing Authorities,Australia (NATA). Technical Note 33,Guidelines for Estimating and Reporting Measurement Uncertainty of Chemical Test Results [R].

[3] 辽宁出入境检验检疫局，中国标准化研究院.GB/Z 22553—2010，利用重复性、再现性和正确度的估计值评估测量不确定度的指南[S].北京:中国标准出版社,2010.

[4] 辽宁出入境检验检疫局,中国合格评定国家认可委员会.GB/T 27407—2010，实验室质量控制-利用统计质量保证和控制图技术评价分析测量系统的性能[S].北京:中国标准出版社,2010.

[5] 辽宁出入境检验检疫局,中国合格评定国家认可中心.GB/T 22554—2010，基于标准样品的线性校准[S].北京:中国标准出版社,2010.

[6] 辽宁出入境检验检疫局，中国合格评定国家认可中心，中国计量科学研究院.GB/T 27411—2012，检测实验室中常用不确定度评定方法与表示[S].北京:中国标准出版社,2013.

[7] 李玉武，狄一安，孙海容，曹实，任立军，周昊，郭婧，杨勇杰，王斗文.用经验模型评估环境样品测量不确定度[J].中国无机分析化学，2012,2(1)：1-8.

[8] 熊英，郭巨权.利用重复性和再现性的估计值评估测量不确定度[J].岩矿测试，2012，31(2)：350-354.

[9] 李宣，慕俊泽，张斌，江丽媛.塑料中镉的测量不确定度评定[J].分析试验室，2007，26(2)：71-74.

[10] 罗惠明，任春华，梁希杨，蔡颖.应用实验室能力验证结果评定蒸馏酒中甲醇浓度的不确定度[J].检验检疫科学，2007，17(增刊)：8-10．

[11] 尹兰风.复现性限与不确定度评定[J].中国计量，2002(3)：44-45.

[12] Eurachem Workshop.Recent Developments in Measure-ment Uncertainty [R].2011.

[13] The New Draft Eurachem/CITAC Guide: A Summary of Structure and Changes. Quantifying Uncertainty in Analytical Measurement(MU指南第3版) [R].2011.

[14] Van der Veen A M H.Revision of the Guide to the Expression of Uncertainty in Measurement [R].2011.

[15] Magnusson B,Naykki T,Hovind H. NORDTEST Report TR537：Handbook for Calculation of Measurement Uncertainty in Environmental Laboratories [R]. 2003.

[16] European Federation of National Associations of Meas-urement,Testing and Analytical Laboratories(EUROLAB).Measurement Uncertainty Revisited: Alternative Approaches to Uncertainty Evaluation[R].2007.

[17] Ramsey M H,Ellison S L R. Eurachem/EUROLAB/CITAC/Nordtest/AMC Guide: Measurement Uncertainty Arising from Sampling: A Guide to Methods and Approaches[S].Eurachem ISBN 978 0 948926 26 6(http:∥www.eurachem.org/guides/UfS_2007.pdf).2007.

[18] 孙海容，李玉武. 用经验模型判断能力验证上报数据统计分析结果合理性[J].岩矿测试，2012，31(6)：992-996.

[19] ISO 13528—2005,Statistical Methods for Use in Profi-ciency Testing by Inter-laboratory Comparisons [S].

[20] Analytical Methods Committee. Robust Statistics: A Method of Coping with Outliers [R].AMC Technical Brief.2001.

[21] 佟艳春. 拉伸试验能力验证结果的稳健统计指定值及其不确定度[J].理化检验(物理分册)，2010，46(2)，70-83.

[22] 邢小茹，马小爽，田文，吴忠祥.实验室间比对能力验证中的两种稳健统计技术探讨[J].中国环境监测，2011,27(4)：4-8.

[23] 中国合格评定国家认可委员会.CNACNAS T0476低合金钢中化学成分分析能力验证计划结果报告(附录D) [R].2010.

[24] 中国实验室国家认可委员会.环境检测领域基于质控数据评定测量不确定度指南[S].2013.