崔淑玲(呼伦贝尔市产品质量计量检测所)
浅谈检验过程中测量数据处理及修约方法
崔淑玲(呼伦贝尔市产品质量计量检测所)
本文论述了测试数据处理种类及适用范围,如何优化数据处理、有效给出测试数据。
数据处理 适用范围 有效
化学实验中常见的数据处理有: (1)公式计算;(2)用实验数据作图或对实验数据计算后作图; (3)线性拟合,求截距或斜率; (4)非线性曲线拟合; (5)作切线,求截距或斜率。计算机作图软件越来越多。利用计算机Origin 软件可方便地进行作图、线性拟合、非线性曲线拟合等数据处理,还可以求出R2(相关系数的平方) 、SD (标准偏差) 、RSD (相对标准偏差)、ρ值( R2= 0 的概率)等。能够满足化学实验数据处理的要求,特别是先进的仪器设备大都具备自动检测及数据处理功能,但是对于一些异常值的处理和判定,仪器设备还存在缺陷和不足,仪器有时会出毛病,需要人工验证。本文介绍常规检验中一些小数据的处理方法适用范围、优缺点。
1.1 数据修约
实验数据修约按GB/T 8170—2008《数值修约规则与极限数值的表示和判定》,按照其修约间隔或指定单位进行修约,比如按0.1,0.2,0.5修约间隔及指定单位修约。如检测化肥中有效磷的修约用0.1修约间隔,假设磷含量15.1160%,标准要求三位有效数字,在运算过程多保留一位,所以修约15.12%;如柴油中闪点的数据修约要求按0.5修约间隔,假设闪点数值56.4℃,则按修约要求修约后为56.4×2=112.8℃=113℃,113÷2=56.5℃。不允许连续修约,如45.4546,按1修约间隔,要求保留整数,正常修约为45,要是连续修约(错误的修约)就是45.455→45.46→45.5→46。
1.2 进舍规则
四舍六入五考虑,五后非零则进一,五后皆零视奇偶,五前为偶则舍去,五前为奇则进一,要一次修约完成,不可连续修约。
特例:对于非连续型数值个数、分数、倍数、名义浓度等,其有效位数可视为无限多位。如0.5mol/L氢氧化钠标液中的“0.5”为名义浓度,其有效位数为无限多位,规格项目下的“10g”“1mL”等,其有效位数为无限多位。
在单次检验数据保留中,要根据最少有效精度的条件来决定。如在检验化肥总氮含量过程中,用万分之一天平称取分析试样1.5002g,天平检定证书给出示值误差(检定结果的)为0.2mg(0.0002g),所使用的25mL或50mL的碱式滴定管,样品消耗氢氧化钠标准溶液体积为12.78mL,是四位有效数字,由天平称量及滴定管准确度决定,在计算总氮含量时,最多保留五位有效数字(在运算过程),多留无意义。最后保留四位或四位以下才有意义,当然根据产品标准要求,也可以保留四位以下的有效数字。
结论:在计算中,其有效数位应根据其他数值的最少有效位数来定。
1.3 数据修正
在油品馏程检测数据处理过程中,要进行温度和大气压修正,如柴油馏程温度计读数264.0℃,经温度计修正及大气压修正后为(温度计修正值由检定证书给出,大气压修正值按GB/T 6536—2010中表6,当地大气压为93kPa,计算出来):264.0+0.4+4.09=268.5℃。
2.1 判别异常值常用的统计方法——格拉布期准则
设定一组重复结果Xi中残差最大者为可疑值Xd,设置信概率ρ,显著水平α=1-ρ,s为实验标准偏差,为要计算的一组数据的平圴值,G(α, n)为格拉布期准则临界值(由表查出),可以用来判定是否存在可疑值,当< G(α,n )无可疑值;≥ G(α,n )为可疑值,依此类推,连续判定,直到无可疑值,取平均值作为检验结果。
2.2 方法标准中给出重复性限和再现性临界差要求
在GB/T 214—2007《煤中全硫的测定方法》中,当St≤1.50%时,重复性限0.05%(St,ad);再现性临界差0.10%(St,d),符合误差要求的,取算术平均值作为最终结果,若不符合,按CB/T 483—2007《煤炭分析试验方法一般规定》加大检验数量,求重复性测量的极差值,然后再进行数据处理,符合要求的取算术结果的平均值,当样品测定数量加大至规定极限时,仍不符合要求的,舍弃全部结果,从人、机、料、法、环上查找原因,重新试验。
2.3 准确度值的实际应用
GB/T 6379.6—2009《测量方法与结果的准确度(正确度与精密度) 第6部分:准确度值的实际应用》应用的基础是基于超过两个值的比较。
2.3.1 一个实验室内两组测量结果的比较
在重复性条件下进行两组测量,第一组测试结果数为n1,其算术平均值为,同理,第二组为n2,,在GB/T 6379控制条件下,σr为重复性测量结果的估计值代替标准差Sr,则的标准差为;在ρ=95%概率水平下,临界差为 ,(当n1=n2=1,临界差化简为 r =2.8σr)。
2.3.2 两个实验室两组测量结果的比较
在重复性条件下,第一个实验室测试结果数为n1,其算术平均值为,同理,第二个实验室为n2,的标准差=ρ=95%条件下,的临界差为:CD0.95=,(当n1=n2=1,临界差化简为R=2.8σR)。
2.3.3 一个实验室的测试结果与参照值的比较
在重复性条件下,第一个实验室得到n个实验结果,其算术平均值为,与某个确定的参照值μ0比较,在偏倚的实验室分量尚未确定的情况下,(-μ0)的标准差为:
2.3.4 多个实验室的测试结果与参照值的比较
若有p个实验室,分别在重复性条件下得到 ni(i=1,2,...,p)个测试结果,每个实验室测试结果的算术平均值为,所有实验室测试结果的总平均值为,其算术平均值为y,与某个确定的参照值μ0比较,在偏倚的实验室分量尚未确定的情况下,(-μ0)的标准差为:
2.3.5 报告比较结果
测试结果的绝对值符合要求的,可以取平均值,报出测试结果,超过以上条款给出的合理限值,应认为相应的绝对差可疑,可认为用于计算此绝对差值的所有测量结果可疑,需要做进一步审查。
检查测试结果可接受的方法包括:
(1)重复性条件下所得测试结果可接受性的检查方法;(2)在再现性条件下所得测试结果可接受性的检查方法。
通过用多种方法对测试数据进行处理,可以在日常分析及实验室比对中,正确处理、评估测试数据,及时发现数据中存在的偏倚情况,有效的提供科学测试数据。
[1]GB/T 8170—2008 数值修约规则与极限数值的表示和判定
[2]CB/T 483—2007 煤炭分析试验方法一般规定
[3]GB/T 214—2007 煤中全硫的测定方法
[4]中国计量测试学会. 二级注册计量师基础知识及专业实务[M]. 北京:中国计量出版社,2009.
[5]GB/T 6379.6—2009 测量方法与结果的准确度(正确度与精密度) 第6部分:准确度值的实际应用
Discussion on Data Processing and Rounding off Method during the Inspection
Cui Shuling ( Hulunbeier Product Quality Measurement Institute )
This paper discusses data processing methods and application scope, how to optimize data processing and obtain valid data.
data processing, application scope, effective