王子亮 王继荣
(中国合格评定国家认可中心 北京 100062)
数理统计是数学的一个分支,分为描述统计和推断统计,以概率论为基础,研究大量随机现象的统计规律性,在自然科学、工程技术、管理科学及人文社会科学中得到广泛应用[1]。例如,在研究培育高产优质农产品的过程中,用回归和方差分析法计算遗传力;在开发新产品和改进旧产品的过程中,用多元统计分析法确定最优生产条件;在工业大批量生产中,用质量控制图监视工序,用抽检曲线图确定抽样方案;在药学临床试验中,用正交设计确定最佳试验方案;以及社会学中的列联表分析、人口学随机过程统计、经济学中的经济计量模型等[2]。
随着时代的发展,数理统计方法在质量管理中的作用愈发凸显,而认可工作作为质量管理的重要方面,也得到其强力支持。在实验室认可领域,主要涉及判定规则的制定、方法的选择和确定、测量不确定度评定及检测结果有效性等方面。例如,在CNAS—RL01《实验室认可规则中》,条款7.1.3判定规则:“可依据分析数据的分布或样本量大小,选择相应的检验方法”;条款7.2.1方法的选择:“通过方差分析比较各方法的优劣”;条款7.6测量不确定度评定:“用回归分析精确估计不确定度,用格拉布斯法剔除异常数据”;条款7.7检测结果的有效性:“制作质量控制图进行内部质量控制,用稳健统计法进行能力验证活动,用方差分析法进行实验室内比对”等[3]。
质量控制图可以利用过程数据判定系统是否处于统计控制状态。如果有合格的精密度和准确度,数据应服从正态分布;如果过程受到影响,其分布状态也会变异。通过判别标准,可以发现产生问题的原因并及时纠正。图中的基本组织包括中心线、上下警告线、上下控制线和辅助线。判定规则大体上可分为2点:确定所有的点都在界限内、在界限内的点排列符合规则。例如,数据点在警告线外但在控制线内说明可能存在失控的风险;连续7点递增或递减说明过程有失控的倾向;连续7点位于中心线同侧或落在范围内的数据点<50%,说明分布不合适,数据失控,需要更换控制图种类等[4]。
质量控制图大体上可分为2类:计量型控制图、计数型控制图,包含了7种基本图表。计量控制图主要有3,使用时要求控制对象为计量型。当样本总量≤10,可选用极差控制图;样本量>10,可选用标准差控制图;单值—异动极差控制图适合只能控制1个值的情况,它判断过程变化的灵敏度较差。计数型控制图主要有4类,使用时要视控制对象为计数值质量指标。控制不合格频率时,若样本量可变,用P控制图;若样本量固定率,用NP控制图;控制单位缺陷数时,若样本量可变,用U控制图;若样本量固定,用C控制图。GB/T 4091-2001《常规控制图》可提供参考[5]。
实验室检测工作的过程非常复杂,若其中某一环节出现问题,仅凭对单一数据的分析难以找出问题所在。通过制作质量控制图监控过程,可以及时发现偏差,根据实际情况针对人、机、料、法、环等因素进行分析研究,找出问题并纠正,在一定程度上保证数据的精密度,是实现质量控制的有效手段。
方差分析用于多个样本均数差别的显著性检验。各种影响因素使所得的数据呈现波动状,原因大体分为2类:随机误差(又称组内误差,用变量在各组的均值与该组内变量值之偏差平方和的总和表示);实验条件(组间误差,用变量在各组的均值与总均值之偏差平方和的总和表示)。通过求得组内均方和组间均方,再除以各自的自由度,计算统计量值并与其临界值做比较,可判定各影响因素及其交互作用是否显著[6]。
方差分析中,如果所分析影响因素只有一个,可使用单因素方差分析法。例如,分析不同类别的种子对农作物产量的影响。如果有多个影响因素需要分析,应使用多因素方差分析法。例如,分析不同品种、不同施肥量以及不同土壤对农作物产量的影响。方差分析的检验方法包括参数检验和非参数检验。参数检验的应用条件:各样本是相互独立的随机样本;各样本分布均为正态分布;各样本的总体方差相等。常用的检验方法主要是F检验,当显著水平≥0.05时,其稳健性会非常可靠。当数据总体不满足正太分布时,可以使用非参数检验。常用的检验方法主要是卡方检验,可用于数据精密度不等的情况,且在没有参考值的情况下依然适用[7]。
方差检验是进行实验室比对的一种重要方法,它可以判定不同人员、不同实验方法、不同设备以及不同实验室间测量结果的一致性。它可以评价实验室进行指定测量的能力,确定某测量方法的有效性和可比性,识别实验室间的差异,帮助实验室发现问题原因并采取相应的措施[8]。但是方差分析中常用的F检验和卡方检验对适用条件的要求比较苛刻,在实际工作中往往难以满足,导致其出具报告结果的可信度大打折扣。
当适用条件不能严格的满足时,所使用的统计方法的性能受到的影响不大,那么称该统计方法具有稳健性,又称为稳健统计法。四分位数法可以忽略离群值对统计结果的影响,其统计量Z=(Xi-Xm)/0.7413×IQR,若|Z|≤2,结果满意,2<|Z|<3,结果可疑,而当|Z|≥3时,结果不满意[9]。ISO13528(实验室间比对能力验证中的统计方法)中涉及的迭代稳健统计法中的A算法常用于能力验证活动中。迭代法的步骤,先将数据递增排列,算出每个数据Xi中位值Xm和1.483×(Xi-Xm)中位值S的初始值,通过判定公式对Xi和S不断修正,直至满足迭代收敛,最终确定Xi为指定值,S为能力验证标准差[10]。
四分位法不计算两端的数据,所得的标准差比经典统计法小,部分数据被判定为离群值的可能性较大。迭代法是通过赋予极端值小权重,减小其对均值和标准差估算的影响。两种算法算出的中位值没有明显差异,但迭代法算出的标准差比四分位数法的大。研究表明,若先剔除数据中的离群值,使用经典统计法得出的数据为参照,迭代法得出的结果与之更接近。所以当2种方法得出结果有差异时,通常迭代法的效果更好[11]。
Bootstrap重抽样方法在样本代表性好的情况下可对组数据模拟再抽样,当总体分布未知或样本量不足时,比四分位数法更适合用来对结果进行分析[12]。
在严格满足条件的情况下,经典统计方法的性能非常好。但实际上正态假定常常只是近似地满足,且被测数据也会包含系统误差。四分位数和迭代稳健统计法对数据总体的分布没有特殊要求,也无需剔除数据中的异常值,Bootstrap重抽样方法可以在样本量不足的情况下使用。这3种方法可以有效地弥补经典统计法的不足,是数理统计应用于实验室能力验证活动中的重要方面。
由于被测量物品的真值只是理论存在的,所以在实际操作中所得的结果必然存在误差。不确定度就是指测量结果不能确定的程度,是反映测量结果可信度的质量指标。不确定度越小,结果可信度越高;不确定度越大,结果可信度越低。实验室可通过测量不确定度来证明自身的能力,以便获得相关方的认可。
2.4.1 异常值剔除的方法
当处理少量数据时,异常值的判定对分析结果影响很大,在进行不确定度评定时应对这类数据进行甄别。格拉布斯法(Grubbs)是检验异常值的统计方法之一,通常采用双尾检验,适用于在有限次测定中,剔除一组数据的一个或多个异常值[14]。检验步骤:把组数据按顺序排列,通过计算标准差和均值;找出可疑值,计算统计量的值;依据数据个数和置信度求得临界值;比较统计量的值和临界值,对可疑数据做出判定。
2.4.2 回归分析的应用
回归分析是确定随机现象中2种或以上变量之间定量关系的一种数理统计方法,通过建立表示变量关系的标准曲线,可以对在检定校准过程的数据进行处理。此外,多项式回归分析方法可以对实验室测量数据进行分析,给出数据的不确定度的无偏估计和区间估计,并计算检测器灵敏度的置信上、下界。通过不确定度的估计精度,也可分析大样本实验中所需的最小样本量[16]。
2.4.3 小样本量情况的处理
增加测定次数,测定结果的A类不确定度会更加可靠。但在有毒有害、测试过程耗时长的情况下,实验室只能进行少量测试求得结果,此时可通过极差法计算A类不确定度。极差法的思想是利用组数据极差值和极差系数求得标准差的近似值,从而求得A类不确定度的值,在测试次数<9时应用效果较好[17]。
随着我国经济发展、社会制度的进步,在国家质量管理中,部分由政府主导的行政审批事项逐步过渡至由第三方认可机构主导的合格评定活动当中。目前CMA实验室行政审批对象数量远高于CNAS实验室认可对象的数量。在未来,CNAS实验室认可业务量可能会大量增加,若要保质保量地完成认可工作,离不开数理统计方法的强力支持。
随着生活水平的提高,人们对食品安全问题越来越关注。传统的食品检测分析方法较为复杂、速度慢、成本高,不能满足日常监管的需求。食品属于快速消耗品,这就需要操作简便、成本低、耗时短的检测方法提供技术保障。因此,快速检测被逐渐应用于各个商品流通场所。而且食品安全问题比较敏感,对实验室的检测结果也提出了更高的要求。为了保证检测方法的可靠性,实验室需要对检测活动中采用的方法进行方法确认,其中改变控制参数检验方法的稳定性、新旧方法的实验比对、实验室间比对和评估不确定度等,都涉及了数理统计知识的运用。
随着人工智能技术的逐渐成熟,自动化检测技术的应用范围将越来越广。实验室通过使用自动检测设备实现测量、实验和数据处理的自动化,可以有效地缓解当前所面临的压力,从而提高其科研效率。同时实验室管理方法和工作方式也发生了一些变化,对实验室认可工作提出了新的要求。而数理统计学作为人工智能的重要数学基础,其在实验室认可领域中的应用也会更广泛、更专业。