应用主成分分析综合评价实验室间的能力验证结果

2018-01-22 08:03
理化检验-化学分册 2017年9期
关键词:实验室测量评价

刘 攀

(中国船舶重工集团公司第七二五研究所(洛阳船舶材料研究所),洛阳471023)

能力验证[1]等实验室间比对活动是评价实验室检测能力,发现内部系统偏倚,确保检测结果准确性、可比性的重要措施,也是实验室申请和维持中国合格评定国家认可委员会(CNAS)、美国国家航空航天和国防合同方授信项目(NADCAP)等检测资质认证的基本要求。能力验证等实验室间比对活动通常采用曼德尔h统计量(或称为Z比分数)表征测量值与公认值的差异性,并据此评价参与实验室的检测能力。但h统计量仅能评价某一具体参数的检测能力,无法评价多个参数的综合检测能力。具体实验室在参与多参数的能力验证过程中,采用同一标准方法、设备、程序测量多参数能力验证中的数个参数,其引入的系统误差具有同向性,从而使这些参数的h统计量存在一定程度的相关性。在参数间存在较强相关性时,若不考虑参数间相关性引起的权重差异,对多个参数的h统计量通过简单加和的方法评价实验室的综合检测能力是不科学的。

主成分分析是一种较为客观的多元统计分析和综合评价方法,通过正交变换将一组可能存在相关性的变量通过线性组合,转换为一组线性不相关的变量(主成分),从而实现数据降维,并确定各原始变量及主成分的权重系数,以排除众多共存信息中相互重叠的部分(相关性)。文献[2-4]论述了主成分分析法的基本原理和权重赋值方法。目前,主成分分析 已 广 泛 应 用 于 水 质 和 土 壤 环 境[5-7]、产 品 品质[8-9]、资 源 负 载 力[10]、安 全 风 险[11-12]、顾 客 满 意度[13]、区域或城市发展水平[14-15]等各类综合评价研究。文献[16-17]应用主成分分析分别评价了小麦品质和食品检测能力验证参与实验室的综合检测能力。本工作以金属合金化学成分分析国际能力验证为例,应用SPSS软件的Factor分析探讨主成分分析在多参数实验室间的能力验证结果的综合能力评价中的应用。

1 数据来源

数据来源于本单位参加的由Exova组织的金属合金化学成分分析国际能力验证中的7项常规测量参数。部分实验室仅参与有限项测量参数或未能上报最终测量结果,其主客观原因非常复杂,或缺乏需求,或缺乏设备,或对测量数据缺乏信心。试验中对这部分实验室的综合检测能力不予评价,仅提取全部参与上述7项常规测量参数的42家实验室的测量结果进行主成分分析,以期对该42家实验室的综合检测能力进行客观、公正的评价。

为消除不同参数的量纲大小的影响,能力验证一般采用各参数标准化后的测量结果(即h统计量),见公式(1):

式中:hi为实验室i的统计量;xi为实验室i的测量值为公认值;s为公认标准差。

表征实验室单一参数的检测能力,数值相等代表其检测能力一致,与正负符号无关。因此,应采用绝对值的方法对h统计量进行预处理,将其全部转化为|h|统计量作为主成分分析的数据来源。对于部分实验室存在某一参数上报多种分析方法的情况,优选应用最普遍的方法,其次选择|h|统计量更接近0的测量结果进行后续分析。最终选择的42家实验室(依序命名为L01~L42)的|h|统计量列于表1。

表1 42家实验室的|h|统计量Tab.1 The|h|statistics of 42laboratories

2 主成分分析

对表1数据执行KMO检验和Bartlett球形检验,并计算各参数间的相关系数矩阵,结果见表2。KMO统计量为0.791,表明表1预处理数据适合进行主成分分析。Bartlett球形检验的显著性水平小于0.05,说明相关矩阵不是一个单位矩阵。

表2 各参数间的相关系数矩阵Tab.2 The correlation coefficient matrix of the parameters

由表2可知:21个相关系数中(不含自相关系数)有9个相关系数大于0.4,表明这些变量有正相关性;其中6个相关系数大于0.6,表明这些变量存在强正相关性,存在很大程度的信息重叠。综上所述,这些原始变量很适合进行主成分分析。

进一步计算主成分特征值、方差贡献率和方差累积贡献率,结果见表3。主成分分析的目的是减少变量个数,保留m个主成分代替p个原始变量的信息(m≤p,p=7)。m取值一般符合以下两个条件:所提取m个主成分的特征值的方差累积贡献率应不小于80%,特征值λi宜不小于1。

结合表3,确定保留3个主成分,并采用最大方差法进一步计算主成分的旋转后因子载荷矩阵见表4。

由表4得到3个主成分的线性表达式:

表3 主成分特征值、方差贡献率和方差累积贡献率Tab.3 The eigenvalue,variance contribution rate and variance cumulative contribution rate of each principal component

表4 保留主成分对应的载荷矩阵Tab.4 The factor loading matrix of the reserved principal components

式(2)~(4)中:F1,F2,F3分别为主成分1、主成分2、主成分3。

根据主成分的线性表达式,得出3个主成分所能代表的典型参数,列于表5。

表5 主成分对应的典型评价参数Tab.5 The corresponding typical parameters for each principal component

3 综合能力评价

采用综合主成分的评价方法对各实验室的检测能力进行整体评价[4],见公式(5)。每个主成分Fi所对应的特征值λi占所提取的3个主成分总的特征值之和的比例作为权重,对3个主成分进行加权求和以计算综合主成分F,见公式(6)。根据h统计量的含义,|h|越接近于0,表示测量结果越准确,|h|越大,则测量结果越差。因此,综合主成分F代表了参与实验室的综合检测能力,F越接近于0,表示综合检测能力越强。

各实验室的主成分及综合主成分数值和综合检测能力排名列于表6。

表6 42家实验室的主成分得分与综合能力排名Tab.6 The principal component score and comprehensive performance ranking of 42laboratories

表6 (续)

对于单个测量参数而言,|h|≤1表示测量结果的准确度高;1<|h|≤2表示测量结果的准确度较高;2<|h|≤3表示测量结果有问题;|h|>3为离群结果。根据|h|统计量临界值的判定原则,令|h|=1,代入公式(2)~(6),计算得到F1、F2、F3、F的临界值分别为4.131,1.490,1.027,3.042。分别统计7项测量参数的|h|统计量与F1、F2、F3、F 的分布,列于表7。

表7 42家实验室的|h|统计量和主成分的统计分布Tab.7 Statistical distribution for|h|statistics and principal components of 42laboratories %

由表7可知:① 综合主成分F和第一主成分F1的统计分布的相似度较高,这与其贡献率有关(方差贡献率占提取主成分的62%);②综合主成分F剔除了各参数间的相关性(重复信息),其统计分布并不完全等同于7项测量参数的(简单加和)平均|h|统计量的统计分布;③ 综合主成分F与各测量参数统计量(尤其是权重较大的|h3|、|h1|、|h2|、|h7|)的统计分布的变化趋势基本一致。

4 结语

能力验证及标准方法的实验室间协同验证、标准样品的实验室间协作定值等实验室间比对活动一般采用h统计量(或称为Z比分数)来评价各实验室针对单一特定参数的检测能力,但对于多测量参数的实验室间比对结果缺乏评价综合检测能力的有效手段。主成分分析根据各参数自身数据的相关性和变异性客观的赋予各参数权重,并进行综合评价,既避免了简单加和引入的相关参数的重复干扰,又避免了人为确定权重的随机性和主观性,为评价参与实验室的综合检测能力提供了一种值得尝试的相对科学、有效的方法。本工作以金属合金化学成分分析国际能力验证的7项常规测量参数的h统计量数据为例,在基本保留原有数据信息的基础上,通过合理降维,将7个具有相关性的原始变量提取为3个相互独立的主成分,探讨了主成分分析在评价参与实验室的综合检测能力的应用。

本方法仍具有下列不完善之处:① 采用绝对化的|h|统计量,丢失了正、负偏差信息,无法体现检测能力的方向性差异。② 未考虑到各参数的商品贸易或工程应用性质(如各参数对售价、性能的利弊、危害等各种特性的作用及大小);各参与实验室可以根据自身的关注点,结合“专家调查权重法”适当地调整各原始变量的权重,以期充分考虑各参数的实际贸易或工程应用的作用差异。③ 能力验证等实验室间比对活动中或多或少存在部分实验室因各种复杂原因造成缺席或未上报部分测量参数的情况,传统评价方法和主成分分析法对这部分实验室的综合检测能力的准确评价均缺乏行而有效的手段。④ 多参数综合检测能力仅包括以|h|统计量的平均值表征的准确度指标,未能涉及实验室内部精密度等其他指标(如k统计量);因缺乏杜绝和辨别参与实验室关于内部精密度参数的作弊动机和行为(主观选择报告值以确保较小的标准差或极差)的有效手段,现有的实验室间比对活动的结果评价方法及主成分分析法均不能对精密度参数给予客观、公正的评价。上述方面是多参数能力验证等实验室间比对结果综合能力评价必须面对且需要妥善处理的重要课题,有待进一步研究、发展更加科学、客观、公正、全面、可行的多参数综合评价方法。

[1] 马冲先.能力验证及其评价[J].理化检验-化学分册,2005,41(11):74-77.

[2] 李艳双,曾珍香,张闽,等.主成分分析法在多指标综合评价方法中的应用[J].河北工业大学学报,1999,28(1):96-99.

[3] 宋之杰,高晓红.一种多指标综合评价中确定指标权重的方法[J].燕山大学学报,2002,26(1):20-22.

[4] 韩小孩,张耀辉,孙福军,等.基于主成分分析的指标权重确定方法[J].四川兵工学报,2012,33(10):124-126.

[5] 张东方,吴以中,宗良纲,等.主成分分析方法在农田土壤环境评价中的应用[J].江西农业学报,2008,20(7):36-38.

[6] 杨竞,童祯恭,刘玉哲.SPSS软件对饮用水水质进行主成分分析评价的运用[J].环境科学与技术,2011,34(7):171-174.

[7] 王秋璐,周燕遐,陈斐,等.基于SPSS的数理统计方法在海洋重金属环境背景值计算中的应用[J].海洋通报,2011,30(1):100-103.

[8] 刘科鹏,黄春辉,冷建华,等.“金魁”猕猴桃果实品质的主成分分析与综合评价[J].果树学报,2012,29(5):867-871.

[9] 张玉.SPSS软件和主成分分析法在牧草营养价值评价中的应用 [J].安徽农 业 科 学,2012,40(12):7186-7188.

[10] 王春娟,冯利华,陆小强.鄂尔多斯市水资源承载力的主成分分析[J].水资源与水工程学报,2012,23(1):77-80.

[11] 彭慧芳,魏久传,尹会永,等.基于主成分分析法的底板突水危险性评价[J].煤矿开采,2012,17(6):101-104.

[12] 丁明祯,郑双忠,潘开名.企业安全评价分析的主成分方法[J].工业安全与环保,2004,30(2):14-16.

[13] 方世敏,邓丽娟.基于主成分分析法的游客满意度评价研究[J].宁波职业技术学院学报,2012,16(5):20-23.

[14] 岳斯玮,胡灿.基于主成分分析对四川10年来城市发展评价[J].西南民族大学学报(自然科学版),2010,36(2):302-307.

[15] 王丽娜,陆迁.基于主成分分析的陕西省三大区域经济差异评价[J].西北农林科技大学学报(社会科学版),2012,12(1):66-71.

[16] 李东刚.主成分分析在实验室综合检测能力评定中的应用[J].实验室科学,2010,13(2):145-149.

[17] 孙彩玲,张永祥,田纪春.基于主成分分析的实验室比对中检测能力的综合评价[J].实验室科学,2012,15(2):118-121.

猜你喜欢
实验室测量评价
中药治疗室性早搏系统评价再评价
把握四个“三” 测量变简单
滑动摩擦力的测量和计算
电竞实验室
电竞实验室
电竞实验室
电竞实验室
滑动摩擦力的测量与计算
测量
基于Moodle的学习评价