周伟燕,刘庆香,刘珍妮,邓宇航,张传宝(.北京医院 国家老年医学中心 国家卫生健康委临床检验中心 北京市临床检验工程技术研究中心 中国医学科学院老年医学研究院,北京00730; 2.中国医学科学院 北京协和医学院,北京00730)
精确诊断和治疗离不开准确可比的实验室检测结果。临床专家在推荐和制定医学决定水平和诊断切点的时候,往往不考虑测量系统之间的区别,因此无论是哪种方法或哪家实验室得出的结果都应该准确可比。计量溯源能使检测结果溯源到高级别的参考系统,是保证终端实验室检测结果准确可比、实现标准化的重要途径[1]。本文就计量溯源性和参考系统相关内容进行介绍和总结。
计量溯源性(metrological traceability)是测量结果的一种属性,也称“量值溯源”,通过文件规定的不间断的校准链将测量结果与参考标准联系起来,校准链中的每项校准均会引入测量不确定度[2]。计量溯源是确保在不同时间和/或不同实验室的测量结果具有可比性和同质化的过程。计量溯源的理想目标是,终端实验室与最高等级的参考测量程序测定同一患者样本得到相同结果,均可溯源至国际单位制(SI)单位[3]。当不能溯源到SI单位时,结果的可比性可通过其他不太理想的方式实现,如通过约定的测量程序或校准物暂时实现一致化。
计量溯源最初是为了商业而发展的,在物理和化学领域发展较早较成熟,在这些领域实现测量结果溯源到SI单位相对简单,因为测量的量如质量或长度等都是具有明确定义的量,通常可以用特定方法直接测量。相比之下,临床实验室的待测量则较为复杂,通常为复杂基质(如血清)中的生物标志物,很难根据分子结构和质量进行明确定义。除了细胞计数这类可以直接测量的项目之外,绝大部分待测物都无法通过检测系统进行直接测量,因此检测结果受影响的因素较多,结果可比性较差。
检测是临床实验室的核心活动,应确保检测结果溯源到可获得的最高参考标准[4],这对改善结果的可比性至关重要,有助于促进统一的参考区间的使用及临床研究和循证医学研究。1979年,Tietz[5]在其文章中主张临床检验领域可通过“全面、连贯的测量系统”模式实现测量结果的量值溯源,此测量系统含有不同层次,包括决定性方法、参考方法和参考物质。得益于Tietz的倡导和临床检验工作者的努力,计量溯源性在检验医学领域发展良好,可有效改善患者的诊疗水平,降低重复测量次数,减少医疗支出。研究显示,胆固醇测量出现3%正偏倚时会使确诊为高胆固醇血症的患者增加约9%,而10%的正偏倚会使患者假阳性率增加约28%[6]。据统计,美国通过实施胆固醇标准化计划,降低了实验室间检测变异(CV从18%降到<5%)。由于减少了重复检测和诊断错误,每年可节省超过1亿美元的医疗费用[7]。因此,建立计量溯源是临床检验领域应积极开展的一项重要任务。
为了指导临床实验室和诊断试剂厂家进行计量溯源,2003年国际标准化组织(ISO)发布了第1版ISO 17511:2003[8],旨在为临床实验室校准品和质控品的赋值提供计量溯源性策略。此标准的实施使计量溯源的概念深入临床检验领域,极大地促进了临床检验工作标准化,提高了检测结果的准确性和可比性。我国也将此标准转化为国家标准或相关指南[9-10]。此版标准具有一定的局限性,如:不适用于酶学项目,酶学相应的溯源标准为ISO 18153:2003[11-12];未说明须溯源的质控品为何种质控品;重点并非终端临床样本检测结果的溯源性。在此后十多年里,此标准分别于2013年11月、2014年4月、2014年10月、2015年4月、2015年11月进行了多次修订,并于2020年4月发布了第2版ISO 17511:2020[13]。
2.1第2版对第1版的修订要点 新版将ISO 18153酶催化浓度赋值的计量学溯源性的重要概念整合进来,提供了催化活性和催化活性浓度的计量溯源路径;规定酶催化活性浓度可溯源到SI单位。
新版修改了标准的标题和范围,赋值的溯源性要求从校准品和质控品扩展到患者样本,明确样本检测结果应能追溯到目前可获得的最高级别标准。
新版更新了专用术语的规范性引用文件,删除了国际计量学基础和通用术语(第2版,ISO,日内瓦,1993)和ISO 指南35:1989。
新版明确定义体外诊断设备制造商在校准品、正确度质控品和患者样本赋值中建立和记录计量溯源信息方面的要求。
新版增加了计量溯源校准等级的新模式,如酶催化浓度测量的模式(以前在ISO 18153:2003谈及)以及赋值溯源到国际一致化方案的情况(ISO 21151的要求)
2.2校准等级的划分 第1版将溯源校准等级分为5类,第1类可溯源到SI单位,其余4类均不可溯源到SI单位。第2版修改为6种校准等级,前3类均具有参考测量程序(reference measurement procedure,RMP),可溯源到SI单位。第1版和第2版校准等级的比较见表1。第2版中强调校准等级中的二级校准品、体外诊断医疗器械(简称IVD MD)工作校准品、IVD MD产品校准品互通性的重要性。
表1 2003版和2020版ISO17511校准等级的区别和比较
2.2.1具有RMP和一级参考物质(RM)的情况 可溯源至SI单位(图1):此模式为最理想的校准溯源模式,终端用户检测结果可溯源到最高等级的一级RM,被测量的校准等级得到己有的RMP(p.3)和一级RM(m.1,有证参考物质CRM)支持并可完全溯源到SI单位。此处的RMP(p.3)即指满足ISO 15193要求的RMP,如NIST建立的同位素稀释气相色谱质谱法和我国国家卫生健康委临床检验中心(NCCL)建立的测定血清胆固醇的RMP。我们通常所说的参考方法大多是指RMP(p.3),此程序经过一级RM校准,并对二级RM(m.3,一般为具有互通性的基质参考物质,如多项目冰冻血清参考物质NIST SRM909C,我国血脂冰冻血清一级标准物质GBW09178等)赋值。满足此模式的项目通常为化学定义明确的小分子化合物,包括电解质类物质(如钾、钠、氯、镁、钙、锂离子等)、代谢物类物质(如胆固醇、三酰甘油、葡萄糖、肌酐、尿酸、尿素等)和某些类固醇激素、甲状腺激素、维生素类物质等。
图1 完整计量溯源至SI的情况
2.2.2具有一级RMP,无一级RM的情况 可溯源至SI单位(图2):此模式主要针对于催化活性和催化活性浓度项目。在此模式下,被测量具有确定的一级RMP(p.3),没有真正意义上的一级RM,测量结果可溯源到SI单位。其中一级RMP指测定结果独立于校准品等测量标准的RMP,如重量法等基准测量方法,但此处指一套完整详细的测量程序。此模型纳入ISO 18153酶学催化活性浓度校准模式,可溯源到SI单位。酶学项目、某些凝血因子(如凝血因子Ⅷ)都属于此类校准模式。
图2 由RMP定值但没有一级RM的情况
2.2.3具有经特定的一级校准品校准的RMP的情况 可溯源至SI单位(图3):此模式的被测量由RMP(p.3)确定,RMP被特定的一级校准品(m.2)校准,结果可溯源到SI单位。此溯源链与第1种溯源链很相似,不同的是RMP(p.3)检测的是被测量的1个组分量(例如1个多肽片段或者1个位点)不是被测量的整个分子。如液相色谱串联质谱法测定糖化血红蛋白A1c(HbA1c)及同位素稀释质谱法测定C反应蛋白。
2.2.4有国际约定校准品的情况 不可溯源至SI单位(图4):该模式只适用于具有国际约定校准品的被测量(m.3),此校准品符合ISO 15194要求。不具有RMP(p.2),没有一级RM(m.1)或一级校准品(m.2),不能溯源到SI。国际约定校准品(m.3)的赋值是人为约定的数值,由国际上达成共识的赋值方案(p.3)进行赋值,此方案被认为是被测量最高等级的计量学溯源标准。该模式主要适用于具有WHO国际标准物质的项目,如癌胚抗原、肾素等。
图3 由使用特定一级校准品校准的RMP定值被测量的情况
图4 由国际约定校准品定值被测量的情况
2.2.5国际一致化方案支持的情况 不可溯源至SI单位(图5):此模式纳入了ISO 21151中的校准等级,只适用于具有国际一致化方案的被测量。没有一级RM(m.1)和国际认可的RMP(p.3),也没有约定的RMP或RM,无法溯源到SI。如TSH,此项目具有国际一致化工作方案。
2.2.6被测量只溯源到制造商内部人为规定的RM的情况 不可溯源至SI单位(图6):在此模式下,以上5种高级别的溯源标准均不可得,没有一级、二级和约定校准物质,没有RMP,没有一致化方案支持,被测量的最高溯源标准为制造商内部规定的校准物质。目前临床检验大多数检测项目符合此模式,尤其是免疫类和微生物类项目,如肿瘤标志物、抗体和衣原体等项目。
图5 通过国际一致化方案对被测量定值的情况
图6 由制造商内部任意定义的RMs对被测量定值的情况
由以上校准溯源链可知,实现检测结果的量值溯源和标准化离不开参考测量系统(reference measurement system,RMS),简称“参考系统”。在2020版ISO 17511中,参考系统包括:(1)测量单位;(2)被测量的定义;(3)RMP;(4)RM;(5)1个或多个提供参考测量服务的实验室。通常认为的参考系统包括RMP、RM和参考测量实验室(reference measurement laboratory,RML),其中RMP和RM是参考系统的关键[4]。RMP指测量结果能够满足其预期用途的测量程序[2],用于评价测量同一量的其他测量程序的正确度和为RM进行赋值或评价。RMP需经过详尽的研究,在溯源校准等级中使用的RMP需满足ISO 15193[14]的要求。RM指一种或多种特性值足够均匀和稳定的材料,用于校准和评价测量系统,以及给其他物质赋值或提供质量保证[15]。用于校准的RM需满足ISO 15194[15]的要求,除了均匀性和稳定性满足要求之外,还要对校准的常规系统具有互通性。
RML指运行RMP的实验室,提供计量校准服务的RML需满足ISO 15195[16]的要求。制造商或临床实验室可以选择符合ISO 15195标准的RML提供参考测量服务,以实施计量溯源校准体系。所选的RML应证明有能力为所选的测量提供最佳可用的测量方法,并保证样本检测结果的计量溯源性在规定的校准等级范围内。
符合ISO 15193要求并获得权威机构认可的程序才是真正的“参考测量程序”。为了指导和促进临床检测结果在世界范围内的可比性和等价性,以改进临床诊疗,为检验医学测量标准溯源提供全球化平台,国际检验医学与溯源联合委员会[17](The Joint Committee for Traceability in Laboratory Medicine,JCTLM)应运而生。JCTLM的一项重要工作[18]就是鉴别和遴选国际上急需开展溯源性和可比性的检验指标,鼓励适当的机构建立合适的RMP、研制有证RM并提供参考测量服务。成立之初只有2个工作组,即WG-1和WG-2。WG-1是RM和RMP工作组,WG-2负责RML工作,指导国际参考实验室能力验证(external quality assessment scheme for reference laboratories in laboratory medicine,RELA)计划的开展。2016年,WG-1和WG-2合并为数据库工作组(Database Working Group,DBWG),同时成立新的溯源工作组(Working Group on Traceability,TEPWG)。DBWG的任务是评审有证RM、RMP和RML的参考测量服务,满足要求的实验室被列入JCTLM数据库,按分析物的不同分别设有9个专家小组。TEPWG主要进行量值溯源推广和教育工作,以减少方法学的差异及改善临床结果和患者安全。2018年新成立了第3个工作组即参考测量系统应用工作组(Task Force on Reference Measurement System Implementation,TF-RMI)。TF-RMI主要负责开展参考测量系统的整理工作,评价其计量溯源完整性方面的工作[19]。
JCTLM致力于促进和指导检验医学标准化,提供全球化的溯源平台,是全球最权威的医学参考测量能力评审机构。JCTLM每年发布RMP、RM和RML目录并组织RMP的能力验证活动,使全世界有统一的参照标准[20]。JCTLM对RMP的评价要求为:(1)满足ISO 15193的要求;(2)方法的信息经公开发表;(3)与现有的RMP进行比对。对RML的要求为符合以下3个条件:(1)通过ISO 17025和ISO 15195认可;(2)RELA实验成绩符合要求;(3)采用JCTLM公布的RMP。截止2020年2月,该数据库列出了涉及173个检测项目的303份有证RM,87个项目的201项RMP(其中质谱方法135项,占半数以上)和19家RML提供的针对40个项目的135项参考测量服务。其中NCCL有7个RMP[21-26]进入JCTLM参考测量程序列表,中国计量科学研究院和NCCL也有多个项目的RM进入JCTLM参考物质列表,NCCL、上海市临床检验中心、北京航天总医院、广东省中医院、南通大学附属医院、四川迈克公司、宁波美康公司和深圳迈瑞公司的多个项目的测量服务也进入到JCTLM的参考服务列表中。
互通性是RM的一种重要属性,也是RM在不同测量程序间测定结果保持一致的关键性能参数[27]。在校准溯源链上,RM(除一级RM或一级校准品外)具有互通性是保证检测结果溯源性的关键环节,也是RM用于量值溯源与传递的技术基础[28]。当前,由于绝大多数临床项目分析物对被测量的代表性不足、RM基质不同等原因,导致RM在不同测量系统之间不具有互通性。因此,无论是RM生产者还是医学实验室工作人员均应重视互通性。2010年和2014年美国临床和实验室标准协会(Clinical and Laboratory Standards Institute,CLSI)发布的EP30-A[29]和EP14-A3[27]及2018年IFCC介绍的互通性评价新方案[30-31]提供了详细的RM互通性评价方法,有助于RM生产者、临床实验室制造及使用互通的RM,促进临床实验室检验结果的正确性和溯源性。
众所周知,不同项目在实验室间检测结果的可比性不尽相同。化学性质简单的小分子化合物,如电解质和胆固醇,往往表现出高度的标准化,不同系统检测结果具有较好的准确性和可比性。因为这些项目可以使用成熟的、稳健的检测方法进行检测,结果可溯源到较高等级的RMP或RM。而多数免疫方法测定的项目,则具有较大的挑战性和不一致性,不能实现标准化。阻碍这类分析物实现标准化的因素主要包括没有国际有证RM或RMP,制造商使用不同的校准品且不能溯源到同一标准;使用的免疫方法性能不佳,抗干扰能力较差;试剂厂商对同一分析物识别的抗原或表位不同;试剂厂商对同一分析物同一抗原或表位采用不同的捕获或检测抗体。这种抗原或抗体不同造成的检测差异往往是明确的且不可避免的,因为专利的限制使得不同的厂商只能有意或无意的采用不同的检测策略,这些原因造成了同一项目不同系统检测结果不具有可比性。无论使用何种分析系统,临床检验医学的目的是能够在世界各地任何实验室的任何样本上产生正确且“真实”的结果,检测系统的性能应在空间和时间上具有可比性,并满足临床需要。
实验室检验结果标准化与一致化是减少方法间偏差和实现方法间检测结果准确可比的基础[15]。一致化指不同实验室不同方法在检测相同临床样本时得到的检测结果一致可比,标准化指符合参考溯源体系的一致化。标准化的实现有赖于建立其完整的参考溯源体系。标准化和一致化的依据来源于ISO 17511。对于可溯源到SI单位的项目,我们需要努力实现标准化,使终端用户的检测结果可以通过不间断的校准链溯源到SI单位,如代谢物类、酶学项目、HbA1c等。后3类等级的项目不能溯源到SI单位,我们需要按其临床意义的重要性排序并对重要项目暂时实现一致化。一致化只是一个中间过渡阶段,随着技术的进步,最终会逐渐实现标准化。
室间质量评价计划(external quality assessment,EQA)又称实验室能力验证(proficiency testing,PT),是标准化计划不可或缺的一部分,用于评估不同实验室在检测同一份样本时是否达到期望水平的方法。为了评价和改进参考实验室的检测能力,2003年由IFCC与德国临床化学和检验医学协会(German Society for Clinical Chemistry and Laboratory Medicine,DGKL)联合开展了参考实验室的能力验证,即RELA,是针对参考方法的EQA计划。参加RELA比对且检测结果在等效限范围内,是申请JCTLM列表中RML服务的必备条件。此计划每年进行1次,每个项目2个水平冻干基质样品,目前参加实验室近一半来自中国。NCCL于2007年发起了国内参考实验室比对计划(external quality assessment scheme for reference laboratories in China,EQARL),起初仅针对酶学项目,现已发展为涵盖酶学、代谢物、总蛋白和胆红素、电解质、甾体激素、脂类、甲状腺激素、HbA1c、维生素、高半胱氨酸等34个项目的比对计划,2020年参加实验室25家。EQARL计划每年1次,大多使用冰冻人血清样品并通过干冰冷链运输。值得说明的是,为了提高我国RML的检测能力,促进国内检测结果标准化和量值溯源,从2021年起满足NCCL要求的实验室可免费参加。
2011年,中国合格评定国家认可委员会(CNAS)开始进行RML认可。认可的标准包括了ISO 17025和ISO 15195,至2020年9月已有16家国内RML的部分项目通过了CNAS认可,其中6个来自医院或临床检验中心,10家为企业实验室。由于CNAS是国际认可论坛(IAF)、ILAC、亚太实验室认可合作组织(APLAC)和太平洋认可合作组织(PAC)的正式成员,并签订有互认协议,所以其认可活动已经融入于国际认可互认体系。实验室获认可项目的测量报告在国际范围内均可得到同行互认。参加RELA或EQARL计划,并获得满意的结果,是申请我国CNAS医学RML认可的必需条件之一。
相比较欧美发达国家,计量溯源的概念和参考系统工作在我国起步较晚,但是发展较快。经过检验领域各方专家多年的努力,我国目前已建立起三十多个项目的RMP,多项RMP、RM和参考测量服务进入JCTLM数据库。我国的参考实验室EQA计划最近几年也迎头赶上,大多数EQARL计划已通过ISO 17043认可,在质评样本的质量、项目的数量、检测结果的满意程度等方面均得到很大提高。但我们仍应当看到同发达国家之间差距:首先在参考测量系统中,含金量最高、最具有创新性和影响力的是RMP,我国目前仅有7个RMP得到国际认可,还需要完善和发展,争取获得更多的国际公认。其次,不同于欧美国家的配套检测系统,我国主要以非配套系统为主,因此实现校准溯源并不仅仅与仪器制造商有关,更是各种非配套检测实验室的工作。我国的国情使得校准溯源和研制具有互通性的RM更为重要。另外,我国目前在治疗药物浓度监测项目的参考系统方面几乎处于空白阶段,需要加快推进此类项目的参考体系建设,为临床患者提供准确可溯源的药物浓度信息。