王 薇 张志新 张传宝 周伟燕 王治国
(北京医院 国家老年医学中心 国家卫生健康委临床检验中心 北京市临床检验工程技术研究中心中国医学科学院老年医学研究院,北京 100730)
如何设定性能规范是检验医学领域多年来备受关注的问题。关于性能规范的设定,国内外均有诸多研究方法和成果[1-7]。我国临床检验项目室间质量评价(external quality assessment,EQA)标准多参考美国临床实验室改进修正案能力验证评价限,但这个标准缺乏客观、合理的依据和大数据支持。本研究根据意大利米兰会议最新确定的性能规范设定模式[3],分别基于分析性能对临床结果的影响、基于被测量的生物学变异(biological variation,BV)数据和基于当前技术水平设定性能规范。基于BV导出的性能规范具有客观依据,适用已经根据人群或特定个体建立BV数据的大部分检验项目;基于当前技术水平设定的性能规范主要来源于室内质量控制(internal quality control,IQC)数据。准确度、精密度和正确度[8]是临床检验定量测定项目中非常重要的3个性能特征,其相应的性能规范可分别表示为允许总误差(allowable total error,TEa)、允许不精密度[以变异系数(coefficient of variation,CV)表示]和允许偏移(bias,Bias)。目前,我国临床实验室广泛开展的内分泌相关检验项目有甲状腺激素、性激素、肾上腺激素等,用于内分泌疾病诊断、病情评估和疗效监测。本研究对22个内分泌检验项目进行性能规范研究,旨在帮助临床实验室选择和设定合理的性能规范,保证检验结果的准确性。
1.1.1 资料收集
访问欧洲临床化学和检验医学联合会生物变异数据库[9],采集22个内分泌检验项目(有19个查到BV数据)最新的BV数据,并通过公式[10](表1)分别推导出基于BV的3个水平的TEa、允许CV和允许Bias。22个项目为:游离三碘甲状腺原氨酸、总三碘甲状腺原氨酸、游离甲状腺素、总甲状腺素、促甲状腺激素、皮质醇、雌二醇、卵泡刺激素、黄体生成素、孕酮、催乳素、睾酮、C-肽、叶酸、胰岛素、甲状腺球蛋白、甲状旁腺激素、醛固酮、硫酸脱氢表雄酮、维生素B12、生长激素、促肾上腺皮质激素。
表1 基于BV数据导出的TEa、允许CV和允许Bias的计算公式
1.1.2 EQA和IQC数据
收集参加国家卫生健康委临床检验中心2020—2022年内分泌项目EQA活动的实验室的回报数据(包括质控品的批号、靶值和测量结果),每次EQA活动实验室回报数据时,同时回报前1个月的IQC数据,包括IQC的均值、标准差、质控规则、在控结果个数、当月在控CV。EQA每年2次,每次5个批号,共收集30个批号的数据。IQC每次2个批号,共收集12个批号的数据。
1.2.1 基于BV的模式
1)TEa的推导。基于EQA数据,根据公式:百分差值=(测量结果-靶值)/靶值×100%[7],计算每个批号质控品测量结果的百分差值,将其与基于BV导出的不同水平TEa进行比较,如百分差值≤BV导出的某水平TEa,则确定为通过该水平TEa的要求。计算所有批号的通过率,如通过率达到80%,则该评价标准可作为该项目推荐TEa的要求。若经比较和计算,基于BV导出的3个水平的TEa均不满足作为推荐TEa的要求,则需要基于当前技术水平导出推荐TEa。
2)CV的推导。基于每年的IQC数据,按照批号将每个实验室上报的“当月在控CV”分别与BV导出的不同水平允许CV进行比较,如“当月在控CV”≤BV导出的某水平允许CV,则将其确定为通过该水平CV的要求。计算所有批号的通过率,如通过率达到80%,则该评价标准可作为该项目推荐允许CV的要求。若经比较和计算,基于BV导出的3个水平的CV均不满足作为推荐CV的要求,则需要基于当前技术水平导出推荐CV。
1.2.2 基于当前技术水平模式
基于当前技术水平模式适用于无BV数据的检验项目,或有BV数据却无法使用基于BV导出的性能规范作为推荐性能规范的检验项目。
1)TEa的推导。百分差值分布曲线总体上呈近似正态分布,且中位数在0附近,数值有正有负,可将各批号所有实验室百分差值的第10百分位数(P10)~第90百分位数(P90)作为该批号80%实验室的百分差值分布区域。根据公式:TEa当前=1/2×(P90-P10)[7],计算当前技术水平TEa。为让大多数实验室可以通过要求,取各批号中最大的TEa当前作为推荐TEa。
2)CV的推导。在各项目的IQC数据中,每个批号“当月在控CV”的第80百分位数(P80)可作为该批号基于当前技术水平推导出的允许CV当前。为让大多数实验室可以通过要求,取各批号最大的CV当前作为推荐CV。
1.2.3Bias的导出
将Westgard提出的总误差计算公式转化为:|Bias|≤TEa-z×CV(z通常为1.65)[11],通过代入导出的推荐TEa和允许CV,计算出|Bias|的最大值。
2020—2022年,22个内分泌检验项目中,参加实验室数最多的项目是促甲状腺激素(3 555家),最少的是硫酸脱氢表雄酮(291家)。见表2。
表2 22个内分泌检验项目各年参加实验室数 家
基于BV导出的性能规范见表3。对有BV数据的19个检验项目,分别计算各项目各批号质控品百分差值通过率和当月在控CV通过率,其分布情况见表4。有13个检验项目使用基于BV导出的性能规范作为推荐性能规范;胰岛素项目仅使用基于BV推荐的CV;有5个项目(游离三碘甲状腺原氨酸、游离甲状腺素、总甲状腺素、黄体生成素、硫酸脱氢表雄酮)未推荐基于BV导出的3个水平性能规范(太严或太宽松),见表5。
表3 基于BV导出的性能规范 %
表4 19个检验项目基于BV的3个水平百分差值和当月在控CV通过率 M,%
表5 各检验项目推荐的TEa、允许CV、允许Bias %
本研究有3个检验项目(维生素B12、生长激素、促肾上腺皮质激素)未查到相关BV数据,有6个检验项目(游离三碘甲状腺原氨酸、游离甲状腺素、总甲状腺素、黄体生成素、胰岛素和硫酸脱氢表雄酮)未推荐基于BV导出的TEa,这9个检验项目基于当前技术水平推荐TEa。分别计算上述9个检验项目各批号百分差值的P10、P90和TEa当前,结果见表6。本研究有8个检验项目(维生素B12、生长激素、促肾上腺皮质激素、游离三碘甲状腺原氨酸、游离甲状腺素、总甲状腺素、黄体生成素、硫酸脱氢表雄酮)需要基于当前技术水平推荐允许CV,分别计算各项目各批号当月在控CV的P80,取各批号最大的P80作为推荐CV。
表6 基于当前技术水平导出的性能规范 %
将Westgard提出的总误差计算公式转化为下述公式:|Bias|≤TEa-z×CV(z通常为1.65),代入导出的推荐TEa和允许CV,计算出推荐的允许Bias。见表5。
本研究根据意大利米兰会议最新确定的性能规范设定模式,基于BV和基于当前技术水平模式导出性能规范,参加实验室众多,且有EQA和IQC大量数据的支持,因此推荐的性能规范较为合理。
基于BV 导出性能规范的模式已经较为成熟,直接受个体内BV(CVI)和个体间BV(CVG)的影响。本研究所用的BV数据来源于国外,所以在基于BV推荐性能规范时要结合我国实验室的情况,因此有些项目虽然满足1个或多个水平的要求,但并未推荐。例如:游离三碘甲状腺原氨酸 、游离甲状腺素、总甲状腺素和硫酸脱氢表雄酮4个项目,基于BV适当水平和最低水平的百分差值通过率均超过80%,若是推荐这个TEa,将给实验室允许CV的设定带来很大压力;胰岛素和黄体生成素这2个项目,基于BV的3个水平的百分差值通过率均超过80%,但相应的TEa或有些严格或过于宽松。鉴于以上情况,并未推荐基于BV导出的TEa,但在基于当前技术水平推荐TEa时,7个项目计算出的TEa当前也比较严格,因此推荐了2022年国家卫生健康委临床检验中心EQA使用的评价标准[12]。基于当前技术水平推荐TEa仍需深入研究,以提供更为客观、合理的方法。
本研究也存在不足。首先,EQA数据百分差值部分,百分差值通过率普遍较高,且基于当前技术水平推荐的TEa较为严格,目前的EQA评价多采用分组(仪器或试剂)的方式,靶值是由参加者确定的公议值[13](稳健平均值),说明实验室同一检测系统结果的一致性较好。EQA可以反映实验室的当前检验水平,但也存在一定的局限性。其次,IQC数据CV部分。由于参加实验室使用的质控品、方法、仪器和试剂不同,上报的CV会有较大的差异,可能导致部分项目推荐的允许CV较大。第三,理想情况下,对任一分析物进行测定最为科学的方法是根据不同的浓度水平设定不同的性能规范,但在实际工作中这样做难度较大。澳大利亚皇家病理学家学会质量保证计划[14]部分项目的评价标准设定了特定的浓度分界点,大于此分界点以百分位数表示,小于此分界点则用绝对值表示。第四,本研究用来计算推荐允许Bias的公式是以Westgard提出的总误差计算公式为基础转化而来的。正确度验证计划可以获得真正的偏移,但是由于目前开展的计划有限,参加的实验室较少,本研究根据Westgard提出的总误差计算公式得出偏移,可为实验室进行方法确认与性能验证提供数据参考,鼓励更多的临床实验室参与,从而为更多检验项目制定更为客观、合理的允许Bias。
实验室在制定性能规范的时候,应同时考虑TEa、允许CV和允许Bias。确定CV时,TEa制定得太宽,不利于实验室的质量改进,检测结果敏感性不足以反映患者病情的变化,无法进行重大医疗决策;TEa制定得太严格,可能给实验室本身造成过大的压力。实验室可通过转化为西格玛水平[σ=(TEa-Bias)/CV],用西格玛度量进一步评价检验项目的性能,选择适合的质控规则[15]。