袁雪,张柏畅,李会强
(1.天津医科大学医学检验学院,天津300070;2.天津医科大学第二医院输血科,天津300211)
甲状腺疾病是临床常见的内分泌疾病,近年来甲状腺功能亢进症(甲亢)及甲状腺功能减退症(甲减)的发病率逐渐增加,严重影响患者日常生活及工作[1-2]。《中国甲状腺疾病诊治指南》中对于甲亢及甲减的诊断必要条件均包括血清甲状腺功能检测。
临床中常见不同品牌间血清甲状腺功能检测结果存在差异,而当前研究往往重视检测结果数值的一致性[3],或是对进口仪器进行性能验证[4],但不同品牌检测系统由于其参考范围相差较大,理论上不宜开展对于血清甲状腺功能检测数值的可比性及一致性分析[5]。本研究依据多因素联合诊断ROC曲线及WS/T505-2017《定性测定性能评价指南》提供的McNemar 方案[6],评估不同进口品牌间5 项血清甲状腺功能检测项目临床诊断价值及诊断效能是否一致,探讨在不同检测机构间开展结果互信是否具有可行性。
1.1 临床资料 收集我院2018 年3 月—2019 年4月,初诊诊断为甲亢患者63 例,甲减患者66 例,患者均符合典型的临床诊断特征,甲状腺功能指标均符合甲亢或甲减的诊断标准[7],同时均未进入治疗期,选择与甲亢组及甲减组年龄、性别相匹配的健康体检人群70 名作为对照组,共计收集标本199个,每个标本分装3 份-80℃保存。
1.2 试验方案 分别选择血清甲功检测市场占有率较大的3 个进口品牌及仪器:罗氏Cobas E602(电化学发光法)、西门子Centaur XP(吖啶酯直接化学发光法)及贝克曼库尔特DXI800(碱性磷酸酶-金刚烷酶促化学发光法),分别检测分装样本中促甲状腺激素(thyroid-stimulating hormone, TSH)、FT4、FT3、T4及T3水平,保障各品牌试验日室内质控结果在控,同时试验仪器系统封闭,可溯源,仪器依据实验室SOP 文件定期执行周期性校准及保养维护。所有样本在每个品牌仪器上重复检测2 次,2 d 内检测完毕,记录均值。
1.3 多因素联合诊断ROC 曲线评价诊断价值 分别将Cobas E602、Centaur XP 及DXI800 检测的血清TSH、FT4、FT3、T4、T3均值记录,对每个品牌的5个检测结果采用Logistic回归计算合成概率,将临床诊断甲亢或甲减作为“金标准”,绘制ROC 曲线,比较各品牌曲线下面积(AUC)。同时分析以上形成的AUC 主要贡献来源,本研究将每个品牌的5 个检测项目分别组合或单独成组,采用Logistic回归计算相应合成概率,绘制ROC 曲线,比较不同组合项目AUC 与5 个项目联合AUC 是否有统计学差异,进而判断贡献AUC 的主要检测项目。
1.4 McNemar 方案评价诊断效能 ROC 曲线考虑了所有可能的诊断临界点的影响,而结合各品牌既定的临界点(参考范围上下限),采用McNemar 方案评价诊断效能。该方案常用来判断两种方法的临床敏感性和临床特异性之间是否有统计学差异。这种统计学检验没有假定一种方法优于另一种方法,而是认为两种方法均可能引起诊断错误,将两方法同时与诊断准确度标准比较,形成配对数据,进而计算两方法的临床敏感性之差及临床特异性之差的可信区间。本研究依据各品牌临界点(表1),结合甲亢、甲减数据变化特点,分别针对甲亢、甲减判断数据组阴阳性,将临床诊断作为金标准,3 个品牌两两比较计算临床敏感性及临床特异性。若两系统间临床敏感性之差及临床特异性之差的可信区间包括0,认为两品牌临床敏感性或临床特异性一致,诊断效能相当。
1.5 统计学方法 应用SPSS20.0 软件中二项Logistic回归计算合成概率,MedCalc 软件绘制ROC 曲线并比较不同品牌间AUC 大小。应用Excel 软件计算临床敏感性、临床特异性以及各自差值的置信区间。P<0.05 为差异有统计学意义。
表1 3 个品牌参考范围汇总Tab 1 Summary of the reference range for three brands
2.1 多因素联合诊断ROC 曲线分析
2.1.1 3 个品牌多项目联合检测对甲亢疾病的诊断价值一致性评价 5 个项目(TSH、FT4、FT3、T4、T3)联合检测ROC 曲线见图1,不同品牌AUC:Cobas=0.99、Centaur=0.98、DXI=0.99,三品牌两两比较AUC 之间差异无统计学意义(均P>0.05)。
为比较个别项目对AUC 的主要贡献,将每个品牌的5 个项目联合、3 个项目(TSH、FT4、FT3)联合及单独检测TSH 绘制ROC 曲线,具体AUC 结果及AUC 差异比较见表2,可得3 个品牌单独检测TSH的AUC 均与5 项或3 项联合检测AUC 无差异(均P>0.05),在初诊患者中对甲亢的诊断价值3 个品牌基本一致,同时TSH 的检测贡献了绝大部分AUC。
2.1.2 3 个品牌多项目联合检测对甲减疾病的诊断价值一致性评价 5 个项目(TSH、FT4、FT3、T4、T3)联合检测ROC 曲线见图2,不同品牌AUC 为Cobas=0.84、Centaur=0.832、DXI=0.81,3 个品牌两两比较AUC 之间差异无统计学意义(均P>0.05)
同样,为比较个别项目对AUC 的主要贡献,将每个品牌的5 个项目联合、3 个项目1(TSH、FT4、FT3)联合、3 个项目2(TSH、T4、T3)联合、单独检测TSH、单独检测FT4及单独检测FT3绘制ROC 曲线,具体见图3A-C,可得Centaur XP 5 个项目(AUC=0.83)与3 个项目1(AUC=0.82)的AUC 无差异,与其他组合及单项比较(AUC 在0.69~0.73 之间)差异明显(均P>0.05);CobasE602 5 个项目(AUC=0.84)与3 个项目1(AUC=0.83)的AUC 无差异,与其他组合及单项比较(AUC 在0.70~0.72 之间)差异明显(均P>0.05);DXI800 5 个项目(AUC=0.81)与3 个项目1(AUC=0.77)的AUC 无差异,与其他组合及单项比较(AUC 在0.61~0.72 之间)差异明显(均P>0.05)。可得在初诊患者中对甲减的诊断3 个品牌价值中等并基本一致,同时TSH、FT4、FT3的检测贡献了绝大部分AUC。
图1 3 个品牌5 个项目甲亢联合检测多因素ROC 图Fig 1 The ROC curve of multi-factor combined diagnosis for five projects cooperative detection with three brands in hyperthyroidism
图2 3 个品牌5 个项目甲减联合检测多因素ROC 图Fig 2 The ROC curve of multi-factor combined diagnosis for five projects cooperative detection with three brands in hypothyroidism
表2 甲亢患者每个品牌不同项目联合计算得AUC 及AUC 差异Tab 2 AUC calculated by different cooperative detected projects of every brand in hyperthyroidism and its difference
图3 甲减患者每个品牌不同项目联合绘制ROC 曲线Fig 3 The ROC curve drawn by different cooperative detected projects of every brand in hypothyroidism
2.2 McNemar 方案评价两两品牌间临床敏感性及临床特异性 针对不同品牌参考区间,依据2.1 结果,选取影响AUC 较大的TSH、FT4、FT3项目,判断甲亢及甲减患者3 项目检测结果阴阳性,3 个品牌两两配对,比较配对两品牌之间临床敏感性及临床特异性,见表3。对于甲亢患者:TSH 项目Centaur 的临床敏感性优于Cobas 及DXI,Cobas及DXI 的临床特异性优于Centaur,其他所有比对临床敏感性及特异性均一致。对于甲减患者:FT3项目,Centaur 的临床敏感性优于Cobas 与DXI,临床特异性基本一致;FT4项目,临床敏感性DXI 优于Cobas,Cobas 优于Centaur,临床特异性DXI 明显低于Cobas 与Centaur;TSH 项目,临床敏感性Cobas 优于Centaur,Centaur优于DXI,临床特异性与之呈相反关系。
表3 McNemar 方案评价两品牌间临床敏感性及临床特异性Tab 3 Evaluate the clinical sensitivity and specificity between the two brands that based on McNemar scheme
甲状腺疾病是临床常见病,作为内分泌领域第二大疾病,其发病率逐渐增加,以甲亢和甲减最为常见。甲亢是由于甲状腺腺体本身功能亢进,合成和分泌甲状腺激素增加所致的甲状腺毒症,其可加速机体新陈代谢,增加机体能量消耗;甲减是由于甲状腺激素合成和分泌减少或组织利用不足导致的全身代谢减低综合征。无论是何种类型疾病,均对患者身体健康构成一定危害,因此甲亢及甲减的二级预防应引起足够重视,早发现、早诊断、早治疗对改善患者生存质量具有重要意义[8-9]。
临床医生日常诊治过程中,常发现不同进口品牌仪器间的血清甲状腺功能检测结果数值一致性较差,并且不同检测项目的组合在疾病诊断中的异常表现也不尽相同,导致品牌间的结果互认较难开展,造成大量重复检测。
本研究利用多因素联合诊断ROC 曲线分析市场占有率较大的3 个品牌即罗氏、西门子及贝克曼之间在甲亢及甲减项目中的诊断价值。所得结论为:对于甲亢的诊断,3 个品牌5 个项目联合检测的临床诊断价值均较高并一致(AUC 在0.98~0.99 之间),同时TSH 的单独检测结果贡献了绝大部分曲线下面积(AUC 在0.98~0.99 之间),即3 个品牌同时 检 测TSH、FT4、FT3、T4、T3与 单 独 检 测TSH 的AUC 无统计学差异,故在甲亢的初诊诊断中,TSH的诊断价值尤为重要,同时3 个品牌能够做到该项目的诊断价值一致;对于甲减的诊断,3 个品牌5 个项目联合检测的临床诊断价值均中等并一致(AUC在0.81~0.84 之间),同时经过不同项目组合筛选,3个品牌TSH、FT4、FT3联合检测与5 个项目联合检测相比,AUC 无差异,故在甲减的初诊诊断中,TSH、FT4、FT3的诊断价值尤为重要,同时3 个品牌能够做到该3 个项目的诊断价值一致,但其对于甲减的诊断价值不及甲亢。
本研究同时依据各品牌的参考范围判断各数据阴阳性,以临床诊断为金标准比较3 个品牌的诊断效能。所得结论为:对于甲亢,TSH 项目临床敏感性西门子>罗氏=贝克曼,临床特异性罗氏=贝克曼>西门子,其他临床敏感性和特异性均一致,故结合参考范围的设定,3 个品牌的TSH、FT4、FT3,临床诊断效能基本一致,其对临界点的设定能够满足对甲亢的诊断并诊断效能基本一致,西门子在获得更好临床敏感性的同时放弃了一部分临床特异性。对于甲减,FT3临床敏感性西门子>罗氏=贝克曼,均较低(13.70%~27.41%),临床特异性基本一致;FT4临床敏感性贝克曼>罗氏>西门子,临床特异性西门子=罗氏>贝克曼;TSH 临床敏感性罗氏>西门子>贝克曼,临床特异性贝克曼>西门子>罗氏。故3 个品牌对临界点的设定,在甲减的诊断中互有优势,西门子FT3项目临床敏感性优于其他两个品牌,但FT4临床敏感性最低,TSH 临床敏感性中等水平;罗氏TSH临床敏感性优于其他两个品牌,但FT4临床敏感性中等水平,FT3临床敏感性与贝克曼持平但稍差于西门子;贝克曼FT4临床敏感性优于其他两个品牌,但TSH 临床敏感性最低,可见,单次血清TSH 检测值作为亚甲减的诊断依据存有技术不确定性,这与徐清芳等[10]、王婷婷等[11]的研究所得结论类似。通过表3 可得出无论是甲亢或甲减疾病,以品牌既定临界值(参考范围上下限)辅助诊断疾病,FT3及FT4的临床敏感性均较低,临床诊断效能有待提高。
综上所述,罗氏Cobas E602、西门子Centaur XP及贝克曼DXI800 检测血清甲状腺功能项目,对于甲亢的诊断价值较高并基本一致,对于甲减的诊断价值中等并一致;同时以品牌既定临界点辅助诊断甲减,从临床敏感性及临床特异性的角度来看,3个品牌互有优势;但在FT3及FT4的检测上,无论是甲亢或甲减疾病,3 个品牌临床敏感性均较低,临床诊断效能有待提高。基于上述研究,在甲亢的临床诊断方面,可建议使用该3 种品牌的检验机构开展检验结果互信,以减少重复检验,节约医疗资源。