正确理解和运用“金标准”一词

2023-03-10 01:56:27何权瀛

临床内科杂志 2023年1期

何权瀛

在阅读中文医学文献或审稿时常常发现一种比较常见的现象，即滥用“金标准”这个词。如在有关慢性阻塞性肺疾病(简称慢阻肺)诊疗中，许多作者常写到“肺功能测定是诊断慢阻肺的金标准”，或者说“胸部高分辨CT是诊断支气管扩张的金标准”，而在有关睡眠呼吸障碍疾病诊断时又说“多导睡眠图(PSG)是诊断阻塞性睡眠呼吸暂停(OSA)的金标准”，还有作者提出“胸部增强CT(CTPA)是诊断肺栓塞的金标准”等。这种情况较为常见，在此不具体列出文献出处。笔者认为上述表述存在问题，肺功能测定、拍摄胸部CT或CTPA、进行PSG检测，这些检查都只是一种临床检测手段和方法，并非具体诊断标准，所以将某种或某些辅助检查方法说成是某种疾病的诊断标准，从逻辑学和概念上来说是错误的。即使进一步说明在某种疾病诊断中规定了某种检查结果的具体诊断标准，也不一定就是所谓的“金标准”。

为了清楚地说明这个问题，我们先来谈谈疾病诊断中的标准与病征的关系。临床医生在确立诊断时，首先要通过必要详尽的询问病史和全面准确的体检后，建立一个初步拟诊(即印象)，然后再根据临床需要和患者的具体情况(包括患者及其家庭经济承受能力、当时当地的医疗条件)开出一系列辅助检查项目，之后再对各种辅助检查结果进行综合分析。各种疾病诊断时依据的临床思维模式大致可分为以下3种：(1)充足征+必要征+否定征——确定诊断；(2)可能征+必要征+否定征——可能诊断；(3)必要征+否定征——除外诊断。

必要征(恒见征)：即此种病征100%(或接近100%)出现于某种疾病，因此要诊断该病此征是必要的，但未必是充分的，因为这种病征很有可能见于其他疾病。如绝大部分急性肺血栓栓塞患者的D-二聚体水平均会明显升高，即此项检查结果阳性，对于肺栓塞的诊断敏感度很高，属于必要条件。因此如果某一患者D-二聚体检查结果为阴性，临床上多不考虑肺血栓栓塞的诊断。但这一结果并非充分条件，因为许多其他外伤、出血性疾病患者都可能出现D-二聚体水平升高，但这些患者不一定均发生肺血栓栓塞。

充足征(仅见征)：此种病征仅见于该疾病，不会见于其他疾病，但并不一定是诊断某种疾病的必要征。充足征的含义是出现该征时有100%的把握诊断该疾病，但并非此征100%会出现于该疾病。前一句话表示其他疾病不会出现此种征象，而后一句话则是指并非所有患者均会出现此征。如从痰涂片中检查到结核杆菌和诊断活动性肺结核就属于这种情况，其敏感度不高，但特异度很高。

可能征(或见征)：此征常见于或可见于甚或偶见于某疾病(发生率为1%～90%)。这是临床上经常遇见的情况，也是临床诊断复杂性和概然性的重要原因。事实上，临床医生常常不得不从很多可能征中作出临床诊断。现在许多疾病的诊断标准或模式多半是提出若干条主要诊断标准，此外再加上若干条次要诊断标准，在此基础上规定符合几项主要标准再加上几项次要标准即可诊断为某种疾病。这足以说明目前临床医学对许多疾病的诊断尚缺乏特别可靠的标准，同时许多疾病诊疗标准中常常会提示采用此标准的敏感度和特异度参数，这足以说明即使采用目前通用的诊断标准也并非真正的“金标准”。需要注意若把可能征误认为充足征则会导致误诊。众所周知，杵状指常常出现于支气管扩张，因而人们常将杵状指作为诊断支气管扩张的依据，但应当看到杵状指对于支气管扩张的诊断只属于可能征，并不是必要征，因为某些支气管扩张患者，尤其是轻度支气管扩张患者并不会出现杵状指。相反，其他疾病如肺脓肿、肺癌、某些先天性心脏病也可出现杵状指。

否定征：某种病征绝对不会出现于该疾病，若出现该征则可否定这种疾病的可能性。否定征常用于除外诊断。但应注意若把可能征误认为否定征，则会造成诊断错误。严格地说，否定征是100%不会出现于该疾病的病征，如临床上怀疑为慢阻肺，支气管舒张试验结果显示吸入短效β2受体激动剂后第1秒用力呼气容积(FEV1)/用力肺活量(FVC)>70%，提示其气流受限并非完全不可逆，因此据此即可排除或否定慢阻肺的诊断，因该结果与慢阻肺的定义不符。

在评价一项检查技术的临床应用过程中常会用到以下几个指标：敏感度/特异度、准确度、诊断比值比、阳性预测值/阴性预测值、阳性似然比/阴性似然比，以上均为卫生统计学的基本概念，限于篇幅不一一复述，仅谈谈敏感度和特异度与金标准的关系。敏感度是指实际患病的患者被正确诊断的可能性，敏感度越高，漏诊的病例就越少，即漏诊率等于1-敏感度。任何一项检查项目的敏感度都不会是100%，敏感度较低易发生漏诊，然而敏感度过高又会发生误诊。特异度是指采用金标准诊断无病的病例中，诊断性试验结果为阴性的比例。换而言之，特异度是指诊断试验判断无病者确实为非患者的可能性，特异度越高则漏诊越少，误诊率=1-特异度。任何一项检查项目的特异度也不会是100%，特异度过低易发生误诊，而过高又易发生漏诊。准确度为诊断试验检测为真阳性和真阴性患者例数之和与总检测患者例数之比，这才是全面评价一项检查诊断项目准确性的标准。准确度是最全面和最可靠的标准，不能简单地认为某一项检查指标的敏感度或特异度高，就一定是诊断某种疾病的金标准，要兼顾敏感度和特异度两个方面。至于谈到目前全国广泛应用的核酸病毒检测阳性是否可作为新冠病毒感染(包括病毒携带者、疾病潜伏期和临床确诊病例)的问题，也要进行具体分析，不能一概而论，因为任何一种临床检测手段具体应用到临床，由于各种主观和客观的条件限制都必然存在一定比例的假阴性和假阳性，不会100%准确，既无假阳性(误诊)，也无假阴性(漏诊)。很可惜截止目前，国内尚未见到这方面的完整资料。

为进一步厘清各种辅助检查手段对于疾病的诊断价值，下面再作进一步探讨。国内外慢阻肺的诊断标准中均已明确规定，结合慢阻肺的高危因素、临床症状和体征的基础上进行肺功能测定，重点是支气管舒张试验，若吸入短效β2激动剂后FEV1/FVC确实<70%，则证明患者存在不可逆的气流受限，慢阻肺的诊断即可建立。然而事情并非如此简单，国外已有文献报道，若患者支气管舒张试验后FEV1/FVC处于0.6～0.8时，不能仅依靠1次肺功能检测结果便武断认为该患者已患慢阻肺，这时应重复测定肺功能，因为在某些情况下该比值可能会有变化。若该比值<0.6则不必再重复测定，因该比值再有波动，也很少会>0.7。又如应用PSG监测诊断OSA同样也需综合评估OSA的高危因素和症状，特别是夜间是否打鼾、鼾声大小、白天(包括晨起)是否有嗜睡、记忆力下降等，不能仅凭1个晚上的呼吸暂停低通气指数(AHI)>5次/小时或<5次/小时便武断作出诊断或除外诊断。明明是一个重度打鼾患者，在睡眠室或睡眠中心因睡眠环境的改变，夜间睡不好甚至难以入睡，其检查结果常不可靠，在这种情况下仅根据1次AHI检查结果作出诊断，可靠性则差得多。即使应用胸部HRCT诊断支气管扩张也应充分了解患者的现病史和既往史，全面检查患者的体征，在评价CT照片上的征象时还应注意是否存在相关的干扰因素，如进行胸部CT检查之前，是否应用过支气管舒张剂(可使支气管管腔增大)、舒张和收缩肺血管的药物(影响支气管动脉的口径)，这些因素均会影响支气管外径/伴行的支气管动脉外径比，同样会影响支气管扩张诊断的准确性。临床上凡是遇到可疑肺栓塞时通常要进行CTPA检查，若增强CT后相应肺动脉段出现截断现象，常提示存在肺动脉栓塞，但这也并非绝对，如肺动脉肉瘤时也可出现这种征象，如不认真鉴别，常可造成严重的误诊、误治。

总之，在应用各种辅助检查手段诊断疾病时，对于临床上常用的所谓“金标准”一定要有全面准确的理解。除应了解各种影响相关指标的因素外，更重要的是不能片面强调一两项辅助检查项目的绝对数值，要密切结合临床病史、体格检查资料，进行综合分析。其后还应根据治疗效果反证诊断的正确性。此外，临床上在确定诊断之前务必做到切实充分的除外诊断，即不断地思考自己初步建立的诊断是否经得起推敲。