付志远,寻艳香,陈红天
湖南师范大学附属第一医院(湖南省人民医院),湖南长沙410005
甲状腺结节是颈部最常见的疾病之一,超声检出率可达70%[1],但恶性率仅4%~6.5%[2],患者病死率基本保持稳定[3]。如何更加准确使用超声筛选出具有临床意义的甲状腺癌仍是近年研究热点。美国放射学会(ACR)提出的美国放射学会甲状腺影像报告和数据系统(American college of radiology thyroid imaging reporting and data system,ACR TIRADS)风险分层系统是目前最新的风险分层判定标准,但目前关于其在甲状腺结节良恶性判定中的相关研究较少。为此我们分析了ACR TI-RADS 风险分层、甲状腺结节超声声像图赋值评分在鉴别甲状腺恶性结节中的应用价值。现将结果报告如下。
1.1 临床资料 收集 2017 年 1 月—2019 年 8 月在湖南师范大学附属第一医院(湖南省人民医院)行甲状腺常规超声检查的236例患者(共发现255个甲状腺结节,19 例患者有2 个甲状腺结节),患者中男50例、女 186 例,年龄 21~81(44.7 ± 12.9)岁。 纳入标准:所有结节均有清晰、完整的超声图像;所有结节均有术后组织学病理结果;超声检查在术前8 周内进行[4]。排除标准:回顾研究时发现图像数据丢失者,或者图像不清晰者;ACR TI-RADS 所评估的结节与手术切除的结节两者不是同一结节者;非初次诊治甲状腺结节患者。本研究经本院伦理委员会批准同意,纳入者或其家属均签署知情同意书。
1.2 超声检查及ACR TI-RADS 风险分层判定方法 采用Mindray M9(迈瑞)超声诊断仪(高频线阵探头,频率5~14 MHz)对患者进行常规甲状腺超声检查,所有超声检查均由具有5 年以上甲状腺超声诊断经验的高年资医师完成。根据ACR TI-RADS风险分层系统对每个结节分类(TR1~5 类)。读图前2名医师一起学习ACR TI-RADS风险分层系统,所有ACR TI-RADS 风险分层判读均由2 位具有5 年以上甲状腺超声诊断经验的高年资医师双盲单独评价,当两者意见不统一时,请另外一名副主任以上职称的高年资医师参与诊断,经共同商议得出最后结论。
1.3 甲状腺结节超声声像图赋值评分判定方法
236 例患者在超声检查后均行结节切除术并获得组织病理学结果。分析甲状腺的结节超声声像图特征(结节数量、位置、大小、结构、回声、形状、边缘、局灶性强回声),对声像图特征进行赋值(ACR TIRADS 标准),计算总得分。
1.4 统计学方法 采用SPSS 25.0 软件及MedCalc 16.8.4 软件进行统计处理。符合正态分布的计量资料用表示,计数资料用%表示,组间比较采用χ2检验。术后组织病理结果作为“金标准”,构建以ACR TI-RADS 风险分层与甲状腺结节超声声像图赋值评分鉴别甲状腺结节良恶性的受试者工作特征曲线(ROC),根据ROC 曲线下面积(AUC)和最佳诊断界值(Yonden 指数最大所对应的值)分析其诊断效能[准确度、敏感度、特异度、阳性预测值(PPV)、阴性预测值(NPV)];运用Z检验比较ACR TI-RADS风险分层与甲状腺结节超声声像图赋值评分的AUC。P<0.05为差异具有统计学意义。
255 个甲状腺结节,术后病理良性、恶性分别为71、184个。
255 个甲状腺结节ACR TI-RADS 风险分层TR2、TR3、TR4、TR5 分别为12、16、51、176 个。与病理金标准比较,TR2、TR3、TR4、TR5 结节恶性率分别为8.3%(1/12)、6.3%(1/16)、41.2%(21/51)、91.5%(161/176)。当 AUC 为 0.850(95%CI:0.789~0.911)时,Yonden 指数最大所对应的ACR TIRADS风险分层最佳诊断界值为>TR4类(TR1~4类为超声诊断良性,TR5 类为超声诊断恶性)。以TR3类为界(TR1~3 类为超声诊断良性,TR4~5 类为超声诊断恶性)时,Yonden 指数为 0.355,ACR TIRADS 风险分层预测甲状腺恶性结节的准确度、敏感度、特异度、PPV 及 NPV 分别为 81.6%、98.9%、36.6%、80.2%、92.9%;以TR4 类为界(TR1~4 类为超声诊断良性,TR5 类为超声诊断恶性)时,Yonden指数为0.664,ACR TI-RADS 风险分层预测甲状腺恶性结节的准确度、敏感度、特异度、PPV 及NPV 分别为85.1%、87.5%、78.9%、91.5%、70.9%。
255 个结节中,超声声像图赋值评分总得分值范围为2~14分,其中2、3、4、5、6、7、8、9、10、11、12、13、14 分结节分别有12、16、28、14、9、38、12、42、39、1、27、16、1 个,其恶性率分别为8.3%(1/12)、6.3%(1/16)、32.1%(9/28)、35.7%(5/14)、77.7%(7/9)、86.8%(33/38)、50%(6/12)、97.6%(41/42)、97.4%(38/39)、100%(1/1)、92.5%(25/27)、100%(16/16)、100%(1/1)。当 AUC 为 0.895(95%CI:0.848~0.941),Yonden 指数最大所对应的最佳诊断界值为 5.5 分,当以结节总得分值≥6 分时,Yonden 指数为0.674,超声诊断甲状腺恶性结节的准确度、敏感度、特异度、PPV 及 NPV 分别为 87.1%、91.3%、76.1%、90.8%及77.1%。
与ACR TI-RADS 风险分层比较,结节总得分值鉴别甲状腺恶性结节诊断价值高(AUC 分别为0.850、0.895,Z=2.907,P均<0.01)。
图2-1 ACR TI-RADS风险分层与超声声像图赋值评分诊断甲状腺恶性结节的ROC
近年来,一些学者和组织机构根据一系列超声可疑恶性征象提出了使用超声对甲状腺结节进行恶性风险分层,但对甲状腺结节的描述术语、分类标准以及不同分类相对应的管理建议并未达到规范、统一。根据中国超声医学工程学会浅表器官及外周血管专业委员会最新颁布的《甲状腺及相关颈部淋巴结超声若干临床常见问题专家共识(2018版)》[5],各位专家一致建议使用ACR TI-RADS词典[6]来规范描述甲状腺结节。ACR TI-RADS 风险分层系统[7]是在ACR TI-RADS词典的基础上建立的,是2017年ACR综合了美国国家癌症研究所数据、不同专家意见以及既往TI-RADS 的信息,推出的全新TI-RADS,其结构简单、易于掌握。
本研究中,以ACR TI-RADS 风险分层鉴别甲状腺结节良恶性的 AUC 为 0.850(95%CI:0.789~0.911),表明该分类方法能较好的鉴别甲状腺结节的良恶性。ROC 结果显示Yonden 指数最大所对应的最佳诊断界值为>TR4 类,说明甲状腺结节为TR5类者则高度怀疑为恶性[8]。进一步分析以TR3 类为界(TR 1~3类为超声诊断良性,TR4~5类为超声诊断恶性)及以TR4 类为界(TR1~4 类为超声诊断良性,TR5 类为超声诊断恶性),ACR TI-RADS 风险分层预测恶性结节的诊断价值。研究结果表明,如果将TR4 类和TR5 类结节均视为甲状腺恶性结节,敏感度有所提高(98.9%),恶性结节不易漏诊,但特异度显著降低(36.6%),许多良性结节将被视为恶性结节处理,导致不必要的FNA 检查,增加患者经济负担,造成医疗资源浪费,而当我们将TR4类和TR5类结节一起视为恶性结节时,存在45个假阳性结节和2 个假阴性结节,与仅将TR5 类结节视为恶性结节相比(存在15个假阳性结节和23个假阴性结节),假阳性结节和假阴性结节总数量增多(47 个vs38个)。因此我们建议将TR 5 类结节作为超声诊断甲状腺结节恶性的标准,而TR 1~4 类结节超声诊断为良性。
本研究中,以甲状腺结节超声声像图赋值评分鉴别甲状腺结节良恶性的AUC 为0.895(95%CI:0.848~0.941),表明该方法具有较好的鉴别甲状腺结节良恶性的能力。ROC 结果显示Yonden 指数最大所对应的最佳诊断界值为5.5 分,故本研究认为甲状腺结节累计分值5.5 分以上者则高度怀疑为恶性。当以结节总得分≥6 分作为超声诊断恶性的标准时,具有较高敏感度(91.3%),恶性结节容易被检出;但特异度一般(76.1%),容易造成对部分良性结节进行不必要的FNA 检查。但ACR TI-RADS 对轻度可疑和中度可疑结节的FNA 阈值比其他风险分层系统均要高[9],这样有利于尽可能地避免对良性结节进行 FNA。有文献报道[10-15],ACR TI-RADS 的FNA 阈值对于减少对良性结节行不必要的FNA 比其他风险分层系统更为有效,多数不建议活检的恶性肿瘤可建议随访。GRANI 等[13]分析比较了ATA、ACR TI-RADS、AACE、ETA TI-RADS 和 KSThR TIRADS这5种超声风险分层系统的诊断性能,结果显示ACR TI-RADS 减少了53%的活检,假阴性率仅为2.2%。ATA 指南与Kwak TI-RADS 风险分层系统等都忽视了每种可疑超声征象预测恶性风险的差异,其分类方法中每种可疑超声特征所代表的恶性风险相同,而ACR TI-RADS 将每种可疑超声征象进行了细分,根据恶性风险给予不同的分值,并通过计算总分值来进行分类,能更好的鉴别甲状腺结节的良恶性。
在 ACR TI-RADS 风险分层系统中,TR 1 类(0分),TR 2 类(2 分),TR 3 类(3 分),TR 4 类(4~6分),TR 5类(≥7分),其中TR 4类包括评分为4分、5分及6 分的结节,因此我们分析了结节以ACR TIRADS 风险分层与以结节总得分值鉴别甲状腺结节良恶性的差异。研究结果显示,这两种方法的AUC分别为0.850、0.895,两者之间的诊断价值存在的差异具有统计学意义,以结节总得分值鉴别结节的良恶性比ACR TI-RADS 风险分层的诊断价值高。因此,建议临床使用ACR TI-RADS 风险分层系统过程时,应在报告中说明所评估结节的类别以及相应的总分值,帮助临床医生更加准确的评估结节的恶性风险,以为进一步临床处理提供依据。
但本研究也存在弊端,本研究为回顾性研究,超声医师所读图像均为静态图像,而并非实时扫查,总体而言,可确保对每一个结节进行评估,但可能会妨碍某些个别细节信息的评估(如甲状腺外扩散、边缘微分叶、海绵状结构等),超声仪器的调节、超声医师的经验对研究结果有一定影响;同时病理科医生的经验、染色试剂的批号可能对结果也有一定影响,未来需要进一步前瞻性验证;此外,本研究所纳入的研究对象均为经US-FNAC 检查及手术病理证实的患者,存在较大的选择偏倚,增加了甲状腺结节的恶性风险,所得出结节的恶性风险可能仅适用于需要手术的患者,而非一般患者;最后,本研究为单中心研究,未来需要通过多中心研究以及更大样本量来验证。
综上所述,ACR TI-RADS 风险分层与超声声像图赋值评分鉴别甲状腺结节良恶性均具有较高诊断价值,最佳诊断界值分别为>TR4 类和5.5 分,且甲状腺结节超声声像图赋值评分鉴别恶性结节的诊断价值更高。