孙 鑫,张 巍,程令刚,广 旸,张雨康
(首都医科大学附属北京天坛医院超声科,北京 100070)
桥本甲状腺炎(Hashimoto thyroiditis, HT)是伴甲状腺肿大、淋巴细胞浸润和甲状腺抗体升高的自身免疫性甲状腺疾病[1],为甲状腺乳头状癌的危险因素之一[2]。HT常伴发甲状腺结节,但不同研究[3-4]报道的良、恶性结节特征有所差异,导致鉴别较困难。现有国内外甲状腺影像报告和数据系统(thyroid imaging reporting and data system, TI-RADS)主要版本包括2011年KWAK等[5]提出的Kwak-TIRADS、2015年美国甲状腺学会(American Thyroid Association, ATA)发布的ATA指南[6]、2016年美国临床内分泌医师协会(American Association of Clinical Endocrinologists, AACE)/美国内分泌协会(American College of Endocrinology, ACE)/意大利内分泌协会(Associazione Medici Endocrinologi, AME)指南[7]、2016年韩国甲状腺放射学会(Korean Society of Thyroid Radiology, KSThR)提出的K-TIRADS[8]、2017年欧洲甲状腺协会(European Thyroid Association, ETA)发布的EU-TIRADS[9]、2017年美国放射协会(American College of Radiology, ACR)-TIRADS[10],以及2020年中华医学会超声医学分会浅表器官和血管组提出的《2020甲状腺结节超声恶性危险分层的中国指南》(简称C-TIRADS)[11];多种TI-RADS版本导致临床工作中超声评估甲状腺结节标准较为混乱,且现有相关研究[12-14]多针对非病变甲状腺背景下的结节。本研究比较上述7种TI-RADS用于鉴别诊断HT背景下甲状腺良、恶性结节的价值。
1.1 研究对象 回顾性收集2020年8月—2023年8月200例于首都医科大学附属北京天坛医院经术后病理证实的HT伴甲状腺结节患者,男28例、女172例,年龄21~72岁、平均(49.8±13.4)岁;共338个甲状腺结节,最大径0.3~5.0 cm、平均(1.42±1.06)cm,其中良性167个、恶性171个。纳入标准:①术前接受甲状腺超声检查,且临床数据和超声资料完整;②病理诊断明确。排除标准:①图像质量不佳;②无法对甲状腺结节进行分类。本研究经院伦理委员会批准(KY2020-007-02),检查前所有患者均知情同意。
1.2 仪器与方法 采用Canon Aplio i900彩色多普勒超声诊断仪、L4-18线阵探头,探头频率4~18 MHz。
嘱患者仰卧、充分暴露颈前区,以预设甲状腺条件进行连续扫查,留存甲状腺结节灰阶图像。由2名超声科医师独立分析超声图像,记录结节大小、成分、内部回声、形态、边缘、局灶性强回声等特征,并分别以上述7种TI-RADS进行分类;意见存在分歧时,经讨论达成一致。见图1~4。
图1 患者女,37岁,甲状腺左叶乳头状癌声像图 甲状腺左叶实性结节,Kwak-TIRADS 4b类、ATA指南中度可疑、AACE/ACE/AME指南中风险、K-TIRADS 4类、EU-TIRADS 5类、ACR-TIRADS 4类、C-TIRADS 4b类 (箭示病灶) 图2 患者男,38岁,甲状腺右叶乳头状癌声像图 甲状腺右叶实性结节,Kwak-TIRADS 4c类、ATA指南高度可疑、AACE/ACE/AME指南高风险、K-TIRADS 5类、EU-TIRADS 5类、ACR-TIRADS 5类、C-TIRADS 4c类 (箭示病灶) 图3 患者女,72岁,甲状腺左叶乳头状癌声像图 甲状腺左叶实性结节,Kwak-TIRADS 5类、ATA指南高度可疑、AACE/ACE/AME指南高风险、K-TIRADS 5类、EU-TIRADS 5类、ACR-TIRADS 5类、C-TIRADS 4c类 (箭示病灶) 图4 患者女,63岁,甲状腺左叶腺瘤声像图 甲状腺左叶实性结节,Kwak-TIRADS 4a类、ATA指南低度可疑、AACE/ACE/AME指南中风险、K-TIRADS 3类、EU-TIRADS 3类、ACR-TIRADS 3类、C-TIRADS 4a类 (箭示病灶)
1.3 统计学分析 采用SPSS 27.0和MedCalc 20.0统计分析软件。以χ2检验比较计数资料。以病理结果为金标准,绘制受试者工作特征(receiver operating characteristic, ROC)曲线,计算7种TI-RADS鉴别HT背景下甲状腺良、恶性结节的敏感度、特异度、阳性预测值、阴性预测值及准确率,评估其诊断效能;以DeLong检验比较各TI-RADS的曲线下面积(area under the curve, AUC),采用McNemar's检验比较其敏感度及特异度。P<0.05为差异有统计学意义。
Kwak-TIRADS、ATA指南、AACE/ACE/AME指南、K-TIRADS、EU-TIRADS、ACR-TIRADS及C-TIRADS鉴别HT背景下甲状腺良、恶性结节的敏感度分别为97.08%、98.25%、99.42%、95.91%、99.42%、90.06%及99.42%,特异度依次为88.02%、83.23%、82.04%、88.02%、82.04%、86.83%及84.43%,AUC分别为0.946、0.913、0.907、0.934、0.909、0.916及0.960。其中,C-TIRADS、EU-TIRADS及AACE/ACE/AME指南的敏感度均高于K-TIRADS和ACR-TIRADS(P均<0.05),Kawk-TIRADS、K-TIRADS的特异度均高于C-TIRADS、ATA指南、EU-TIRADS、AACE/ACE/AME指南(P均<0.05),C-TIRADS和Kawk-TIRADS的AUC均高于其他TI-RADS(P均<0.05)。见表1及图5。
表1 7种TI-RADS鉴别HT背景下甲状腺良、恶性结节的效能
图5 7种TI-RADS鉴别HT背景下甲状腺良、恶性结节的ROC曲线
以Kwak-TIRADS、ATA指南、AACE/ACE/AME指南、K-TIRADS、EU-TIRADS、ACR-TIRADS、C-TIRADS鉴别HT背景下甲状腺良、恶性结节时,同一TI-RADS中,不同等级结节的恶性率差异均有统计学意义(P均<0.05);且结节恶性率随TI-RADS分类等级增高而上升。见表2。
表2 7种TI-RADS鉴别HT背景下甲状腺结节的恶性风险分层
HT是常见自身免疫性疾病,超声表现复杂:甲状腺实质可呈弥漫性回声减低、多发片状低回声、多发条状高回声、血管数量增加等表现;伴发甲状腺结节时,复杂的背景表现可对判断结节回声、边缘等特征产生影响,导致难以区分良、恶性结节。另一方面,由于现有TI-RADS版本较多,导致超声评估甲状腺结节标准较为混乱。对比分析不同版本TI-RADS鉴别HT背景下甲状腺结节的效能,可为超声医师适当选择TI-RADS提供依据。
本研究显示,同一TI-RADS中,不同等级甲状腺结节恶性率差异均有统计学意义(P均<0.05),且结节恶性率随其TI-RADS等级增高而上升,提示上述7种TI-RADS分类均具有一定合理性[14];同时,本研究发现不同TI-RADS分类等级结节的实际恶性率多符合或接近其推荐恶性率,而C-TIRADS 4b类实际恶性率较高(65.38%vs. 10%~50%),可能与可疑特征“极低回声”有关:C-TIRADS 4b中较多恶性结节表现为极低回声,提示临床工作应对HT背景下C-TIRADS 4b结节给予足够重视。
C-TIRADS主要根据5个阳性指标及1个阴性指标进行分类,而Kawk-TIRADS则根据5个恶性征象进行分类。既往研究[15-16]对比2~3种不同TI-RADS鉴别HT背景下甲状腺良、恶性结节的效能,结果均显示C-TIRADS价值最佳。WANG等[17]报道,Kawk-TIRADS用于诊断非HT背景下甲状腺结节的效能最优。本研究中,Kwak-TIRADS、ATA指南、AACE/ACE/AME指南、K-TIRADS、EU-TIRADS、ACR-TIRADS及C-TIRADS鉴别HT背景下甲状腺良、恶性结节的敏感度、特异度及AUC均较高;其中,C-TIRADS、EU-TIRADS及AACE/ACE/AME指南的敏感度均高于K-TIRADS和ACR-TIRADS,Kawk-TIRADS和K-TIRADS的特异度均高于C-TIRADS、ATA指南、EU-TIRADS及AACE/ACE/AME指南,而C-TIRADS和Kawk-TIRADS的AUC均高于其他5种TI-RADS。上述结果提示,临床实际工作中,可视具体情况选择以C-TIRADS或Kawk-TIRADS评估HT背景下甲状腺结节,与另外5种TI-RADS相比更为便捷。
本研究的主要局限性:①为单中心回顾性分析;②仅根据静态超声图像进行判断,可能存在偏倚。
综上所述,C-TIRADS和Kawk-TIRADS用于鉴别HT背景下甲状腺良、恶性结节具有较高价值;其中,C-TIRADS的敏感度较高而Kawk-TIRADS的特异度较高。
利益冲突:全体作者声明无利益冲突。
作者贡献:孙鑫研究设计和实施、图像和数据分析、查阅文献、撰写文章;张巍指导、研究设计和实施、修改和审阅文章;程令刚、广旸和张雨康研究实施、图像分析。