林 宇,罗渝昆,李 杰,任秀昀,王宏伟
1解放军医学院,北京 100853 中国人民解放军总医院第一医学中心 2病理科 3超声诊断科,北京 100853 4中国人民解放军总医院海南医院超声诊断科,海南三亚 572013 5中国人民解放军总医院第四医学中心病理科,北京 100048
甲状腺结节在人群中较为常见(20%~76%),其中7%~15%为恶性肿瘤[1]。细针穿刺(fine needle aspiration,FNA)是评估甲状腺结节有效且可靠的方法[2]。尽管FNA有很多优点,但也有一定的局限性,其中7%~10%的FNA结节归为Bethesda Ⅲ类,包括意义不明确的细胞非典型性或滤泡性病变,甲状腺细胞病理学报告系统评估这类结节的恶性风险为15%~30%[3-4],美国甲状腺协会(American Thyroid Association,ATA)指南建议对这类结节重复FNA以指导临床决策,然而,重复FNA会产生大量细胞学意义不明确的非典型性或滤泡性病变(atypia of undetermined significance/follicular lesion of undetermined significance,AUS/FLUS)结果和高假阴性率,因此并不是一个合适的解决方案[5]。二维超声是评估甲状腺结节良恶性的最常用的影像学方法,近年来,多种甲状腺影像报告和数据系统(Thyroid Imaging Reporting and Data System,TIRADS)被广泛应用,包括2015年美国ATA指南[6]、2017年美国放射学会发布的美国放射学会甲状腺影像报告和数据系统(American College of Radiology Thyroid Imaging Report and Data System,ACR-TIRADS)[7]及2020年Zhou等[8]提出适合中国临床实践的中国甲状腺影像报告和数据系统(Chinese Thyroid Imaging Reporting and Data System,C-TIRADS),这些不同分级系统可靠的诊断性能在一定程度上有效减少了不必要的活检和良性结节的过度治疗。BRAFV600E突变是甲状腺乳头状癌(papillary thyroid carcinoma,PTC)中最常见的基因变异,占所有基因突变的28%~83%[9],有研究试图将FNA、超声和BRAFV600E突变结合起来预测PTC[2,10],但较少有研究对比分析不同超声分级系统联合BRAFV600E突变对甲状腺结节的诊断价值,尤其是AUS/FLUS结节。因此,本研究旨在比较ATA指南、ACR-TIRADS、C-TIRADS单独及联合BRAFV600E突变在AUS/FLUS结节的诊断价值。
资料来源回顾性分析2020年1月至2023年5月于中国人民解放军总医院第一医学中心行FNA且细胞学诊断为AUS/FLUS结节的患者资料。纳入标准:(1)甲状腺超声检查资料完整;(2)细胞学诊断为AUS/FLUS并行BRAFV600E基因检测的患者;(3)具有完整术后病理组织学诊断的患者。排除标准:(1)术前未行甲状腺超声检查或不符合超声图像分析的患者;(2)术后病理诊断为低风险肿瘤的患者;(3)因样本质量和质控不合格导致BRAFV600E结果无法检出的患者。最终纳入138例甲状腺结节患者。本研究经中国人民解放军总医院医学伦理委员会批准(伦理审查编号:S2019-178-01),患者在穿刺前均知情同意。
超声分级系统的判读甲状腺超声检查采用意大利百盛MyLab Twice,德国Siemens ACUSON Sequioa彩色多普勒超声诊断仪,探头频率为5~12 MHz。图像由2名具有5年以上甲状腺超声检查经验的超声医师在不了解患者临床信息和手术病理的情况下利用同一报告工作站进行独立地回顾性分析。在评估前,2名医师均详细查阅了3种甲状腺超声分级系统的相关文献和指南,并分别根据ATA指南[6]、ACR-TIRADS[7]和C-TIRADS[8]对138个甲状腺结节的超声特征进行分析和分级。当诊断出现分歧时,由第3名具有高级职称的医师评估并确定分类。
FNA及BRAFV600E基因检测FNA由2名具有5年以上超声介入经验的医师完成。患者取仰卧位,充分暴露颈前区,常规碘伏消毒后铺孔巾,超声引导下选择穿刺点,将穿刺针沿穿刺路径刺入结节,针尖(无负压情况下)在结节内不同部位来回提插5~10次,快速取样涂片2~3 张,固定后送细胞病理学检查及BRAFV600E基因检测(试剂由厦门艾德生物医药科技股份有限公司提供)。若样本6-羧基荧光素信号有明显扩增曲线且阈值周期<28,判断为BRAFV600E突变;若样本6-羧基荧光素信号无明显扩增或阈值周期≥28,判断为BRAFV600E未突变。
诊断标准单独诊断标准:BRAFV600E突变定义为恶性,BRAFV600E未突变定义为良性;ATA指南5类、ACR-TIRADS 5类、C-TIRADS ≥4c类定义为恶性。联合诊断标准:超声分级系统和BRAFV600E检测其中之一或同时为恶性则判为恶性,超声分级系统和BRAFV600E检测同时为良性则判为良性。
统计学处理采用SPSS 26.0和Medcalc 9.3软件进行统计分析。符合正态分布的数据以均数±标准差表示,组间比较行t检验;非正态分布的数据以中位数(四分位数间距)表示,组间比较行χ2检验或Fisher精确概率检验。McNemar检验用于组间灵敏度、特异度及准确性的比较。以手术组织病理为金标准,受试者工作特征曲线下面积(area under the curve,AUC)用于评估BRAFV600E突变、3种超声分级系统单独及联合BRAFV600E突变的诊断效能,两者之间的AUC比较采用Z检验,P<0.05为差异有统计学意义。
甲状腺结节的组织学病理结果138例患者共计纳入138个甲状腺结节。组织学病理结果:良性结节45个,其中17个为结节性甲状腺肿,14个为滤泡性腺瘤,12个为桥本氏甲状腺炎伴腺瘤性增生,2个为纤维化结节伴不典型增生;恶性结节93个,其中90个为乳头状癌,2个为滤泡癌,1个为髓样癌。
临床及超声特征138例患者中,男28例(20.3%)、女110例(79.7%),年龄23~70岁,平均(47.3±10.7)岁;结节最大径2.0~40.0 mm;峡部5个、左叶59个、右叶74个。患者的年龄(t=1.444,P=0.151)、性别(χ2=0.259,P=0.611)及结节的位置(χ2=2.055,P=0.358)对AUS/FLUS结节的良恶性鉴别差异均无统计学意义;结节的大小(Z=2.500,P=0.012)、回声(χ2=14.693,P<0.001)、成分(χ2=17.075,P<0.001)、纵横比≥1(χ2=9.477,P=0.002)、边缘不规则(χ2=14.641,P<0.001)、微钙化(χ2=6.892,P=0.009)对AUS/FLUS结节的良恶性鉴别差异均有统计学意义(表1)。
表1 AUS/FLUS结节的临床及超声特征
单独诊断价值术后ATA指南诊断恶性92个,良性46个;ACR-TIRADS诊断恶性92个,良性46个;C-TIRADS诊断恶性81个,良性57个;BRAFV600E突变46个,44个为恶性,2个为良性;92个BRAFV600E未突变,49个为恶性,43个为良性。BRAFV600E突变具有相对较高的特异度(95.56%)和阳性预测值(95.65%);3种超声分级系统中,ACR-TIRADS的灵敏度(χ2=37.923,P<0.001;χ2=40.462,P<0.001)和准确度(χ2=81.595,P<0.001;χ2=76.912,P<0.001)均显著高于ATA指南和C-TIRADS,C-TIRADS的特异度显著高于ATA指南(χ2=11.746,P<0.001)和ACR-TIRADS(χ2=21.235,P<0.001);ATA指南(Z=1.177,P=0.239)、ACR-TIRADS(Z=0.213,P=0.831)、C-TIRADS(Z=1.016,P=0.310)单独诊断AUC两两之间比较差异均无统计学意义(表2、3,图1)。
图1 ATA指南、ACR-TIRADS、C-TIRADS单独及联合BRAFV600E诊断的受试者工作特征曲线
表2 ATA指南、ACR-TIRADS及C-TIRADS单独及联合BRAFV600E对AUS/FLUS结节的诊断价值
表3 ATA指南、ACR-TIRADS和C-TIRADS单独及联合BRAFV600E诊断曲线下面积比较
联合诊断价值联合应用时,BRAFV600E突变与ACR-TIRADS、C-TIRADS联合诊断均提高了BRAFV600E突变对AUS/FLUS结节良恶性的诊断效能(Z=2.107,P=0.035;Z=2.752,P=0.006),ATA指南联合BRAFV600E突变的准确度有所提高(χ2=20.679,P<0.001),但与BRAFV600E突变单独诊断相比,ATA指南联合BRAFV600E突变对AUS/FLUS结节的良恶性诊断效能差异无统计学意义(Z=1.321,P=0.186)。ATA指南、ACR-TIRADS及C-TIRADS联合BRAFV600E突变均提高了超声分级系统对AUS/FLUS结节的诊断效能(Z=2.770,P=0.006;Z=2.770,P=0.006;Z=2.890,P=0.004),其中ACR-TIRADS联合诊断的灵敏度(χ2=4.712,P=0.030;χ2=4.712,P=0.030)最高,而C-TIRADS联合诊断的准确度(χ2=77.627,P<0.001;χ2=85.827,P<0.001)最高,但ATA指南(Z=1.276,P=0.202)、ACR-TIRADS(Z=0.808,P=0.419)及 C-TIRADS(Z=1.615,P=0.106)联合BRAFV600E突变诊断AUS/FLUS结节的AUC两两之间比较差异均无统计学意义(表2、3,图1)。
AUS/FLUS结节主要指由于细胞/结构异型性较小或因制片伪影不能轻易划分为明确的细胞学类别的非典型性病变,是甲状腺细胞学病理诊断的“灰色地带”。有报道AUS/FLUS结节手术标本的患病率和恶性风险差异均有统计学意义[4,11]。本研究手术确诊人数多,恶性率为67.4%,高于既往报道[4],但低于其他研究[12],这种差异由于纳入标准、术前评估方式和随访策略的差异引起。因此,有必要谨慎处理AUS/FLUS结节。为了解决这一问题,除了重复FNA外,有学者提出了几种解决方案,如粗针穿刺[13]、基因表达分类器检测[14]和多基因下一代测序检测[15]。考虑到成本效益,国内多数医疗机构选择已被证实为甲状腺癌的高度特异性分子标记物BRAFV600E。有研究显示FNA-BRAFV600E突变检测的特异度为88.7%~100%[9,16],灵敏度为32%~82%[10]。本研究BRAFV600E突变的特异度为95.56%,灵敏度为47.31%,与既往研究一致。有研究显示AUS/FLUS结节中恶性结节的BRAFV600E突变率为15.0%~54.6%[10,17],未突变率为20%~60%[18]。本研究恶性结节的BRAFV600E基因未突变率为53%,在文献报道的范围内,但略高,可能是由于不同种族、地理位置、基因突变检测方法不同所致。此外,本研究2例滤泡癌及1例髓样癌术前BRAFV600E检测结果均为阴性,故还应结合RAS、RET等分子标志物[19]或其他诊断方法避免单基因检测的假阴性问题。本研究2例经手术证实的良性AUS/FLUS结节均有BRAFV600E突变,2例AUS/FLUS结节均为纤维化结节伴不典型增生,具有PTC的一些细胞学特征,笔者认为这些结节与Chung等[20]报道的不典型增生结节相同,可能是PTC的前驱病变。
目前,颈部超声仍是检测甲状腺结节的首选。大量文献报道微钙化、纵横比≥1及不规则边缘等超声特征与甲状腺结节较高的细胞学分类相关[10,12,21-22],但这些征象对AUS/FLUS结节良恶性鉴别是否有意义需深入探讨。本研究显示微钙化、纵横比≥1、不规则边缘等可疑恶性超声特征在AUS/FLUS结节良恶性鉴别中差异有统计学意义,表明结节的超声特征可能对AUS/FLUS结节的恶性风险预测具有一定的价值。此外,本研究显示AUS/FLUS良恶性结节的大小差异有统计学意义,表明甲状腺恶性肿瘤直径通常较小。然而,有研究表明结节的直径与恶性肿瘤相关性较差[21-22],结节的大小并不是提示结节具有恶性风险的可靠指标,因此,甲状腺结节的良恶性鉴别不应仅通过结节的大小判断,还应结合其他因素综合考虑。近年来,有学者对不同超声分级系统的诊断价值进行了评估[16],2015年基于超声特征对甲状腺结节进行危险分层的ATA指南认为实性低回声、微钙化、纵横比>1及边界不规则等征象提示结节恶性可能性大,但在临床上,部分良性结节的患者也可以表现为实性低回声[23-24],这导致ATA指南在临床应用的局限性。2017年ACR-TIRADS对甲状腺结节的评估主要基于结节的结构、回声、边缘、纵横比和微钙化5个关键特征,适用于绝大多数甲状腺结节的恶性风险分层,具有相对较优的灵敏度和特异度[25],但ACR-TIRADS的评分方法比较繁琐,需要检查医师丰富的工作经验和扎实的专业知识,难以在基层社区医院开展和推广。2020年中国超声医学界提出的C-TIRADS是基于5项恶性超声特征和1项良性超声特征进行计数和积分的风险评估系统,可靠性较高且临床可操作性较强。1项多中心回顾性研究显示C-TIRADS的灵敏度超过90%,阴性预测值大于95%[26]。此外,与其他分级系统相比,C-TIRADS更简单、更易于应用[27]。目前,鲜有文献评价C-TIRADS对AUS/FLUS结节的诊断性能。
本研究就目前国内比较常用的2015年ATA指南、2017年ACR-TIRADS和2020年提出的C-TIRADS进行比较,探讨3种方法单独诊断及联合BRAFV600E突变对AUS/FLUS结节的诊断价值。本研究138个AUS/FLUS结节良、恶性占比分别为32.6%、67.4%,以病理组织学为检验标准,3种超声分级系统的恶性率随着等级升高而增加。本研究ATA指南 5类、ACR-TIRADS 5类和C-TIRADS≥4c类结节的恶性率分别为81.52%、83.70%、86.42%,与既往研究[6-8]一致;ATA指南、ACR-TIRADS和C-TIRADS的诊断灵敏度依次为80.65%、82.80%、75.27%,特异度依次为62.22%、66.67%、75.56%,准确度依次为74.64%、77.54%、75.36%,AUC依次为0.714、0.747、0.754,3种超声分层系统对AUS/FLUS结节的诊断效能差异无统计学意义,ATA指南、ACR-TIRADS和C-TIRADS均能有效地为AUS/FLUS结节提供危险分层。在临床工作中,超声检查医师可根据自己的工作经验和对各分级系统的掌握程度斟酌选择。1项Meta分析比较了韩国TIRADS、ATA指南、ACR-TIRADS 及欧洲TIRADS对甲状腺结节良恶性鉴别的应用价值,发现不同超声分级系统的诊断性能相似[28]。尽管ATA指南、ACR-TIRADS和C-TIRADS具有一定的准确性,但也有假阳性和假阴性的情况出现。有报道BRAFV600E基因检测可以提高FNA准确性,尤其是有BRAFV600E突变的PTC[2,10]。因此,本研究将BRAFV600E突变与超声分级系统结合,探讨3种超声分级系统单独及联合BRAFV600E突变对AUS/FLUS结节的诊断效能。本研究纳入的138个AUS/FLUS中有92个BRAFV600E未发生突变,其中28个被ATA指南、32个被ACR-TIRADS、33个被C-TIRADS诊断更正;与BRAFV600E基因检测联合诊断时,ATA指南及ACR-TIRADS误诊的12个结节被更正,C-TIRADS误诊的18个结节被更正。超声分级系统和BRAFV600E突变可以有效互补,一方面BRAFV600E突变可以提高ATA指南<5类、ACR-TIRADS<5类及C-TIRADS<4c类恶性结节的检出率,另一方面,超声分级系统可以为AUS/FLUS结节提供可靠的危险分层,尤其是在基因检测尚未普及的情况下。与BRAFV600E突变或超声分级系统单独诊断相比,联合诊断提高了AUS/FLUS结节诊断的灵敏度、准确度、阴性预测值,对降低AUS/FLUS结节患者的不必要的穿刺活检有一定的促进作用。
本研究的局限性:首先,由于成本效益,本研究只分析了BRAFV600E单基因检测,而甲状腺癌仍有其他分子遗传学改变,所以存在诊断不足可能;其次,存在选择偏倚,本研究以术后病理为金标准,没有纳入缺少组织病理的AUS/FLUS结节,导致本研究恶性率偏高;最后,本研究是单中心回顾性研究,图像分析基于静态图像,且不同医生对TIRADS分类的理解可能不同,分类时可能存在一定的偏差;期待后续涉及更多基因和更大样本量的前瞻性研究进一步证实。
综上,ATA指南、ACR-TIRADS和C-TIRADS均能有效为AUS/FLUS结节提供危险分层,其中ACR-TIRADS灵敏度最高,C-TIRADS特异度最高,超声医师可根据不同指南的风险和益处选择最佳的分级方法;超声分级系统与BRAFV600E突变可以互相弥补,两者联合可以提高AUS/FLUS结节的诊断灵敏度、准确度,降低结节漏诊率,有助于AUS/FLUS结节患者的进一步管理和治疗。