周本涛 ,卢晓峰(通讯作者),罗 琼
(1.汕头大学医学院第一附属医院 甲乳外科,广东 515000;2.东莞市清溪医院,广东 523660)
甲状腺结节问题临床多见。甲状腺结节指甲状腺内与其实质不同的离散性病变[1]。流行病学结果显示,非缺碘人群的甲状腺结节患病率约为5%[2],通过高分辨率超声辅助,发现甲状腺结节发病率可高达68%,其中以女性和老年人比例更高[3]。在我国,通过超声发现的甲状腺结节患病率为20%~35%[4]。考虑人群基数,如何个体化管理甲状腺结节人群是临床亟待解决的关键问题。
随着检测手段的发展和检测经验积累,甲状腺结节发病率可能有继续上升的趋势。由于绝大部分的甲状腺结节为良性结节,因此,如何通过简单可行的手段对甲状腺结节罹患状态进行评估并进行个体化治疗,对改善预后及医疗卫生支出结构尤为重要。
2020年,中华医学会超声医学分会浅表器官和血管学组提出适合中国国情和医疗状况的中国超声甲状腺影像报告和数据系统 (Chinese-Thyroid Imaging Reporting and Data System,C-TIRADS)[5]。C-TIRADS分类系统具有简便、易行、便于推广的特征,而且以我国大样本超声数据为基础,具有非常高的分类可靠性。但C-TIRADS分类系统作为一个新的危险分层系统,仍缺乏足够的临床推广和应用数据。因此,本研究拟以本中心行甲状腺超声检查的患者为研究对象,与传统分类系统进行对比,探讨C-TIRADS分类系统有效性及可行性。
本研究回顾性分析2015年1月至2021年12月于本中心就诊行甲状腺超声检查的患者。排除甲状腺结节的超声图像模糊、缺失、不完整以及甲状腺结节的超声图像有明显标记而影响判读的病例。最终共入选531个具有病理结果和完整甲状腺超声图像结节患者。
①基本资料。收集患者年龄、性别以及以下进行实验室检查的资料:游离三碘甲状腺原氨酸(Free triiodothyronine,FT3)、游离甲状腺素( Free Thyroxine,FT4)、 促甲状腺激素 (Thyroid-stimulating hormone,TSH)、甲状腺过氧化物酶抗体(Thyroid peroxidase antibody,TPO-Ab)、 甲状腺球蛋白抗体(Thyroglobulin antibodies,TG-Ab) 。
②甲状腺超声资料。
结节位置:左侧和右侧上、中、下以及峡部共7个区域。
结节方位:包括垂直位(纵径/横径>1)和水平位(纵径/横径<1)。
结节数目:单个或者多个。
结节大小:前后径、左右径和上下径。
结节边界:分为边界清晰和边界模糊,不规则甚至呈蟹足样改变。
结节结构:根据结节构成情况,分为实性结节、囊性结节、囊实混合性结节。
结节钙化:分为微小钙化(1mm以下)、粗大钙化(1mm以上)和周边钙化(甲状腺结节边缘部位的环状钙化)。
结节回声:极低回声、中等回声及高回声。内部回声均匀及回声不均。
周边晕环:结节周围的低回声带,完整的晕环,或晕环缺如、均匀或不均匀。
颈部淋巴结:均匀低回声或淋巴结构消失、多个淋巴结融合。
③甲状腺结节评分系统。
C-TIRADS 评分系统[6]:5 个阳性指标(实性、极低回声、垂直位、可疑微钙化、边界模糊/不规则或甲状腺外侵犯)和1个阴性指标(彗星尾征,且不存在其他的钙化类型),阳性指标每存在一个即+1分,阴性指标存在即-1分,最后根据结节的总分值得到相应的风险分层。
ACR-TIRADS 评分系统[6]:根据结节的结构、回声、形态、边缘和局灶性强回声这5个方面分别赋予不同的分值,根据总得分确定分类。
EU-TIRADS评分系统:按照结节不同超声表现类型进行分类。
采用SPSS 22.0统计软件分析数据。正态分布的计量资料以(±s)表示,采用t检验。非正态分布的计量资料以中位数表示,采用非参数Mann-Whitney检验。计数资料以(n,%)表示,采用X2检验或Fisher确切概率法。对比C-TIRADS评分系统、ACRTIRADS评分系统和EU-TIRADS评分系统中不同甲状腺结节构成差异。以患者手术或者细针穿刺病理结果为标准,将结节分为良性结节和恶性结节。通过绘制受试者工作特征曲线 (Receiver-operating characteristics,ROC), 获得 C-TIRADS 评分系统、ACR-TIRADS评分系统和EU-TIRADS评分系统曲线下面积(aera under the curve,AUC)并评估诊断效能。最后通过联合TSH和TgAB,绘制三种TIRADS的ROC曲线,评估诊断效能变化情况。以AUC≥0.7为诊断效能良好。以P<0.05为差异有统计学意义。
本研究共纳入531例结节病变。结果显示总体年龄 46.58(35.9,58.53)岁,男性 127 例(23.9%)。 包括良性结节235个,恶性结节296个。对于恶性结节病例,年龄较小,女性比例构成明显高于良性结节病例,差异具有统计学意义(P<0.05)。在实验室检查方面,恶性结节TSH显著高于良性结节病例,差异具有统计学意义 (P<0.05)。在恶性结节组中,TgAb阳性病例也显著高于良性病例组。差异具有统计学意义(P<0.05)(见表 1)。
表1 一般临床基本资料
续表1 一般临床基本资料
总体甲状腺结节大小中位数为11.34(8.05,16.44)mm。对于恶性结节,平均甲状腺结节大小及结节尺寸构成均显著小于良性结节病例,差异具有统计学意义(P<0.05)(见表 2)。
表2 甲状腺超声结节大小
甲状腺超声特征方面,恶性结节和良性结节发病部位类似,差异无统计学意义(P>0.05)。恶性结节比良性结节有更多的颈部淋巴结转移、实性病变、低回声/极低回声、不规则边界/蟹足样改变、微小钙化、垂直位,差异具有统计学意义 (P<0.05)。良性结节比恶性结节具有较多结节内血流丰富、声晕、囊性病变、高回声、规则边界、彗尾征钙化、水平位,差异具有统计学意义(P<0.05)(见表 3)。
续表3 超声特征资料
根据C-TIRADS评分系统、ACR-TIRADS评分系统和EU-TIRADS评分系统分析显示,三种评分系统自身对甲状腺结节区分均具有统计学意义(P<0.05)。如表4所示。
表4 不同评分系统对恶性结节识别情况
按甲状腺结节病理结果分组,通过ROC曲线分别获得三种评分系统对恶性结节具有较高的诊断效能,分别为 C-TIRADS(AUC 0.889,95%CI 0.853-0.923)、ACR-TIRADS (AUC 0.857,95%CI 0.811-0.902)、EU-TIRADS (AUC 0.863,95%CI 0.821-0.912)。三种评分系统ACU和准确率无差异。CTIRADS评分系统特异度最高,而ACR-TIRADS评分系统敏感度都最高。见表5和图1。
表5 不同评分系统对恶性结节识别情况
图1 C-TIRADS、ACR-TIRADS、EU-TIRADS评分系统对恶性结节诊断的ROC曲线
本研究进一步分析实验室检查对不同评分系统诊断效能的差异。结果显示,TSH水平(AUC 0.625,95%CI 0.516-0.725)和 TgAb 阳性(AUC 0.631,95%CI 0.528-0.731)本身对恶性结节具有一定的诊断效能。 而 C-TIRADS、ACR-TIRADS、EU-TIRADS评分系统联合TSH、TgAb可显著提高诊断效能。分别为 C-TIRADS(AUC 0.938,95%CI 0.873-0.969)、ACR-TIRADS(AUC 0.926,95%CI 0.851-0.957)、EU-TIRADS(AUC 0.931,95%CI 0.832-0.961)。 如图2。
图2 TSH、TgAb,以及C-TIRADS、ACR-TIRADS、EUTIRADS评分系统联合TSH、TgAb对恶性结节诊断的ROC曲线
在本研究中,评估856例患者的1 015个结节的临床、检验和超声特征。随后通过对其中531例具有术后病理结果的甲状腺结节,比较C-TIRADS、ACR-TIRADS、EU-TIRADS评分系统对甲状腺恶性结节的诊断性能,再通过联合甲状腺相关指标,探讨提高三种评分系统的可行性。最后本研究发现:①C-TIRADS、ACR-TIRADS、EU-TIRADS 三种评分系统在甲状腺结节分型上具有相对一致的识别能力。②再次验证恶性甲状腺结节超声特征。③CTIRADS、ACR-TIRADS、EU-TIRADS 三种评分系统对恶性结节具有较高的诊断效能,C-TIRADS评分系统特异度最高,而ACR-TIRADS评分系统敏感度都最高,但三种评分系统AUC和准确率无差异。④联合TSH水平和TgAb阳性能进一步提高CTIRADS、ACR-TIRADS、EU-TIRADS 三种评分系统的诊断效能。
甲状腺恶性结节与良性结节的超声特征具有明显差异。随着超声检查设备和技术的发展,甲状腺结节(特别是小结节)的检出率迅速提高。同时,对每个结节超声特征的描述也比以前更加精确。大量研究结果提示,实性病变、低回声/极低回声、不规则边界/蟹足样改变、微小钙化、垂直位结节等均为恶性甲状腺结节的超声特征[2,7]。本研究中发现,恶性结节比良性结节具有较多的颈部淋巴结转移、实性病变、低回声/极低回声、不规则边界/蟹足样改变、微小钙化、垂直位。结果再一次验证恶性甲状腺结节的超声特征。
甲状腺恶性结节发病部位仍有争议。有学者发现,甲状腺中部结节的恶性风险较高[8],但另一项研究提示峡部结节的恶性风险最高[9],我国学者发现甲状腺结节分布于上部分时,恶性风险最高[10]。然而在本研究中,并未发现甲状腺恶性结节发病具有显著分布部位差异。其中,可能原因为本研究样本量相对较少,差异未达统计学意义。
甲状腺恶性结节发病具有个体化差异。本研究发现,良性和恶性甲状腺肿块的患者性别和年龄存在显著差异,对于恶性结节病例,年龄较小、女性比例构成明显高于良性结节病例。由于结节的恶性转化风险可能受非甲状腺结节变量的影响,例如性别、种族、年龄、家族史、体重指数和辐射暴露[11],因此,这些结果似乎是合理的。
C-TIRADS、ACR-TIRADS、EU-TIRADS 等甲状腺结节评分系统,是通过不同超声风险类别标准对甲状腺结节病变进行风险分层的评估系统。其主要目的是以快速和相对准确的方式区分结节恶性程度。通过将结节分为不同的类别,计算每个类别的恶性风险,并根据每个结节的类别和大小推荐是否行FNA。然后,FNA结果确认结节是恶性还是良性,必要时考虑手术。这对临床诊断和决策具有关键作用。
ACR-TIRADS评分系统通过不同超声特征的分数累计获得的总分估计结节的恶性程度。按得分将结节分为TR1至TR5的不同类别。然而,每个超声特征的选择依据主要专家意见而不是通过统计分析获取。因此,ACR-TIRADS在甲状腺结节恶性预测中的准确性仍然值得怀疑[6]。本研究中,尽管三种评分系统AUC和准确率无差异,但ACRTIRADS评分系统AUC和准确率最低。EU-TIRAD评分系统基于甲状腺超声结果进行分类,具有任一个高危超声特征为高风险分级,恶性风险为(26%~87%),因此,潜在出现过度FNA及治疗可能。
C-TIRADS评分与传统公布的风险分层系统相比,具有以下优点:首先,C-TIRADS评分旨在对恶性肿瘤风险进行分层,临床管理由临床医生参考其他信息确定。本研究显示,C-TIRADS5的恶性肿瘤风险为100%,明显大于EU-TIRADS和ACRTIRADS评分系统,这与既往研究类似[12]。其次,CTIRADS采用的用于对恶性肿瘤风险进行分层的超声特征可能更科学。因为这些特征已经通过构建前向逐步选择的多变量逻辑回归模型进行优化和评估,并且将显著差异的超声特征包含在最终的逻辑中回归分析。有研究显示,无论结节大小或超声特征如何,C-TIRADS评分标准与其他评估系统相比,诊断性能更佳[13]。 在本研究中,C-TIRADS、ACR-TIRADS、EU-TIRADS三种评分系统的诊断效能并无差异,但C-TIRADS具有较高的AUC和准确率,进一步验证了C-TIRADS的有效性。这与既往研究结果类似[14]。再次,尽管不同评分系统对超声特征的解释几乎相同,但管理方案不同。CTIRADS的评分方案更简单、更清晰。例如,细点状微钙化在C-TIRADS中评分为1,在ACR-TIRADS中评分为3分,在K-TIRADS中被设置为高度提示恶性肿瘤的重要指标。具有彗尾伪影的高回声病灶在C-TIRADS中计为-1,在ACR-TIRADS中计为0分,并被视为提示良性结节的指标。最后,CTIRADS是基于计数法建立的,在临床实践中比加权法更方便实用。C-TIRADS相对简单的评分系统可以节省医师累积评分的时间,具有更强的临床实用性。
基于超声特征的风险分层系统,是甲状腺结节进行 FNA 主要依据[11,15]。 然而,每个风险分层系统的超声特征和FNA的结节大小临界值具有不同差异,需要深入了解FNA以优化患者管理。有研究显示,ACR-TIRADS评分系统的FNA结节百分比和不必要的FNA率最高,C-TIRADS评分系统的FNA结节百分比相对较低,不必要的FNA率也较低。结合其对ROC曲线的高特异性、准确性和AUC,基于超声特征的FNA标准显示,C-TIRADS的诊断性能优于其他评分系统[13]。一方面,甲状腺癌是生长缓慢的肿瘤,并且比其他恶性肿瘤具有更好的预后,但延迟诊断有可能会影响患者的预后;另一方面,不必要的FNA可能会给患者带来相当大的焦虑,加重经济和医疗负担。有研究显示,没有高危超声特征的甲状腺癌预后较好[16],所以,选择合适的随访策略可能是一种更有效的替代方法[17]。本研究中,C-TIRADS 4C、EU-RADS 5和 ACR-TIRADS 5在甲状腺结节的风险分层中显示出良好的敏感性和特异性。这意味着它们更擅长区分恶性甲状腺结节和良性结节,能协助更好地选择FNA适应症。
血清TSH水平有利于协助评估甲状腺结节状态[18]。血清TSH水平升高可能与结节性甲状腺恶性肿瘤的风险增加有关[19-20]。分化的甲状腺癌细胞在细胞膜上含有TSH受体,并通过增加多种甲状腺特异性蛋白的表达对TSH刺激作出反应,并导致细胞生长速率升高[21]。低TSH水平导致甲状腺上皮细胞分化减少,这可能导致对恶性细胞转化的敏感性更高[22]。即使在正常范围内,甲状腺恶性肿瘤的风险也会随着TSH浓度的升高而增加[23]。观察性数据显示,甲状腺癌患者的TSH水平与肿瘤分期正相关[24]。学者 Boelaert等(2006)[25]通过对 1 500 名没有甲状腺功能异常的患者进行分析显示,与TSH水平<0.4mU/L的患者相比,TSH水平在1.0和1.7mU/L之间的受试者比TSH水平<0.4mU/L的患者患恶性肿瘤的风险高。其他相关研究也有类似结果[19,26]。在本研究恶性结节组中,也发现类似结果:TSH水平也升高,具有一定诊断效能。此外,有研究显示,甲状腺激素对甲状腺细胞增殖有潜在直接影响。T3受体是通过作用于其启动子来控制甲状腺成纤维细胞生长因子表达的因子,而且T3受体突变形式可能会增加磷脂酰肌醇3-激酶信号传导并在小鼠模型中引起甲状腺癌[27]。有研究提示,低水平血清FT3和FT4是预测甲状腺癌的危险因素,而且与性别和结节类型无关[28]。但本研究并未发现组间血清FT3和FT4具有统计学差异,可能原因系甲状腺激素对不同甲状腺肿瘤影响不同,本研究中恶性甲状腺结节疾病构成比与既往不同。
甲状腺自身免疫状态有利于协助评估甲状腺结节恶性程度。有学者发现对于甲状腺恶性肿瘤患者15%合并桥本氏甲状腺炎[29],而且无论是否存在自身免疫性甲状腺炎,TgAb阳性是结节中甲状腺恶性肿瘤的独立预测因子,而且和甲状腺恶性肿瘤恶性程度相关[30-31]。
联合TSH和自身免疫指标能进一步提高TIRADS对甲状腺结节诊断的准确性。本研究发现,C-TIRADS、ACR-TIRADS、EU-TIRADS 评分系统联合TSH、TgAb可显著提高诊断效能。平均AUC达0.93以上。因此,对于TIRADS评分系统临界值或FNA Bethesda标准 (III-IV)分类的大量不确定结节,联合诊断有望进一步提高诊断效能。
本研究存在以下不足。首先,本研究为单中心研究,其研究结果不一定适合所有医院。其次,作为回顾性研究,分析超声图像为静态图为主,在一定程度上可能影响结果判读。本研究通过删除超声图像不清晰病例,同时由具有丰富经验的甲状腺超声医生进行解读,一定程度上降低图像的影响。最后,本研究病理结果依靠手术和FNA判断甲状腺结节良恶性,因此,有可能低估恶性结节的患病率。
C-TIRADS和其他评分系统 (ACR-TIRADS及EU-TIRADS)具有一致诊断效能。C-TIRADS联合甲状腺相关检查能提高诊断效能有效性。CTIRADS简单可行且有效。