林 蔚,丁 宁,朱思平*
1南京医科大学第一附属医院老年内分泌科,2呼吸与危重症医学科,江苏 南京 210029
超声作为一种安全、无辐射、无创伤的检测方式,是甲状腺结节筛查及良恶性预测的首选影像检查方法。为了更好地应用超声技术对甲状腺结节进行评估,2009 年Horvath[1]提出了甲状腺影像报告与数据系统。然而,在临床实践中,不同超声医师对恶性超声征象特征的解读不同[2],进而得到的结果也各有差异,给临床医生制定临床治疗策略带来了一定困扰。2020 年,中华医学会超声医学分会浅表器官和血管学组专家委员经过多中心研究论证后提出了中国(超声)甲状腺影像报告和数据系统(Chinese thyroid imaging reporting and data system,C-TIRADS)[2]。我们在前期临床实践中使用C-TIRADS 预测甲状腺结节的良恶性,发现其具有较好的特异性、敏感性和可操作性。然而,还鲜有针对该分类方式联合弹性成像的临床应用报道。因此,本研究通过与此前广泛应用的Kwak TIRADS[3]及美国放射学会(American College of Radiology,ACR)提出的ACR TI-RADS[4]进行比较分析,并结合弹性成像技术对甲状腺结节进行良恶性预测,为临床诊疗提供依据。
回顾性分析2018 年1 月—2019 年12 月在南京医科大学第一附属医院行细针穿刺抽吸活检(fineneedle aspiration biopsy,FNAB),获得明确术后组织病理或细胞学病理结果的患者120 例,结节共计123 枚。纳入标准:①均有矢状面及横断面二维超声图像,弹性成像动态存储视频及测值记录;②均经手术切除或取得FNAB明确结果。记录甲状腺结节的常规超声特征:包括结节大小、内部结构(成分)、回声、形态、边界、钙化等指标。图像采集、超声特征记录及弹性成像评分均通过同一超声医师(5 年以上工作经历)获得,评分时不知病灶的良恶性。采用Philips iU Elite 超声诊断仪,线阵探头L12-5,频率5~12 MHz。
1.2.1 Kwak TI-RADS分级[3]
评分标准:5 项恶性可疑征象包括实性、低或极低回声、细小分叶或形态不规则、微钙化、纵横比>1。2类包括海绵样结节、囊性结节;3类不包含任一恶性征象;4类:4a(1项恶性征象)、4b(2 项恶性征象)、4c(3~4 项恶性征象);5 类(5 项可疑恶性征象或有明确颈部转移性淋巴结)。
1.2.2 ACR TI-RADS分级[4-5]
纳入的超声指标:结节的成分、回声、形状、边缘边界及钙化5 项。囊性或几乎全为囊性或海绵状0分,囊实性1分,实性或几乎为实性2分;无回声0分,等或高回声1分,低回声2分,极低回声3分;纵横比<1 为0 分,纵横比>1 为3 分;边界光滑或不清楚0分,不规则或呈分叶状2分,紧贴包膜或甲状腺外侵犯3分;无或伴大彗星尾0分,粗大钙化1分,周边钙化2 分,点状强回声3 分。TR1:0 分;TR2:2 分;TR3:3分;TR4:4~6 分;TR5:≥7分。
1.2.3 C-TIRADS分级[2]
纳入超声的阳性指标:垂直位、实性、极低回声、微钙化(如微钙化、慧尾征和意义不明确的点状强回声共存,只记录微钙化)、边界模糊/不规则或甲状腺外侵犯,计数上述恶性超声特征的数量,每项恶性超声特征计1分。阴性指标:点状强回声伴慧尾(只在未出现微钙化时才记录),减1分。总计分值行结节的风险分层:-1 分为2 类,0 分为3 类,1 分为4a类,2分为4b类,3或4分为4c类,5分为5类。
1.2.4 剪切波弹性成像评分
通过Philips iU Elite 超声诊断仪配置的剪切波弹性成像系统,应用五分法[5]记录结节的弹性分值。
使用SPSS 22统计软件对资料进行分析。定量资料的描述采用均数±标准差()表示,定性资料的描述采用百分比表示。率的比较采用卡方检验,相关性采用Sperman相关分析。以病理结果为结局变量,分别对Kwak TI-RADS 分级、ACR TI-RADS 分级、C-TIRADS 及其分别联合弹性成像进行模型预测,制作ROC 曲线并比较曲线下面积(area under curve,AUC)。同时比较联合弹性成像与单纯分级的敏感性与特异性。P<0.05为差异有统计学意义。
120例患者,结节共计123枚。其中男27例,女93 例,年龄(47.8±12.4)岁(24~82 岁)。结节上下径(1.29±1.15)cm(0.2~7.5 cm),前后径(0.97±0.79)cm(0.2~4.6 cm),左右径(0.94±0.69)cm(0.1~3.6 cm)。123个甲状腺结节中,67例恶性(乳头状癌65例,淋巴瘤1例,滤泡型乳头状癌1例),56例良性(图1)。3种TI-RADS分类方法下结节的良恶性构成见表1。
C-TIRADS 分类级别与结节恶性率呈显著正相关(r=0.689,P均<0.01)。分类级别越高,恶性率越高,差异具有统计学意义(P<0.01)。C-TIRADS、Kwak TI-RADS 及ACR TI-RADS 最佳截断值分别为4c、4c、TR5。独立预测时,C-TIRADS 的AUC 最高,与另两种方式比较差异无统计学意义(P>0.05,图2);最佳截断值时,组间结节恶性率无明显差异(P>0.05)。
联合弹性成像后,3 种分类方式AUC 均有所增加(0.83~0.90,P>0.05),以C-TIRADS 的AUC 最高。C-TIRADS 联合弹性成像后特异度增加,较联合前差异有统计学意义(P<0.05),但与另两种方式差异无统计学意义(P>0.05);3种方式灵敏度均有所降低,但前后各组无明显差异(P>0.05),C-TIRADS灵敏度高于另两组,差异有统计学意义(P<0.05,图2,表2)。
表2 TI-RADS分类诊断效能比较(n=123)
图2 3种方式独立预测及联合弹性成像后ROC曲线
随着超声医学的发展及其在甲状腺疾病中的广泛应用,甲状腺结节检出率增加[6],TI-RADS分类已经成为临床诊疗的重要依据,因此规范甲状腺结节危险分层,对制定合理的临床诊疗策略尤为重要。C-TIRADS是2020年由中华医学会超声医学分会浅表器官和血管学组专家委员会经过多中心研究论证后提出的中国第一个甲状腺结节恶性风险分层超声指南,其价值尚需在临床中进一步应用总结,因此本研究选取此前在国内应用广泛的Kwak TI-RADS 及ACR TI-RADS[7-9],与C-TIRADS 进行比较分析,探讨C-TIRADS 联合弹性成像在甲状腺结节良恶性评估中的应用价值。
本研究中3 种分类方式均具有良好重复性,临床预测价值与既往研究结果具有高度一致性。Kwak TI-RADS AUC 0.85,ACR TI-RADS 的AUC 0.78,与之前的研究结果一致[10-11]。C-TIRADS AUC 0.88,灵敏度94.0%,特异度69.6%,与多中心研究结果一致(AUC 0.89,灵敏度92.7%,特异度71.2%)[2]。在独立预测时,C-TIRADS的AUC及灵敏度最高,但是与其他分类方法无统计学差异,可能与我们的样本量偏小有关。本研究中Kwak TI-RADS与ACR TIRADS的最佳诊断值分别是4c与TR5,与既往研究一致[10-11],C-TIRADS最佳诊断值为4c,这也是C-TIRADS发布后的首次相关报道。
对甲状腺结节进行良恶性评估,3 种分类方式都是通过二维超声图像特征进行评估,主要评估内容围绕甲状腺结节的纵横比、回声、内部结构、边界、微钙化,观察的主要内容一致,C-TIRAD 较其他两种分类方式更为简便。ACR TI-RADS 采取赋分的方法,体现了恶性特征在分级诊断中的加权意义,但是在实际操作中,增加了计算内容,再根据总分数进行归类分级,不如另两种方式简便,而且ACR TI-RADS 中的超声特征对不确切的钙化进行赋值时有一定困难,还可能对结节的分类造成影响[8]。Kwak TI-RADS及C-TIRADS均采取按项计数的方式,简便易行。C-TIRADS 较Kwak TI-RADS 的改进之处是,对于不能区别的微钙化、慧尾征和意义不明确的点状强回声直接计分[2],减少了不易辨认的钙化对危险分层的影响。另外,C-TIRADS 对于明确的具有彗星尾征的点状钙化(不同时存在微钙化)予以减分,降低了良性特征明显结节的穿刺风险[2]。C-TARDS 灵敏度最高,有利于筛选出需要进一步评估的结节,这可能与C-TIRADS 评价内容更全面有关。例如C-TARDS 描述的垂直位包含了纵切面和横切面测值比,而Kwak TI-RADS 及ACR TI-RADS的纵横比仅含横切面测值比。
随着对甲状腺结节良恶性评估研究的深入,弹性成像越来越多地应用于甲状腺结节的危险分层[12]。联合弹性成像评估后发现,C-TIRADS 的AUC增加,灵敏度虽略有降低(94.0%vs.89.6%,P>0.05),而特异度却得到了明显提高(69.6%vs.83.9%,P<0.05),这说明联合弹性成像可以在不损失CTIRADS 预测灵敏度的基础上提高诊断的特异性,诊断效能增加。因此我们认为C-TIRADS 联合弹性成像更有利于对甲状腺结节进行危险分层评估时,降低穿刺率,更加利于临床诊疗策略制定。
综上所述,C-TIRADS 分类标准对甲状腺结节良恶性的评估具备很好的预测价值,联合弹性成像可以增加预测效能,降低穿刺率,对临床诊断策略制定更加有利,有很好的临床应用前景。本研究主要采用回顾性分析,尽管与实时性观测效果有所不同,存在一定局限性,差异有待进一步验证,但可以为甲状腺结节超声评估标准化及远程会诊提供一定参考。联合弹性成像后,AUC 均有所改变,虽然无明显统计学差异,但也呈现出一些趋势,有待于日后累积病例再行探讨。