陈俊慧,张 曼,刘水澎,马 琳,刘 洋,李晓松,孟 健,李 劼,张树华
华北理工大学附属医院超声科,河北 唐山 063009
目前,在所有肿瘤中,甲状腺肿瘤发病率增长最快,这使得甲状腺肿瘤备受关注。早期鉴别诊断甲状腺结节的良恶性对患者的心理、临床干预及预后具有重要意义。当前临床常用的甲状腺检查方法有超声、CT、MRI、核素扫描、细针抽吸活组织检查(fine-needle aspiration biopsy,FNAB)等,虽然病理检学查是鉴别诊断甲状腺结节良恶性的金标准,但因超声检查具有无创、无辐射、敏感、实时及可重复性强等特点,成为甲状腺疾病诊断的基础[1]。超声检查又包括灰阶超声、彩色多普勒超声、超声造影及弹性成像,而灰阶超声检查更是其他所有超声检查的基础。近年来,为了能更准确地评估甲状腺结节的良恶性,国内外诸多学者探索了甲状腺结节风险分级模型,包括传统超声、超声造影及弹性成像,以尝试建立甲状腺结节超声诊断的规范化标准,但尚无共识。基于这种状况,本研究旨在建立一种超声征象权重评分法的甲状腺癌风险预测模型,为鉴别诊断甲状腺结节的良恶性提供更为客观、高效的依据。
本研究分析了1 988例甲状腺结节的超声征象,采用超声征象多因素logistic回归分析,基于其β值做权重评分,建立积分法的甲状腺癌诊断模型;通过150例甲状腺结节验证研究,评估并验证了其在甲状腺结节良恶性鉴别诊断中的价值。
将2015年1月-2018年8月于华北理工大学附属医院检查的甲状腺结节患者作为试验研究对象;将2018年9月-2018年12月于华北理工大学附属医院检查的甲状腺结节患者作为验证研究对象。纳入标准为:① 于术前3个月内行常规超声检查;② 图像清晰、完整;③ 超声所检查结节得到手术或FNAB后的病理学检查证实。排除标准:①图像处理不当,内部结构不能很好地识别;② 术后病理学检查缺失或病理学检查与结节不能一一对应;③ 术前检查时间超过3个月。共计1 749例患者,共1 988个甲状腺结节纳入试验研究;96例患者共150个甲状腺结节纳入验证研究。
分析所纳入甲状腺结节的超声报告及影像资料,经严格培训并参照甲状腺超声描述词典,对图像进行标准化处理,在不了解患者病理学检查结果的前提下,由两名主治医师对甲状腺结节的超声征象共同分析,意见不统一时请高年资医师会诊协商决定;对于多灶性结节,依据结节部位及大小,分别编号记录。主要记录内容如下:
① 成分:分为实性、囊实性、海绵样。②回声水平:分为极低回声、低回声、等回声、高回声、混合回声。当囊实性结节内实性成分占比高于80%时,以实性成分回声水平为准记录;当实性成分内部回声不均一时,以主体部分的回声水平为准记录。③ 纵横比:分别以<1及≥1记录。④ 边界:分为清晰和不清晰。⑤ 形态:分为规则、不规则。⑥ 被膜受侵:即结节突破甲状腺被膜。⑦ 钙化:分为微钙化、粗大钙化、边缘钙化、彗星尾征。
采用SPSS 22.0统计学软件进行数据分析,将所记录甲状腺结节的超声征象,用单因素分析筛选甲状腺癌独立危险因素,将单因素分析有统计学意义的变量纳入多因素logistic回归方程,以其中最小的偏回归系数β值为1,以其他危险征象β值与此β值之比为各征象赋分,并以10倍评分作为其最后权重分值,以结节的总积分建立甲状腺癌的风险预测模型。计量资料以x±s表示。对整个模型的拟合情况采用似然比检验,对回归参数估计采用Wald检验,并用受试者工作特征曲线(receiver operating characteristic curve,ROC)评价此预测模型的诊断价值,计算此模型在鉴别诊断甲状腺结节良恶性中的最佳诊断截点及灵敏度、特异度、准确率、阳性预测值、阴性预测值、Youden指数,并以验证数据验证其工作效能。P<0.05为差异有统计学意义。
1749例试验研究甲状腺结节患者,年龄11~82岁,平均(51.59±11.63)岁。其中,男性患者结节数494个(24.8%),平均年龄(51.58±12.06)岁(19~81岁);女性患者结节数1 494个(75.2%),平均年龄(51.60±11.49)岁(11~82岁)。在1 988个结节中,恶性结节650个,其中未分化癌4个,髓样癌3个,转移癌3个,结节性甲状腺癌并乳头状癌19个,桥本甲状腺炎并甲状腺癌15个,滤泡癌6个,梭形细胞恶性肿瘤2个,弥漫大B细胞淋巴瘤2个,甲状腺乳头状癌596个;良性结节1 338个,其中增生活跃结节126个,腺瘤208个,亚急性甲状腺炎48个,桥本甲状腺炎216个,结节性甲状腺肿740个。超声特征单因素分析结果见表1。
表 1 单因素卡方检验分析结果Tab. 1 Single factor x2 analysis results
筛选甲状腺癌的危险因素,并以其中最小的偏回归系数β值0.969为1分,构建甲状腺癌风险评估量表,以10倍赋分作为征象的权重评分,再次纳入logistic回归分析中,以各结节总积分建立甲状腺癌的风险预测模型,多因素分析结果与危险因素积分值汇总于表2。
表 2 多因素logistic回归模型分析结果及危险因素积分值Tab. 2 Logistic regression analysis results and integral value
采用logistic回归β值积分法的甲状腺癌风险预测模型的ROC:根据独立危险因素积分绘制ROC,曲线下面积为0.953(图1),最佳诊断截点(cut-off)为24.2分,诊断的灵敏度、特异度、阳性预测值、阴性预测值分别为88.6%、93.3%、86.8%和94.4%,ROC坐标及约登指数(表3)。
表 3 Logistic回归分析的ROCTab. 3 ROC of logistic regression analysis
图 1 甲状腺癌的危险因素评分体系ROCFig. 1 ROC of risk factor scoring system for thyroid cancer
经验证研究,绘制此模型对甲状腺结节良恶性预测能力的ROC,曲线下面积为0.883(图2)。
图 2 此模型对甲状腺结节良恶性预测能力的验证ROCFig. 2 ROC of the model's ability to predict benign and malignant thyroid nodules
结节性甲状腺疾病在任何年龄段均可发生,尤其多发于中青年女性,其发病率逐年升高,已跃居头颈外科恶性肿瘤的首位[2]。如何提高甲状腺结节的诊断准确率,避免不必要的手术,防止过度治疗已成为亟待解决的问题。本研究参照甲状腺超声报告术语对超声图像进行标准化处理,对结节的超声征象进行规范化评估,并采用积分法量化了甲状腺癌的危险征象,确立了甲状腺结节良恶性的最佳诊断截点,建立了简便而快捷的甲状腺癌风险预测模型,其诊断的灵敏度、特异度和正确率分别为88.6%、93.3%和95.3%。
本研究中,以单因素分析法筛选的甲状腺癌独立危险因素包括:实性、极低回声、低回声、被膜侵犯、纵横比≥1、形态不规则、边界不清晰、微钙化及边缘钙化,均被纳入logistic回归模型,但被膜侵犯及边缘钙化未能出现在logistic回归方程中,可能与这两种征象在本研究样本中的出现频次有关。研究发现,具有被膜侵犯特征的甲状腺结节,术后病理学检查均被证实为恶性,其敏感度及特异度均达到100%。关于被膜侵犯,闫维等[3]和邱凯等[4]研究显示,其与甲状腺乳头状癌中央区淋巴结转移有相关性,转移率高达50.49%;张明琼等[5]研究则认为被膜侵犯是肿瘤具有侵袭性生长这一生物学特性的标志。所以,可以认为,当发现被膜侵犯征象时,肿瘤的恶性可能性高度增加。而关于边缘钙化,有研究[6]表明其常被认为是甲状腺良性肿瘤的标志,与本研究多因素logistic回归结果一致,对于单因素分析中,边缘钙化为独立危险因素的结果,有待增加样本量后进一步验证。
多因素logistic回归法筛选的甲状腺癌独立危险因素为:实性结节、极低回声、低回声、微钙化、纵横比≥1、形态不规则及边界不清晰。与Kwak等[7]观点一致,本研究认为实性成分、低回声或明显低回声、微分叶或形态不规则、微钙化、纵横比>1与甲状腺癌高度相关。田虹等[8]研究证实,形态不规则和边界不清晰是诊断恶性结节特异度和准确率都较高的指标,考虑其与恶性肿瘤呈侵袭性生长有关。美国甲状腺学会(American Thyroid Association,ATA)于2015年发布《成人甲状腺结节与分化型甲状腺癌诊治指南》[1]明确提出当结节含有微钙化、边缘不规则及纵横比>1征象时,高度怀疑为恶性结节。有学者研究发现微小钙化是诊断甲状腺乳头状癌特异度最高的指标[9],与本研究结果一致。微小强回声不仅出现在大部分甲状腺乳头状癌中,还可见于甲状腺嗜酸性腺瘤滤泡(浓缩胶质)、桥本甲状腺炎(胶质沉积)及结节性甲状腺肿(灶状或带状纤维化)。因此,当发现这一征象时,需重点观察结节内强回声的数目、形状、大小、分布[10]及结节内部结构,对这一征象进行综合评价,减少良恶性结节混叠的现象,提高准确率。李裕生等[11]研究发现纵横比≥1更多见于微小乳头状癌,考虑可能是前后方向的癌细胞比其他方向的细胞增殖分裂更活跃所致。金占强等[12]研究发现边界模糊、不规则边缘及垂直生长与甲状腺癌无相关性,本研究与之不一致。Moon等[13]研究发现当甲状腺结节具备极低回声、低回声、毛刺或小分叶、纵横比大于>1、微钙化或粗大钙化等特征时,恶性的可能性增加,本研究中粗大钙化未能进入回归方程,考虑与该征象在样本中出现的频次及其在良恶性结节中出现的比例有关,需加大样本量进一步验证。
本模型在验证研究中,对甲状腺结节良恶性的鉴别诊断正确率达88.3%,证实其在实际工作中具有较高的效能。
基于超声征象多因素logistic回归β值权重评分法研究的意义:近年来,关于甲状腺结节的超声评分方法已有部分报道[14-15],但均没有对各危险征象的权重进行考量,本研究通过对危险征象的权重进行分析、评分,更加客观地量化了各征象的诊断权重,为鉴别诊断甲状腺结节的良恶性提供了更为客观、可靠的依据。
本研究的不足:① 可能存在选择性偏倚;②样本数量不足,致使单因素分析时有统计学意义的征象未能进入方程。
综上所述,多因素分析可以提高诊断甲状腺癌的准确性,本研究采用超声征象多因素logistic回归β值权重评分法建立了简易、客观、高效的甲状腺癌风险预测模型。虽然本研究的超声征象积分方法还存在不足,但这种权重评分法已显示出重要价值,并经实践证明,权重积分≥24.2分对甲状腺癌的诊断具有较高的准确性;此外,当结节出现被膜侵犯征象时,恶性可能增加。