陈佳乐,任克
厦门大学附属翔安医院放射科,福建 厦门 361000;*通信作者 任克 renke815@sina.com
大多数甲状腺结节在影像学检查时偶然发现,65%的甲状腺结节可通过超声成像检出,约15%的结节由CT或MRI颈部扫描发现[1]。1990—2019年,甲状腺癌的发病率呈明显上升趋势[2]。目前临床医师在诊断甲状腺结节时,既要避免对低风险癌症的过度诊断,又要不影响需要迅速治疗的罕见晚期或高风险肿瘤患者[3]。随着交叉学科研究的迅速发展,影像组学应时而生,它将医学影像图像转换为数据信息,并对其进行定量分析,挖掘出潜在的病理生理信息,可以给医师提供更多的信息[4]。在适当治疗和监测高风险患者的同时,影像医师可借助影像组学最大限度地减少过度治疗对患者的潜在危害,为临床提供更加准确的影像诊断。
超声是筛选甲状腺结节最常用的方法,随着诊断技术的不断进步,甲状腺结节的确诊率越来越高[5]。为了避免甲状腺结节过度诊断,美国放射学会(American College of Radiology,ACR)于2017年创建了甲状腺影像报告和数据系统(thyroid imaging reporting and data system,TI-RADS),对甲状腺结节的诊断提出了建议。根据图像上结节的实性成分、回声、形状、边缘和强回声灶5个影像学特征对甲状腺结节进行评分,确定结节恶性的概率以决定是否做细胞细针穿刺检查(fine-needle aspiration biopsy,FNA)[6]。虽然FNA是诊断的“金标准”,但该检查仍然不完善,20%~30%的样本被认为没有诊断性或不确定[7];同时FNA为有创检查,对无症状的患者存在一定损害;并且完全保守检查偶尔会出现漏诊。
对于ACR TI-RADS标准,Huang等[8]通过TIRADS评分与影像组学评分制作诺谟图进行对比,发现影像组学模型的预测性能更好,训练集和验证集的受试者工作特征曲线下面积(AUC)达0.877和0.864,决策曲线分析表明模型具有一定的临床价值,证明影像组学在甲状腺结节良恶性鉴别中有一定的价值,对于初级影像医师而言,借助影像组学可以更好地指导临床。Park等[9]则用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)算法选取的特征的线性组合计算每个结节的影像组学评分,以反映恶性肿瘤的风险;并通过约登指数确定的最优截断值评估其性能,同时根据影像组学评分不同的恶性肿瘤风险程度(5%、10%、20%)选择截断值进行评估,在验证集中比较这3种截断值对应的敏感度和特异度;该研究发现影像组学评分的风险值为5%时具有最高的敏感度,为95.6%,而根据约登指数确定的最优截断值具有最高的特异度,为79.8%,同时降低了FNA的不必要率。针对行FNA检查时偶尔会出现不确定的细胞学特征无法判断结节良恶性的情况,Yoon等[10]结合细胞学特征进行研究,通过MATLAB 2019b软件采取内部纹理分析算法提取纹理特征,在交叉验证的LASSO回归模型下确定了15个最优特征,然后进行单变量逻辑回归和多变量逻辑回归分析,在内、外部验证中均发现多临床变量+影像组学评分模型优于单临床变量+影像组学评分模型,证明定量的影像组学特征有助于确定细胞学中不确定的甲状腺结节的良恶性。
随着研究不断深入,影像组学在甲状腺结节确诊方面的价值逐渐上升,同时超声新技术的迅猛发展所带来的技术革新弥补了常规超声鉴别诊断甲状腺结节的不足,提高了甲状腺结节良恶性的诊断率。剪切波弹性成像可实时定性定量显示结节的软硬度信息,技术检查结果较客观,可重复性高,避免了操作时需要人为加压、易受操作者经验及手法影响等不足[11]。Zhao等[12]结合常规超声图像与剪切波弹性成像图像,通过机器学习辅助视觉方法建模比较,发现添加剪切波弹性成像图像后,机器学习辅助视觉方法的诊断效果更佳,与ACR TI-RADS相比,在验证集中FNA的不必要率从30.0%降至4.5%。结合不同参数的图像,融合数据训练模型,提高模型预测精度对精准治疗有很大的帮助。
在鼓励交叉学科学习后,研究者对机器学习有了更深的认识,部分学者在建模算法上进行了很多尝试。深度学习是目前人工智能发展的热点,可以自动从大量数据中学习有效特征,并将这些特征进行分类[13],与影像组学结合应用可避免手动图像分割带来的误差。Zhou等[14]基于卷积神经网络(convolutional neural networks,CNN)开发了甲状腺的深度学习影像组学(deep learning radiomics of thyroid,DLRT)模型对1 629例病例进行分析。与其他模型不同,DLRT使用每一图像的3个感兴趣区(ROI)作为输入层,并且为了更好地解读超声图像,DLRT应用了一种深度学习可视化技术,称为类激活图,让DLRT认为色调较暖的像素比色调较冷的像素与结节分类的相关性更强,还在训练集中通过数据增强策略减少模型过拟合的问题,得到DLRT模型的诊断准确率比其他模型高,AUC达到0.96。DLRT模型的敏感度和特异度显著优于人工诊断,表明DLRT对甲状腺结节的良恶性鉴别诊断值得参考。Zhou等[15]还建立了一种迁移学习和在线学习相结合的方法对甲状腺结节进行定量分析,并与基于视觉几何群网络(visual geometry group network,VGG)的VGG16模型和基于不同输入图像的模型进行比较,发现模型在训练集和验证集中AUC达到0.91和0.90,比VGG16模型的迁移学习具有更高的诊断准确度,还表明基于3种ROI的CNN模型(AUC=0.88)比基于一种ROI的模型诊断准确率高0.05,是较好的学习方法。
超声检查图像分析受医师主观性影响强,更依赖其操作手法,在采集和图像重建参数时可能会引入非病理变化。而CT和MRI受主观因素影响小,对甲状腺结节诊断有潜在的优势,借助CT和MRI图像对甲状腺结节进行影像组学分析,可为临床提供更好的诊断。
2.1 基于CT图像 梁红琴等[16]通过甲状腺结节CT特征指标建立Fisher判别及非条件逻辑回归模型预测甲状腺结节的性质,发现Fisher判别方法的敏感度为96.6%、特异度为91.1%、约登指数为94.4%,非条件逻辑回归法的敏感度为95.4%、特异度为92.9%、约登指数为94.4%,均显示出良好的鉴别水平。赵泓博等[17]联合机器学习对39例甲状腺乳头状癌与45例腺瘤进行鉴别,采用随机森林、逻辑回归和支持向量机3种模型进行分类训练,发现随机森林模型的AUC最大,且敏感度和特异度最高,分别为0.75和0.70,对结节良恶性的鉴别效果良好。由于直径≤2 cm的结节在临床上不易鉴别,胡小丽等[18]对97例符合要求的甲状腺结节患者的CT平扫图像进行影像组学分析,通过LASSO算法选取的特征建立逻辑回归模型,发现在训练组及验证组中,模型鉴别能力较好,敏感度分别为0.77和0.74,特异度分别为0.79和0.91,相应的AUC分别为0.84和0.88。对于直径较小的结节,影像组学也具有很好的预测效果。
由于CT伪影、甲状腺周围组织复杂、边缘模糊等原因,Li等[19]认为传统的机器学习算法难以在增强CT图像中对甲状腺结节进行处理,其设计了一种端到端的甲状腺结节自动识别分类系统,采用语义分割网络Unet模型对图像进行处理。该模型的跳跃连接结构网络和U型结构网络可以同时结合高分辨率的局部信息和低分辨率、大面积的信息,使甲状腺结节的分割更加准确,融合训练不同深度的CNN网络,最终算法的总体分类性能准确度为85.92%,召回率为91.43%,精准度为90.57%,特异度为66.67%,AUC为0.825 3。孟名柱等[20]通过使用CT双期增强图像的3种深度迁移学习模型对甲状腺良、恶性结节进行分类预测,在验证集中得到以稠密卷积网络(dense convolutional network,DenseNet)中DenseNet201模型的分类效能最佳,准确度达0.98,各项指标均高于VGG19模型和残差网络(residual network,ResNet)的ResNet50模型,有助于提高影像诊断准确度;而虽然ResNet50模型分类效果最差(AUC=0.91),但预测训练时间最短。随着深度学习在医学中的迅猛发展,模型的适用性成为大家关注的热点。为了测试模型的适用性,Zhang等[21]基于CT和超声两种成像方式开发了一个以数据为中心的深度学习模型用于甲状腺疾病检测,选取目前更先进的Xception架构(Extreme Inception),对不同性质的甲状腺结节进行区分,模型对超声图像和CT扫描的准确度分别达到0.972和0.942,表明所选择的CNN模型可以适应两种图像模式,证明了深度学习模型的可行性,并强调了其在临床中的进一步应用。但既往研究大多数基于CT增强图像,对于碘对比剂对甲状腺结节患者的影响[22],以及如何最大程度地降低检查中的潜在危险因素需要进一步思考。
2.2 基于MRI图像 MRI有良好的软组织对比,同时能进行多平面和多序列扫描,在甲状腺结节检查中可获取更多的图像信息。Brown等[23]对42例甲状腺结节患者的扩散加权成像(DWI)图像评估纹理分析是否可以提高对可疑甲状腺结节恶性分层的准确度、敏感度和特异度,采用MaZda纹理分析方法进行研究,发现与表观扩散系数(ADC)图像相比,弥散加权回波平面图像的纹理分析具有更高的敏感度和特异度。影像组学能提供有关肿瘤表型和微环境的信息[4],结合临床结果可以更好地辅助诊疗,Meyer等[24]通过常规序列MRI图像的纹理分析反映了甲状腺癌不同的组织病理学特征,发现T1WI和T2WI上提取的部分纹理特征与p53、Ki-67有关联,且ADC峰度与细胞数呈负相关,ADC与Ki-67指数呈负相关,强调了不同的MRI序列反映了肿瘤不同的微观结构特征。除纹理分析外,基于不同的序列图像,Wang等[25]在算法上进行了比较研究,对120例甲状腺乳头状癌患者在1.5T MRI上T2WI、ADC和增强T1WI的图像进行甲状腺乳头状癌侵袭性评估,用11种特征提取的算法与22种机器学习算法分别建模并绘制热图,发现在LASSO特征提取与梯度提升决策树算法结合比其他算法的AUC更大(AUC=0.915),在评估甲状腺乳头状癌侵袭性方面具有较好的准确度,对甲状腺结节性质的判断有一定能力。Dai等[26]在对甲状腺乳头状癌的侵袭力预测中,采用基于稀疏表示的分类方法建立模型,单独测试了基于增强T1WI、T2WI和DWI图像的模型,其中DWI模型准确度最高,达0.861;通过联合3个序列特征得到的模型效果最好,准确度为0.917,AUC达0.960,敏感度和特异度分别为0.912和0.946。同样也证实了融合不同图像数据,模型能达到更好的准确度。从以上研究还能看出基于DWI/ADC图像,影像组学能够很好地应用于甲状腺结节良恶性鉴别,且比增强T1WI效果好,可避免患者过度检查。MRI作为无创、无辐射的检查方法,人为干扰因素少,在影像组学中能更好地实现图像标准化和实验的可重复性,在未来甲状腺研究中具有更大的潜力。
影像组学是超越人眼主观评估、对定量影像特征进行提取、分析和解释的一种科学。在甲状腺结节良恶性鉴别方面,基于不同模态的影像组学均取得了一定的成果,为临床提供了更多、更详尽的信息,有助于临床确定治疗方案。但现有的甲状腺结节影像组学研究大多还是以小样本、回顾性分析为主,所得结论缺乏外部验证且重复性较差,未来还需要进一步展开多模态合作与多中心验证取得更有价值的研究成果。
总之,随着医学影像成像技术的不断标准化,在与计算机领域的不断交流下,对不同数据分析模型的深入理解,影像组学将对甲状腺结节患者提供更精准的临床诊疗。