于 淼,郭 昊,李彩娟(通讯作者),2
(1.牡丹江医学院,黑龙江 157011;2.牡丹江医学院附属红旗医院 超声科,黑龙江 157011)
2015年,美国甲状腺结节及甲状腺癌管理指南中指出,甲状腺结节为甲状腺内的离散病变,在影像学中与结节周围的甲状腺实质略有不同,日常检查正变得越来越普遍[1]。一般人群甲状腺结节检出率达65%,大多数是良性结节,其临床意义并不大[2],只有大约5%~10%的甲状腺结节是恶性的[22]。目前,细针穿刺活检(FNA)和组织学检查是诊断甲状腺结节良恶性的金标准。但在临床实践中高达25%的活检是非诊断性的[23],非诊断性活检的患者经常重复活检,在某些情况下进行诊断性甲状腺切除术,可能导致永久性甲状旁腺功能减退和喉返神经损伤[24]。在微小器官的无创检查应用中,高频超声是其重要组成部分,尤其是在甲状腺疾病的诊断领域,具有无创、无放射性、灵敏度高、操作方便等优点,是目前广泛使用的甲状腺结节筛查方法[3]。随着超声技术的发展,诊断甲状腺结节的方法主要有常规二维超声、超声弹性成像、多普勒超声、超声造影等。国内外研究表明,超声诊断甲状腺癌的敏感性和特异性分别为27%~63%、78.0%~96.6%[1,16-17],导致这种结果的原因可能是由于临床医生在诊断超声特征时的一些可变性,同时超声高度依赖操作者的临床经验,不同年资的医师、不同的超声仪器以及对超声特征的不同定义都会影响诊断的准确性。
2012年,荷兰学者Lambin等(2012)[5]提出一种通过高通量提取大量医学图像特征的方式,使用针对所提出的成像模型的自动化或半自动化软件获得医学成像数据的定量分析,称为影像组学,可以提供给临床医生更准确的诊断信息。Kumar等(2012)[6]又将影像组学扩展为“从计算机断层扫描(CT)、磁共振成像(MRI)和正电子发射断层扫描(PET)图像中高通量提取和分析大量高级定量图像特征”。在常规影像学诊断基础上,通过深度挖掘影像图像中肉眼不可见的疾病内涵特征,进而反映人体组织细胞和基因水平对未来临床医学的重大影响[7],Doroshow和Kumar(2014)[8]也 认 为 影 像 组 学可能会很大程度上改变医学发展方向。将影像组学应用在超声方面,则称为超声影像组学。本文将针对多模态超声影像组学对甲状腺结节良恶性的鉴别进行综述。
影像组学的工作流程主要为:标准化图像获取-图像分割与重建-特征提取与筛选-预测模型构建-模型应用与分析。目前,图像分割可以自动、半自动分割或由年资丰富的影像科医生进行手工勾画感兴趣区;特征提取则是对先前勾画的感兴趣区提取定量特征,这些特征包括形态学特征、影像强度特征、统计学特征、纹理特征等,如边界、形状、内部回声、纵横比、钙化、标准差、平均值、熵、灰度共生矩阵、灰度行程矩阵、领域灰度差分矩阵等;然后通过人工智能技术及统计学方法选择上述特征与临床信息相结合,构建最佳模型。影像组学的分类器模型有很多种,常用的为支持向量机、k近邻、AdaBoost、高斯混合模型、概率神经网络、决策树等[31-34],尤其是基于纹理特征的支持向量机方法通常用于甲状腺结节的分类[35-36];最后将上述模型用于肿瘤的分期分级、鉴别诊断、肿瘤的病理学表型以预测疗效、评估治疗的预后等方面。
目前影像组学主要分为两种,机器学习影像组学和深度学习(deep learning,DL)影像组学。机器学习影像组学较为常见,其通过人工描绘感兴趣区域,利用专门的计算机算法提取感兴趣区特征,通过捕捉反映形状、形态和质地的直观参数来描述病变。深度学习影像组学则是基于全自动化处理图像、提取特征并执行分类,而不需要描述详细流程,DL不但可以进行数据挖掘,还可以用于数据生成。DL常采用一类深度学习神经网络,即卷积层神经网络(CNN),由于其在特征设计上独立于人,已广泛应用于医学图像分析领域,在CNN中提取定量特征的数量比在传统影像组学中使用的通过人工勾画特征提取算法多几个数量级;另一个显著的优点是,在同一卷积神经网络中,特征提取、选择和分类可以跨不同的层进行[9]。尽管CNN在多模态图像中具有显著的自动化程度和应用的灵活性,但是其完整过程仍是处于“黑匣子”的状态,其透明度和可解释性未来仍需进行多方面验证[9],在黑匣子里,连神经网络架构师都不确定最相关的特征是如何选择的,以及预测是如何做出的。
超声多模态包括二维超声、超声弹性成像、多普勒超声、超声介入以及超声造影等,目前甲状腺良恶性结节的诊断鉴别主要集中在二维超声、超声弹性成像和超声造影等方面。多模态超声与影像学特征相结合,可以大大提高疾病诊断的检出率和准确率。
既往研究表明,超声图像中的甲状腺结节大多形态不均匀,内部成分多样,边界模糊,很难区分良恶性结节。Ma等(2017)[20]提出一种进行预先训练的两个拥有不同卷积层和完全连接层的卷积神经网络(CNN)相结合的、可进行甲状腺结节诊断的混合方法,最后将融合后的特征图,利用Softmax分类器对甲状腺结节进行诊断。这两种基于CNN模型的融合显著提高了性能,其灵敏度、特异度和准确度分别为82.41%±1.35%、84.96%±1.85%和83.02%±0.72%。Zhou等(2020)[18]的一项大数据回顾性研究中,采用卷积层神经网络(CNN)模型对良性和恶性甲状腺结节进行了良好的分析,DL模型的AUC值达0.97,提示一些图像特征可提高模型的预测性能,并且甲状腺结节的形态学特征可以改善诊断的准确率。Zhu等(2021)[19]基于甲状腺癌和乳腺癌相似的超声特征构建模型,使用迁移学习和相同的架构参数,可以成功识别这两种癌症。利用深度卷积层神经网络(DCNN)对超声图像中的甲状腺和乳腺病变进行自动分类,其AUC可达0.875。这些研究表明,深度学习算法的性能可与影像科医生媲美,甚至更好。
甲状腺乳头状癌超声检查淋巴结转移的预测假阴性率较高,达32.4%~84.3%[10-13],应用二维超声组学可以在术前预测甲状腺乳头状癌(papillary thyroid carcinoma,PTC)淋巴结转移情况,降低假阴性率,提高阳性率,减少不必要的手术。李小毅(2016)[14]解读2015年美国甲状腺结节及甲状腺癌管理指南的外科部分中提出,仅依靠常规超声诊断淋巴结转移程度,其特异性虽高达94%,但敏感性仅为14.81%,而超声组学基于PTC病灶特征的转移性淋巴结的准确率为0.731,敏感性为0.714,特异性为0.74,明显高于一般研究中常规超声的诊断率,也高于通常报道的20%~31%的超声检出率。 王伟镇和李颖嘉(2019)[15]的一项前瞻性研究显示,在甲状腺乳头状癌患者淋巴结转移的超声图像中,手动描绘感兴趣区域,最终提取出16个高级特征,达到AUC为0.777的准确率,灵敏度为40%,特异度为51%,常规术前甲状腺超声检查诊断颈部中央区淋巴结转移的准确性仅为37%,敏感性为28.6%,特异性为55%。
当前临床上具有TI-RADS(甲状腺成像报告和数据系统)4级和5级的结节被怀疑为恶性,一般通过穿刺活检或手术进行鉴别,4级以上的结节应用于超声组学将更具有临床意义。Liang等(2018)[21]建立一个超声组学评分方法,将模型与美国放射学会提出的甲状腺成像、报告和数据系统(TI-RADS)评分标准相结合,以预测甲状腺结节恶变的可能性,其训练队列的AUC值高达0.921,验证队列的AUC值为0.931。这种超声组学评分模型可能会特别提高低年资医师预测甲状腺结节恶性的鉴别能力,其高诊断性能证明了影像组学技术能够从超声图像中提取比医师视觉解释更具有预测性的信息潜力。
剪 切 波 弹 性 成 像 (shear wave elastography,SWE)是一种用于量化组织硬度的弹性成像技术(采用5分视觉颜色评估和共识平均弹性值)。多项研究表明,SWE上较高的弹性指数可作为PTC颈淋巴转移的标志。既往研究表明,若将SWE与影像组学结合鉴别甲状腺结节的良、恶性,会明显提高准确率[26]。Jiang等(2020)[28]的一项研究中,SWE影像组学特征展示出对淋巴结状态的良好区分,其AUC值可达0.829。Bhatia等(2016)[29]建立了一个最优模型,利用开源软件包提取了纹理特征、形态特征、灰度特征、规律特征和小波特征,最优模型包含压缩前最高水平的两个SWE纹理特征,分别为弹性标准差(SD)和弹性对比指数(ECI),是唯一用于评估甲状腺弹性成像上肿瘤异质性的数值指标,其AUC值高达0.973,敏感性为97.5%,特异性为90.0%。经比 较,SWE的AUC值 为0.709,特 异 性 虽 可 达95.8%,敏感性仅为18.8%。这些初步结果表明,SWE纹理分析可以高效鉴别甲状腺结节的良、恶性,恶性结节的SWE空间异质性更大。
Ding等(2011)[35]的一项回顾性研究中,采用高年资的影像科医师手工勾画弹性成像图像中的病变区域,提取筛选纹理特征,利用最小冗余度-最大相关性算法从中选出最有效、最准确的特征,将这些特征输入支持向量机以鉴别良、恶性的甲状腺结节,其病变区域的硬面积比和纹理特征(能量)进行分类的准确率为93.6%,硬质面积比的AUC大于应变比的AUC(0.97:0.87;P<0.01),硬质面积比的AUC也大于彩色记分的AUC(0.97:0.80;P<0.01)。硬面积比是弹性图的一个重要的定量指标,通过使用计算机辅助诊断技术对弹性图进行定量分析可以提高诊断的准确性,能够更有效、更准确地区分甲状腺弹性图上的良、恶性结节。有学者指出,净重分类指数(NRI)和综合判别改善指数(IDI)的显著改善,表明SWE影像组学特征是预测甲状腺癌淋巴结转移的一个高性能的标志物。SWE和彩色多普勒检查结果可作为进一步根据超声组学特征进行风险评估的辅助工具。
超声造影通过注射造影剂使血管散射回声增强,辅助超声科医生提高诊断能力。Acharya等(2014)[33]的一项研究将影像组学与3D增强超声造影相结合,利用离散小波变换和纹理算法对甲状腺图像进行相关特征提取,将得到的特征发送到三种不同的分类器:K最近邻(K-NN)、概率神经网络(PNN)和决策树(DETR),得到ROC曲线下面积为0.987,准确率为98.9%,灵敏度为98%,特异度为99.8%。他们还提出甲状腺恶性指数(TMI)这一新的综合指标,它由纹理特征组成,仅用这个指标就可以诊断结节的良、恶性。Molinari等(2010)[37]的一项研究则是对良性和恶性病变的超声造影三维体积进行建模,并对结内血管参数进行量化,通过一个计算机分类框架,可以将三维超声造影的超声图像用于甲状腺病变的鉴别诊断。该框架可以有效地显示微血管和结节内血管,最后得出小波变换和纹理参数结合简单的KNN分类器可以用于自动分类,其准确率、敏感度和特异度都在98%以上,很多学者认为是这些特征捕捉到了良、恶性图像特征的细微变化。
在Liu等(2018)[30]的研究中,建立基于二维超声与超声弹性成像的深度学习影像组学模型,使用留一法交叉验证的支持向量机,输入二维超声和弹性超声提取的特征,影像组学模型AUC为0.90,准确度为0.85,灵敏度为0.77,特异度为0.88,优于单独使用二维超声和弹性超声提取的特征。通过应用支持向量机,该模型的AUC分别从0.81和0.80提高到0.90,提高了约10%。这种基于多模态的非侵入性影像组学方法结合了二维超声和弹性超声所筛选的特征,具有最好的区分性。李春艳和李忠原(2020)[38]利用多模态超声组学模型进行甲状腺结节良恶性的预测,多模态诊断模型鉴别诊断甲状腺良恶性结节的敏感性、特异性、准确性分别为93.5%、81.2%、86.9%,均高于常规超声、超声造影、超声弹性成像的单一模型。在裴书芳(2019)[39]的研究中,利用随机森林分类器建立常规超声联合弹性成像模型,也得出一个较好的结果,其AUC高达0.938,敏感性89.1%,特异性85.3%,准确性85.7%,表现远优于超声科医生。
目前影像组学的研究表明,其优越的诊断鉴别以及预测能力都远远优于超声科专家的诊断能力,在未来有望将其开发为软件安装于超声仪器中作为第二阅片人,显著提高经验较少的低年资医师对于肿瘤疾病的诊断能力。将超声图像输入模型软件即可明确肿瘤的良恶性,减少非必要的手术以及额外的医疗费用。但是目前的研究中仍有一些局限性,大多数的研究都是单中心研究,没有进行多中心的临床验证,未来有望进行多中心研究。同时一些研究中纳入的肿瘤类型过于单一,如乳头状甲状腺癌、甲状腺滤泡状癌、髓样癌等的特征均不相同,在以后的研究中,应合并来自不同类型肿瘤的训练数据。在超声图像方面,大多数应用的是静态图像,若动态或实时地查看图像,得出的结论也许更加可靠,同时对于超声图像没有固定的统一标准,不同仪器、不同医师所得出的图像均有所不同,未来也需要制定固定标准来统一获取图像。