朱逸峰,王绍武
软组织肿瘤(soft tissue tumors,STTs)是一组起源于中胚层间充质组织(如黏液、纤维、脂肪、平滑肌、滑膜、横纹肌、血管和淋巴管等)中多能干细胞的肿瘤,成分复杂且种类繁多,临床、影像及病理表现各异[1]。软组织肿瘤的治疗以手术切除为主,对于软组织肉瘤必要时还需辅以放化疗及靶向治疗,准确的影像学诊断是临床制定治疗方案的重要依据,手术前运用影像学检查对肿瘤进行全面评估具有重要意义[2]。MRI检查具有较高的软组织分辨力,其凭借多序列、多参数成像的特点可以更清晰地显示肿瘤的大小、形态、内部信号、边界以及肿瘤对周围组织侵犯情况,已经成为软组织肿瘤病变检出、确定起源、良恶性鉴别诊断、侵袭范围评价和判断有无复发等方面最重要的临床检查方法和术前诊断依据[3]。
人工智能是一项用于研究并模拟人类思维与能力的新技术[4]。医学影像与人工智能的结合始于上世纪60年代,自上世纪80年代以来,随着基于人工智能的计算机辅助诊断软件的使用,人工智能开始逐渐整合到影像科的日常工作流程中,如肺结节和肺癌筛查、乳腺结节和乳腺癌筛查等[5]。影像组学(Radiomics)方法即是人工智能技术在医学影像学领域应用的成果,Radiomics的前缀Radio意为影像,而后缀Omics则源于分子生物学,用于描述生物大分子的详细特征,如基因组学和蛋白质组学等;2012年,该后缀Omics被Lambin等[6]首次用于医学影像学研究领域,Radiomics一词便应运而生,后由Kumar等[7]于同年进行了补充和完善,定义为“高通量地从医学影像中提取并分析高级、定量的影像特征来深层次反映肿瘤组织的空间异质性特征”。
影像组学方法是医学影像学、计算机视觉和机器学习等多学科交叉的产物,能在宏观影像水平间接反映肿瘤微观水平基因或蛋白质的变化,并且不完全依赖于影像医师的专业技能、临床经验及主观因素,所提供的是医学影像相对客观的定量信息,具有传统影像方法难以做到的独特优势[8]。对于软组织肿瘤而言,肉眼从影像上获取的信息十分有限,明确诊断非常困难,这时就需要使用影像组学方法来辅助影像医生对其进行诊断,进而帮助影像医生和临床医生更全面、更深入、更透彻地认识和理解软组织肿瘤。本文就目前影像组学方法在软组织肿瘤中应用研究的进展进行综述。
影像组学方法在软组织肿瘤中应用的流程分为5个步骤:确定研究目标、软组织肿瘤影像的获取、软组织肿瘤病灶的分割、软组织肿瘤影像特征值的提取与降维、软组织肿瘤影像组学模型的建立[9]。
1.确定软组织肿瘤研究目标
准确地寻找并确定研究目标是软组织肿瘤影像组学研究的关键,在确定研究目标后才能借助影像组学方法从软组织肿瘤影像中提取多维度特征以探索其与软组织肉瘤分级、软组织肿瘤良恶性、软组织肉瘤治疗及预后的相关性[10-12],因此软组织肿瘤影像组学研究需要紧密的医工交叉与结合来设计合理的研究方案。
2.软组织肿瘤影像的获取
在软组织肿瘤影像组学研究的过程中,影像特征的可重复性、稳定性是十分重要的,扫描设备、扫描参数以及重建方式等都会对软组织肿瘤影像特征的稳定性造成影响,因此在获取软组织肿瘤影像前需要建立影像检查与处理的标准流程,保证扫描设备、扫描参数的一致性,减少外界因素对结果带来的误差,使影像组学特征更加稳定,从而获得精准的特征值分析与建模结果[13]。目前,大部分软组织肿瘤影像组学研究使用的均为同一检查机器及固定的检查参数[9-10,14-18],但也有部分研究使用了不同机器及不同检查参数[12,19-21]。
3.软组织肿瘤病灶的分割
准确地对软组织肿瘤病灶进行识别与分割在软组织肿瘤影像组学研究中至关重要。在采集了大量标准化的软组织肿瘤影像数据后,需使用手动、半自动或全自动图像分割方法对软组织肿瘤病灶进行分割,其中手动分割具有主观性,准确性较高,但可重复性较差,建模结果会受到不同医生对影像解读方式的影响[22]。在半自动和全自动分割领域,ITK-SNAP、3D Slicer和Image J等软件的应用较为广泛,ITK-SNAP由宾夕法尼亚大学开发,其提供了基于主动轮廓的半自动分割方法[23],在软组织肿瘤影像的半自动分割中已经得到应用[14,24];3D Slicer由美国国家卫生研究院开发,提供了多种分割方法,如基于区域生长、基于模板、基于交互和基于统计等,在软组织肿瘤影像的半自动分割中也已得到了应用[17]。另有研究表明,基于3D Slicer的半自动分割方法与手动分割方法相比具有更佳的可重复性[25-26];Image J是一款基于JAVA的图像处理软件,已被应用于影像组学鉴别脂肪瘤与脂肪肉瘤的研究之中[20]。半自动及自动分割方法的优点是高效且重复性高,但使用其分割的兴趣区相对于手动分割的兴趣区精确度会有偏差,对于边界不清晰的软组织肿瘤可采用手动分割方法;而对于边界清晰且形态规则的软组织肿瘤,半自动或全自动分割方法高效且重复性高,能够满足海量数据分割的要求[27]。病灶影像的精准分割是软组织肿瘤影像组学分析的前提,但影像的伪影及软组织肿瘤对周围正常组织的浸润会导致病灶边缘显示不清,致使病灶影像的分割存在一定难度。目前,分割精确度高且重复性好的病灶影像分割算法还有待开发与研究。
4.软组织肿瘤影像特征值的提取与降维
软组织肿瘤影像特征值的提取是使用计算机算法在像素水平上将软组织软组织肿瘤影像数据转化为大量量化的影像特征值数据再进行分析,是软组织肿瘤影像组学研究的核心步骤[9]。不同软件或平台计算特征值的方法各不相同,特征值可以分为如下几类,即一阶统计形态学特征、二阶统计特征、高阶统计特征、基于模型和基于变换的特征。
一阶统计形态学特征主要包括病灶的大小、形状等,也称为语义特征,主要量化像素值的分布规律而不考虑其空间分布关系,其指标包括平均灰度值、标准差、熵值等[28]。二阶特征即纹理特征,主要量化兴趣区内相同灰度或像素强度间的空间关系,指标有灰度级共生矩阵、灰度级长度矩阵、灰度区域大小矩阵等,间接反映病变的异质性,相当于二维直方图,多用于模式识别中[28]。
高阶特征是利用邻域灰度差矩阵计算高阶统计量,研究三个或更多体素间的空间关系,包括邻域灰度差值矩阵和灰度区域大小矩阵灰度级形状矩阵等。基于模型和基于变换的特征是将提取的图像特征进行滤过,常用的滤过包括基于拉普拉斯算法的高斯滤过、Gabor滤过、小波变换及分形维数变换等[29]。
勾画的软组织肿瘤兴趣区经过特征值提取后可获得成千上万的特征,这与原始数据的样本量相差悬殊,会导致模型的过拟合,因此模型的建立有赖于病变主要特征值的降维分析。目前,常用的降维算法包括方差选择法、单变量选择法及最小绝对收缩和选择算子等[22]。
5.软组织肿瘤影像组学模型的建立
软组织肿瘤影像组学模型的建立需要通过大数据的机器学习来完成,机器学习是使用程序代码让计算机模拟或实现人类的学习行为,达到获取新知识或技能的目的。需要指出的是,机器学习的概念在上世纪60年代就已经被计算机科学家提出[30],但机器学习技术于近十年才开始被应用于医学影像领域。机器学习的方法包括:无监督机器学习、半监督机器学习及监督机器学习[29]。
无监督机器学习是对数据采用热点图分析或聚类分析,挖掘数据的自然结构特征,不预设数据标签。
监督机器学习则需要设置数据标签来训练模型,常用的监督机器学习算法包括支持向量机(support vector machine,SVM)、随机森林(random forests,RF)、决策树(decision tree,DT)和逻辑回归(logistic regression,LR)等,其中SVM由Cortes等[31]于1995年提出,一般应用于二分类问题当中,具有相对优良的性能指标,是建立在统计学理论基础上的机器学习方法,能够寻找出区分度较高的支持向量,可以最大化类与类的间隔,因此具有较好的适应能力和鉴别能力,在软组织肿瘤影像组学研究中得到了广泛的应用[9,11-12,14,19]。SVM只需由各类域边界样本的类别来决定最后的分类结果,其优点是不依赖全部样本数据就可以解决高维度问题,缺点是核函数的确定有一定难度,且核函数的选择会影响分类结果[30]。RF是由Breiman[32]于2001年提出的一种利用多个树分类器进行分类和预测的方法,其输出类别由单个树输出类别的众数而定,通过随机方法建立一个由很多棵无关联决策树组成的森林,在输入新样本时森林中的每一棵决策树会对其分别进行判断,最终根据相对多数投票法即该样本被选择最多的分类给出其分组,RF在软组织肿瘤影像组学研究中也有应用[9,11-12],该算法以能够降低过拟合现象为优点,但其不能较好地预测超越训练集外的数据[30]。DT因其输出结果类似一颗倒置的树而得名“决策树”,本质上可看作一个树状预测模型,通过将实例从根节点排列到某个叶子节点完成分类。DT在软组织肿瘤影像组学研究中也有应用[19],其优点是计算省时,缺点是易出现过拟合现象[30]。LR的基本原理是将标记好的数据通过机器学习总结归纳得出分类模型或分类决策函数,通过输入离散或连续变量对输出结果进行分类,其缺点是当特征维度很大时该模型的准确性不佳[33]。LR在软组织肿瘤影像组学研究中亦有应用[12,14,20]。
半监督机器学习则介于无监督机器学习和监督机器学习之间,通过使用大量未标记的数据和少量标记的数据来对模型进行训练,主要用于类别标签不明确的数据[34]。
不论使用何种机器学习方法,均需对比训练集及验证集的受试者操作特征曲线(receiver operating characteristic,ROC)的曲线下面积(area under curve,AUC)、敏感度、特异度、符合率、召回率及和F1-Score等指标来评价机器学习模型的诊断效能及稳定性。
作为一种新兴的医工结合手段,影像组学方法用于软组织肿瘤的研究与传统软组织肿瘤影像研究的不同之处主要体现在传统影像手段仅能通过兴趣区测值的方法来间接反映软组织肿瘤的局部信息,无法反映软组织肿瘤的整体情况,而影像组学方法则能提取软组织肿瘤病灶多个层面乃至全部层面的影像特征,从而对软组织肿瘤的异质性进行全面评估。
目前,影像组学方法在软组织肿瘤良恶性鉴别、术前预测软组织肉瘤分级、评价软组织肉瘤治疗及预后等方面都有应用研究。
1.影像组学方法在软组织肿瘤良、恶性鉴别中应用研究的进展
软组织肿瘤的良、恶性鉴别一直是临床关注的重要问题,相比于良性软组织肿瘤,恶性软组织肿瘤内部的异质性更明显,因而可以借助影像组学方法来鉴别软组织肿瘤的良恶性。
Mayerhoefer等[10]通过对经过病理证实的58例软组织肿瘤患者(良性30例,恶性28例)的T1WI、T2WI及FS-T2WI图像进行纹理分析,分别比较了K最近邻算法和人工神经网络算法的诊断效能,其中基于FS-T2WI序列的人工神经网络算法取得了90.5%的符合率,故作者指出良恶性软组织肿瘤在常规MRI图像信号特征上只有很小的差异,机器学习算法可能有助于鉴别软组织肿瘤的良恶性,但是需要更多数据来证明其临床价值。Wang等[14]通过使用91例软组织肿瘤患者(良性55例,恶性36例)的FS-T2WI图像进行影像组学诺模图和决策曲线分析,得出影像诺模图能够将恶性与良性软组织肿瘤区分开(AUC为0.94),且诺模图的诊断效能优于单一的影像组学模型和临床模型,由此指出结合了影像组学特征和临床特征的诺模图是一种无创且低成本的术前预测软组织肿瘤良恶性的方法。Juntu等[19]通过对135例软组织肿瘤患者(良性86例,恶性49例)患者的T1WI图像进行纹理分析,并将三种机器学习模型(支持向量机、人工神经网络、C4.5)的诊断效能与影像科医师进行比较,得出支持向量机分类器的符合率为93%,优于影像科医师(90%),经过纹理分析训练的机器学习分类器对于在T1WI图像中检测恶性肿瘤具有潜在的价值,对分类器的学习曲线分析表明小于100个T1WI图像的训练数据量足以训练出诊断效能和影像科专家一样的机器学习分类器。Kim等[15]通过对40例含有粘液成分的软组织肿瘤患者(良性23例,恶性17例)的ADC图进行纹理分析,发现恶性组的峰度、能量、相关性和均质性均明显高于良性组,但对比度和方差均低于良性组,因此认为基于ADC图的纹理分析有助于鉴别良恶性含黏液成分的软组织肿瘤。Chen等[35]通过对114例软组织肿瘤患者(良性73例,恶性41例)的超声图像进行纹理分析,通过使用10个形态学特征和6个灰度共生矩阵特征来鉴别良恶性软组织肿瘤,并将纹理分析的诊断效能与四位诊断医师进行比较,发现纹理分析的诊断符合率(89.5%)高于诊断医师(74%~86%),这表明在超声检查中使用纹理分析进行辅助诊断可成功地区分良性和恶性软组织肿瘤,以避免不必要的穿刺活检。Xu等[16]通过对103例软组织肿瘤患者(良性44例,恶性59例)的PET/CT图像进行纹理分析,分别对CT图像上计算的纹理参数、PET图像上计算的纹理参数以及PET和CT组合的纹理参数进行计算,将它们的诊断效能与标准化摄取值方法进行比较,发现仅使用PET(或CT)纹理参数的符合率为74.76%(72.82%),与SUV方法没有显著差异,但将PET和CT最佳纹理参数(PET:熵和粗糙度,CT:熵和相关性)进行联合纹理分析的方法表现出更好的诊断效能(符合率为82.52%),因此得出使用纹理分析的方法能够显著提升18F-FDG PET/CT对软组织肿瘤良恶性的鉴别诊断能力。Thornhill等[20]通过回顾分析24例脂肪瘤和20例脂肪肉瘤患者的T1WI、T2WI、FS-T2WI及T1WI增强图像,在T1WI上对病灶进行勾画并提取灰度级共生矩阵特征、灰度级长度矩阵特征及形态学特征,将纹理特征的组合用于训练多个线性判别分类器,最终使用10折交叉验证评估每种分类器鉴别脂肪瘤和脂肪肉瘤的诊断效能,并和两位影像科医师的诊断效能进行比较,发现影像组学模型的诊断效能(91%)高于两位影像科医师(80%、77%),因此指出计算机辅助诊断模型有助于影像科医师鉴别脂肪瘤与脂肪肉瘤。
2.影像组学方法在预测软组织肉瘤组织病理学分级中应用研究的进展
软组织肉瘤(soft tissue sarcomas,STSs)的组织病理学分级关系到患者的预后及临床治疗方案的制定[36],如果能在术前通过影像组学方法建立精度逼近病理的软组织肉瘤组织病理学分级预测模型,那么对其临床治疗方案的制定有重要的指导意义。影像组学特征能间接反映软组织肉瘤内部的异质性,而软组织肉瘤的异质性越高则其组织病理学分级越高。因此,影像组学特征与软组织肉瘤的组织病理学分级相关。
Zhang等[9]通过对35例STS患者(Ⅰ级9例,Ⅱ、Ⅲ级共26例)的磁共振FS-T2WI图像研究发现,基于FS-T2WI的随机森林、K最近邻、支持向量机的机器学习模型均可在术前预测STSs的组织病理学分级,且这些模型的诊断效能均比术前穿刺活检更高。Corino等[24]通过对19例软组织肉瘤患者(Ⅱ级5例,Ⅲ级14例)的ADC图采用合成少数过采样技术进行了影像组学分析,指出基于ADC图的影像组学模型能够鉴别Ⅱ级与Ⅲ级STSs,且该模型仅需使用两个一阶统计形态学特征。Wang等[11]通过使用113例STSs患者(Ⅰ级25例,Ⅱ、Ⅲ级共88例)的术前T1WI和FS-T2WI建立随机森林机器学习模型,指出基于影像组学特征的机器学习模型对于区分STSs的分级非常有意义。
3.影像组学方法在评价软组织肿瘤治疗及预后的应用研究进展
软组织肿瘤的治疗和预后情况亦是临床关注的重要问题,研究表明影像组学特征与软组织肿瘤的治疗及预后存在相关性。
Spraker等[21]通过对来自两个中心的Ⅱ、Ⅲ级STSs患者共226例的T1WI增强图像图像提取30个影像组学特征值进行分析,并分别构建了临床模型、影像组学模型、临床-影像组学模型,使用Harrell一致性指数评估模型的诊断效能。结论为在考虑年龄和分级时,从MRI图像中提取的影像组学特征与STSs的总生存期独立相关,使用临床-影像组学模型可以改善STSs患者的个性化治疗选择方案。Crombe等[12]通过对65名成年高级别STSs患者新辅助化疗前后的T1WI、T2WI和T1WI增强图像进行影像组学分析,提取了33个纹理特征和形态学特征来研究Delta影像组学预测接受新辅助化疗的STSs患者早期反应的价值。在训练集中,RF算法的符合率为88.1%,而在验证集中,该模型的符合率达到了74.6%,由此作者指出基于T2WI的Delta影像组学模型可以凭借有限的特征值来评估STSs患者对早期新辅助化疗的反应情况。Tagliafico等[17]通过对11例软组织肉瘤患者进行了33次随访,对其T1WI、T2WI和T1WI增强图像进行了影像组学分析,指出影像组学特征可在监测STSs局部复发时将正常组织与病理组织区分开来,影像组学不仅可以用于检测STSs,而且可用于病灶表征的量化分析。Tian等[18]对20例STSs患者进行了研究,所有患者均单独接受贝伐单抗治疗2周,然后在手术前接受贝伐单抗治疗加放疗6周,并且均在治疗后2周和8周均接受了CT灌注检查,并测量了肿瘤血流流速,另使用纹理分析软件测量了增强CT动脉峰值时的图像正像素的平均值作为纹理参数,并测量了肿瘤的大小和密度,将这些参数的百分比变化与病例结果进行对照,结果表明8周后图像正像素平均值的百分比变化与手术标本中的肿瘤坏死有显著相关性,而大小、密度和肿瘤血流流速的差异则无统计学意义,因此作者指出图像正像素平均值的改变是评价STSs新辅助化疗疗效的最佳生物标志物。
作为影像科医生的得力助手,影像组学方法虽然在软组织肿瘤中的应用已取得一定的成果,但我们必须认识到该方法目前尚处于起步阶段,并且与普通图像识别与分割相比,医学影像诊断学具有其独特的复杂性,在相关成果转化为临床应用前还有很多问题亟待解决,例如不同扫描参数和重建算法缺乏统一标准、缺乏统一规范的影像组学研究流程和具有可解释的专家共识、现有的影像组学诊断模型缺乏大样本多中心的前瞻性研究检验以及各种诊断模型的鲁棒性问题等[37]。另外,现有诊断模型假阳性率过高的问题也必须引起我们的重视,如何降低假阳性率而不漏诊疾病是一个重要议题[38]。并且,各种诊断模型的适用性还有待更大规模数据的检验,然而由于发病率较低,软组织肿瘤的病例数通常较少,数据的收集需要耗费大量的时间,这都是影像组学在软组织肿瘤进一步应用所需要攻克的问题。总之,影像组学在软组织肿瘤中应用的前景广阔,它会在软组织肿瘤的精准医疗中发挥越来越重要的作用,影像科医生必须与时俱进,理解并掌握影像组学这个利器才能在将来的临床工作中游刃有余、事半功倍[39]。