邹清艺 周 婷 黄必贵 吴英宁,2
(1 右江民族医学院研究生学院,广西百色市 533000;2 右江民族医学院附属医院放射科, 广西百色市 533000)
【提要】 影像组学是一种定量映射,是目前医学影像学领域的前沿热点之一,其可从海量影像学资料和信息中高通量提取大量先进的定量成像特征,临床应用潜力较大。本文对影像组学的概况及其在非小细胞肺癌病理组织学分型中的应用研究进展进行综述,以期为促进影像组学的发展与临床应用提供参考。
非小细胞肺癌(non-small cell lung carcinoma,NSCLC)患者数量占肺癌总病例数的80%以上[1]。肺腺癌和肺鳞状细胞癌(以下简称肺鳞癌 )在NSCLC中的占比分别约为60%、35%[2],二者在肿瘤生物学行为、治疗方式、临床特征方面均有显著差异,如肺腺癌患者的癌细胞生长分裂相对缓慢[3],间变性淋巴瘤激酶阳性、表皮生长因子受体基因突变等改变是其靶向治疗应用决策的重要因素[4],而晚期肺鳞癌患者对免疫治疗联合化疗更敏感[5]。因此,病理组织学分型是NSCLC疗效评估的基础,也是个性化治疗的依据,其不仅关乎手术时机,亦对分子靶向治疗药物的选择具有决定性作用。影像组学能从MRI、CT、PET/MRI、PET/CT等影像学图像中提取肿瘤特征,从而挖掘肿瘤内部在时间上和空间上的异质性,提供更全面的肿瘤视图[6],以获知人类视觉系统无法直接辨识的信息。随着肺癌病理组织学亚型诊断技术的发展及分子检测技术的兴起,影像组学作为一种无创性鉴别病理组织学亚型的手段,可能对不适合行有创性鉴别检查的肺癌患者非常有利。本文对影像组学的概况及其在NSCLC病理组织学分型中的应用研究进展进行综述,以期为促进影像组学的发展与临床应用提供参考。
影像组学的概念是由Lambin等[7]于2012年首次提出,是一种定量映射,其从影像图库中提取高通量的大数据,并加以探索性分析处理,从而全面量化肿瘤内部在时间上和空间上的异质性,旨在提取与研究目标相关的影像组学特征,通过进一步分析及建立模型来判断预测效果。影像组学分析主要分为影像图像资料获取、勾画感兴趣区并分割图像、特征提取及筛选、构建模型及验证等阶段。
影像图像资料获取是影像组学的基础,须借助X线、CT、MRI等医学影像成像技术采集高质量、标准化的优质图像,对图像进行预处理、扫描设备尽可能保持统一标准、维持一致的像素及灰度等措施均有益于避免图像的“异质性”[8-9]。勾画感兴趣区是影像组学的关键步骤,勾画方式主要包括自动勾画、半自动勾画和手动勾画,这3种方式各有优劣之处,如自动勾画、半自动勾画的效率高于手动勾画,但准确性较后者差,而在大样本研究中选择手动勾画则需耗费大量的时间和精力,且受医师主观因素影响较大[10]。影像组学特征主要包括形状、强度、纹理等,而特征提取和筛选是影像组学的核心步骤,其中特征提取可通过Pyradiomics、MaZda、IBEX、3D Slicer等软件实现。为避免过度拟合风险[11],须对初步获取的特征进行筛选,常用的特征筛选方法有最大相关最小冗余法、过滤法、LASSO算法等,其中LASSO算法能够对提取特征的回归系数进行压缩,甚至使得部分特征系数归零,在临床上较为常用。构建模型是验证影像组学诊断效能的重要手段,而机器学习算法是构建模型的重要方法,主要包括Logistic回归、支持向量机、决策树等,在实际操作中需要根据数据集的类型选择合适的算法。建立模型之后,需通过模型测试及验证来评估模型的性能,最终获取最佳模型。目前,主要的模型性能评估方法有交叉验证法、受试者工作特征曲线分析等,评估的指标包括曲线下面积(area under the curve,AUC)、特异性、敏感性等。
目前,影像组学已成为医学影像学领域研究的前沿热点之一,这主要归因于它能够从海量影像资料和信息中高通量提取大量先进的定量成像特征,其核心假设是将影像组学转变为可挖掘的形式,用于构建与病灶相关联的描述性生物学数据或临床数据,从而为临床提供有价值的预测、诊断、预后评估信息[12]。近年来,针对肺癌、肝癌、胃癌、乳腺癌等常见恶性肿瘤,采用影像组学预测肿瘤病理组织学亚型的相关研究日益增多,并获得理想效果[13-16],证实了影像组学在恶性肿瘤病理组织学分型中的可行性。
因解剖位置、生长部位、组织特征、葡萄糖代谢的不同,肺腺癌和肺鳞癌具有各自的最佳临床决策[2,17-18]。目前,病理组织活检仍是鉴别诊断肺腺癌和肺鳞癌的金标准。然而,病理组织活检作为一种侵入性检查,不仅并发症多、费用昂贵,而且无法达到量化及全面评估肿瘤异质性的目的。因此,在临床工作中急需一种非侵入性检查技术用于NSCLC病理组织学亚型的术前有效评估。虽然影像组学不可能完全替代病理组织活检,但其可提供肿瘤内部时间上和空间上的异质性等生物学信息,为临床实现无创性“虚拟病理活检”提供客观的量化依据。
2.1 影像组学在肺腺癌和肺鳞癌鉴别诊断中的应用价值 对于病情稳定的患者而言,病理组织活检仍是鉴别肺腺癌和肺鳞癌的首选手段。但对于基础状态差的患者而言,当其无法耐受CT引导下穿刺活检或支气管镜取材活检等侵入性检查时,影像组学在肺腺癌和肺鳞癌的鉴别诊断中表现出明显的优越性。Zhu等[19]通过手动绘制肿瘤区域提取129例NSCLC患者的影像组学特征,结果显示训练集和验证集的AUC分别达到0.905、0.893,表明影像组学特征对肺腺癌和肺鳞癌具有良好的鉴别诊断效能,其中纹理特征X2_GLCM_cluster_tendency最能反映肿瘤的异质性。Bashir等[20]分析基于CT影像组学特征、CT语义特征及联合特征的随机森林模型鉴别肺腺癌和肺鳞癌的效果,结果显示基于CT影像组学特征、CT语义特征及联合特征的随机森林模型鉴别肺腺癌和肺鳞癌的中位数错误率分别为35.8%、24.5%、37.7%,表明基于CT影像组学特征的随机森林模型能够较为准确对NSCLC的病理组织学亚型进行无创性分析。Tang等[21]采用PET/MRI影像组学对肺腺癌和肺鳞癌进行鉴别,结果显示训练集和验证集的AUC分别为0.886、0.847。Tomori等[22]的研究显示,非增强CT影像组学可以区分肺腺癌和肺鳞癌,并发现非增强CT影像学特征与肿瘤细胞最大活性之间存在显著相关性,进一步表明通过分析非增强CT影像组学特征获得的肿瘤结构特征与18F-氟脱氧葡萄糖-PET/CT显示的代谢特征密切相关。
综上,基于影像组学特征进行NSCLC病理组织学分型,在术前及抗肿瘤治疗前即可有效鉴别肺腺癌和肺鳞癌。这不仅能够使患者避免因有创检查导致的并发症风险,还有助于个性化治疗方案的制订,以及避免因治疗导致肿瘤生物学行为改变而使影像组学特征产生偏差。
2.2 影像组学在肺腺癌微乳头成分术前预测中的应用价值 2011年,在国际肺癌研究协会、美国胸科学会及欧洲呼吸学会联合公布的肺腺癌国际多学科分类中,将肺腺癌分为5个亚型[4]:微乳头为主型、腺泡为主型、贴壁为主型、乳头为主型、实性为主伴黏液产生型。该分类旨在应对肺腺癌在分子生物学诊断、病理学诊断、影像学诊断及治疗方面的新需求。其中,微乳头成分是肺腺癌侵袭性的独立危险因素,亦是影响患者预后的独特病理形态学特征[23],因此在基于5%的增量半定量的组织学分型中,微乳头为主型肺腺癌被正式确定为新的组织学亚型[24]。Zhang等[25]利用风险曲线评估肺腺癌患者病灶中的微乳头成分,从而评估肿瘤复发风险,发现即使是Ⅰ期肺腺癌患者,只要病灶中存在微乳头成分,其就会持续存在复发风险,且术后早期复发风险相对较高。该研究还通过分析微乳头成分占比较低和微乳头成分占比较高肺腺癌患者的基因检测及免疫组化染色结果,发现微乳头成分占比较高者机体免疫抑制情况更严重、T淋巴细胞浸润水平及肿瘤突变负荷更高,提示微乳头成分占比较高可能与肿瘤免疫治疗敏感性存在联系[25]。
目前,针对肺腺癌患者病灶中微乳头成分的分析研究主要为定性研究,鲜有基于影像组学的定量研究。陈志鹏[26]术前采用影像组学预测肺腺癌患者是否存在微乳头成分,结果显示,像素最小值、差异方差及差熵、表面体积比及最大直径可作为微乳头成分阳性的预测因子。He等[27]纳入268例肺腺癌患者的CT图像提取影像组学特征,并构建支持向量机、朴素贝叶斯、广义线性模型及随机森林分类器4个预测模型,结果显示上述4种基于影像组学特征的模型均可有效预测微乳头成分的存在,其中朴素贝叶斯模型的预测性能最佳(AUC为0.75)。Song等[28]采用CT影像组学对339例肺腺癌患者进行微乳头成分预测,发现阳性像素值的方差可用于预测微乳头成分。上述研究表明,影像组学为术前鉴别诊断微乳头成分阳性或阴性的肺腺癌提供了可能。然而,目前国内外的相关研究较少,后续仍需要通过大量的研究深入探讨影像组学在预测微乳头成分中的价值,促进影像组学技术的进一步发展和成熟。
2.3 影像组学特征联合临床特征在NSCLC病理组织学分型中的应用价值 在MRI、CT、PET图像中均能提取影像组学特征,但这3种影像学技术的成像方式差异导致其临床应用领域有所不同:MRI是利用病理状态下人体相关组织的弛豫时间差异产生信号,然后通过收集这些信号重建图像,主要用于显示病灶的细微形态结构及肿瘤浸润范围等;CT成像可反映组织密度的分布规律,主要用于常规检查,如术前评估、初步判断肿瘤良恶性等;PET成像则反映肿瘤代谢的差异性,主要用于评估肿瘤疗效、评估复发或转移等。相关研究表明,部分临床特征也能鉴别诊断肺腺癌和肺鳞癌,如年龄、吸烟史、瘤体径线、免疫组化检测指标,以及影像学征象(如毛刺征)、微血管密度等[27,29-33]。但是,单纯应用临床特征进行病理组织学分型会受到诊断医师的主观因素或样本异质性及数量的影响,从而导致诊断结论具有差异性[34]。
研究表明,影像组学特征联合临床特征对NSCLC病理组织学亚型的评估效能优于单一特征[35]。Tang等[36]纳入68例肺鳞癌患者和80例肺腺癌患者,从患者的多模态MRI图像中提取影像组学特征,并构建列线图模型用于预测NSCLC病理组织学亚型,结果显示基于影像组学特征联合临床特征的列线图模型预测效能最佳,训练集和验证集的AUC分别为0.901、0.872。Ren等[37]提取122例肺鳞癌患者和193例肺腺癌患者的PET/CT影像组学特征,并收集肿瘤标志物等临床特征,随后分别构建临床特征模型、PEI/CT影像组学模型及临床特征-PEI/CT影像组学组合模型用于预测NSCLC病理组织学亚型,结果显示与临床特征模型、PEI/CT影像组学模型相比,临床特征-PEI/CT影像组学组合模型的预测性能最佳。Chen等[38]发现,临床特征-CT影像组学联合模型鉴别诊断肺腺癌与肺鳞癌的效能优于单独CT影像组学模型或临床特征模型;其进一步通过双能CT构建临床特征联合动肝或静脉相影像组学模型,结果显示临床特征-静脉相影像组学联合模型的AUC最大(0.93)。然而Yang等[39]的研究结果显示,MRI影像组学-临床特征组合模型与MRI影像组学模型的诊断性能差异无统计学意义(P>0.05),提示临床特征的纳入不一定能进一步提高影像组学特征对肺鳞癌和肺腺癌的鉴别效能,这与大多数研究者的观点不一致,其原因尚需后续研究进一步探究。
将影像组学特征联合临床特征应用于NSCLC病理组织学分型,是对影像组学应用价值的进一步探索,其有望通过更全面的病灶异质性评估来更准确地开展NSCLC病理组织学分型。
当前,影像组学面临的挑战主要为方法缺乏标准化、黑盒性质缺乏深度学习性和可重复性、缺乏基于高质量数据的大型数据集等[40]。同时,影像组学亦受以下相关因素的影响:(1)观察者间的描绘差异。Haga等[41]在每例肺癌患者的CT图像上勾画4个感兴趣区,分别基于每个感兴趣区评估观察者间描绘差异对影像组学特征的影响,结果显示,描绘的不确定性可能导致无显著意义的影像组学特征,从而高估基于单一个感兴趣区建立的模型对肺癌患者预后的评估能力,因此,瘤体的多轮廓分析对于避免此类情况至关重要。(2)机器学习和深度学习方法上的差异。尽管卷积神经网络(convolutional neural network,CNN)、胶囊网络(capsule network,CapsNet)等方法已被广泛应用于影像组学研究,但算法的不同可能会对诊断效能产生影响。Liu等[42]比较CapsNet、CNN和4个影像组学模型评估NSCLC病理组织学亚型的效能,发现CapsNet作为一种自动亚型识别模型,在上述模型中表现出最佳的诊断效能。亦有研究表明,在CNN衍生的定量影像组学特征上使用如支持向量机、k最近邻等分类器评估NSCLC病理组织学亚型,其效能相当[43]。
近年来,影像学从单纯语义演变成囊括深度和传统影像学特征的影像组学,在此基础上,影像组学采用机器学习与数字学习方法从病灶内部提取生物学特征,以探索生物学信息与临床之间的可能联系。影像组学目前存在的难题主要在于如何更高效、更安全地开启与多学科结合、融合多模态图像的模型训练。作为当代医学影像学研究的前沿与热点之一,影像组学的最大优势在于可通过高通量提取影像学图像中与病灶密切相关的定量特征,挖掘肿瘤内部具有异质性的高维数据。影像组学具有术前评估NSCLC病理组织学亚型的潜在价值,有望为优化临床决策提供更可靠、更科学、更前沿的影像学依据。
尽早确诊是对NSCLC患者实施有效诊治的重要基础,有助于改善患者预后。影像组学具备可重复性、无创性等优势,在NSCLC病理组织活检难度大或取材有限时,可通过定量分析肿瘤异质性发挥病理组织学分型作用,从而协助临床医师优化并实施个性化治疗。未来可通过大样本、多中心的研究提高影像组学模型的泛化能力和稳定性。