秦 旭 综述,张喜荣 审校
(陕西中医药大学医学技术学院,陕西 咸阳 712000)
肺癌是全球第2常见癌症类型,其中非小细胞肺癌(NSCLC)是主要的亚型,占80%~85%[1-2]。近年来,我国肺癌发病率和死亡率呈上升趋势[3]。恶性肺部病变的早期检测至关重要,早期接受治疗的肺癌患者5年生存率为57%,仅5 %发展为进展期。影像学检查是早期肺癌筛查和诊断、制定治疗策略、预后评估和随访的一种重要无创性工具[4]。随着医学设备、影像学技术的迅速发展及精准医疗的提出,影像组学作为一种新兴手段被放射科医生熟知,其具备以非侵入性方式捕获肿瘤异质性的能力,从而可提高肺癌诊断的特异性和准确性[5]。肺癌精准医学研究的主要目的包括早期检测和晚期量身定制治疗和护理策略[6]。影像组学从CT、磁共振成像(MRI)和正电子发射断层扫描成像/计算机断层扫描成像(PET/CT)图像中提取和整合特征,在判断肿瘤组织学类型、分级分期、评估治疗效果和判断预后等方面取得较好的效果[7]。本文就影像组学在肺癌应用中的研究进展进行了综述。
影像组学是指从医学图像中分离出病灶,通过高通量特征的提取和分析来建立函数或数学模型,在宏观和微观层面反映肿瘤学的诊断特征和发病机制,从而帮助临床进行疾病诊断和制订治疗决策[8]。影像组学可单独使用,也可与人口统计学、组织学、基因组学或蛋白质组学等数据结合使用,解决更多临床问题[9]。影像组学的流程分为图像采集、图像分割、特征提取、模型构建4个步骤[8-9]。
1.1图像采集 目前主要是从CT、MRI、PET-CT等设备获取图像信息。但不同成像设备、不同医疗单位的扫描协议存在差异,影响提取数据的准确性[10]。因此,在多中心采集图像必须遵守标准化成像原则,并对扫描图像进行标准化处理,提取的图像数据应用图像归一化和重采样技术进行校准[10],以实现影像组学研究的可重复性和准确性。
1.2图像分割 准确的图像分割是影像组学分析中一个关键且具有挑战性的步骤,分割方法包括手动分割、半自动或自动分割。手动分割可以精准勾画肿瘤,准确性高,被视为图像分割的“黄金标准”,但是费时、费力且存在一定的主观性[9]。近年来,半自动或自动分割技术快速发展,其稳定性优于手动分割,已逐渐成为图像分割的主要方法,但尚未研究出一种适合所有图像的半自动或自动分割方法[10]。随着人工智能在医学中的应用,深度学习算法如卷积神经网络已成功应用于重建、去噪、分割和分类等方面,在医学图像分析中具有良好的稳定性,可以克服图像噪声及肿瘤异质性等方面问题,具有很大发展潜力[11]。
1.3特征提取 影像组学领域的重点是从对反映病灶生物学特性和肿瘤异质性的数字图像中提取定量特征,并将其转换为可挖掘的高维数据。目前,如何准确地进行特征提取及精准应用定量特征是亟须解决的难题。提取的主要特征包括形状、强度、纹理及小波等,各影像特征又包含众多详细特征指标,不同指标特征反映病灶内部的不同信息[8]。提取的特征数量越多并不一定代表模型性能越好,高维特征可能会导致多重共线和过拟合等问题。因此,在提取和分析定量特征之后,需要对数据进行降维,从而得到具有代表性的特征以建立精准预测模型[9]。最具信息量的特征是根据与其他特征的独立性、可重复性和数据的突出性来识别的。然后,分析所选特征与治疗结果或基因表达的关系。最终目标是将成像特征纳入治疗结果的预测模型,并评估其对常用预测因子的附加值,从而提供准确的风险分层。
1.4模型构建 影像组学的最终目的是利用筛选出来的最优影像组学特征构建疾病早期诊断、肿瘤类型及治疗预后的预测模型。目前常用的模型有回归模型、分类模型、人工神经网络、多变量模型等。Bagging和boosting算法是较常用的建模方法,其通过在训练过程中整合特征选择和有效采样,并引入稳健分类器或回归器训练。该方法可以将重点从基于专家的特征选择转移到直接让分类器评估候选特征并识别具有预测价值的特征,使模型精确度更高。最近,神经网络模型重新成为强大的分类和特征构建模型。给定足够的训练数据时,卷积神经网络优于特征选择方案,因为最佳特征是从图像数据本身构建的,而不是从预定义和有限的特征候选集中选择特征。一个限制是需要过多的训练数据,这种限制最近已经被迁移学习等策略成功地解决,这些策略利用了跨问题域的视觉特征的相似性。
2.1在NSCLC筛查和早期诊断中的应用 影像组学作为一种新兴的技术,已经被广泛应用于NSCLC筛查和早期诊断中,其主要基于医学影像分析、计算机辅助诊断及人工智能等技术,对肿瘤形态、纹理等多重特征进行综合分析,有效提高了NSCLC检测效率和准确性。
早期诊断是NSCLC治疗成功的关键。影像组学通过对CT、PET等影像分析,能够快速发现可能存在的NSCLC病灶,从而提高患者生存率。近年来,越来越多的研究表明,基于深度学习的影像组学技术在肺癌早期诊断方面具有良好的效果。CHAE等[12]研究使用深度学习模型结合传统的特征提取方法,实现了对肺结节的自动化筛查和分类,为肺癌早期诊断提供了一种新的解决方案。有研究表明,在联合使用传统机器学习算法和深度学习算法的情况下,NSCLC筛查灵敏度可以高达90.2%,而误诊率则降低至11.5%[13]。
虚拟胸透也是一种潜在的影像组学技术,可用于NSCLC早期筛查。虚拟胸透可将多个X射线影像合并成一个三维图像,从而提高准确性。一项2022年的研究表明,通过使用虚拟胸透技术和计算机视觉算法对肺部结节进行诊断,可实现95.2%的准确率和90.2%的灵敏度[14]。此外,PET-CT也在NSCLC早期诊断中得到广泛应用。一项研究表明,利用人工智能算法对PET-CT图像进行分析,可以提高NSCLC早期诊断精确度,并且可以实现更好的定量评估[15]。
2.2在NSCLC恶性程度评估中的应用 肿瘤恶性程度评估是一个复杂的过程,需要考虑多个因素,如肿瘤大小、形态、纹理等。传统方法主要依赖于人的判断,存在主观性和误差。影像组学技术的一个重要应用是基于人工智能的深度学习模型。深度学习模型可以通过大量的医学影像数据,自动学习肿瘤特征,并建立高度准确的预测模型。
SONG等[16]对661例NSCLC患者的CT影像组学特征进行了研究,结果显示,CT影像组学为NSCLC的转移潜力或侵袭性提供了可靠信息,为指导NSCLC个体化治疗方案的选择提供了临床价值。在肺癌组织学亚型区分方面,结合手工勾画图像和逻辑回归分析的临床特征可以有效区分小细胞肺癌(SCLC)和NSCLC,其受试者工作特征曲线下面积(AUC)为0.94,准确率为86.2%。此外,该研究选择了5个手工制作的放射性组学特征作为区分肺鳞状细胞癌和腺癌的特征,其AUC为0.89。对920例患者的研究显示,影像组学在鉴别腺癌、鳞状细胞癌和小细胞肺癌方面均具有较高的性能[17]。最近的研究表明,影像组学可以提供Ki-67表达水平信息[18]。
PET-CT能够同时提取功能和结构特征,具有比单独PET或CT更广阔的应用前景[19]。HYUN等[20]关于210例肺腺癌和186例肺鳞癌患者的研究表明,基于PET-CT的影像组学可以区分肺腺癌和肺鳞癌。ZHANG等[21]关于248例未经治疗肺癌患者的研究表明,综合临床和放射特征预测表皮生长因子受体(EGFR)突变模型的AUC可达到0.87。此外,对于EGFR突变患者,深度放射评分是一种非侵入性工具,可用于识别对酪氨酸激酶或免疫检查点抑制剂敏感的NSCLC患者。
MRI技术在肺癌的诊断中相对于CT和PET/CT等影像学技术而言,其应用仍不普及。然而,近年来一些研究表明,MRI也可以用于NSCLC恶性程度评估,并且取得了一定的进展[22]。一项研究通过比较不同组织的MRI信号强度差异时发现,在T2加权影像中观察到的信号强度越高,患者存活率越低,提示MRI信号强度可以作为预测NSCLC恶性程度和预后的一个潜在指标[23]。
2.3在淋巴结转移诊断中的作用 国际肺癌研究协会的一项大型数据库显示,肺癌淋巴结转移患者5年生存率为26%~53%[24]。关于转移性淋巴结的精确评估、淋巴结清扫程度的研究仍存在争议。肺癌淋巴结转移是影响肿瘤和淋巴结分期的重要因素。因此,术前无创评估淋巴结对于确定肺癌分期、手术计划和预后至关重要[25]。CT是目前临床诊断淋巴结转移最常用的无创方法,如果能提高诊断准确性,将为确定放疗靶点和手术范围提供更重要的临床指导。已有研究证实了利用影像组学特征预测直肠癌、乳腺癌和食管癌中淋巴结转移的可行性[26]。SHA等[24]对86例具有病例诊断结果的肺癌淋巴结转移患者进行影像学组学模型构建,结果显示,不同分期的诊断模型均具有鉴别良恶性淋巴结的能力,CT平扫比CT增强扫描能选择更多的纹理特征,CT平扫的纹理特征对鉴别纵隔转移淋巴结更有意义。TAU等[27]使用卷积神经网络训练PET图像,结果显示,以中等性能预测淋巴结转移的准确率为80%,远处转移的准确率为63%。在CT图像中整合大量人眼无法识别或区分的特征的方法,对诊断NSCLC患者纵隔淋巴结转移具有较高的准确度和灵敏度,从而有望提高NSCLC治疗疗效。
2.4在预测NSCLC治疗反应中的作用 NSCLC常用的治疗方式包括手术、立体定向消融放射治疗、细胞毒性化疗、酪氨酸激酶抑制剂治疗和免疫检查点抑制剂治疗等[28]。影像学检查是评估NSCLC治疗反应的主要手段,主要依赖于肿瘤大小,辅以其他肿瘤特征的定性评估,如密度、形状等。从定量角度来看,这种方法不了解医学图像中的大量信息,影像组学可以构建治疗反应的预测模型,提供定量标记物及治疗策略等[29]。有研究对分别接受联合放化疗和酪氨酸激酶抑制剂治疗后行手术切除患者进行了多变量分析,结果显示,接受联合放化疗患者的峰度(OR=1.107,P=0.009)和接受酪氨酸激酶抑制剂治疗患者的强度变异性(OR=1.093,P=0.028)是独立预测病理反应的指标。有学者进行了一项前瞻性研究,调查了接受放化疗联合手术切除的NSCLC患者基于PET的定量特征与病理反应之间的关系,结果显示,最大标准化摄取值的早期变化是病理完全缓解的一个极好的预测因子[30]。影像组学的预测模型必须在临床实践中进行前瞻性研究,提高重复性和临床实用性。
虽然影像组学在NSCLC临床诊断方面具有非常重要的价值,但是仍然存在着不足。首先,可重复性低是影像组学领域中亟待解决的问题,大部分影像组学研究只使用了分裂样本方法,即单中心数据集被分成训练和验证数据集后进行特征提取,这种模型通常具有重复性低的缺点[31]。其次,缺乏具有高质量数据的大型数据集及标准化数据采集方法。影像组学模型预测的准确性与设备的性能、扫描协议、影像科医生图像处理能力及选取的数据特征息息相关。目前,不同设备在NSCLC患者图像采集和图像后处理方面的标准不统一,很大程度上影响着模型预测的准确性,因此需要大型的、多中心的数据集来便创建稳健的模型[32]。最后,有研究对肺癌影像组学方法进行综述时发现,不同研究间无法确定可靠的放射组学特征[32]。
目前,在数据和方法学方面的挑战阻碍了影像组学在临床实践中的广泛应用。未来,影像组学有望克服这些障碍,朝着更安全、更有效的模型训练模式发展,融合多模态图像,并结合多学科或多组学来形成“医学组学”,以满足精准医疗的要求。