刘昊沅, 艾和平, 赵俊苹, 李红
肺癌是世界癌症相关死亡的主要原因,尽管低剂量CT在体检中的广泛开展有助于早期筛查,但仍有部分患者就诊时病情已处于进展期[1]。非小细胞肺癌(non-small cell lung cancer,NSCLC)约占所有肺癌病例的80%左右[2]。NSCLC的发生、发展、侵袭和转移涉及多种基因,目前最常研究的NSCLC驱动基因包括表皮生长因子受体(epidermal growth factor receptor,EGFR),克尔斯滕大鼠肉瘤病毒癌基因同源物(kirsten rat sarcoma viraloncogene,KRAS)和间变性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)。过去数十年,针对基因激活通路的靶向治疗为非小细胞肺癌患者的治疗带来革命性变化,尤其是针对EGFR 突变的小分子酪氨酸激酶抑制剂(TKI) 。与标准一线化疗方案相比,EGFR-TKI靶向治疗的EGFR突变敏感型患者拥有更长的无进展生存期(progression free survival,PFS)和更高的客观缓解率(objective remission rate,ORR ),而EGFR野生型肺癌患者若接受EGFR-TKI药物治疗,其PFS将会明显缩短[3],早期准确诊断患者肿瘤基因突变状态将对临床诊疗意义重大。常规分子突变状态的检测依赖于术后基因测序或扩增阻碍突变系统(ARMS),但肿瘤内部存在异质性,病理活检可能会出现操作不佳、活检标本较小及取样伪影等情况,最终结果可能无法完全反映肿瘤的整体情况。CT扫描常作为肺癌患者的常规影像检查,具有无创、经济、方便等特点。随着大数据时代的来临及人工智能的发展,影像组学(Radiomics)已成为肿瘤分子影像学中的研究热点。通过分析影像学相关特征与肿瘤分子表型之间的关系,揭示肿瘤内部异质性及生物学相关特征,极大的提高了临床诊断客观性及诊断效能,对患者个体化治疗及管理意义重大。本文就影像组学在非小细胞肺癌中EGFR突变状态的早期诊断、EGFR-TKI疗效评价、预后风险分层及转移等方面的研究现状及前景展开综述。
影像组学(Radiomics)[4]指从医学影像中高通量地提取定量成像特征,可深度挖掘图像所包含的信息,为临床诊疗及预后预测等提供有效信息。一般包括4个步骤。①高质量图像的获取及重建:根据研究目的获取相关图像,通常需要对图像进行标准化处理,从而减少不同扫描协议及重建参数差异带来的误差。②图像分割:即感兴趣区(region of interest,ROI)的分割,ROI分割直接影响到特征提取,精确分割是进行影像组学研究的前提。一般有手动、半自动和全自动等3种方式,其中以手动分割最为准确,但任务繁重,需耗费大量时间与人力;半自动及全自动分割方法高效且可重复性高,故目前多采用自动勾画后由人工辅助修改边缘的方式[5,6]。③特征提取及筛选:特征提取是关键步骤,一般包括形态学特征、一阶灰度直方图特征、二阶与高阶纹理特征、小波特征等;大量特征可提高事物描述的准确度,但当样本量过小而特征维度较大时,会导致模型出现过拟合影响其泛化能力,必须对提取的特征进行筛选及降维处理,找出最佳特征,从而提高模型准确性及鲁棒性,常用的选择方法有Lasso-Cox回归模型、最大相关最小冗杂(mRNA)、RELIEF和PCA法等。④模型构建及分析:常用模型有逻辑回归(logistic regression)模型[7]、随机森林算法(radom forest)[8]、决策树(decision tree)、支持向量机(SVM)模型[9]和人工神经网络(artificial neural network,ANN)[10]等,选取最适合的数据模型,然后对模型进行训练及验证。可采用受试者工作曲线(receiver operating curve,ROC)的曲线下面积(area under the curve,AUC)、灵敏度和特异度等评估模型的诊断效能。目前,影像组学在肺部疾病的诊疗中应用广泛,如鉴别磨玻璃结节的良恶性[11]、预测肺腺癌的病理分级[12]及预后预测[13]。
EGFR突变在亚洲人群中突变率较高,约为50%,好发于不吸烟的女性患者中[14]。EGFR突变位点主要位于酪氨酸激酶功能区的18~21外显子,其中外显子19缺失(EGFR 19Del)和外显子21 L858R点突变(EGFR 21L858R)对EGFR酪氨酸激酶抑制剂(TKIs)的治疗表现出更好的客观反应率[15]。部分患者在EGFR-TKI治疗过程中会出现继发性耐药而导致病情进展,约60%的继发性耐药与外显子20的T790M位点突变相关[16]。
既往研究[17-19]指出EGFR突变与不吸烟、病灶小、空气支气管征、胸膜回缩等征象有关,含有GGO成分的肿瘤更易发生EGFR突变。Shi等[20]发现19外显子缺失相关的影像特征包括女性、肿瘤最大直径较小、胸膜凹陷、无纤维化,而21外显子突变与无吸烟史、毛刺、亚实性病灶有关。Zhou等[21]指出具有明显增强异质性或空洞的肿瘤可能与19外显子的缺失有关。这些研究主要依赖于传统形态学征象,主观性较强,且图像易受扫描条件和重建算法等因素的影响,导致结果可重复性差,各中心无法形成统一共识。
影像组学能对图像中像素与空间分布关系进行定量分析及充分挖掘,补充传统形态学成像特征,可作为早期预测非小细胞肺癌患者EGFR基因突变有用的影像诊断工具[22]。Wu等[23]基于术前增强CT图像,提取了849个组学特征,LASSO回归分析后显示10个影像组学特征与EGFR突变相关,加入临床特征后模型取得了较好的检测效能(AUC=0.97),显著高于单一影像组学模型(AUC=0.88)及单一临床模型(AUC=0.84)。周建忠等[24]利用双能CT静脉期的组学特征建立模型,多因素分析后指出,肺腺癌EGFR基因突变状态与DECT定量参数λHU(能谱曲线斜率)存在显著的相关性(P=0.004),理论上不同物质有其独特的λHU ,这在一定程度上反映出肿瘤的异型性。唐兴等[25]基于多序列MRI影像组学来预测EGFR突变,分别在T2WI、DWI序列及ADC图中提取出404个特征,经过SVM-RFE方法筛选后,保留16个最优特征,包括4个GLCM、9个GLRLM,1个NGDTM和2个GLSZM,其预测EGFR突变型的敏感度53.1%,特异度92.9%,准确度75.7%,AUC 0.826;联合性别因素构建模型,预测准确率可提升至78.9%,且DWI序列较ADC更有价值。MRI扫描过去常因易受呼吸伪影影响及价格较高等特点,在肺部疾病诊断中应用并不广泛,但MRI有着较高的软组织分辨率及多序列成像等独特优势,未来随着呼吸门控技术的进一步发展,基于MRI的影像组学在肺部疾病的诊断也将有良好的应用前景[26]。
此外,有学者对EGFR突变型非小细胞肺癌相关纹理特征展开研究。纹理分析是对图像灰度空间排布位置及规律的定量分析,肿瘤内部异质性会导致灰度排列空间性出现微小差异。Sacconi等[27]指出均值(mean)、SD值、偏度(skewness)等一阶统计参数与EGFR基因突变密切相关,其AUC值分别为0.751、0.749、0.641。吕昌生等[28]在肺腺癌 EGFR 突变状态与CT纹理灰度共生矩阵相关性的研究中指出EGFR野生组的对比度均值明显高于EGFR突变组,且突变组与野生组在对比度、逆差距、相关性之间的差异具有统计学意义(P<0.05),这代表着EGFR突变型肺癌图像纹理沟纹浅、视觉效果模糊。Li等[29]在研究中对比发现EGFR 19Del CT 图像中包含4个纹理相关特征,而这些特征在EGFR 21L858R中不存在;在用于预测EGFR 19Del 特征中具有最大AUC的特征是偏度(AUC=0.722),而EGFR 21L858R中具有最大AUC的特征是球形(AUC=0.727),这表明EGFR 19Del肿瘤在内部纹理特征上表现出差异,而 EGFR 21L858R 肿瘤则在形状上表现出不同。这可能为开发针对突变亚型的靶向NSCLC药物提供基础,为患者带来更好的治疗效果。
杨春生等[30]及Song等[31]基于影像组学特征成功筛选出EGFR-TKIs治疗优势人群,并能快速区分进展和缓慢进展的EGFR-TKI治疗的患者,列线图在训练集及两个独立验证集的C指数分别为0.743(95%CI:0.700~0.786)、0.718(95% CI:0.669~0.767)、0.720(95% CI:0.676~0.764)。AERTS等[32]对比观察了47例早期EGFR突变型NSCLC患者使用吉非替尼治疗前后的CT图像,发现治疗后影像组学特征Gabor_Energy-dir135-w3的增加与EGFR-TKI疗效较好相关(AUC=0.74)。这些可能代表着肿瘤对EGFR-TKI敏感性差异可以表现在图像中,利用影像组学的相关特征可以帮助临床早期筛选出EGFR-TKI治疗优势人群。Hyun等[33]研究144名TKI靶向治疗后因T790M突变造成耐药的患者,发现空气支气管征与T790M突变阳性有关(P=0.06)。目前上市的第三代EGFR-TKI药物(奥希替尼)对EGFR-TKI获得性耐药的患者有较好的疗效。因此,影像组学对于EGFR突变型NSCLC患者耐药突变位点的深入研究将会为患者提供更加个性化和精确的治疗选择。
非小细胞肺癌的预后与多种因素相关如个体差异、病理分型、肿瘤原发灶-淋巴结-转移(tumor-node-metastasis,TNM)分期等。计算机通过定量化相关特征可将预后因素可视化,从而更好的辅助临床决策。Wang等[8]以3年生存期作为界限,回顾性分析了173例非小细胞肺癌患者的CT图像及临床资料,提取了23个特征建立模型,其模型预测准确率可达79.6%,其中灰度共生矩阵(GLCM)中的逆差矩及角二阶矩与肺癌患者的生存期最相关。晚期非小细胞肺癌患者常发生远处转移,提示预后不良,患者5年生存率较低。肺门及纵隔淋巴结转移是肺癌较早的转移途径,与肺癌TNM分期中的N分期高度相关,TNM分期对治疗方式与预后评价有重要意义[34]。从梦迪等[35]基于增强CT成功预测了IA期非小细胞肺癌淋巴结转移,这将会帮助避免病理活检等有创检查,为下一步治疗提供有利证据。脑也是肺癌远处转移的常见靶器官,约10%~36%的肺癌会发生脑转移,导致进行性神经功能缺损,给患者带来极大的危害。Chen等[36]研究75位EGFR突变型非小细胞肺癌脑转移患者的MRI图像,发现瘤周水肿程度特征(edema_intensity_squareroot_intensity_median)与患者的生存时间密切相关,同时,基于T1WI+C及T2FLAIR等序列建立影像组学模型可预测脑转移瘤发生风险,其AUC、灵敏度、特异度分别为0.977、0.960、0.940。一般来说能够穿过血脑屏障的肿瘤细胞更具侵袭性和转移性,而肿瘤内部及癌周的差异能在影像学表现出细微变化并被检测出来[37],这表明影像组学可在疾病早期对脑转移发生进行预测及风险评估,提示临床制定最合适的诊疗方案,极大改善患者的预后。
当前,精准医疗对临床诊疗提出了更高的标准,影像组学作为新兴技术,其多参数的定量分析在疾病诊疗中具有巨大的优势,其在肺部疾病诊疗中已展现出巨大的潜能。将分子生物特性与影像学特征相结合也是未来肿瘤诊疗的发展趋势。但影像组学研究尚处于初始探索阶段,仍然存在许多问题需要解决:①大部分为回顾性研究,缺乏前瞻性研究,这可能会导致数据过拟合,模型泛化能力不足。②各研究间样本量相差较大,同类型研究的入选标准未达成一致,且部分研究为单中心小样本研究,缺乏外部独立验证,这就需要多中心合作,建立庞大的数据库,提高模型的准确率。③扫描设备及扫描参数难以标准化,ROI的勾画方式未达成一致,这会在一定程度上影响实验的客观性及可重复性。目前已有团队提出了生物标志物标准化倡议(image biomarker standardization initiative,IBSI)[38],对图像质量、特征提取及预处理模式提出统一标准,这将增加实验的可重复性,尽可能地减少误差。
未来,随着影像组学的进一步成熟,研究队列的多样化,大样本、多中心数据库的完善、机器学习算法的更新,上述问题可以得到有效解决,影像组学也将在肺癌分子诊断与治疗中拥有更广阔的应用前景。