蓝雨晴
(浙江中医药大学第一临床医学院 浙江 杭州 310053)
肺癌是世界范围内癌症相关死亡的首要原因,其发病率也位居前列[1],其中非小细胞肺癌(NSCLC)为主要的病理类型。随着医疗大数据的发展,影像组学因能从医学影像图像中提取海量定量组学特征,并具有无创性、与互联网发展息息相关等特点,故在NSCLC的精准治疗中具有较大潜在应用价值。本文主要就影像组学在NSCLC诊疗中的应用与存在的问题展开论述,应用方面主要包括肺结节良恶性的鉴别,磨玻璃结节型肺腺癌浸润性鉴别,NSCLC淋巴结转移,肿瘤分期、无病生存期及基因表型。本文是关于影像组学进行定量及综合分析的研究,并为NSCLC个体化精准诊疗提供客观依据,支持临床决策分析。
用于影像组学研究所采用的图像主要是临床中采集患者的CT、MRI和PET等影像图像[2]。将CT影像特征的体素大小和灰度归一化处理能在一定程度上改善数据来源不同的情况。
指勾画病灶的二维感兴趣区(region of interest,ROI)或三维容积感兴趣区(volume of interest,VOI),进而针对该区域进行影像组学分析。目前,图像分割的方法有人工分割、半自动分割和全自动分割三种,常用的图像分割软件有ITK-SNAP、3D slicer等[3]。
影像组学定量特征通常可以分为形态学特征(如球形不均匀度等)、一阶统计特征(如体素强度等)、二阶统计特征(如空间灰度共生矩阵等)和高阶统计特征(如邻域灰度差矩阵等)四个类型[4],这些特征可以直接从图像中提取,也可以通过应用不同的滤波器或变换(如小波变换)后从图像中提取[5]。
从影像图像中可以提取大量影像组学特征,然后通过相关统计学方法等剔除冗余特征,筛选并保留与结果最相关的一些特征,从而用于构建影像组学的模型。影像组学特征具有特有的不确定性[6],且为防止建立的模型的过拟合与欠拟合问题,常需要选取鲁棒性好及临床结果相关性高的特征。
影像组学最终是利用筛选出来的最优影像组学特征构建预测模型。目前常用的模型有Logistic回归模型、随机森林、支持向量机、聚类分析和人工神经网络等,其中Logistic回归模型因具有简单和可操作性强的特点而广泛应用于临床[7]。此外模型建立后需进行内部及外部验证,评估诊断效能,以便以后进一步应用于临床。
肺结节是临床的常见病与多发病,准确鉴别肺结节的良恶性具有重要的意义,既能防止因过度诊断而进行不必要的手术,又可以及时施行手术根治肺癌。目前相关研究[8]表明影像组学在肺结节良恶性鉴别中具有较高的临床应用价值。Peikert等[9]对恶性结节408例和良性肿瘤318例进行影像组学分析,通过套索回归模型筛选出8个有效特征,模型结果显示曲线下面积(area under curve,AUC)为0.939;且对于直径为7~15 mm的肺结节进行子集分析,AUC达到0.947 7,可见该模型具有鉴别良恶性肺结节的临床应用价值。
临床上肺腺癌常表现为外周的结节或肿块,因此也有一些影像组学研究被应用于鉴别肺腺癌与肺肉芽肿。Beig等[10]筛选了结节内及其周围共12个纹理特征,在验证集中鉴别二者的AUC达0.80,准确率为71%,灵敏度为74%,特异度为68%。不难发现,基于联合结节内及其周围纹理特征的影像组学分析能有效区分良恶性结节,且更优于仅基于结节内部纹理特征的研究。
根据“国际肺癌研究协会/美国胸科学会/欧洲呼吸学会国际多学科肺腺癌分类(2011年版)解读”[11],可将肺腺癌分为侵袭前病变和侵袭性病变,前者包括不典型腺瘤样增生(atypical adenomatous hyperplasia,AAH)和原位腺癌(adenocarcinoma in situ,AIS),后者包括微浸润腺癌(minimally invasive adenocarcinoma,MIA)和浸润性腺癌(invasive adenocarcinoma,IA)。肺磨玻璃结节(ground-glass nodule,GGN)是早期肺腺癌的重要影像学特征,因此影像组学在GGN侵袭性判断中的应用对肺腺癌的手术时机、手术方式及治疗方面均具有重要意义。
目前研究发现影像组学可以增加GGN浸润性诊断的准确性。如,Wu等[12]的研究与之前有所不同,他们着眼于结节内及其周围的影像组学特征,在一定程度上可以反映肿瘤微环境。通过分析结节内、结节周围以及整体影像组学特征,可以发现整体影像组学特征模型的AUC值最高,为0.896,具有更好的鉴别侵袭前病变和IA的能力。
影响肺癌患者生存和复发的一个重要因素是淋巴结转移,影像组学分析或成为预测肺癌患者淋巴结转移的一种非侵入性检查方法。Yang等[13]从159例静脉期CT图像中提取了14个与淋巴结转移显著相关的特征,并建立了一种能预测实体肺腺癌淋巴结转移的影像组学诺模图,其训练和验证队列的AUC值分别为0.871和0.856。不难发现,其研究模型对淋巴结转移具有较好的预测性。
临床中,对于隐匿性淋巴结转移的预判更为重要。Zhong等[14]从492个病例中提取了量化肿瘤强度、纹理和子波影像组学特征构建模型,ROC曲线分析显示预测隐匿性纵隔淋巴结转移的准确率为91.1%,AUC为0.972。
原发肿瘤的范围(T)、淋巴结侵犯(N)和远处转移(M)是选择肺癌治疗方案和肺癌分期的决定性因素。筛查和薄层计算机断层扫描(CT)对早期肺癌的发现具有重要意义,肺癌发现的越早,其预后越好,因此肺癌分期临床意义显著[15]。其中,寻找预测非小细胞肺癌脑转移的有效方法是十分有必要的,关于这方面的研究,Chen等[16]从89例T1型肺腺癌患者(脑转移35例,非脑转移54例)的CT平扫图像中筛选了4个最具特征的影像特征,据此建立的影像组学模型的平均AUC值为0.847,结果表明基于CT的影像组学模型能较好地预测T1类肺腺癌患者的脑转移情况。
无病生存期(disease-free survival,DFS)是指从随机化开始至疾病复发或由于疾病进展导致患者死亡的时间。Khorrami等[17]从90例Ⅲ期非小细胞肺癌患者的CT图像中提取了13个稳定的结节内部及其周围实质区域影像学特征,并建立了多因素Cox回归模型来预测DFS,结果显示影像组学特征是DFS的独立危险因素,影像组学对预测肺癌无病生存期有意义。
除了上述CT平扫图像的研究外,Chen等[18]从119例行肺叶切除术的病理Ⅰ期实体肺腺癌患者的胸部CT增强图像中提取了4个特征,并建立模型来预测Ⅰ期肺腺癌的DFS,其AUC为0.693。相较于基于CT平扫做出来的模型,Chen等[18]所研究的模型结合非冗余和可重复的影像组学特征进行了数据标准化和降维处理,具有额外的价值。
影像生物基因组学指的是在通过CT等影像识别到的病变中检测出生物(基因组、蛋白质)的改变。因其为无创性操作,故很多医生和学者在此方面展开了研究。
对于晚期肺腺癌EGFR突变的预测,国建林等[19]从患者的动脉期和静脉期图像中分别提取影像学特征建立预测模型,动脉期和静脉期模型训练组的AUC分别为0.75和0.69,同时基于动脉期和静脉期影像特征所建立的联合预测模型的AUC可提升至0.76。此外,除了针对EHFR的研究,NSCLC中ROS原癌基因1(ROS proto-oncogene 1,ROS1)重排也比较常见。Digumarthy等[20]发现ROS1重排与EGFR突变的NSCLC影像学特征有较大的重叠,但前者更容易出现淋巴管癌变、远处淋巴结转移和硬化型骨转移的影像特征,而在原发灶内较少出现支气管充气征。
在临床工作中,螺旋CT扫描为胸部疾病诊断的常用辅助检查,其在NSCLC的检出、诊断及随访中均发挥着重要作用。随着人工智能的发展,基于CT成像的影像组学或将能提高NSCLC的精准诊疗,并有望提高患者的生存率。但目前仍存在影像组学研究所需数据量大多来自单中心的情况,因此研究模型可能存在过拟合现象或诊断偏倚等问题,不过相信随着标准化大数据库的建立,其将成为放射科医师强有力的辅助工具。