王紫君 黄劲柏 邱大胜 周 颖
支气管肺癌(肺癌)是全球癌症相关死亡的主要原因,是世界范围内男性新发病例、死亡病例最高的肿瘤。
临床上肺癌确诊时70%的患者已失去最佳治疗机会,仅有15%的肺癌在早期确诊。早期肺癌5年生存率在50%以上,肺癌总的5年生存率不足15%。由此可见,肺癌的早诊早治是改善肺癌预后、延长生命的重要方法。随着医学图像技术的发展及低剂量CT筛查在肺癌高危人群中广泛应用,越来越多的早期肺癌被发现,但是,大约有18%的良性肺结节被过度诊断恶性。造成了医疗资源浪费及人们的恐慌。因此,需要探索、开发更系统、更全面的图像诊断技术。2012年Philippe Lambin首次提出影像组学的概念。
影像组学是借助计算机软件,从医学影像图像中通过自动学习算法深度挖掘肉眼看不到的高维定量影像特征用以解析临床信息。采集基于临床目的常规影像图像(CT、MRI、PET),而不需要特殊的成像,通过重建算法,勾画病灶边界,将感兴趣区域分割开,从中提取出海量影像组学特征,筛选出最有价值的特征,通过机器学习建模,并且验证分类器。目前,影像组学在多系统多器官疾病的研究中取得了突破性的进展。其中以肺结节的影像组学研究最为成熟。
空气支气管征、分叶、毛刺、血管集束、胸膜凹陷、强化方式是对肺部病灶良恶性鉴别的常见影像学征象。但良、恶性病灶间的影像征像交叉,缺乏特异的形态学征象,完全取决于诊断医师的主观经验,不同的影像诊断医师采用不同的思路,其诊断结果不同。肺结节单个CT征象的诊断的准确率是58.3%~76.7%,联合征象也不能提高其诊断的准确率。PET/CT将解剖信息与功能信息结合,一定程度上提高的诊断水平[1],但PET代谢特征并不能完整地反映肿瘤内部各种复杂信息,会导致诊断的特异性降低。研究表明,纯磨玻璃结节中,恶性结节和炎性结节的SUVmax没有差异。肉芽肿等炎性病变会增加假阳性结果。
Tu等[2]发现,CT平均标准差越大、均匀度越小、“熵”越大,更偏向于良性,且通过Logistic回归建立的分类器准确性最高,达到79%,采用组学特征建立的分类器性能比为肺癌筛查试验建立的LUNGRADS系统好。磨玻璃结节尤其是混杂磨玻璃结节在后续随访中被确诊为恶性肿瘤比实性结节多。因此,对于亚实性结节性质的预测是很有必要的。在一项有86个肺磨玻璃结节的77个患者中,对其纹理特征,CT征象(大小,位置,实性成分大小、病灶数量)、临床表现进行统计分析。结合纹理特征、CT征象、组学特征建立的预测结节性质的诺莫图(AUC=92.9%)的预测性能明显优于仅仅基于临床和CT 特征(AUC=79%)[3]。
研究表明,除了肺结节的SUVmax之外,组学特征与结节良恶性也有显著的相关性。组学参数如偏度、强度越大、峰度、角二阶距越小,更倾向于恶变可能,并建立了回归方程预测恶变的概率,AUC为0.775,灵敏度和特异度分别为89.6%、50.8%,诊断效能较 SUVmax 高(AUC=0.757,SUVmax≥2.5时,灵敏度、特异度分别为80.9%、50.3%)[4]。于鹏等[5]研究发现 FDG-FLT双示踪剂PET/CT检查的病例中,影像组学参数的准确率达到峰值83%,此时灵敏度、特异度分别为81%、85% ,传统代谢参数诊断准确率、灵敏度及特异度分别为74%、87%及75%。在一项鉴别炎性肉芽肿和肺癌的研究中,非增强CT的平方和与方差、熵越大,越倾向于肺癌,且建立的组学标签产生88%的灵敏度和92%的特异性(AUC=0.90±0.06,P<0.0001)。而增强CT中,提取的单个组学特征无法鉴别结节良恶性,且联合标签的预测性能不强,用PET/CT的代谢参数预测结节性质的性能亦低于组学参数[6]。上述研究表明,增强CT、PET/CT的纹理特征预测性能并不高,这可能是由于对比剂模糊了肺纹理导致的。一项56例肺结节队列中,将形态分形维(morphological fractal dimension,m-fd,描述CT上形态学复杂性的定量表示)、密度分形维(density fractal dimension ,d-fd,描述PET-CT上FDG摄取分布不均匀性的定量表示)、SUVmax与结节性质相关,越小的m-fd,d-fd倾向于是恶变,而越小的SUVmax倾向于良性。PET/CT上的SUVmax(68.5%)、d-fd(77.8%)显示更好的准确性比CT上的m-fd(64.8%),结合m-fd和SUVmax或者d-fd建立的预测模型诊断肺结节良恶性,准确性分别为 92.6%,94.4%[7]。
基因突变状态的检测是靶向分子通路治疗决策的关键,是个性化治疗的一个领域。对于30%有基因突变的非小细胞肺癌患者,人表皮因子受体(epidemal growth factor receptor,EGFR)靶向药物酪氨酸激酶抑制剂(TKIs)与标准化疗方案相比,具有更高的疗效反应和预后。研究表明EGFR突变与肺气肿、空气支气管征之间存在负相关,而与坏死、局部侵润之间存在正相关(P=0.017),此外,基于CT图像的均值、标准差、偏斜度与基因状态有显著相关性[8]。在2017年,对4个不同中心、不同种族的763名患者进行研究,发现体积、最大轴面直径可区分EGFR突变状态,却不能区分KRAS状态,亦不能将KRAS突变型与EGFR突变型区分开。而组学特征却能很好地区分,特别是联合临床特征后,对EGFR突变状态的预测准确性显著提高(从 AUC=0.7到 AUC=0.75),在区分KRAS突变型与EGFR突变型时,联合预测准确性亦显著提高。在此研究中,将所有样本分为探究组和验证组,进一步验证了模型性能[9]。在一项基于PET图像的大队列数据研究中, SUVmax越小的肿瘤EGFR突变率越高,有8个组学特征(紧密度,最小标准摄取值,最大概率,逆差距,长游程低灰度增强,大小区域变化,短灰度大小区域增强,and频度和2个传统特征:代谢肿瘤体积、SUVmax能显著的区分EGFR突变状态,仅逆差距可将EGFR突变型和KRAS突变型肿瘤区分开,此组学特征在EGFR状态上的预测性能也最好[10]。
在102例直径小于1cm的肺部纯磨玻璃结节中,提取组学特征建立预测病理侵袭性的模型,基于不同特征选择方法建立的预测模型其预测性能(AUC分别为 0.822、0.848 和 0.874)优于病灶大小和平均CT值的预测性能(AUC分别为0.726、0.786)[11]。在182例病理证实的晚期肺腺癌(实验组98例,验证组84例)队列中,提取635个组学特征,从中筛选出35个组学特征(熵、标准差等)是远处转移的预测指标,12个组学特征(一阶特征的偏度、标准差、熵、峰度)是生存的预测指标,组学特征与远处转移存在显著相关性,临床模型中加入组学特征后,预测远处转移能力显著提高[12]。
国际上报道了第一个影像组学与肺癌预后评估的文章。这项研究中,1019名肺癌及头颈癌患者被划分为7个训练组和验证组。从中提取了440个组学特征,将其与患者的预后、基因表达相关联。从440个组学特征中筛选出4个最优特征,统计能量(statistics energy)、形状密实度(shape compactness)、灰度不均匀性(grey level nonuniformity)、小波转换后的灰度不均匀性(grey level nonuniformity,HLH)很好地量化患者预后表型[13]。在Takeda等[14]研究中,3个传统代谢特征和4个在多个研究中被证明与预后有关的组学特征被从PET/CT图像中提取出来,除区域百分比外,其他6个特征均显示很好的再现性。只有高强度大面积增强(high-intensity large-area emphasis ,HILAE)是局部控制的重要预测因子,AUC=0.72。组织学类型、剂量分次和SUVmax 与无进展生存相关,组织学类型和放射剂量分次与总生存相关。另一项基于患者CT的组学研究中,联合组学特征标签与无进展生存显著相关,研制出联合组学特征和临床病理特征的诺莫图(CI: 0.72; 95%置信区间 : 0.71, 0.73)优于单独的临床病理诺莫图(CI: 0.691; 95% CI: 0.68, 0.70),联合组学诺莫图在临床决策中的应用也明显优于传统的分期系统和临床病理诺莫图[15]。
为了保证组学特征的重复性和一致性,得到可比较的组学特征,依赖于统一的设备、技术、扫描参数、重建方法和患者的呼吸运动。PET图像组学分析高度依赖于示踪剂及其注射量、注射-扫描间隔时间等。使用不同的两种重建算法和扫描参数提取出来的纹理特征存在明显差异。在两项研究中,分别采用不同的特征选择方法及不同的机器学习分类器算法来得出最终的预测模型,其建立的影像组学标签的准确性也是不同的。感兴趣区分割时,不可避免的可变性及高强度的密集工作限制了手动分割的大规模应用。组学分析软件纷杂多样,从图像的分割到模型的建立自然也存在区别,这导致大量用不同分析软件得到的研究结果没有统一的标准度量。这些都是影像组学运用于临床的巨大的实际挑战,各种影像技术的定量成像协议应该被严格制定出来,开发统一的标准来评估分割算法,制定统一的组学分析软件是有必要的。且目前大部分研究为回顾性研究,样本量小,临床数据不完整,入组标准不能严格把控。更大样本,多中心的前瞻性研究应该是未来研究的重点。
综上所述,影像组学在肺癌的诊断、疗效评估、预后及生物学行为预测等方面均有非常重要的应用价值,显示了它在临床肿瘤学中的潜在应用前景。影像组学有望为精准治疗提供依据,为患者提供个性化的决策。另外,影像组学从图像的采集到建立模型有许多问题有待解决,影像组学特征参数指导临床决策存在挑战。迫切需要多学科合作来促进影像组学的发展。