影像组学技术进展及其在非小细胞肺癌中的应用*

2018-01-13 16:30黄庆综述王卫东郎锦义审校
肿瘤预防与治疗 2018年3期
关键词:组学预测特征

黄庆 综述,王卫东,郎锦义审校

530000 南宁,广西医科大学 研究生院(黄庆) 610041成都,四川省肿瘤医院·研究所,四川省癌症防治中心,电子科技大学医学院 放疗科(王卫东、郎锦义)

肿瘤在基因、蛋白质、细胞、组织和器官水平上均表现出空间和时间异质性[1-2],这是导致肿瘤具有侵袭性和治疗失败的主要原因[3],并限制了基于活检的分子病理学的应用。医学影像以非侵入性的方式动态观察肿瘤及其微环境,为全面评估肿瘤的异质性提供了可能。目前医学影像通常由放射科医师或核医学医师通过视觉定性描述,主观描述肿瘤表型如中心性坏死、中等强化、密度不均、边缘毛糙等,缺乏客观的定量指标,同时这些特征在观察者之间变异性较大[4-5]。经定量图像处理技术获取的数据信息可以描述肿瘤的不同性质,如形状和尺寸,强度和纹理特征,这些特征值与统计建模技术相结合,以预测临床终点或肿瘤性质,即称之为影像组学(Radiomics)[6]。影像组学最终目的是将其提取、分析得到的定量图像特征与患者临床数据结合,建立临床预测模型,提供准确的风险分层,指导癌症的精准治疗。其工作流程大致分为图像采集与重建、图像分割、特征提取、数据分析4个方面[6-7]。影像组学自出现以来,在癌症管理的各个阶段均表现出巨大的潜力,包括辅助诊断、病情评估、疗效监测、预测分析等方面。本文将重点阐述近年来影像组学研究所面临的挑战、相关技术进展及其在非小细胞肺癌(non-small cell lung cancer, NSCLC)中的应用。

1 影像组学研究流程与技术进展

影像组学的工作流程主要包括以下4个方面:(1)图像采集与重建;(2)图像分割;(3)特征提取与选择;(4)数据分析。

1.1 图像采集与重建

目前影像组学研究中的图像采集方式主要包括CT、MRI和正电子发射型计算机断层显像(positron emission tomography,PET)。CT对肿瘤的密度具有较高的分辨率,成像时间快,能够准确地测量各组织的X射线吸收衰减值,可作定量分析,是影像组学研究中最常用的图像获取方式。MRI具有较高的软组织分辨率,多参数、多序列及功能成像能够提供肿瘤组织的结构和功能信息,对评估肿瘤异质性具有较大的优势。PET从分子水平反映图像功能性质与肿瘤潜在生物学行为的关系[8],在肿瘤的分期、疗效预测、预后评估等方面具有巨大的潜力。

影响图像采集和重建的因素主要有:(1)呼吸运动:MRI和PET图像采集时间相对较长,图像质量势必会受到患者移动和呼吸的影响。Oliver等[9]比较了23例肺癌患者三维和四维PET / CT图像特征,结果显示使用静态采集与呼吸门控技术获得的图像特征表现出显著差异,表明呼吸运动对影像特征的影响不容忽视;(2)不同的采集设备和采集参数均会影响图像的质量和可靠性。Mackin等[10]发现不同CT扫描仪获取的影像组学特征值的变异性较大,建议在影像组学研究中,考虑不同扫描仪间的差异。Zhao等[11]分析了不同重建算法和切片厚度得到的CT图像,结果显示在一定成像设置范围内,影像特征才具有重现性;(3)CT图像后处理技术,Huynh等[12]对比静态自由呼吸图像和经后处理的平均密度投影图像(average intensity projection,AIP)发现,AIP图像包含更多的信息,能更好地预测NSCLC患者的预后。目前美国医学物理学家协会、美国放射学会、世界分子成像学会等相关专业学会正在制定关于成像仪操作和验证的定量成像技术指南。

1.2 图像分割

获取的图像需要将肿瘤从正常组织中分离出来,即图像的分割,是影像组学研究中最具挑战性和争议性的过程。图像分割必须是可重复且可靠的,包括手动分割、半自动或自动分割。目前已经开发出许多半自动或自动的分割算法和软件。Velazquez等[13]利用三维Slicer软件平台对NSCLC的原发肿瘤体积进行半自动分割,肿瘤体积显示出高度的一致性,并与实际体积相当。Mattonen等[14]利用CT图像纹理特征预测NSCLC放疗后复发,发现半自动分割比手动分割速度更快,预测精度更高。有研究对半自动分割和手动分割的图像进行对比,发现基于区域增长体积算法的半自动分割获取的图像特征重复性更高,一致性更好[15]。手动分割耗时、重复性差,自动或半自动分割为特征量化的手动描绘提供了更好的替代方法,但自动分割仍具有一定的局限性,只有当肿瘤和背景区域存在强烈的信号差异时,自动分割才是有效的。因此要达到最佳的分割效果可以应用半自动或自动分割技术减少轮廓的不确定性和提高分割效率,然后由有经验的医师进行校正。

1.3 特征提取与选择

1.3.1 特征提取 有效分割之后需要从感兴趣区域提取高维影像特征,定量描述肿瘤的属性。目前常用的特征主要分为四种类型:(1)形态学特征;(2)统计学特征;(3)区域特征;(4)基于模型的特征。

(1)形态特征:形态特征描述有关肿瘤形状和体积方面的物理特性。如体积、表面积、紧密度、离心率、球形度、粘性、边缘形态外观等。目前评估肿瘤疗效主要通过双径或单径测量,如WHO或实体瘤疗效评价标准(Response Evaluation Criteria in Solid Tumors,RECIST)[16],但肿瘤是不规则的,径线测量无法评估直径没有变化的肿瘤的形态学改变。肿瘤体积倍增时间越短,侵袭性越强,提示预后更差,体积测量可作为肺癌疗效评估的关键参数,比常规方法更好地评估治疗反应[17]。同样,有研究发现肿瘤的离散致密度与肿瘤侵袭性相关[18]。

(2)统计学特征:包括肿瘤直方图特征和纹理特征。直方图是肿瘤像素衰减与每个衰减值处像素的频率构成的曲线图,显示感兴趣区域内像素值的范围和频率,不包含空间位置信息,可以计算出多个一阶统计量,如平均值、中值、标准差、峰度、偏度、能量、熵、均匀性和方差等,可评估肿瘤的细微变化。Kamiya等[19]通过密度直方图的峰值和偏度有效区分肺结节的良恶性。纹理特征可以保留像素间的空间信息,常用的纹理特征包括①灰度共生矩阵:是像素距离和角度的矩阵函数,通过计算图像中一定距离和一定方向的两点灰度之间的相关性来反映图像的信息。代表性特征有相关性、逆方差、对比度、能量和熵;②灰度游程矩阵:描述任何方向上具有相同灰度级的连续像素,提取的特征有短游程因子、长游程因子、灰度不均度、不均匀游程长度和百分比;③局部灰度差分矩阵:描述每个体素与相邻图像平面中相邻体素之间差异性,包括粗糙度、复杂度、纹理强度。有研究者利用二阶纹理特征预测早期NSCLC治疗后复发率,显示出良好的预测性能[14]。Pena等[20]研究发现纹理特征可有效区分胸膜病变的良恶性,AUC(0.92±0.05)。大量研究表明,纹理特征与肺癌分期、转移、治疗反应和生存率相关,可作为肺癌的预后指标。

(3)区域特征:区域特征是基于区域之间变异强度的计算,描述肿瘤内亚区域出现的数量和频率。许多微环境因素包括组织学类型,解剖位置,代谢,缺氧和血管生成均与肿瘤表型相关,但具有相同遗传基因的肿瘤,由于其基本的分子结构相似仍表现出相似的表型,此时区域特征则可以有效反映其异质性。Ganeshan等[21]的研究发现区域特征与肿瘤预后相关。Wu等[22]通过PET/CT图像肿瘤内区域特征有效识别肺癌放疗后的高危亚区。

(4)基于模型的特征:分形变化指一个物体在一定范围内的形状复杂性,分形维数是其重要特征和量化指标,精确量化物体的固有形状。有研究[23]利用分形纹理特征区分侵袭性和非侵袭性肺癌,预测精度超过80%。

1.3.2 特征选择 通常单纯提取得到的图像特征数量巨大,而用于临床应用的特征则要求是稳定、可重复的,因此需要对特征进行选择。特征选择主要取决于临床问题、队列的大小、相关结构位置等。目前主要通过主成份分析、互信息、线性判别等机器学习和统计学分析方法对图像特征进行降维,用一致性相关系数和动态范围检测来选择具有低冗余度、信息丰富和可重复的稳定特征。特征的选择方法至关重要,Parmar等[24]对14种特征选择方法和12种分类方法对比研究发现,基于Wilcoxon检验的特征选择方法和随机森林分类方法具有最高的预后预测性能。Zhang等[25]利用影像组学特征预测NSCLC预后,并对主成分分析和Wilcoxon两种特征选择方法的预测性能进行比较,发现主成分分析AUC值明显高于Wilcoxon(P<0.05),表明主成分分析在预后预测方面具有更大的潜力。因此,要实现最佳的预测性能,必须将适合的特征选择方法和分类模型结合使用。

1.4 数据分析

影像组学根据图像特征对患者进行分类和评估,建立临床预测模型,解决临床问题。在模式识别和机器学习语言中,数据分析相当于建立一个分类模型,是一种分析训练数据并推断假设的算法,用于预测未知的观察值,如临床结局或肿瘤表型。建立预测和分类模型是影像组学研究中最重要的部分,需要仔细验证才能产生可靠的结果,各种计算方法如多因素分析,常用于评价图像特征和临床、生物信息的相关性。例如Coroller等[26]利用影像组学特征预测局部晚期肺腺癌的远处转移。大量的图像数据和要处理的特征需要强大的数据挖掘技术,如机器学习,深层神经网络、支持向量机和贝叶斯网络等技术在影像组学中已得到广泛应用。

2 影像组学在NSCLC中的临床应用

近年来,医学图像分析呈现指数级增长,模式识别工具、数据集数量不断增加,推动了影像组学研究的快速发展。影像组学提供了一种客观定量评估肿瘤表型的方法,在癌症管理的各个阶段具有潜在应用价值,如辅助诊断、基因分型、肿瘤分期、疗效及副反应评估、预后预测等方面。影像组学在NSCLC中的临床应用包括以下几个方面。

2.1 辅助诊断

在临床实践中,肿瘤组织学鉴定的金标准是通过活检对肿瘤组织进行病理学检测;与通过有创活检获取的肿瘤碎片的随机样本不同,影像组学通过无创和可重复的医学影像技术提供关于整个肿瘤的特征,揭示肉眼不易观察的特征,丰富和补充病理学检测。Chae等[27]对86例经病理证实的肺磨玻璃结节的CT图像进行纹理分析,发现峰度、熵、平均衰减值等纹理特征可以较好地区分浸润性肺腺癌和浸润前病变。进一步,Yuan等[28]从431例肺腺癌患者CT图像中提取强度、纹理和小波特征,用于区分原位腺癌/微浸润腺癌/浸润性腺癌,分析显示预测准确率达到80.5%。Miwa等[29]回顾性分析了54例PET / CT检查疑似NSCLC患者的资料,研究表明形态分形维数或密度分形维数与最大SUV值结合分别将肺结节良恶性的诊断准确率提高到92.6%和94.4%。Saad等[30]利用CT影像组学特征解码组织学亚型不明确的NSCLC(non-small cell lung cancer not otherwise specified,NSCLC-NOS)的分子或细胞结构,构建分类模型提高了NSCLC组织学分类的特异性,平均准确率为81%,平均AUC为95.3%。影像组学使非侵入性评估肿瘤异质性成为可能,将影像数据转换成高维定量数据,提供个性化和精准医学中基于多特征的影像组学标记,将协助病理学家和肿瘤学家实现NSCLC的精确诊断和治疗。

2.2 基因分型

影像特征与基因表达调控、突变状态或表观遗传变化相关,为影像组学的临床应用提供了生物学基础。Rizzo等[31]分析了285例NSCLC的CT特征与表皮生长因子受体(epidermal growth factor receptor,EGFR)、K-ras(kirsten rat sarcoma)和间变性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)突变状态的相关性,其中支气管充气征、胸膜凹陷、病灶尺寸、无纤维化与EGFR突变相关,圆形病灶、非肿瘤叶结节与K-Ras突变相关,胸腔积液与ALK重排相关。Rios等[32]通过综合分析352例肺腺癌患者体细胞突变检测和CT图像资料,发现影像组学特征可以有效区分EGFR(+)和EGFR(-),AUC=0.69。Weiss等[33]对48例早期NSCLC患者的肿瘤DNA和CT图像进行研究,偏度与峰度特征可区分K-ras突变型与野生型肿瘤,灵敏度、特异度和准确度分别为96.3%、81.0%和89.6% 。Yoon等[34]则使用影像组学方法比较ALK和c-ros原癌基因1酪氨酸激酶(c-rosoncogene 1 receptor tyrosine kinase,ROS1) / 原癌基因RET(rearranged during transfection proto-oncogene)融合阳性肺腺癌的特征,ROS1 / RET与ALK融合阳性肿瘤在中心位置、SUV(max)、体素距离均一性和体素距离上的总和均有显著差异,提出无创性评估ALK、ROS1/RET 状态的方法。基础研究方面,Panth等[35]发现影像组学特征可以识别基因诱导或放疗后基因表达的早期改变。整合医学图像和基因表达状态的影像基因组学可作为肿瘤预后的图像生物学标志,促进个体化医疗的发展[ 36-37]。目前影像基因组学在NSCLC中的研究仍处于早期阶段,许多问题仍亟待解决,需要医学图像、基因组学、临床数据的有效整合和大数据研究。

2.3 肿瘤分期

准确的分期决定了治疗的方式和强度,影像组学特征被证明可以区分肿瘤的早期和晚期阶段。Flechsig等[38]对122例肺癌(绝大部分为NSCLC)患者的PET/CT图像进行分析,发现良性和恶性淋巴结中位CT密度值有显著差异(P<0.05),提出非侵入性评估肺癌淋巴结分期的方法。同样,Pham等[39]使用灰度共生矩阵和半方差图特征预测肺癌(NSCLC 147例,SCLC1例)纵隔淋巴结的良恶性,敏感性为75%,特异性为90%,AUC为0.89。Nguyen等[40]对肺门和纵隔淋巴结支气管内超声图像进行研究,发现超声图像特征可鉴别良恶性淋巴结,结果与PET-CT相当。在宫颈癌、结直肠癌、食管癌也得到了类似的结果[41-43]。使用影像组学特征辅助肿瘤分期,可以将患者进行风险分层,选择最佳的个体化治疗方案。

2.4 疗效及副反应评估

影像组学通过预测治疗反应来指导肿瘤的精准治疗,包括预测治疗效果和副反应评估。Coroller等[44]从127例NSCLC患者新辅助放化疗前的CT图像中提取15个影像组学特征,发现7个特征可预测大体残留病变(AUC>0.6,P<0.05),1个特征可预测病理完全缓解(AUC=0.63,P=0.01)。进一步,Coroller等[45]的研究表明,描述肿瘤球形度和淋巴结均匀性的3个影像学特征可以区分NSCLC新辅助放化疗后病理完全缓解和非完全缓解。Mattonen等[46]则使用影像组学方法识别NSCLC立体定向消融放疗后的局部复发,AUC为0.85,表明影像特征可以发现临床医师肉眼无法察觉的早期变化,指导高危复发患者的早期治疗。副反应评估方面,Moran等[47]研究发现,灰度共生矩阵特征可以有效区分立体定向放射治疗(stereotactic body radiotherapy,SBRT)后的中度/重度肺损伤和无/轻度肺损伤(AUC 为0.643~0.750)。影像组学以非侵入性的方式预测NSCLC治疗效果和副反应,指导临床治疗,有望进一步改善患者生存。

2.5 预后预测

Kirienko等[48]对295例NSCLC患者的术前影像展开研究,发现CT、PET、PET / CT影像特征均可用于预测术后患者的无病生存期(disease-free survival,DFS), AUC分别为0.75、0.68和0.68。Yu等[49]回顾性分析了经手术和立体定向消融放疗(stereotactic ablative radiotherapy,SABR)治疗的Ⅰ期NSCLC患者CT图像和临床资料,发现峰度和灰度共生矩阵特征构建的预测模型实现最佳的风险分层(P<0.001),是总生存期(overall survival,OS)的独立预测因子。Fave等[50]研究表明影像组学特征可显著改善常规临床因素模型的预测能力,使 OS预测的一致性指数从0.60增加到0.67,远处转移从0.53增加到0.63。类似,Huang等[51]研究发现影像特征与DFS明显相关,与传统分期系统和临床病理危险因素相结合可更好地预测DFS。Grossmann等[52]发现,结合影像组学特征,分子途径和临床因素可最大限度预测NSCLC的预后。影像组学可准确预测NSCLC的临床结局,实现治疗前的病情评估。鉴于影像生物学标志的潜在价值,美国国家癌症研究所已经建立定量影像分析网络,促进定量成像方法、标准和软件工具的发展。

3 问题与展望

综上所述,影像组学是一种全面评估肿瘤及其微环境的非侵入性方法,提取的图像特征可作为肿瘤遗传学和临床结局的预测因子,实现患者的危险分层和个体化治疗。目前影像组学已经在NSCLC的辅助诊断、基因分型、病情评估、疗效预测、预后分析等方面开展了大量的研究并取得了令人鼓舞的成果,在NSCLC的诊疗中有巨大的临床应用价值。然而,当前影像组学仍处于初步研究阶段,应用于临床实践仍需要克服以下关键问题:(1)不同采集设备、参数设置、分割方式、特征选择方法所获取的影像特征存在明显的差异[9-15,24-25],应用于临床的影像生物标志物必须是稳定且可重现的,因此图像采集和特征计算的标准化是未来研究的主要方向之一;(2)样本量决定了临床预测模型的普遍性和预测性能,目前大多数研究仅涉及少部分特定对象的图像特征,缺乏普遍性,同时这些特征易受多种因素影响,因此需要足够多的数据集来克服临床影像中的异质性问题。通过跨区域、跨机构的数据共享建立大型影像组学数据库是可能的解决方案;(3)在临床试验中,通过前瞻性收集的独立队列进行验证,是验证一个确定的统计学关联或生物学标志的参考标准。目前大多数研究仍为回顾性分析,与其他生物学标志一样,仍需要高质量的前瞻性研究加以验证。尽管许多问题还亟待解决,影像组学结合表型和遗传学的多学科方法仍是实现精准医疗的重要战略。可以预见,通过计算机科学家、医学物理学家、临床医生的多学科合作,影像组学与基因组学、蛋白质组学的有效整合,影像组学将有望应用于临床,推动癌症的精准治疗,改善患者预后。

作者声明:本文第一作者对于研究和撰写的论文出现的不端行为承担相应责任;

利益冲突:本文全部作者均认同文章无相关利益冲突;

学术不端:本文在初审、返修及出版前均通过中国知网(CNKI)科技期刊学术不端文献检测系统学术不端检测;

同行评议:经同行专家双盲外审,达到刊发要求。

猜你喜欢
组学预测特征
根据方程特征选解法
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
离散型随机变量的分布列与数字特征
影像组学在肾上腺肿瘤中的研究进展
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
蛋白质组学技术在胃癌研究中的应用