罗敏 高鹏 谢秋霞 刘于宝*
慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是一种由气道异常、肺气肿和肺外效应组成的复杂疾病,是世界人口寿命缩短的第七大原因[1-2]。目前,诊断COPD 的金标准是肺功能检测,但其不能直观地显示病变的部位、范围及细微的病变,甚至影响该病的早期诊断及疗效评估[3]。而影像检查可直观地显示COPD 病人的肺内及肺外结构改变并进行量化,部分定量参数可以预测肺功能检测结果、疾病进展及死亡率[4-5],可用于筛选适宜肺减容手术的病人[6],且可评估经药物治疗后病人通气-血流不平衡的改善情况等。
医学影像中每一个像素点都是基于底层解剖结构的某些物理特征的测量,但目前临床上对影像的解释仍多依赖于视觉分析。尽管病灶的平均衰减值、大小等简单的定量参数也在临床及研究中应用,但仍有大量的信息被遗漏。影像组学是用计算机图像处理技术,从医学影像中高通量地提取分析大量的定量特征数据,用于评估疾病的异质性,并经过特征选择、模型建立及验证与临床需要的结果指标相关联,为疾病的临床诊断和治疗提供参考,是实现精准医疗的一种重要的医学工程学研究方法。影像组学提取的定量特征数据不仅包含既往常用的定量参数,还能全面地描述兴趣区的形态学特征、强度特征、体素的空间关系、相邻体素之间的差异、同质区域的特征及变化等,已广泛应用于COPD的相关研究[7]。本文就影像组学在COPD 的早期发现,肺气肿的识别、分类及评估,气道、心血管改变和肺部通气情况的评估以及COPD 预测模型及其表型开发等方面的应用进展予以综述。
COPD 主要诱因是吸烟及家庭空气污染[1]。COPD 病人暴露于污染空气一段时间之后,肺部结构出现小叶中心结节和磨玻璃密度区等早期改变,这些改变可早于临床诊断,甚至早于肺气肿[8]。影像组学有助于发现肺部的早期改变。Ginsburg 等[9]基于灰度游程长度及灰度间隙长度训练多元Logistic 回归分类器建立的模型可以成功区分正常肺组织、小叶中心结节和小叶中心型肺气肿;研究还显示该模型测得有肺气肿的受试者,其小叶中心结节的数量少于无肺气肿的吸烟者,表明呼吸性毛细支气管炎是肺气肿的先兆。Szigeti 等[10]建立了暴露于不同空气污染物下的小鼠模型,对小鼠的CT 影像依据特定的衰减区间进行二值化,并利用分形维数进行空间模式分析,得到的模型可以在肺气肿形成之前区分小鼠是否处于空气污染物中。分形是指非欧几里得结构,具有自相似性及标度一致性,分形维数是分形形体特征的重要参数,对应分形体的不规则性和复杂性。生命体是一个复杂的系统,但具有自相似性,可用分形理论进行描述,分形维数在生物影像中具有广阔的应用前景[11]。综上,影像组学有挖掘疾病发生、发展机制的潜力,未来仍需进行更多的研究。
肺气肿是COPD 的一个组成部分,是肺渐进性破坏导致的远端气腔永久性扩张,对其评估有利于监测COPD,可为临床治疗提供重要参考。评估肺气肿除了应用传统的肺气肿体积分数测量之外,影像组学可提供多方面的量化评估方法,Shimizu 等[12]发现低衰减区域的分形维数较低与更短的COPD 首次恶化时间相关。此外,肺气肿的自动识别与分类也是COPD 影像组学研究的热点。
2.1 肺气肿的识别 最初,机器学习识别肺气肿的研究多是利用有监督的分类器,训练前需要人工判断兴趣区是否是肺气肿区,以此获得已知类别标签,但这种方法耗费人力、时间,且人工注释的稳定性及一致性欠佳[13]。Pino Peña 等[14]利用与肺气肿相关的弱标签,即1 s 用力呼气容积和肺一氧化碳扩散量来训练多实例学习分类器,发现该分类器能自动识别高分辨力CT 中的肺气肿区域;与基于密度及人工注释的方法相比,该分类器得出的肺气肿百分比与肺一氧化碳扩散量的相关性更强。
2.2 肺气肿的传统分型 传统上肺气肿有3 种主要类型,即小叶中心型、间隔旁型和全小叶型,可以通过CT 诊断评估来确定;其不同类型与不同的危险因素及临床表现有关[15]。利用影像组学可自动区分和量化这3 种肺气肿亚型,并据此建立预测模型,相对于密度低于-950 HU 低衰减区的体积分数及影像医师诊断结果,此类预测模型对预测肺功能、呼吸困难情况、生活质量和医疗保健使用情况的能力更强[16-17]。Yang 等[18]在建立肺气肿分类器的过程中,利用无监督的学习模式,得出了均匀的、可重复的纹理原型,表明无监督学习模式具有开发新的更精细的肺气肿亚型的潜能。
2.3 肺气肿的严重程度评估 尽管视觉评估肺气肿的严重程度较耗时且受评估者间变异性限制,但使用标准密度测定法量化肺气肿尚不如视觉评分。影像组学可进行肺气肿严重程度分级,所得分级级别内相关系数较高,与视觉评分的相关性较强,能更好地预测临床肺功能检测指标并与死亡率相关[19-21]。肺气肿是一个连续发展的过程,但视觉分析难以得出连续性的严重程度评分。Kurugol 等[22]利用分层排序支持向量机可得出肺气肿进展的连续性评分,结果显示,该评分与影像医师的视觉评价一致性较高,而且分层排序支持向量机较全局排序支持向量机的分类性能更优,与分类支持向量机相比,还可提供类内排序。
2.4 肺气肿的空间分布 肺气肿在空间分布上也有强的异质性,肺气肿头尾方向上的分布模式与死亡率相关且有助于预测肺减容术的疗效[23]。Boueiz等[24]使用无监督的学习模式中的随机森林法区分总肺气肿数量相当的上叶或下叶优势型肺气肿亚组,所得亚组在头尾方向上的肺气肿分布模式、疾病进展和遗传关联方面均有差异,这可能对实现个性化治疗具有重要意义。排除不属于任何聚类的个体的聚类方法具有更高的可重复性[25],而随机森林聚类法能够区分聚类良好及聚类不良的研究对象,利用随机森林聚类法,将上下叶肺气肿情况相差不大的受试者单独列为一个亚组研究,可识别出相对明确的上叶或下叶优势型肺气肿亚组。综上,将来可以进一步研究应用影像组学方法分析的肺气肿亚型与临床上各种指标的关系及其亚型的预后性能。
持续性呼吸系统症状及气流受限是COPD 的特征,由气道异常和/或肺泡异常所致[1],相对于肺气肿肺泡破坏,气道疾病更难表征,影像组学拓宽了气道改变表征的方法。目前常用的气道表征指标有支气管直径、气道壁面积、气道壁厚度和气道分支的曲折度。但是这些指标都是以单个分支或者特定节段的形态来表征整个气道的改变,准确性较低。气道是一种复杂的结构,从尖端到末尾不断成倍地反复分叉,具有自相似性,是一种分形体,可用分形维数进行度量。Bodduluri 等[26]利用分形维数对气道树的复杂性及重塑性进行度量,结果表明分形维数与呼吸系统发病率和肺功能改变相关,还可提供预测信息并估计死亡风险。COPD 病人的部分气道可收缩,了解气道阻塞程度及梗阻分布有助于预测氦氧混合气体的治疗效果[27]。但目前尚无无创性的技术可提供远节气道的形态和阻塞分布。Pozin 等[28]通过随机森林机器学习法建立动态肺部通气图中提取的通气特征与已知气道半径减小比例之间的映射,得到了令人满意的气道阻塞分布预测模型,结果显示对气道阻塞的检测率超过85%。目前,探讨COPD 病人气道改变的影像组学研究较少,将来可以开发更加全面、准确地表征COPD 病人气道改变的影像组学特征或建立有助于临床评估与治疗的气道改变分型。
COPD 会引起肺动脉高压及右心衰,而肺动脉高压与右心功能不全又与COPD 病人的生存率呈负相关,并且与不良的临床进展和更频繁地使用医疗资源相关[29]。超声心动图、X 线、CT、MRI 及核医学均可以评估COPD 病人的心血管改变,包括肺部的血流灌注情况,血管形态改变,心脏结构改变,心脏功能、血流动力学改变,心肌组织成分及微观结构改变等,有助于诊断和评估肺动脉高压、右心室重构及右心功能的改变,可以更好地预测死亡率[30]。
影像组学在心血管评估方面具有广阔的应用前景。利用深度学习可以自动分割血管及心脏并测量其大小,这为心血管疾病影像组学研究奠定了基础[31-32]。也有研究[33-36]发现,影像组学在对肺动脉高压的诊断及风险分层方面初步展现出应用潜能,所得模型的诊断准确性高,风险分层效果好。另外,预测右心功能衰竭事件发生及开发新的心力衰竭表型的影像组学研究也正在开展中[37-38]。由此可见,心血管影像组学研究仍处于初始阶段,将来需要对COPD病人的心血管改变进行更多的影像组学研究。
运动性呼吸困难是COPD 病人最常见和最主要的症状,由长期炎症引起的气道阻塞和肺气肿肺泡破坏引起的气流受限所致[39]。临床上通过肺功能检测评估气流受限的程度,但评估能力有限,且需要病人良好的配合,因此在危重病人中应用受限。核素显像、MRI 及双能CT 均可进行区域性肺通气成像,但操作复杂且需要病人吸入特殊气体,故而肺通气图在临床上的推广及应用受到限制[40]。
影像组学结合配准的方法可以根据常规影像预测局部肺通气情况。结合不同呼吸状态下的影像可了解肺部通气的异质性。Bodduluri 等[41]将吸气相及呼气相CT 进行配准,在各体素的对应关系中找出局部组织变形模式,并提取肺部的生物力学特征集,包括雅可比矩阵、应变信息和各向异性变形指数,分别测量吸气到呼气相局部体积变化、区域内给定位移的变化及肺变形的取向偏好,基于此识别COPD 并评估其严重程度,结果显示生物力学特征集与密度和纹理特征集相比具有同等或更好的性能,加入生物力学特征改善了基于密度及纹理特征的分类器的性能,且与肺功能指标的相关性更高。由于超级化气体MRI 可以显示肺部通气异质性及微结构[40],Westcott 等[42]将He-MRI 肺部通气图与胸部CT 进行配准,获得基础的真实的训练标签,进而得出基于CT 纹理特征和机器学习模型的预测通气图,结果显示该模型通气图与MRI 通气图相关,该模型和MRI 预测的通气缺损百分比均与肺功能指标相关。
综上,影像组学在肺通气方面的研究较少,仍需继续探究更优的肺部通气的量化参数并研究参数与临床指标和疾病发生发展的关系。
评估COPD 的目的是确定气流受限程度、疾病对病人健康状况的影响以及未来事件(如病情恶化、住院或死亡)的风险,以指导临床治疗[1]。目前,对COPD 的影像组学研究已开发出一些预测肺功能、急性加重事件及死亡率的模型。
6.1 肺功能的预测 以往大多数研究只将肺功能检测指标与CT 影像参数相关联,并未直接预测肺功能检测结果。Gawlitza 等[43]研究提取了75例受试者的吸气相及呼气相的定量CT 参数(包括平均肺密度、全肺体积、低衰减区的体积、半高全宽及双气相的差值),建立5 个肺功能预测模型,分别为均值及中值预测、多项式回归、K 近邻回归、XGBoost 中回归树的加性回归及人工神经网络多层感知器回归,使用留-法交叉验证来测试每一种模型的性能,结果发现在合理的误差范围内,不同的、部分基于机器学习的模型可以根据定量CT 参数预测COPD病人的肺功能值,其中K 近邻回归模型的平均相对误差最小。由此可以推测K 近邻回归是一种较好的建立小样本预测模型的方法,如果样本量加大,XGBoost 和基于神经网络的模型预测性能会有所提高。
6.2 COPD 急性加重的预测 González 等[44]研究认为使用CT 成像数据直接训练卷积神经网络(CNN)可以识别吸烟者中患有COPD 的病人,并可预测急性呼吸系统疾病事件和死亡率;他们还认为在总体人口水平上,CNN 是强有力的风险评估工具,但该方法训练计算成本高、内存需求大,数据量大时,会超过现有图形处理单元的处理能力。功能呼吸成像(functional respiratory imaging,FRI)是一项后处理技术,可利用高分辨CT 和计算机流体力学量化气道容积和气道阻力,以区域性方式评估整体肺部健康和功能。为了预测COPD 急性加重的发生,Lanclus等[45]从提取的90 个FRI 参数和4 个临床肺功能参数中筛选得出可区分发生COPD 急性加重的病人和稳定的COPD 病人的11 个FRI 参数,并使用支持向量机检验这11 个参数的组合预测能力,结果显示基于FRI 的总的气道容积和气道阻力预测COPD 急性加重的准确度为80.65%,阳性预测值为82.35%。该研究表明,与经典的临床参数相比,FRI是一种敏感性较高的诊断工具,可以在个体水平预测发生COPD 急性加重的概率。
6.3 COPD 病人死亡率的预测 Cho 等[46]对利用影像组学预测COPD 病人的死亡率进行了研究,从肺气肿、气道重塑、肺血管疾病及空气潴留4 项指标中半自动提取525 个基于胸部CT 的影像组学特征,再利用最小绝对值收敛和选择算子(LASSO)Cox回归筛选出5 个最有用的生存预测特征,并生成新的影像组学特征,结果显示新的影像组学特征是确诊的COPD 病人死亡率的独立预测因素。
目前,用于COPD 影像组学预测评估模型的参数类型多较片面,局限于肺实质或气道,且与临床参数的结合并不紧密。在后续研究中可以继续探讨不同类型参数的评估预测效果及其之间的相互作用,以便得到更好的评估预测模型。
评估COPD 病人的异质性是实现其个体化治疗的关键。利用影像组学的方法可以从CT 影像中获取信息,开发出新的COPD 表型。Lafata 等[47]应用Langevin 分子动力学退火的无监督动态聚类算法分析肺影像组学数据和肺功能数据之间的多变量关联,结果发现具有相似肺部影像学模式的病人亚群有相似的1 s 用力呼气量。Young 等[48]使用名为“亚型和阶段推断(SuStaIn)”的新型机器学习工具,识别出2 个具有不同纵向进展模式的COPD 病人亚型,即“组织→气道”亚型及“气道→组织”亚型。“组织→气道”亚型即小气道功能障碍和肺气肿先于大气道壁异常;“气道→组织”亚型即大气道壁异常先于肺气肿和小气道功能障碍。结果发现,“组织→气道”亚型病人的体质量指数和慢性支气管炎的发生率较“气道→组织”亚型的病人显著降低,而且“组织→气道”亚型病人的肺功能在疾病早期表现为下降加速。
现有的研究表明影像组学对COPD 的研究有一定的应用价值,但仍存在以下局限性:①大多数研究所使用的影像组学参数仍比较片面,今后的研究中可以进一步研究不同类型参数的优劣势,探究不同参数之间的相互作用,还可以将提取的影像组学特征与临床特征(包括年龄、性别、当前吸烟、包/年数、问卷得分、喘息等)相结合,构建出更有效的多因素评估模型。②目前的COPD 影像组学研究多关注COPD 病人肺实质的量化分析及分型,而COPD 病人气道的分型、心血管的改变、肺外组织改变的量化分析等仍有待进一步研究,尤其是与COPD病人死亡率显著相关的心血管改变。③在探究疾病发生、发展规律时,获得对临床治疗方案有指导价值的影像组学信息尚少。④COPD 影像组学研究与临床治疗方案结合还不甚紧密,尚需加大治疗效果、急性加重及死亡率预测模型的开发力度,以便给临床治疗提供更加直观、有力的参考。⑤尽管COPD 影像组学模型有较高的诊断、评估及预测效能,但容易出现过拟合,造成结果虚高。此外,设备及参数设置的不同也会影响影像组学模型的使用,今后如果可以出台相关的扫描规范,进行多中心研究并加强内部及外部验证,将能够减轻这些影响。