闫映秀 综述 武志峰 审校
间质性肺疾病(interstitial lung disease,ILD)是一组根据共同的临床、影像学、生理学或病理因素进行分类的肺部疾病,病理改变由肺间质破坏(炎症和纤维化改变)累及到肺实质改变(包括肺泡、肺泡管和细支气管)[1,2]。在临床上,ILD 最常见的疾病类型包括特发性肺纤维化(idiopathic pulmonary fibrosis,IPF)[3]、过敏性肺泡炎(chronic hypersensitivity pneumonitis,CHP)[4]和结缔组织间质性肺病(connective tissue disease related interstitial lung disease,CTD-ILD)[5],其中IPF 的预后最差。ILD 的严重程度评估对患者治疗方案具有指导作用,而目前尚未建立统一的量化评估标准。
在上个世纪,ILD 疾病的严重程度通常采用传统的生理数据即肺功能参数进行分级,肺功能测量可量化生理损伤的程度,但结果波动性大,且对局部变化和早期疾病相对不敏感,也不能揭示疾病的形态学变化及异常空间分布特点[6]。而今,高分辨率CT(high resolution CT,HRCT)广泛应用于ILD的诊断[7-9],例如,HRCT对于IPF的影像诊断阳性预测价值与病理诊断基本一致(90%~100%),不再需要通过肺活检确定[8]。同时,诸多学者利用HRCT 对间质性肺病定量评估进行了探索,从早先的视觉半定量方法发展到计算机辅助CT 定量分析,包括密度阈值法、基于直方图法、综合分析法、肺血管定量法等,特别是近年来人工智能深度学习技术在间质性肺病CT 定量分析的应用发展迅速。
目前为止,仍没有可被业界广泛认可的疾病严重程度分级方法。本文对ILD 的多种CT 定量分析方法在疾病严重程度评估方面的研究进展作一综述。
半定量评估是影像科医生根据ILD 的各种影像学特征在各肺叶中分布的情况进行估算,即对标准层面病变范围进行较为精确的估计,再对不同程度的病变赋予分值,最终通过计算标准层面不同程度病变的平均范围,以加权方式得出病变积分[10]。此处半定量评估是单纯CT 视觉评估,之所以称为“半”定量,其是一种准确性比定量分析稍差的分析方法,虽然采用量化连续性数值进行严重程度评估,但不同学者对ILD 病变类型定义、累及范围及严重程度的评估存在差异,因视觉评估致结果不精确,同时也使CT 半定量评估方法无统一标准[7,11,12]。
多项研究表明[13-16],ILD 患者肺纤维化范围和程度与疾病预后存在相关性。肺纤维化严重程度包括:磨玻璃影、肺实变、牵拉性支气管扩张、网格影、蜂窝影;通过对影像学特征进行识别及评分,提出了多种基于视觉的半定量方法。Hwang 等[17]通过对72 例ILD 患者进行回顾性研究,提出了基于视觉的半定量CT 评估方法,但该方法忽略了牵拉性支气管扩张对预后的影响,同时该方法是对肺部疾病总体病变范围估算,缺乏对疾病分布特点的估算。Nurmi 等[18]提出了将影响预后的多种影像特征的肺部分布特点进行分级评分,同时加入了牵拉性支气管扩张为评分特征,该方法最先试用于类风湿间质性肺炎,是否能推广至所有间质性肺病有待研究。目前使用率最高且争议最少的方法为Camiciottoli 等[19]提出的标准,定义磨玻璃影、肺实变影、小叶间隔增厚、网格状影及蜂窝影分别为1 到5 分,病变类型评分由0 分到15分;根据支气管肺段的分布将两肺分为20 个肺段,累及肺段数目以3、9 为界定义为1 到3 分,病变累及范围得分0 分到15 分,最后将两者相加得到患者视觉评估分(0~30 分)。
半定量评估虽在一定程度上引入了定量的概念,但仍主要依赖于医生的主观判断,导致该方法重复性差,耗时长,限制了可评估的图像层数。此外即使是有经验的医师,观察者自身及观察者之间也存在很大差异,并且无法捕捉到一些重要的肺部短期变化特征。
临床广泛应用的CT 图像阅片是主观观察性的、定性的判断,而CT 定量是对CT 图像进行测量和定量分析的方法。定量分析范围可从简单的阈值测量(对某一值范围内单个像素进行计数)到纹理分析(捕捉形态和区域异质性)[20]。
肺组织密度阈值法的主要原理为不同类型的病变在CT 图像上表现为不同的CT 值,通过定义不同病变的CT 值范围,以软件分析密度阈值计算病变范围。最初是针对肺气肿量化的单阈值密度定量分析,而后发展成双阈值量化间质性肺病。对HRCT 上各种影像学特征的病变范围进行量化,用于评估病情动态变化及治疗效果。近年来,多位学者[21-24]使用OsiriX 软件对ILD 进行定量评估,分别定义ILD 病变CT 阈值范围存在差异,计算ILD 病变体积占总肺容积百分比,与肺功能各参数呈不同程度相关。Ohkubo 等[25]提出将正常密度肺体积占全肺体积的百分比进行定量计算,通过对175 例IPF 患者病死率分析,结果显示该百分比定量数值可作为影响预后因素。
密度阈值法的优点在于CT 值提供了清晰的分界点,具有一定可行性和普适性,这项技术与基于视觉的半定量评估存在较高的一致性[26]。目前常使用阈值-950 HU、-750 HU 区分肺气肿、正常肺及磨玻璃影,但关于定义病变CT 阈值目前没有统一标准,可能是由于CT 机各项参数及图像厚层不同,导致CT 阈值标准难以统一。同时,密度阈值法对肺间质性病变的评估是基于影像学结果,而不是组织学检查,任何引起肺组织密度值增降的原因都可能干扰量化结果,如肺部感染、肿瘤等。
密度直方图法是通过软件对肺组织进行分割,使用直方图表示CT 图像密度的分布,计算得出肺CT 密度参数和肺密度百分位数。肺CT 密度参数[19,27-29]包括平均肺密度值、偏度、峰度和标准差(standard deviation,SD)。Best 等[27]通过对144例IPF 患者CT 密度参数与肺功能参数的相关性分析,结果显示均有一定相关性,其中峰度相关性最佳。随着肺总量、偏斜度和峰度的降低,病死率升高。Camiciotolli 等[19]对48 例系统性硬化间质性肺病病例的前瞻性研究中,CT 密度参数比CT 半定量分析具有可重复性,且与肺功能和生活质量显著相关。肺密度百分位法是根据CT 直方图计算肺体积和全肺的百分位数密度(从1%到99%之间)。Ninaber 等[30]提出第85%密度评分为最佳肺密度参数,与肺功能显著相关。使用密度直方图法对干燥综合征相关间质性肺病疾病严重程度进行评估,同样具有临床意义[31]。然而,密度直方图法没有考虑到病灶分布的空间关系,且标准值仍需进一步探究。
Bocchino 等[32]通过对83 例合并ILD 的系统性硬化患者的HRCT 图像进行分析,经过复杂数学计算,建立了一个综合平均肺密度、偏度和峰度的定量综合指标-计算机化综合指数(computerized integrated index,CII)。它是基于直方图参数的综合指数,相对于密度直方图的多个参数,只出现了一个参数,且结果显示ILD 患者的CII 明显低于非ILD 患者,表明CII 对系统性硬化患者是否合并ILD 有很强的区分能力。关于CII 指数与肺功能相关性分析表明,肉眼无法检测的ILD,其CII 和肺功能参数均低于各自的临界值,提示该指数能灵敏地捕捉到ILD 患者早期肺密度变化,因此可帮助识别早期ILD;其次,它是一种客观而敏感的工具,可用于ILD 治疗及预后的评估[29,31-33]。但该方法计算复杂,目前文献较少,缺乏大量临床验证。
ILD 常常累及肺血管,组织学显示肺小血管狭窄、闭塞,因此对肺血管病变的分割和定量分析可反映ILD 病变范围及预后[34,35]。Jacob 等[36-38]发现IPF 患者肺血管容积与间质性病变程度相关性显著,并提出将肺血管容积作为评估IPF 患者严重程度的新参数。通过对283 例IPF 患者进行分析,肺血管容积较视觉半定量评估方法能更好地预测患者预后,且肺血管容积参数联合CALIPER模型能够进一步提高评估效能。对系统硬化患者肺血管的定量分析显示[39],肺功能参数与CT 肺血管分布的变化有关,分布范围以中央区和肺中1/3 区明显增加。
肺血管定量分析是基于计算机分割和定量分析,比视觉评估评分具有更高精确度。但目前研究多为横断面研究,忽略了肺血管容积的纵向变化;其次,肺血管包括肺动脉和肺静脉。
肺纹理分析是指通过对肺组织每个像素密度和形态的特点提取和分析获得局部肺实质的纹理特征,以获得不同特征的分布规律[40]。最常用的纹理分析方法是Zavaletta 等提出的计算机辅助肺信息学病理评估和分级方法——CALIPER[41]。该方法定义了肺部区域的5 种类型(正常、磨玻璃、网格、蜂窝状、肺气肿),将纹理匹配方法与体素直方图特征分析相结合。Maldonado 等[42]对55 例IPF患者基线和随访的CT 图像进行回顾性研究,结果发现CALIPER 量化测量与影像学评估及临床结果相关联,并认为CALIPER 量化测量结果可预测中位随访2.4 年后的存 活率。Jacob 等[36]对283 例IPF 患者分别进行CALIPER 定量及视觉半定量评估,比较CALIPER 定量与视觉半定量分析的优劣性,二者与肺功能参数相关性分析结果显示,CALIPER定量评估优于传统的视觉半定量评估。实验还提出,CALIPER 定量分析对在早期IPF 具有更高的敏感度。CALIPER 同样适用于系统性硬化间质性肺病的量化[43]。目前,CALIPER 被应用于数千例回顾性及前瞻性分析研究,预测间质性肺病的生存和预后情况,甚至包括抗纤维化药物临床试验疗效的评估[44]。但在病灶识别方面有待改进,例如对磨玻璃密度影及网格影混合存在的识别不如视觉评估,也存在错误识别蜂窝状影的情况[38]。
目前,还有不少处于开发过程中的定量CT 分析工具,包括自适应多特征法(adaptive multiple features method,AMFM)、数据驱动纹理分析(datadriven textural analysis,DTA)、肺纤维化定量(quantitative lung fibrosis,QLF)等多种分析算法[44-50]。这些方法在疾病严重程度评估,预测患者病死率等方面,均优于现有定量方法[44-50]。但方法中使用的具体CT 指标与临床实践中ILD 的治疗相关性研究仍不清楚,此外各种纹理分类方法使用的算法略有不同,结果的一致性也有待研究。
现有的CT 定量分析仍存在一些不足:CT 图像在扫描时机器型号及参数不同,扫描层厚、射线强度及重建算法差异,以及患者的吸气配合程度各异,均影响图像质量,致可重复性差。几乎所有定量分析算法都需要对图像进行分割和提取,但对图像的识别分割及提取的精确度程度不一,致实验结果存在差异。基于纹理分析及机器学习的定量CT 评估有特定的适用范围,临床应用受限。
CT 定量分析是评价间质性肺病的有力工具。从视觉半定量,到主观性降低、重复性提高的密度直方图等方法,由于忽视病灶的空间分布,研发出了基于纹理分析及机器学习的定量方法,这些方法提供了对疾病严重程度的可重复的定量测量,并为评估治疗反应、疾病分期提供了客观标准。ILD 的疾病进展是患者高病死率的主要原因,对疾病进行准确评估有利于选择最佳治疗方法,并为患者做出更精准的个性化临床决策。同时及时诊断并进行早期抗纤维化治疗,对患者预后有很大帮助。虽然间质性肺病的CT 定量分析在广泛应用于临床之前仍有一些问题需要解决,但预计这些先进的CT 定量分析方法将在未来的ILD 治疗中发挥重要作用。