基于胸部高分辨CT 的深度学习影像组学对特发性肺纤维化GAP分期的预测价值

2023-10-13 00:55甄涛胡大成姚伟沈起钧
浙江医学 2023年18期
关键词:训练组组学效能

甄涛 胡大成 姚伟 沈起钧

特发性肺纤维化(idiopathic pulmonary fibrosis,IPF)是不明原因的慢性间质纤维化性肺炎的一种特殊类型,组织学表现为普通型间质性肺炎(usual interstitial pneumonia,UIP)[1]。IPF 通常在50 岁以后出现,从最初确诊到死亡的中位生存期3~5 年[2]。因此临床上的早期诊断及治疗至关重要,其中胸部高分辨率CT(high-resolution CT,HRCT)是重要的检查手段。而性别-年龄-肺生理变量(gender-age-lung physiology variables,GAP)分期影响患者的预后,决定患者的治疗决策。然而半定量的GAP 分期方法无法区分同一分期内患者病情的严重程度[3-4]。本研究旨在通过用于体素医学图像分割的全卷积神经网络(fully convolutional networks,FCN)V-net 对胸部HRCT 检查发现的肺间质性病变进行自动分割,并基于深度学习影像组学特征模型对IPF 的GAP 分期进行预测,为临床分期提供一种新的定量评估手段。

1 对象和方法

1.1 对象 回顾2020 年1 月至2022 年6 月浙江大学医学院附属杭州市第一人民医院诊断为IPF 的患者67例,其中男37 例,女30 例,年龄44~84(63.4±10.4)岁,所有患者进行GAP 评分和分期[4]。其中GAP Ⅰ期定义为早期IFP,GAP Ⅱ期及GAP Ⅲ期定义为中晚期IPF,见表1。67 例患者按照8∶2 的比例随机分成训练组及验证组。纳入标准:(1)根据美国胸科学会、欧洲呼吸学会、日本呼吸学会和拉丁美洲胸科学会2018 年更新的IPF 诊断指南[5]:①排除其他已知原因的间质性肺病(如家庭或职业环境暴露,结缔组织病和药物毒性等)和②或③之一;②胸部HRCT 检查出现UIP 特征;③取得肺组织标本患者可具体结合HRCT 类型和组织学类型确定是否为UIP,经过包括放射科、呼吸科和风湿免疫病专家组成的多学科团队评估,诊断为IPF 的患者。(2)患者进行HRCT 检查时间与肺功能测定时间间隔不超过1 个月。排除标准:(1)检查时患有恶性肿瘤;(2)由于其他病理原因造成的肺损伤;(3)CT 检查图像上严重的运动伪影;(4)精神疾病患者;(5)妊娠期或哺乳期者;(6)合并严重肝肾功能障碍、心力衰竭、呼吸衰竭和造血系统功能障碍等原发性疾病患者。本研究经浙江大学医学院附属杭州市第一人民医院医学伦理委员会审查通过(批准文号:KY-20230414-0068-01)。

表1 GAP 评分和分期系统

1.2 临床资料收集 由同一位呼吸科医师完成,包括患者性别、年龄、身高、体重、吸烟史、肺功能等指标,其中肺功能指标包括用力肺活量(forced vital capacity,FVC)、第一秒末用力呼气量(forced expiratory volume in one second,FEV1)和一氧化碳弥散功能(carbon monoxide diffusing capacity,DLCO)。

1.3 影像学检查 采用德国西门子128 排双源螺旋CT 机。患者仰卧位头先进,嘱深吸气后屏气状态下行CT 平扫,具体扫描参数:管电压100~120 kV,管电流200~280 mA,层厚5.0 mm,层间距5.0 mm,扫描视野350 mm×350 mm,矩阵512×512。在完成胸部常规CT 扫描和数据采集后,均以高分辨率骨算法行1.25 mm 薄层横轴位后处理重建。将重建后的CT图像以DICOM 格式导出。

1.4 图像分割、特征提取及筛选 基于联影智能科研平台uAI Research Portal(United Imaging Intelligence,中国)软件中V-net 网络,用肺间质性病变的迁移模型对随机选出30 例患者的胸部HRCT 图像进行自动分割,同时由1 位具有10 年以上呼吸系统影像诊断经验的高级职称医师对相同的30 例患者图像进行手动分割,用Dice 相似性系数(Dice similariy coefficient,DSC)评估自动分割模型的效能,随后用自动分割模型分割剩余的37 例患者图像,并应用软件上的组学分析模块进行自动分割感兴趣区(region of interest,ROI)的特征提取,使用Z值归一化算法进行标准化,通过最小绝对紧缩与选择算子(least absolute shrinkage and selection operator,LASSO)回归对各个特征进行降维筛选,得到差异有统计学意义的影像组学特征,同时计算影像组学标签(Radscore)。

1.5 模型的建立与验证 基于Radscore 建立构建影像组学模型,绘制ROC 曲线,采用AUC 评估影像组学模型对GAP 分期的预测效能。

1.6 统计学处理 采用medcalc 19.1 及R 4.1.2 统计软件。正态分布的计量资料以表示,组间比较采用两独立样本t检验;非正态分布的计量资料以M(P25,P75)表示,组间比较采用Wilcoxon 检验;计数资料以例(%)表示,组间比较采用χ2检验或Fisher 确切概率法。用DSC 评价自动分割模型的分割效能,DSC 是一种集合相似度度量指标,通常用于计算两个样本的相似度,范围为0~1,1 表示分割结果最好,0 表示分割结果最差,计算公式:s=2×|A∩B|/(|A|+|B|)。A 代表手动分割结果,B 代表自动分割结果,s 的取值范围为0~1;0.75≤DSC<1 认为分割效能较好,0.40≤DSC<0.75,认为分割效能一般,DSC<0.40 认为分割效能差。对影像组学模型进行ROC 曲线分析其预测效能,计算AUC、灵敏度、特异度和准确度。采用Hosmer-Lemeshow 检验分析模型拟合度,P>0.05 提示模型拟合较好。P<0.05为差异有统计学意义。

2 结果

2.1 自动分割模型效能 将30 例患者的V-net 自动分割结果与人工分割结果比较计算DSC,DSC 为0.55~0.93(0.83±0.10)。临床特征选择根据GAP 评分和分期系统,早期IPF 40 例,中晚期IPF 27 例,两组患者年龄、性别、FVC 占预计值百分比(FVCpre%)及DLCO 占预计值百分比(DLCOpre%)比较差异均有统计学意义(均P<0.05),见表2。67 例患者按照8∶2 的比例随机分成训练组53 例及验证组14 例,两组患者的一般资料比较见表3。

表2 早期和中晚期IPF 患者GAP 分期指标比较

表3 训练组及验证组不同GAP 分期IPF 患者的一般资料比较

2.2 影像组学特征筛选及模型建立 67 例患者图像最终提取出2 400 个组学特征,经过LASSO(λ=0.1)回归分析最终筛选出5 类,8 个最优影像组学特征,包括2 个肺炎特异性特征ROI_segment10_infected_rates(RSIR)和ROI_segment15_infected_mean_HU(RSIMH),1 个一阶直方图特征中的曲率流分布curvatureflow_firstorder_range(CFR),2 个高阶纹理特征中的灰度共生矩阵特征Gray Level Co-occurence Matrix(GLCM)中的最大概率original_glcm_maximumprobability(OGM)和突出聚类discretegaussian_glcm_clusterprominence(DGC),2 个小波变换特征中的大依赖性高灰度水平强调wavelet_gldm_ wavelet-lhl-largedependencehighgraylevelemphasis(WGWLL)和峰度wavelet_firstorder_wavelet-lhhkurtosis(WFWLK),1 个拉普拉斯变换特征log_firstorder_log-sigma-4-0-mm-3d-90percentile(LFLS),见图1,特征间的相关系数见图2,通过相关系数加权求和计算Radscore,见图3,公式如下Radscore=0.093 718 074×(RSIR)+0.070 571 646×(RSIMH)+0.063 054 5×(CFR)+0.027 729 482×(OGM)+ 0.025 432 792×(WFWLK)+0.007 874 882×(WGWLL)+0.001 407 807×(DGC)+(-0.022 971 317)×(LFLS)+0.425 925 94。GAPⅡ、Ⅲ期患者Radscore 在训练组及验证组均高于GAPⅠ期患者,且在训练组中差异有统计学意义(P<0.01)。基于Radscores 构建出用于预测GAP 分期的影像组学特征模型,训练组及验证组的模型拟合度良好,均P>0.05。训练组及验证组的AUC分 别 为0.862(95%CI:0.740~0.941)、0.854(95%CI:0.568~0.981),见图4,模型效能见表4。

图1 最优影像组学特征组合及其系数

图2 最优影像组学特征间的相关系数

图3 训练组和验证组GAP 分期Radscore 比较的小提琴图

图4 训练组和验证组影像组学模型的ROC 曲线(A:训练组;B:验证组)

表4 训练组及验证组的影像组学模型效能

3 讨论

本研究基于V-net 网络用迁移模型构建了胸部HRCT 的肺间质性病变自动分割模型,并基于自动分割结果的影像组学特征构建了用于预测IPF 患者GAP 分期的影像组学模型。结果显示基于V-net 网络的肺间质性病变迁移模型的自动分割效能较高,有较高实用性。同时发现影像组学特征模型不仅能预测IPF 患者GAP 分期,而且可以对同一分期内的患者进行定量区分。

组学分析的图像标注是一项繁琐的工作,人工分割不仅耗时,而且重复性差,而深度学习的自动分割恰好能解决这一局限性。深度学习的自动分割算法已在多个领域,如各种肿瘤以及部分大器官的分割中展现出较好的可靠性与实用性[6-11]。然而针对一些非肿瘤性疾病的研究相对较少,如UIP。V-net 是近期开发的专门用于体素医学图像分割的FCN,它在医学图像的自动分割方面,表现出强大的实用性和稳定性[12-15]。V-net 于2016 年由Milletarid 等[16]首先提出,主要是针对医学三维图像,与常见二维数据有区别,但其实做法类似,最后输出是单通道的三维数据,代表每个像素为前景或背景概率,如果概率>0.5 则是前景。V-net 数据集多是二进制分类任务,因此其使用医学图像中常用的Dice 损失进行计算,相比同样基于FCN 的U-net,它可以加速收敛的速度,占用更小的内存,理论上有更快的计算速度。本研究由于样本量较少,因此使用了基于V-net 网络的迁移模型,并用部分患者进行了模型的效能评估,最终模型的DSC 超过0.8,显示了其较高的分割效能。另外,V-net 网络可以基于一个较小的样本量构建自动分割模型,并且可以实现批量分割,能节省大量的人工分割成本。

然而,在病变分类方面深度学习所需数据量相对庞大,且结果的解释性较差[17-19]。影像组学由于需要人为监督,分类效能相对较高[20],且较深度学习有更好的解释性,能很好解决这一局限性,而且它已被大量的研究证明其在疾病分期、分级、疗效评估及预测等方面具有一定优势[21-23]。不同GAP 分期的IPF 患者,虽然症状明显不同,但是其影像学表现却可能相似,肉眼有时难以分辨。有研究报道肺纤维化评分与肺功能的相关性较弱,便是很好的佐证[24]。肺纤维化评分是基于人工视觉观察对肺间质性病变进行的半定量分析,其重复性较差,并且是基于肺分区的非精确性的半定量分析方法,即使是有经验的高级职称医师之间也存在差异。影像组学高通量提取信息的能力,正好可以解决这一局限性。Park 等[25]发现IPF 患者肺纤维化边缘的高斯曲率直方图特征随着病情的进展表现出更高的异质性,它和IPF 患者的生存率呈负相关。然而这项研究,只评估纤维化的肺表面,虽然IPF多发生在胸膜下,肺表面易累及,但也不能仅以局部病变评价整体情况。而本研究应用的影像组学模型不仅包含灰度直方图特征,还包含形态特征、纹理特征以及小波特征,能更加全面地评估病变的异质性,本研究最终筛选出的8 个特征中,包括两个肺炎特异性特征:RSIR 和RSIMH,提示发生在两下肺肺段的间质性病变特征对疾病分期具有提示作用。肺间质纤维化有从下往上发展的趋势,这也提示下肺的病变往往更明显,对临床分期更有意义。另外,一阶直方图特征中的曲率流分布(CFR)和小波变换后的峰度(WFWLK)特征提示病灶的分布及密度峰值分布也对疾病的分期有贡献。灰度共生矩阵(GLCM)中的突出聚类(DGC)和最大概率(OGM)也影响临床分期,突出聚类是对GLCM 的偏度和不对称的度量,更高的值意味着更不对称的均值,而较低的值表示峰值接近均值,也意味着均值的变化更少。经过小波变换的灰度依赖矩阵中的大依赖性高灰度水平强调(WGWLL)也可以反映病变的异质性。

GAP 评分及分期系统引入性别、年龄、FVC 和DLCO 对IPF 患者进行评分及分期,并且可以预测患者的死亡率[4]。由于其操作简单,被广泛应用于临床,以改善预后及指导临床诊疗。然而GAP 分期属于半定量方法,它无法区分同一分期内患者疾病的严重程度。影像组学基于患者的胸部HRCT 影像,其测量重复性较高,并且本研究影像组学模型能对每一例患者进行精确定量,不仅能对GAP 分期进行预测,而且能区分同一分期内患者疾病的严重程度,随着Radscore 的增大,肺纤维化程度也逐渐增加。本研究影像组学模型的AUC 较高,训练组及验证组的AUC 分别为0.862(95%CI:0.74~0.941)、0.854(95%CI:0.568~0.981),也提示模型有较高的可靠性,未来可能作为患者预后的潜在生物学标记。

本研究的不足与展望:本研究样本量小,且来自于单一医疗机构,未来样本量的扩大及多中心的合作,会使得该研究成果有更普遍的适用性。本研究未纳入除亚洲人以外的人种,由于不同种族的肺功能测量存在差异,因此使本研究存在一定局限性。

综上所述,本研究基于V-net 深度学习分割结果构建的影像组学模型,可以作为预测IPF 患者GAP 分期的临床工具,同时可对患者疾病进行精确的定量评估,将来有望成为一种新的评价IPF 严重程度的定量生物学指标,辅助临床做治疗决策,实现个体化精准医疗。

猜你喜欢
训练组组学效能
迁移探究 发挥效能
新型抗阻力训练模式改善大学生身体素质的实验研究
同时多层扩散成像对胰腺病变的诊断效能
跑台运动训练对脊髓损伤大鼠肺功能及HMGB-1表达的影响
线上自主训练与线下指导训练表面肌电差异分析
充分激发“以工代赈”的最大效能
口腔代谢组学研究
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
代谢组学在多囊卵巢综合征中的应用
唐代前后期交通运输效能对比分析