陈文韬,孙磊,谭爱斌,唐世强,陈芬,肖建彪,王志芳,甄鑫
1.南方医科大学生物医学工程学院,广东广州510515;2.郴州市第一人民医院放疗中心,湖南郴州423000;3.郴州市第一人民医院北院门诊,湖南郴州423000
肺癌是常见的恶性肿瘤之一,其发病率和死亡率位居前列[1]。放射治疗是肺癌重要的治疗手段之一,特别是在不能够手术和局部晚期肺癌病人的治疗中发挥重要作用。放射性肺炎的存在会严重影响肺部肿瘤放疗效果,对治疗后患者生存时间的长短以及生活质量的好坏有较大影响,所以降低放射性肺炎的发生率有重要的临床意义,而能够提前预测放射性肺炎的发生,就可以及时进行临床干预,降低放疗的风险[2]。
近年来随着机器学习、影像组学技术的发展,基于各种特征对疾病的预后预测越来越受到关注。本研究通过机器学习和影像组学方法对是否发生2级及以上放射性肺炎的肺癌患者的临床物理剂量学特征以及影像组学特征综合进行分析和模型构建[3],旨在发现对预测放射性肺炎更为理想的预测模型以及相关优势因子[4]。
回顾性收集郴州市第一人民医院2013年1月至2017年1月收治的肺癌患者83例,其中,男67例,女16例;年龄40~70岁。收集到的患者均采用调强和适形治疗方式,当次剂量180~240 cGy,剂量4 800~7 000 cGy。入组条件为:(1)经病理学或细胞学检查诊断为原发性肺癌;(2)首次接受肺部调强适形放疗;(3)接受完整放疗过程,能够从放疗计划中获取完整体积剂量数据;(4)随访时间大于3个月。
采用CT 模拟定位系统(飞利浦Brilliance CT BigBore)扫描定位,患者以舒适的姿势自由平躺于扫描床,CT 扫描条件:电压120 kV,电流300 mAs,螺旋扫描螺距为0.938,重建层厚为3 mm。扫描好的图像传至Eclipse放射治疗计划系统。在Eclipse放射治疗计划系统上靶区由高年资医师根据肺癌勾画指南勾画。肿瘤靶区(GTV)包括肺部肿瘤和CT 上可见的区域肿大淋巴结。GTV 边界外放6 mm 作为计划靶区(PTV)。勾画正常器官:左右肺、心脏、食管等。靶区和正常器官勾画完成后,在Eclipse 放射治疗计划系统上由资深物理师完成治疗计划,再由临床医生完成审核认可后再执行。
依据不良事件通用术语标准评价做放射性肺炎评级,2 级及以上的为放射性肺炎并且放疗结束后CT随访3个月以上,发生放射性肺炎48例,没有发生放射性肺炎的35 例。每个病人临床数据包括:性别、肿瘤位置、是否手术、临床分期。物理剂量参数41个:患侧肺的V5、V10、V15、V20、V25、V30、V35、V40、V45、V50,全肺的体积剂量,PTV 的体积及它的最大剂量、最小剂量、平均剂量,心脏的体积、最大剂量、最小剂量、平均剂量、体积剂量,放疗计划野数、治疗技术、单次剂量等。
使用开源的Python 语言环境的pyradiomics 工具包[5],从医学成像中提取影像特征。借软件包建立放射分析的参考标准,并提供经过测试和维护的开源平台,以方便可重复地提取放射特征。pyradiomics 支持2D和3D中的特征提取,可用于计算感兴趣区域每个特征的单个值或生成特征图。pyradiomics 提取的各种功能的定义:一阶统计学特征、形状特征(3D)、形状特征(2D)、灰度共生矩阵(GLCM)、灰度大小区域矩阵(GLSZM)、灰度游程长度矩阵(GLRLM)、相邻灰度色调差异矩阵(NGTDM)、灰度依赖矩阵(GLDM)[6]。本研究用了107 个特征如表1所示,选择的感兴趣区域为GTV。
表1 提取的候选特征Tab.1 Extracted candidate features
基于22 种特征选择算法和8 个分类器构建出176 个鉴别模型,将上述临床物理剂量和影像组学特征作为模型的输入,对鉴别模型进行训练。由于数据量较小,没有分单独的测试集,在模型训练过程中,采用了五折交叉验证来评估模型的鉴别性能。由于是否有放射性肺炎的两类数据不平衡,因此在模型的训练过程中,采用了SMOTE 算法对数据进行增强。该研究中采用了22 种特征选择算法和8 个分类器。一个模型由1 个特征选择算法和1 个分类器组成,共构建176个不同的鉴别模型。22种特征选择算法分别为:CIFE、CMIM、DISR、ICAP、JMI、MIFS、MIM、MRMR、Fisher_score、Lap_score、ReliefF、SPEC、Trace_ratio、II_I21、Is_I21、MCFS、NDFS、RFS、UDFS、F_score、Gini_index、T_score[7-12]。8 个不同的分类器分别是:Logistics Regression、SVM、Naïve Bayes、KNN、Decision Tree、Bagging、Random Forest、AdaBoosting。
采用SPSS20.0统计分析软件,符合正态分布的计量资料使用独立t检验分析,不符合正态分布的计量资料用非参数检验的方法即Mann-Whitney U。P<0.05为差异有统计学意义。
评价上述176 个鉴别模型对放射性肺炎和非放射性肺炎的鉴别能力的指标,包括ROC 下面积(Area Under Curve,AUC)。
将临床物理剂量特征和影像组学特征作为22 种特征选择算法的输入,利用特征选择算法选取最优的特征子集并输入到分类器中进行训练,实验可得选取前30 个特征的鉴别效果最佳。根据模型的训练结果作AUC 值热量图(图1)。每个模型的AUC 值是5 折交叉的平均值。图1是各种特征选择算法与分类器所对应的AUC 值,颜色越深,AUC 值越大,颜色越浅,AUC值越小。
图1 临床剂量特征和影像组学特征的AUC值(选取30个特征)Fig.1 AUC of the combination of radiomics signatures with clinical dosimetric features (30 features were selected)
选择AUC 大于0.7 的所有模型的特征进行出现频率统计,图2中标蓝部分代表了在临床物理剂量和影像组学特征中前10 位的优势特征,分别为Shapebased 特征中的shape_Maximum2DDiameterColumn、shape_Maximum3DDiameter、shape_Sphericity,First-Order based 特征中的firstorder_90Percentile,Texturebased 特征中的glcm_Imc1,还有临床物理剂量特征中的V20、V45、V50、V50a、V25。标蓝柱子的高低代表了特征被优势模型选中的频率和次数,标蓝柱子越高代表特征越有优势。
图2 特征统计条形图Fig.2 Features statistical bar chart
图3为8种分类器针对22种特征选择算法的每种鉴别模型的AUC值箱线图,图中箱体上边框表示上四分位数即75%,箱体下边框表示下四分位数即25%,箱体内横线表示中位数,箱体上面横线表示95%数据,下面横线表示5%数据。从图3可以看出逻辑回归、支持向量机的分类效果比较理想。逻辑回归的AUC值中位线最高,支持向量机的AUC值次之。
图3 8个分类器的AUC箱线图Fig.3 AUC boxplot of 8 classifiers
表2是临床物理剂量和影像组学优势特征的统计学分析,前10 位的特征中只有firstorder_90Percentile 的P值大于0.05,在放射性肺炎(RP)和非放射性肺炎(NRP)中没有显著性差异,其他9 个特征P值均小于0.05,有显著性差异,其中临床物理剂量特征P值均小于10-5。
表2 10个关键特征的统计分析Tab.2 Statistical analysis of 10 key features
放射性肺炎是肺癌放疗的主要并发症之一,影响病人放疗后的生存质量。如果能够预测放射性肺炎的发生,就可以提前避免或者干预,使病人生存质量提高。放射性肺炎的发生与诸多因素有关,如患者相关的因素年龄、性别、吸烟状况和肺部疾病等,治疗方面原因如化疗药物和化疗疗程、免疫治疗药物和疗程、手术方式,还有放射治疗方面的剂量、治疗技术、野数、体积剂量参数等[13-16]。在临床中找到影响放射性肺炎的因素以及影响的程度很重要,可以指导临床工作,能够提前预估放射性肺炎的发生几率,避免放射性肺炎的发生或者做好预防措施。在以往的研究中大多是通过统计的方法来研究单个因素或者多个因素的影响。放射性肺炎相关因素的研究很多,大多数研究已将V20和平均肺部剂量做为最常见的相关参数,同时发现除了肺部剂量外,心脏剂量参数也有相关性[17-20]。
如果想建立一个判别模型来准确地区分两种事物,那么判别精度是最先考虑的,而判别模型达到公认的判别精度,则可能不再需要进行综合分析。如果只是探索两种事物中起重要作用的潜在因素,则应需要进行综合分析,通过采用不同分类器和不同的特征选择算法构建鉴别模型来筛选出被选中的最频繁的关键特征即最可能的关键因素。放射性肺炎的影响因素众多,如何选出更相关的因素很重要,同时也是本研究的目的。本研究采用多种鉴别模型考虑了不同分类器和特征选择算法之间存在算法差异。不同的分类器有不同的判别能力,而不同的特征选择算法选择不同的最优特征子集并输入到分类器中,所以我们采用多个不同的分类器和多个不同的特征选择方法的组合来构建模型进行更加全面评估。
临床物理剂量特征和影像组学特征用不同特征选择算法和不同分类器组合的176个鉴别模型进行预测放射性肺炎训练,模型中选中次数在前面5 位的是:shape_Maximum2DDiameterColumn、shape_Maximum-3DDiameter、V20、glcm_Imc1、V45。从图2可以看出各种特征选出次数的高低,预测效果理想的特征是shape_Maximum2DDiameterColumn、shape_Maximum-3DDiameter、V20,前面两个跟CT的微观形态结构相关,而患侧肺V20是普遍认可的预测特征。Logistic regression分类器与ReliefF、Trace_ratio、MCFS、RFS 4种特征选择算法得到的模型AUC值都是0.9,分类效果理想。
以往的研究大多集中在医学统计的单个因素的分析,或者是单一模型的设计分析,而本研究利用了多个模型分析,不但可以筛选出好的模型而且可以选出好的特征。从上面的研究可以看出在目前的数据和样本情况下,临床物理剂量特征和影像组学特征预测肺癌放疗放射性肺炎比较理想。本研究的局限性:首先,临床治疗特征少,没有收集到化疗药物、免疫治疗药物、疗程数等,没有量化临床治疗对放射性肺炎的影响;其次,基于CT 影像组学特征进行模型构建,并未纳入相关剂量云图特征与之配合,有待在后续研究中增加患者临床信息,并且完善分类模型。
综上所述,基于CT 的影像组学特征和临床物理剂量特征预测肺癌放疗放射性肺炎效果理想。