肖 磊,顾潜彪,张 堃,3*,李 平,沈宏荣,朱 璐
(1.湖南中医药大学第一附属医院放射科,湖南 长沙 410007;2.湖南省人民医院放射科,4.超声科, 湖南 长沙 410005;3.湖南中医药大学中西医结合学院,湖南 长沙 410208)
肺腺癌是肺癌最主要的病理学类型,复发率高,患者预后差[1-2]。表皮生长因子受体(epidermal growth factor receptor, EGFR)酪氨酸激酶抑制剂(tyrosine kinase inhibitors, TKIs)可提高EGFR基因敏感突变肺腺癌患者中位生存期,并改善其生存质量[3-5],而EGFR基因突变阴性或非敏感突变患者并不能从中获益[6],因此,在给予肺腺癌患者靶向药物治疗前,检测其EGFR基因状态极其重要,但目前基因检测方法常为有创性。通过影像组学量化病灶图像像素和灰度空间分布,可无创反映其分子变化[7-8]。CT平扫是肺癌最常用的影像学检查手段。本研究拟建立肺腺癌患者肺部CT平扫影像组学标签,并探讨其用于预测肺腺癌EGFR基因敏感突变的可行性。
1.1 一般资料 收集2014年1月—2018年3月湖南中医药大学第一附属医院收治的80例原发肺腺癌患者的临床及影像学资料,其中男42例,女38例,年龄29~87岁,平均(61.2±12.6)岁。纳入标准:①经活检病理确诊肺腺癌,并对活检组织行EGFR基因检测;②入组前患者未接受任何抗肿瘤治疗。排除标准:①并发其他原发恶性肿瘤;②CT图像质量欠佳,不符合图像后处理要求。本研究经湖南中医药大学医学伦理委员会批准。
依据EGFR基因突变情况将患者分为EGFR敏感组[EGFR基因敏感突变,即19del、21(L858R,L861)、18(G719X,G719)]及EGFR不敏感组(EGFR基因野生型+EGFR基因非敏感突变)[9-10]。EGFR敏感组37例,其中男17例,女20例,年龄34~80岁,平均(61.6±12.6)岁;EGFR不敏感组43例,其中男25例,女18例,年龄29~87岁,平均(60.8±12.8)岁。
1.2 仪器与方法 采用Philips Brilliance 64排螺旋CT机。嘱患者仰卧,吸气后屏气接受扫描。扫描范围自肺尖以上至膈肌水平以下,层厚5 mm,管电压120~140 kV,管电流 200~210 mA,FOV 330 mm×330 mm。
1.3 图像分析及影像组学特征参数提取 分别由1名具有4年CT诊断经验和1名具有9年CT诊断经验的影像科医师在不知晓病理结果的前提下共同阅片,意见不同时经协商达成一致。观察肺部病灶CT主观影像征象[11-13],即空气支气管征、胸膜凹陷征、空泡征、磨玻璃密度影、毛刺征、分叶征及胸腔积液。将CT图像以bmp格式导入MaZda软件,选取病灶最大层面沿病灶轮廓手动勾画ROI,提取影像组学特征参数共244个,具体步骤见图1。
1.4 统计学分析 采用SPSS 20.0及R统计分析软件。以χ2检验比较2组患者性别,Fisher精确检验比较2组CT主观影像征象,采用t检验比较2组患者年龄及模型标签值。以LASSO法对影像组学特征进行降维并挑选;采用多因素Logistic回归分别建立主观影像征象模型、影像组学标签及将二者结合的融合模型,以ROC曲线评价各模型预测EGFR基因敏感突变的效能,各模型间效能比较采用Delong检验;采用内部留一交叉验证计算模型错判率。P<0.05为差异有统计学意义。
EGFR敏感组与不敏感组患者性别(χ2=1.19,P=0.28)、年龄(t=0.28,P=0.78)差异均无统计学意义。
2.1 主观影像征象模型及效能 EGFR敏感组与不敏感组间空气支气管征、胸膜凹陷征、空泡征、磨玻璃密度影、毛刺征、分叶征及胸腔积液差异均无统计学意义(P均>0.05),见表1。以多因素Logistic回归建立主观影像征象预测EGFR基因敏感突变模型,EGFR敏感组模型标签值为0.51±0.16、不敏感组为0.43±0.12,二者差异有统计学意义(t=2.62,P=0.01)。主观影像征象模型预测EGFR基因敏感突变的AUC为0.66[95%CI(0.53,0.78),P<0.05],模型错判率为52%。
表1 EGFR敏感组与不敏感组肺部CT征象比较[例(%)]
图1 影像组学标签预测肺腺癌患者EGFR基因敏感突变的流程 A.肺腺癌患者肿瘤最大层面CT平扫图; B.分割ROI; C.提取ROI内影像组学特征; D.建立预测模型,圆形表示TKIs敏感突变,三角形表示TKIs非敏感突变,实性表示模型预测准确,空心表示预测错误
2.2 CT影像组学标签及效能 通过LASSO法最终选出4个系数非零的影像组学特征(表2、图2)。以多因素Logistic回归建立影像组学标签预测EGFR基因敏感突变模型,EGFR敏感组模型标签值为0.59±0.21、不敏感组为0.35±0.23,二者差异有统计学意义
表2 肺腺癌患者非零系数的CT影像组学特征及其预测EGFR基因敏感突变的效能
注:SumAverg:和均值;Correlat:相关;SumVarnc:和方差;Vertl_RLNonUni:游程长度非均匀性;—:无数据(t=4.83,P<0.01)。影像组学标签预测EGFR基因敏感突变的AUC为0.77[95%CI(0.69,0.88),P<0.01],模型错判率为38%。
2.3 融合模型建立及效能 融合CT影像组学特征及CT主观影像征象特征,以多因素Logistic回归建立预测EGFR基因敏感突变的融合模型,结果显示EGFR敏感组模型标签值为0.65±0.22、不敏感组为0.30±0.25,二者差异有统计学意义(t=6.96,P<0.01)。融合模型预测EGFR基因敏感突变的AUC为0.83[95%CI(0.75,0.92),P<0.01],模型错判率为31%。
Delong检验结果显示,主观影像征象模型(AUC=0.66)、影像组学标签(AUC=0.77)及融合模型(AUC=0.83)预测EGFR基因敏感突变效能的差异均有统计学意义(P均<0.05),以融合模型的预测效能最优,见图3。
EGFR基因突变状态与EGFR-TKIs治疗反应相关,但基因突变检测常为有创性[4]。CT具有无创、便捷等优点,是肺癌诊疗过程中的重要影像学检查手段。受医疗水平、医疗环境、经济条件以及患者耐受性(如肾功能不全)等因素影响,相比增强CT,平扫CT的应用范围更广。本研究尝试以无创、定量影像组学方法对肺腺癌患者肺部CT平扫图像进行分析,探讨影像组学标签应用于预测肺腺癌EGFR基因敏感突变的可行性。
既往对肺腺癌患者肺部CT平扫主观影像征象与EGFR基因突变之间关系的研究[11-13]结果存在差异。Rizzo等[11]认为空气支气管征、胸膜凹陷征与EGFR基因突变有关,而Hsu等[12-13]则未发现上述相关性。CT主观影像征象是诊断和鉴别疾病的重要依据,但征象判读结果受观察者本身及其经验的影响,导致研究结果之间可能存在差异。本研究结果显示EGFR敏感组与不敏感组间空气支气管征、胸膜凹陷征、空泡征、磨玻璃密度影、毛刺征、分叶征及胸腔积液差异均无统计学意义。
图2 采用LASSO法对影像组学特征进行降维 A.LASSO通过10折交叉验证调节调优参数(λ)以实现模型的二项式偏差最小,从而筛选出效能最好的特征集合,左、右虚线分别为平均二项式偏差最小时的logλ及平均二项式偏差最小值1倍标准误以内的最大logλ; B.特征收敛图,每条曲线代表1个特征的系数变化轨迹
图3 各模型预测EGFR基因敏感突变的ROC曲线
影像组学可对一些肉眼可识别的影像学信息进行量化分析,在一定程度上避免观察者主观因素对结果造成的影响;挖掘CT图像上大量人眼无法识别和区分的数字化信息,并与其他类型数据结合,提高模型的预测准确率[14]。本研究ROC曲线和内部交叉验证结果均显示,包含CT影像组学特征的模型(影像组学标签及融合模型)具有较好的预测肺腺癌EGFR基因敏感突变的效能,且结合CT主观影像征象建立的融合诊断模型的预测效能最优(AUC=0.83,错判率31%),提示联合主观影像征象可提高影像组学标签的预测效能。Zhang等[15]分别建立临床模型、影像组学模型及融合模型,预测肺腺癌EGFR基因突变状态,发现融合模型的效能最优(AUC=0.86)。本研究中CT主观影像征象联合影像组学标签组成的融合模型预测肺腺癌EGFR基因敏感状态的AUC达0.83。
本研究的局限性:①采用三维空间的三维图像特征可更全面地描述肿瘤信息,但本组病灶ROI均来自肿瘤最大层面二维CT图像;②未纳入相关临床特征,也未进行外部验证。
综上所述,以CT平扫图像为基础建立的影像组学标签能够预测肺腺癌EGFR基因敏感突变,以CT影像组学特征联合CT主观影像征象特征建立的融合模型对EGFR基因敏感突变的预测效能最优。