基于T1WI 增强影像组学模型预测非小细胞肺癌原发灶EGFR突变的价值研究

2023-11-29 10:18黄锦祥陈杰云
磁共振成像 2023年11期
关键词:状位冠状组学

黄锦祥,陈杰云

0 前言

非小细胞肺癌(non-small cell lung cancer,NSCLC)是肺癌中最常见的病理学类型,发病率约占80%~85%[1],因症状不明显和筛查方法缺乏,约75%的患者确诊时就已属于晚期[2],颅脑转移是肺癌患者致死的主要因素之一[3]。表皮生长因子受体(epithelial growth factor receptor, EGFR)与肿瘤的衍生、增殖和凋亡密切相关[4],相比于EGFR 野生型,酪氨酸激酶抑制剂(tyrosine kinase inhibitors, TKIs)对突变型患者疗效更卓越,可显著提高患者存活率[5],EGFR 突变状态在NSCLC 脑转移患者的整体预后和指导靶向治疗中扮演着重要角色。

病理活检可能因肿瘤的异质性、发病部位、身体状况及主观意愿等原因难以进行确诊。传统影像学是肺癌的诊断、分期、疗效评价方面的首要检查手段。有研究表明EGFR 突变型脑转移瘤较EGFR 野生型更多表现为多发,瘤周水肿和强化程度更轻[6],但传统影像学特征存在主观性、半定量的局限性。影像组学相比于传统影像学,可以客观、全面地挖掘影像图像中人眼所不能感知的高通量特征,建立包括肿瘤的诊断、预测和分子分型等模型[7-8]。目前关于影像组学与NSCLC 的EGFR 基因突变相关性的研究主要集中在原发病灶的CT影像组学方向[9],然而晚期的原发灶常常合并肺炎导致难以勾画感兴趣容积(volume of interest, VOI)[10],且CT 影像组学特征受标准化CT 扫描参数如切面厚度等影响[11],使用非侵入性的MRI 影像组学来预测原发灶EGFR 突变状态是必要的,目前相关研究还较少。JIANG 等[12]基于多参数脊柱MRI 的影像组学方法术前预测肺腺癌EGFR突变状态,但MRI脊柱转移瘤的勾画缺乏自动或半自动分割方法,导致勾画VOI时容易产生主观性误差且烦琐耗时。因此本研究探讨NSCLC 脑转移瘤MRI 影像组学在预测原发灶EGFR 突变状态的应用,使用半自动方法勾画VOI,建立准确预测EGFR突变状态的影像组学模型,并通过影像组学中未参与建模的测试组数据对预测模型效能进行评估,提高预测的准确性和模型的稳定性,帮助临床医生做出更准确的诊断和更合理的个体化治疗方案。

1 材料与方法

1.1 一般资料

本研究遵守《赫尔辛基宣言》,经福建医科大学附属泉州市第一医院医学伦理委员会批准,免除受试者知情同意,编号:2021-231。回顾性分析2015年9 月至2021 年11 月泉州市第一医院97 例NSCLC(91 例为腺癌,6 例为鳞癌)脑转移患者的头颅MRI 影像资料,EGFR突变型50例(17例外显子19缺失突变、33 例21 L858R 点突变),EGFR 野生型47 例,男65 例,女32例,年龄62.00±11.66(41~85)岁,所有病例按照8∶2 比例随机分组至训练组和测试组。纳入标准:(1)患者治疗前行常规头颅MRI平扫和增强扫描;(2)病理证实为NSCLC,并行聚合酶链式反应(polymerase chain reaction, PCR)检测EGFR 基因结果;(3)图像质量满足诊断要求,脑转移瘤数目≤10 个;(4)病灶最大层面直径需≥5 mm,以免病灶太小影响分割。排除标准:患者影像资料不全。

1.2 MRI检查方法

扫描机器为德国SIEMENS Avanto 1.5 T 超导MRI扫描仪,增强扫描包括横断位、冠状位及矢状位图像,用常规头颅线圈扫描,所有病例均行常规T1WI、T2WI、T2 液体衰减反转恢复(T2 fluid attenuation inversion recovery, T2-FLAIR)序列、扩散加权成像(diffusion-weighted imaging, DWI)及T1WI 增强扫描,患者取仰卧位。MRI 平扫采用T1WI-SE 和T2WI-TSE序列,T1WI-SE序列扫描参数:TR/TE=1400 ms/8.4 ms,FOV 23 cm×23 cm,平均次数为1,层厚6 mm,层间距1 cm;T2WI-TSE 序列扫描参数:TR/TE=3330 ms/100 ms,FOV 23 cm×23 cm,平均次数为2,层厚6 mm,层间距1 cm;T2-FLAIR序列扫描参数:TR/TE=5000 ms/89 ms,FOV 23 cm×23 cm,平均次数为1,层厚6 mm,层间距1 cm;轴位DWI 采用平面回波扫描,扫描参数:b 值设定为0 及1000 s/mm2,TR/TE=2900 ms/100 ms,FOV 23 cm×23 cm,层 厚6 mm,层间距1 cm,自动获得表观扩散系数(apparent diffusion coefficient, ADC)图像;MRI增强扫描序列及参数与T1WI-SE 序列相同,扫描横轴位、冠状位及矢状位,对比剂采用钆特酸葡胺注射液(江苏恒瑞医药股份有限公司),注射剂量0.1~0.2 mmol/kg,注射速率1.5 mL/s。

1.3 EGFR检测方法

对患者经支气管镜、经皮肺穿刺或手术活检病理所获取的组织标本进行实时荧光PCR基因检测,采用北京鑫诺美迪公司生产的EGFR基因突变检测试剂盒,仪器为Mx3000P 荧光定量PCR 分析仪,检测操作步骤依照试剂盒说明书,将检测结果分为EGFR 突变型(突变含量1%~100%)和EGFR 野生型(阴性或低于检测下限,突变含量<1%)。

1.4 图像分割

选取T1WI 增强横断位、冠状位、矢状位图像,在肿瘤各个层面沿肿瘤边缘采用半自动结合手动的方法勾画VOI,不包括肿瘤周围水肿区,将VOI导入汇医慧影公司Radcloud 平台,按8∶2 比例随机分为训练组和测试组,为了保证结果的可重复性和模型的泛化能力,平台自动对图像的体素大小、强度进行归一化。所有VOI的勾画由一名具有6年头颅MRI诊断经验的影像科主治医生在不了解患者的临床信息情况下于3D Slicer软件上完成,勾画完成后由一名具有20 年工作经验的主任医生检查所有轮廓,如果差异≥5%,则由高年资影像科医生决定肿瘤边界。

1.5 影像组学特征提取

从图像上所勾画的每个VOI 中提取1409 个定量影像特征,包括一阶统计特征126 个、形状学特征14个、纹理特征525个、高阶统计特征744个。

1.6 影像组学特征筛选及降维

特征选择方法包括方差选择法(VarianceThreshold)、单变量选择法(SelectKBest)及最小绝对收缩和选择算子(least absolute shrinkage and selection operator, LASSO)。VarianceThreshold留下了方差大于0.8 的特征值;SelectKBest 留下P<0.05 的特征;LASSO 使用L1 正则化器作为成本函数,交叉验证的误差值为5,最大迭代次数为1000。

1.7 统计学方法及模型建立方法

使用SPSS 25.0 软件对临床基线资料进行统计分析。性别以例(%)的形式表示,组间比较采用χ2检验,年龄采用±s表示,组间比较采用独立样本t检验,统计结果以P<0.05 为差异有统计学意义。本研究采用支持向量机(support vector machines,SVM)、逻辑回归(logistic regression, LR)2种分类器构建影像组学预测模型,并利用训练组5折交叉验证提高模型的有效性。通过对各模型的受试者工作特征(receiver operating characteristic, ROC)曲线进行评估预测效能,得出最优模型,通过DeLong检验分析各模型间的差异性(流程见图1)。

图1 技术路线流程。Fig.1 Technical route process.

2 结果

2.1 临床基线资料分析结果

97 例NSCLC 脑 转 移 患 者 中,EGFR 突 变 型50 例(51.50%),包括17 例外显子19 缺失突变、33 例21 L858R 点突变,EGFR 野生型47 例(48.50%)。在训练组中,女性EGFR 基因突变率(81.48%,22/27)远大于男性 EGFR 基因突变率(35.29%,18/51),差异有统计学意义(P<0.001)。而年龄在EGFR突变型与野生型中差异无统计学意义(P>0.05)(表1)。

表1 训练组临床基线特征与EGFR(突变型、野生型)的关系Tab.1 Relationship between clinical baseline characteristics and EGFR (mutant, wild type) in the training group

2.2 影像组学特征的降维、筛选结果

基于T1WI增强横断位、冠状位、矢状位及联合序列图像分析,使用VarianceThreshold、SelectKBest、LASSO降维和筛选,最后分别得出7、12、10、13个最优特征(图2)。

图2 最小绝对收缩和选择算子(LASSO)的图像特征和相关系数。2A:T1WI 增强横断位;2B:T1WI 增强冠状位;2C:T1WI增强矢状位;2D:联合序列。Fig.2 Image features and correlation coefficients for least absolute shrinkage and selection operator (LASSO).2A: T1WI enhanced transverse; 2B: T1WI enhances coronal position; 2C: T1WI enhanced sagittal position; 2D: Joint sequence.

2.3 分类器建模结果

降维、筛选后的特征使用SVM、LR分类器建模,结果显示:基于T1WI增强横断位、冠状位、矢状位的SVM和LR 分类器模型预测效果表现优良,大部分AUC 均大于0.60,且联合模型预测效能AUC较单序列模型均有提升,其中联合序列LR分类器预测效能最佳:测试组AUC 0.84,敏感度80%,特异度78%,准确率80%。(表2、3,图3)。DeLong 检验显示联合序列AUC 与单序列差异均无统计学意义(P>0.05)(表4、5)。

表2 SVM模型在训练组与测试组中的预测效能Tab.2 The predictive performance of SVM models in the training and test groups

表3 LR模型在训练组与测试组中的预测效能Tab.3 The predictive performance of LR models in the training and test groups

表4 测试组SVM分类器联合序列和单序列预测效能DeLong检验结果Tab.4 The results of the DeLong test of the combined sequence and single sequence prediction performance of the SVM classifier

表5 测试组LR分类器联合序列和单序列预测效能DeLong检验结果Tab.5 The results of the DeLong test of the combined sequence and single sequence prediction performance of the LR classifier

图3 测试组的支持向量机(SVM)、逻辑回归(LR)分类器的受试者工作特征(ROC)曲线。3A:SVM 分类器的T1WI增强横断位(Tra)模型、冠状位(Cor)模型、矢状位(Sag)模型和联合模型;3B:LR分类器的T1WI增强横断位(Tra)模型、冠状位(Cor)模型、矢状位(Sag)模型和联合模型。AUC:曲线下面积。Fig.3 The receiver operating characteristic (ROC) curves of support vector machines (SVM) and logistic regression (LR) classifiers in the test group.3A: T1WI enhanced transverse (Tra), coronal (Cor), sagittal (Sag)and joint models using SVM classifiers; 3B: T1WI enhanced Tra, Cor, Sag and joint models using LR classifiers.AUC: area under the curve.

3 讨论

本研究对97例NSCLC脑转移瘤的T1WI增强横断位、冠状位、矢状位影像组学特征进行降维、筛选,使用SVM 和LR 分类器建立模型,结果显示基于T1WI 增强横断位、冠状位、矢状位及联合序列均取得了良好预测效能,虽然各模型间差异无统计学意义,但联合序列AUC较单序列有所提升,说明联合序列模型预测效能优于单序列。本研究创新性地通过脑转移瘤MRI影像组学来预测原发灶的基因突变类型,T1WI增强上脑转移瘤边界显示清晰,使用半自动分割方法降低勾画难度并提高鲁棒性,减少人眼判断的主观性限制,联合多序列并使用不同分类器建立模型,帮助临床医生通过模型快速准确地预测EGFR突变的类型,指导临床个性化的靶向治疗。

3.1 影像组学特征与EGFR突变状态的关系

以往有研究表明EGFR突变型肺癌较野生型的纹理更细腻,灰度整体分布更规律[13],但也有研究发现病灶纹理紊乱程度越大,越趋于EGFR 突变型[14],矛盾原因可能是样本量和种族差异,肺腺癌中白种人和东亚人EGFR突变率分别为20%和40%[15]。本研究中预测效能最佳的联合T1WI横断位、冠状位、矢状位模型筛选出的影像组学特征包括一阶特征(幅度、峰度、偏度)、灰度共生矩阵(簇突)、灰度大小区域矩阵(小区域高灰度重点)、灰度游程长度矩阵(长游程高灰度重点、长游程低灰度重点)、灰度依赖矩阵(依赖熵)、邻近灰度差矩阵(粗糙度),与WANG等[16]和PARK等[17-18]的研究筛选出的特征相似。上述特征描述的是肿瘤的灰度强度及分布情况、体素及其周围空间邻域的分布状态,可反映肿瘤的异质性大小[19-20],其中最具相关性的是峰度和小区域高灰度强调。峰度反映图像灰度峰尖的尖度,值越大灰度分布越陡峭,值越小则灰度分布越平坦。本研究中EGFR突变型的峰度大于野生型,表明突变型的NSCLC脑转移瘤的灰度分布更陡峭,这与DIGUMARTHY 等[21]的发现相符合,他们还认为峰度有预示血管生成的作用,而血管生成跟肿瘤侵袭性、预后有关,因此峰度可能是评价EGFR突变阳性患者抗血管生成药物疗效的指标之一,小区域高灰度重点是测量图像小区域高灰度体素分布的程度,值越大图像纹理越细腻,反之纹理越粗糙,本研究中EGFR 突变型的小区域高灰度重点小于野生型,可理解为EGFR 突变型的NSCLC 脑转移瘤比野生型的纹理更紊乱、粗糙。总而言之,EGFR 突变型比野生型灰度分布更陡峭、更不均,纹理更紊乱、更粗糙,原因可能是EGFR突变更容易导致肿瘤内部血管生成,引起肿瘤内部微观结构的改变。本研究的T1WI增强冠状位模型筛选出一个形态学特征——最大2D直径,说明EGFR突变型脑转移瘤冠状位的最大径小于EGFR野生型,HSIAO等[22]发现EGFR突变与肺部CT病灶体积较小有关,YIP 等[14]亦发现EGFR 突变与组学特征紧密性2 密切相关,紧密性2 是描述肿瘤形状相较于球体的紧实程度的,其认为EGFR突变型的瘤体更小,内部排列更紧密。遗憾的是,本研究中还有许多影像组学特征与EGFR基因突变状态的关系尚不明朗,难以通过现有的原理解释清楚,有待后续具体深入研究。

3.2 不同序列的预测效能分析

既往亦有许多基于T1WI增强横断位、冠状位、矢状位的影像组学研究,YANG 等[23]研究了纹理分析在预测胶质母细胞瘤的分子亚型和12个月生存状态方面的性能,结果表明横断位对经典型预测最佳,冠状位对前神经型及12个月生存状态最具预测效能。有研究探讨基于T1WI 增强(横断位、矢状位)的深度学习模型在鉴别高、低级别脑膜瘤中的应用价值,共筛选出15 个特征(10 个来自横断位,5 个来自矢状位),最佳模型的训练组和测试组AUC 分别为0.988 和0.935[24]。本研究T1WI 增强三个方位单序列模型中,冠状位和矢状位的预测效果大部分均好于横断位,原因可能是大部分数据的冠状位和矢状位增强扫描时间稍晚于横断位,增强延迟扫描能显示更清晰、更丰富的信息[25],有待后续进一步纳入延迟T1WI 增强横断位序列以验证该猜想。

与单序列相比,多序列联合分析可能会发掘出更多相互独立又互补的信息,对于提升肿瘤的生物学行为的预测效能具有积极意义。李顺等[26]结合T1WI 增强三个平面的纹理特征鉴别脑脓肿与胶质母细胞瘤,当纹理特征峰度的截断值取0.207时效果最好,AUC、敏感度和特异度分别为0.754、88.0%和54.1%。李笑然等[27]分别基于T1WI、T2WI、T2WI 抑脂序列及联合以上序列,构建朴素贝叶斯模型预测宫颈鳞癌的病理组织类型,联合模型在四种模型中预测效能最高,测试组AUC 为0.860。本研究中的联合序列LR模型预测效能最佳,训练组AUC、敏感度、特异度和准确率分别为0.86、74%、75%和76%,测试组分别为0.84、80%、78%和80%,但与单序列模型相比,差异并不是很显著,还存在进一步探索的空间。过多序列联合建模有过拟合和鲁棒性减弱的风险,实际应用中应视具体情况而定,本研究依次使用VarianceThreshold、SelectKBest和LASSO共3种特征筛选方法,以及5折交叉验证来尽量避免上述的风险。

3.3 不同分类器的分析

本研究应用了LR、SVM两种分类器,其中联合序列的LR 分类器预测效能最佳,测试组AUC 为0.84,敏感度80%,特异度78%,准确率80%。每个分类器都有各自的特点,如LR通过拟合变量系数来预测二分类概率的分对数转换,有较准确和稳定的预测能力;SVM通过寻找超平面来划分不同类别的样本,能够解决高维问题,可扩展性较好,且不依赖于整个样本数据,即使训练样本的数量很少,其学习算法也能够具有良好的泛化以及分类能力[28]。目前还没有被广泛认可的最佳分类器,因为在实际应用中,结果表现好的分类器,可能在某些方面效果不佳,而效能较弱的分类器可能在别的特定问题中表现较优,如YANG等[23]用随机森林分类器研究T1WI 增强和T2-FLAIR 的纹理特征预测高级别胶质瘤的分子亚型,结果T1WI 增强对经典型预测最佳(AUC=0.72),T2-FLAIR 对间质型和神经元型预测最佳(AUC 分别为0.70 和0.75),而CHEN 等[29]联合T1WI 增强和T2-FLAIR 序列,采用随机森林分类器预测肺癌脑转移瘤的EGFR、ALK、KRAS 基因突变状态,AUC 值分别达到0.858、0.845 和0.928。也有研究纳入多种分类器分析,用以评价模型对于数据和结果的适用性,AHN 等[30]和REN 等[31]分别研究脑转移瘤和胸椎转移瘤的增强T1WI 影像组学预测肺癌EGFR 突变状态的价值,均运用了多个分类器建模,前者预测能力最强的分类器是随机森林(AUC=0.868),后者的是LR(AUC=0.803)。故在实际情况下,应具体问题具体分析,尽可能纳入多种分类器以探索最佳的分类器,达到更满意的预测或诊断效果。

3.4 本研究的局限性

本研究仍存在一定的局限性。首先,本研究为回顾性研究,样本量过小且来自单一机构,后续应纳入更大、更多中心、更多序列的样本。其次,本研究中只纳入了突变型与野生型,没有进一步分析突变亚型的预测价值,且所提取的影像组学特征与EGFR突变的关系尚不明朗,将来应进一步研究突变亚型之间的预测和分析具体影像组学特征的关系。最后,本研究应用的降维方法、分类器种类较少,今后争取采用更多降维方法及分类器种类,增加模型的稳定性。

综上所述,基于T1WI 增强横断位、冠状位、矢状位的影像组学模型可以预测EGFR 突变状态,联合T1WI增强横断位、冠状位、矢状位的LR分类器模型预测效能最佳,有助于指导临床合理选择靶向药物治疗及实现个体化精准医学。

作者利益冲突声明:全体作者均声明无利益冲突。

作者贡献声明:陈杰云设计本研究的方案,对稿件重要内容作批评性审阅、修改,获得了福建省自然科学基金的资助;黄锦祥起草和撰写稿件,获取、分析和解释本研究的数据;全体作者都同意发表最后的修改稿,同意对本研究的所有方面负责,确保本研究的准确性和诚信。

猜你喜欢
状位冠状组学
退行性腰椎管狭窄症与脊柱-骨盆矢状位失衡及椎旁肌退变关系的研究进展
新型冠状病毒感染者咽拭子与粪便排毒规律及临床表现
尺骨冠状突骨折的入路和预后
前交叉韧带前内侧束及后外侧束薄层斜矢状位质子密度加权像MRI研究
口腔代谢组学研究
正常成人脊柱-骨盆矢状位影像学参数的关系
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
角度法评价躯干冠状面失平衡
代谢组学在多囊卵巢综合征中的应用
颈椎矢状位形态与颈椎退变性疾病关系