王 刚,余芬芬,吴依芬,邹玉坚,郑晓林,廖玉婷,范宪淼,张坤林
(1.东莞市人民医院放射科,广东 东莞 523059;2.东莞市人民医院肿瘤内科,广东 东莞 523059;3.通用电气药业<上海>有限公司,广东 广州 510526)
最新全球癌症数据显示,肺癌(lung tumor)是2020 年全世界范围内第2 常见的肿瘤,却是癌症死亡的首要原因,它严重危害着人类健康和生命[1]。肺癌的转移往往是患者死亡或病情加重的主要原因之一,与临床分期、治疗方案选择密切相关,针对这一临床问题的解决方案和研究课题中,影像学发挥了重要的作用。但是当传统影像学检查发现转移瘤时,临床干预实际上已经迟了一步,这也直接影响了患者的预后、生存时间。通过对肺癌原发灶进行分析,来预测其转移发生的可能性,早期实施临床干预,改善患者预后成为当前的研究热点。基于此,本研究应用影像组学技术对肺癌原发灶的MRI 图像进行分析,旨在发现伴有肺外转移的肺癌影像组学特征,并有望应用这些特征预测肺癌的转移,以期为肺癌临床治疗方案的合理选择提供参考。
1.1 一般资料 选择2019 年10 月1 日-2020 年1 月1 日于东莞市人民医院行胸部MRI 检查,发现肺内占位性病变的患者。纳入标准:占位病变范围不小于2 cm×2 cm;生命体征平稳;无MRI 检查禁忌证;图像清晰不影响诊断。排除标准:孕妇及儿童;肺部磨玻璃结节;心、肺、肝、肾功能不全;无法平卧。共收集肺内占位病变患者18 例,其中男6 例,女12 例,年龄29~68 岁,平均年龄(56.67±11.06)岁,临床有吸烟史13 例。所有患者检查前签署知情同意书,并进行呼吸训练。本研究已通过东莞市人民医院医学伦理委员会批准。
1.2 方法 所有检查均在SIEMENS MAGNETOM Skyra 3.0T 磁共振机上完成,采用体部18 通道线圈,受检者取仰卧位,扫描范围从胸廓入口至膈肌下方水平。检查序列:横断面T1WI 及T1WI-FS、T2WI及T2WI-FS,层厚3 mm;冠状面和矢状面T2WI-FS;DWI 及ADC 序列,TR 3362 ms,TE 63 ms,b 值为0,500,800。
1.3 病理及手术结果 全部患者均经手术或穿刺活检病理确诊,经其他检查(骨扫描、PET/CT、MRI 及CT 等)证实肺外转移瘤的诊断。根据临床确诊是否发生肺外转移,将患者分为转移组和非转移组。
1.4 数据处理
1.4.1 肿瘤图像的三维分割 选取每例患者T2WI、DWI(b=500)、ADC 图像分别导入ITK-SNAP 软件(version 3.6.0,https://itk.org/)内,由一名高年资MRI诊断医师对病灶进行手动逐层标记(图1)。
图1 肿瘤图像的三维分割
1.4.2 影像组学特征提取 采用A.K 软件(Artificial Intelligence Kit V3.0.0.R,GE)对获得的病灶三维分割图像进行特征提取,每个患者提取5 大类共396个特征,分别包括直方图特征、形态学特征、纹理特征、灰度共生矩阵特征、灰度游程矩阵特征及灰度大小区域矩阵特征。
1.4.3 影像组学特征处理 首先对所提取特征做缺失值和异常值处理,对于缺失值采用所有患者该个特征的中值进行替代,对于超出3sigma 外的异常值采用99%处的数值进行替代。然后采用Z-score 的方法(数值-均值/方差)进行标准化。
1.5 统计学分析 采用R 语言(Version:3.6.1)进行统计分析。对临床资料和影像特征进行组间差异进行统计分析,其中计数资料采用[n(%)]表示,行χ2检验或者Fisher 精确检验,连续变量先进行Shapiro-Wilk 检验,对于符合正态分布的计量资料采用()表示,行t检验,不符合正态性分布的计量资料采用[M(P25,P75)]表示,行Mann-WhitneyU检验。以P<0.05 表示差异有统计学意义。对于具有统计学意义的影像组学特征,采用R 语言中的“ggplot2”包绘制箱图,“pROC”包得到识别肺癌肺外转移的ROC 曲线,“pROC”包获取相应的截断阈值(cutoff)、曲线下面积(AUC)、准确性(ACC)、敏感性(SEN)和特异性(SPE)。截断阈值(cut-off)根据约登指数确定。
2.1 两组一般资料比较 18 例肺内占位患者共18 个病灶,左肺11 个,右肺7 个;18 例患者中,转移组10例,非转移组8 例。两组性别、年龄、吸烟史比较,差异无统计学意义(P>0.05),见表1。
表1 两组一般资料比较[n(%),]
表1 两组一般资料比较[n(%),]
2.2 MRI 图像影像组学特征 每例MRI 图像病灶提取5 大类共396 个特征,两组间影像学特征比较,差异有统计学意义的特征共8 个(P<0.05),见表2;8 个特征均来源于DWI(b=800)和ADC 序列,分别为"B500_ShortRunLowGreyLevelEmphasis_angle45_offset4 "、" B500_ClusterShade_an-gle90_offset7"、"B500_Inertia_angle90_offset4"、"B500_Inertia_angle90_offset7"、"ADC_LongRunEm-phasis_angle45_offset1"、"ADC_GreyLevelNonunifor-mity_AllDirection_offset7_SD"、"ADC_Short Run Emphasis_angle135_offset7"、"ADC_Grey Leve lNonuniformity_All Direction_offset4_SD"。8 个特征ROC 下面积(AUC)均大于0.75(0.781~0.906),其中以ADC_GreyLevelNonuniformity_AllDirection_off -set4_SD 这一特征AUC 最大;cut-off 为-0.106、-0.072、-0.496、-0.516、-0.416、-0.048、0.583、-0.119;准确性为 0.833(0.818~0.848)、0.778(0.759~0.797)、0.722(0.7~0.744)、0.778(0.759~0.797)、0.778(0.759~0.797)、0.889(0.878~0.9)、0.778(0.759~0.797)、0.889(0.878~0.9),敏感性为0.75(0.45~1)、0.875(0.646~1)、0.875(0.646~1)、1、0.7(0.416~0.984)、0.75(0.45~1)、0.6(0.296~0.904)、0.75(0.45~1);特异性为0.9(0.714~1)、0.7(0.416~0.984)、0.6(0.296~0.904)、0.6(0.296~0.904)、0.875(0.646~1)、1、1、1,见图2。
表2 转移组和非转移组的影像特征差异[M(P25,P75),]
表2 转移组和非转移组的影像特征差异[M(P25,P75),]
图2 转移组与非转移组间影像组学特征比较
肺癌由于其发病率高、侵袭性强、死亡率高及5年生存率低等因素一直是临床研究关注的热点。在我国,肺癌相关死亡率占癌症相关死亡总数的30.1%,女性肺癌的发病率高于某些欧洲国家;对于男性,与癌症相关死亡的最常见原因是肺癌,占癌症相关死亡总数的26.4%,且发病年龄逐渐年轻化[1]。肺癌的转移与肺癌诊治及预后密切相关。肺癌常见的远处转移部位以骨、脑、肝常见,这些不同部位的转移往往需要多次多种检查(如CT、MRI、PET/CT、超声)联合应用才能确诊,这在时间、空间上对于肺癌诊治产生了一定的影响[2-4]。
影像组学的提出给肿瘤精准诊治提供了一个新的研究方向,其应用计算机大数据处理技术,通过图像分割、特征提取、量化分析等手段高通量地从医学影像图像中提取大量的数据特征,将图像分析转化为客观的数据进行归纳计算,从中筛选出具有临床诊治及预后相关价值的特征,针对于肿瘤能够更加详细和定量的评价其异质性,以寻找与临床密切相关的内在的要素[5]。肿瘤的异质性决定了其发生发展的特点[6],这些异质性特点不只是表现在形态方面的差异,最主要的在于肿瘤内部细胞结构、基因水平的差异[7,8]。因此,单纯从形态学方面很难发现具备转移特性的肺癌原发灶的影像学特征[9]。DWI 序列是MRI 功能成像技术,能够检测、评价活体内水分子扩散运动受限程度和方向,可在一定程度上反映出肿瘤细胞成分和间隔构成、病理生理情况等微观变化,这些都可能与肿瘤的侵袭转移密切相关[9-11]。但是应用传统技术手段分析DWI/ADC 影像,还不能完全满足预测和分析肿瘤远处转移的需求。
目前关于影像组学预测肺癌转移的研究多集中在针对胸部淋巴结转移,且多是与CT 和PET/CT 结合进行分析,关于其他部位肺外转移的预测研究报道比较少。王旭等[12]等基于影像组学、机器学习提出一种非小细胞肺癌预后分析方法;许新颜等[13]回顾性纳入ALK 阳性的Ⅲ/Ⅳ期NSCLC 患者,提取其CT影像学特征,发现W_GLCM_LH_Correlation 与患者脑转移结果显著相关,能在一定程度上预测治疗前患者发生脑转移的可能性。但是基于MRI 数据的肺癌影像组学分析报道较少。
本研究基于MRI 肺部成像的数据进行影像组学分析,选取了反应病灶特征较为明显,信息量较为丰富的T2WI-FS、DWI(b=500)、ADC 序列进行分析。结果显示,8 个特征分别从明暗和复杂程度、光滑或粗糙程度、灰度信号强度分布的偏度及不对称性方面显示了肺癌转移与未转移患者影像组学特征的差异。这些特征主要集中在两大类方面:①灰度共生矩阵(grey level co-occurrence matrix,GLCM),是一种应用最广泛的二阶纹理特征,本次结果中3 个特征都属于此类,“ClusterShade”描述了病灶的偏度和均匀度;“Inertia”描述了病灶部位差异性的大小,将图像灰度的空间分布拉开,更能分辨出灰度空间分布的复杂程度;②灰度运行长度矩阵(gray level run length matrix,GLRLM),本结果中5 个属于此类特征:“ Short Run LowGrey Level Emphasis ”描述了病灶部位的明暗程度和复杂程度;“Long Run Emphasis”即“长行程优势”、“Short Run Emphasis”即“短行程优势”,两者描述了图像的粗糙度或平滑度;“Grey Level Nonuniformity ”即“灰度不均匀度”描述图像中某种灰度出现的频率[7,9]。上述8 个组学特征在预测肺癌转移方面,AUC 值都大于0.75,最大能够达到0.901(ADC_GreyLevelNonuniformity_AllDirection_offset4_SD 特征),说明这些影像组学特征能够较好的预测肺癌肺外转移的可能性,准确性、特异性和敏感性都较好。
上述8 个影像组学特征均来自于DWI(b=500)/ADC 序列。本研究认为,由于功能成像的图像可能蕴含了丰富的数据信息,反映了肿瘤的细胞分子/基因水平特性,如果应用影像组学技术进行分析,能够发现有价值的信息、且较为客观、可靠。本研究显示,不同类肿瘤之间、同一类肿瘤不同分型之间的异质性都存在差异,从肿瘤发生开始,其就已经具备了细胞分子水平/基因水平的特性,如果在肺内占位MRI影像组学分析中,出现本研究的8 个特征,提示肿瘤内部细胞分子/基因水的平常可能已经为转移提供了一定的基础,并具备了转移的特征。上述影像组学特征可以较好的反映肿瘤的异质性特点,其差异恰好反映了不同个体之间肿瘤异质性的差异,也提示了MRI 功能成像影像组学信息有助于鉴别、预测肺癌的转移。另外一个序列T2WI,其回波时间较T1WI 长,虽然增加了组织间的对比度,对于形态学的观察比较有利,但本研究并未发现其对于识别转移的发生预测证据,分析认为T2WI 序列增加的组织对比度可能尚不足以区分出肺癌转移的特性,也可能与本研究样本量偏小有关。
综上所述,MRI 与影像组学的结合,能够以原发肿瘤为基础,从微观层面出发分析肿瘤特性,针对肺癌肺外转移的预测、早期识别能够提供有利的依据,如果能够充分利用这种方式,有望提供给临床精准、可靠的肿瘤特征信息,可以及时、针对性的制定治疗方案,甚至在转移发生前进行干预,对临床的精准化治疗有着较大的意义,且不需额外增加患者的检查项目和检查时间,也能够在取得一定的社会经济效益方面有所突破。