吕 悦 刘爱连 刘静红 刘义军 陈丽华武敬君 李欣颖 郭 妍 李 昕
胃癌是全世界范围内常见的恶性肿瘤,是导致癌症死亡的第二大原因,中国作为胃癌高发地区,约占全球胃癌人口的42%[1]。已有研究指出病理分级是影响晚期或转移性胃癌患者预后的独立因素之一,而且不同分化程度的胃癌,其生物学行为及化疗敏感性存在差异[2],此外,胃癌的分化程度对术式的选择,能否选择创伤较小的内镜下病灶剥离术也起到决定性作用,目前对胃癌分化程度的判断大多依赖于胃镜下病理活组织检查,其在对患者造成的不适和创伤、对取材部位的选择以及与术后病理的符合率等方面仍旧存在挑战,因此术前基于无创的方法较为准确地获取胃癌的病理分化程度,对临床治疗方案的选择和预后评估将起到举足轻重的作用。
能谱CT作为常规影像学检查手段,其在胃癌的TNM分期、病理类型鉴别及分级等方面的研究已经被许多学者所关注[3-6],但可行性和诊断效能尚未取得普遍结论,仍需大样本研究的证实。近年来,基于CT图像的影像组学研究逐渐受到重视,旨在通过高通量、定量的分析与整合,将传统的影像图像转化为高分辨率、可挖掘的数据库。而能谱CT因其能够提供单能量成像、物质分离分析、虚拟平扫图像、有效原子序数等大量信息的优势,将有望为影像组学研究提供新思路,目前影像组学在消化道肿瘤方面的研究,多是基于平扫/增强CT、MR图像[7-9],未见能谱成像相关影像组学的研究报道。本研究旨在探讨应用能谱CT单能量图像提取的影像组学特征信息以评估胃腺癌(胃癌最常见的组织学类型)病理分级的价值。
回顾性收集2011年7月至2016年8月于我院接受 Discovery 750 CT上腹或全腹GSI扫描的患者,纳入标准:①CT扫描过程中患者呼吸状态平稳,能正常屏气;②临床资料完整,无对比剂过敏史,检查前均签署知情同意书;③均为首次诊断,检查前未接受任何放、化疗及生物靶向治疗;④经活检或手术病理证实为胃腺癌。排除标准:①CT图像存在明显呼吸运动伪影;②病灶过于表浅,不利于感兴趣区的准确勾画;③病理证实病灶混有黏液腺癌、低黏附性癌等其他病理类型成分。符合条件患者共246例,根据病理结果分为低分化组148例(低分化98例和中低分化50例)和中高分化组98例(中分化61例、中高分化24例、高分化13例)。
检查前3天禁服含重金属药物,检查前20分钟饮清水800~1000ml。检查前向患者及其家属说明扫描过程及扫描前后注意事项,扫描过程受到腹部脏器自身蠕动、呼吸运动、胃肠道气体的影响,因此需要检查前积极做好准备及训练患者呼吸屏气,嘱患者在每次憋气时呼气量尽量保持一致。采用Discovery 750(General Electric)单源双能CT机,行平扫和增强三期扫描,患者常规加用腹带。扫描参数:GSI扫描模式,管电压80kVp和140kVp瞬时切换,管电流375~640mA,探测器宽度40mm,螺距 1.375:1,转速 0.6 ~ 0.8 s/r,矩阵 512×512,SFOV 50cm×50cm,扫描层厚和层间距均为5mm,标准算法Stnd重建,重建层厚及层间距均为5mm。经右侧肘正中静脉注射碘对比剂(350mgI/ml),流率 4.0ml/s,剂量 1.5ml/kg;注药后 28s获得动脉期图像,动脉期后延迟28s获得静脉期图像,静脉期后延迟90s获得延迟期图像。
在GE AW4.6工作站上利用GSI Viewer分析软件自动生成70keV单能量图像,将静脉期图像以DICOM格式导出,随后导入A.K.软件(Artificial Intelligence Kit, 通用电气药业)。由2名影像诊断医师在未知患者病理诊断情况下,于静脉期70keV单能量图像上选取病灶最大层面勾画ROI,ROI沿整段增厚的胃壁边缘勾画[10],两人意见不一致时通过请教第3名高年资诊断医师取得共同意见。经A.K.软件自动提取包括一阶的基于图像亮度的直方图特征和二阶的灰度共生矩阵、灰度步长矩阵等影像组学特征。
常规能谱参数应用SPSS 22.0软件进行分析,计量资料进行正态性检验和方差齐性检验后,采用Mann-Whitney U检验比较两组间差异,P<0.05认为差异具有统计学意义。
影像组学特征应用R语言(R Studio, 版本3.3.2,http://www.Rproject.org)进行分析。为避免由于数据量的差异造成偏倚,在148例低分化患者中利用计算机随机筛选98例使得两组病例数呈1:1均衡配比,此时低分化组98例(低分化48例和中低分化50例),中高分化组98例。按7:3的比例随机分为训练组(低分化、中高分化各68例)和验证组(低分化、中高分化各30例)。影像组学特征参数进行正态性检验和方差齐性检验,符合正态分布的数据采用t检验,非正态分布的参数采用非参数检验进行特征数据的第一次降维(P<0.05),合并有统计学差异的参数,利用Lasso回归筛选方法进行第二次降维,得到的参数用于指导Logistic回归模型学习,绘制受试者工作特性曲线(receiver operating characteristics curve,ROC)评价Logistic模型的效能,并利用混淆矩阵模型验证其准确率,评估临床应用价值。
见表1。
图1 A.胃癌患者,男,72岁,低分化腺癌,A.70keV单能量CT图像,胃壁局部增厚;B、C.40倍和100倍光学显微镜下,见细胞高度异型性、腺管、腺泡结构基本消失;影像组学评分=2.373。D.胃癌患者,男,63岁,高中分化腺癌,70keV单能量CT图像,胃壁局部增厚;E、F.40倍和100倍光学显微镜下,见腺管、腺泡结构结构完整,胃壁细胞异型性低;影像组学评分=-3.403。
训练组由A.K.软件自动提取277个特征参数,采用t检验和非参数检验分别进行特征数据的第一次降维(P<0.05)后,分别得到15个和173个参数。合并两次检验中有统计学差异的参数共188个,利用Lasso回归筛选方法进行第二次降维去冗余,得到6个参数用于指导Logistic后退法回归模型学习。通过两次降维选取的特征参数与对应加权系数乘积的线性组合构成的回归模型如下:影像组学评分 =-29.360+0.027×80 百 分 位 数 +1.482× 熵 值+1666.923× 相关性 +17.559× 总熵值+ 0.029× 步长不一致性-7.250×表面积体积比。
绘制ROC曲线评价Logistic模型的分级效能。在训练组和验证组中,曲线下面积(area under the curve, AUC)分别为 0.877 和 0.872,敏感度分别为 69.1% 和 73.3%、特异度分别为 92.6% 和83.3%;该模型在验证组中的诊断准确率为78.3%。Logistic模型鉴别低分化和中高分化胃腺癌举例见图1。
表1 常规能谱参数和Logistic模型的效能、灵敏度、特异度
传统CT对胃癌恶性程度的诊断大多基于肉眼可见的、形态学上的、定性的评估,近年来,随着功能CT在临床的推广与应用,能谱分析作为重要组成部分,与常规CT相比,能够提供单能量成像、物质分离分析、虚拟平扫图像、有效原子序数等大量信息。在胃癌的能谱成像研究结果表明,低分化腺癌的动脉期和静脉期的标准化碘水浓度值都高于分化较好的腺癌,且标准化碘水值与微血管密度呈显著相关,即说明在排除了个体循环与注射剂量、注射速度的差异性因素后,分化程度越差的肿瘤组织摄碘越多,血供越丰富[5]。
能谱单能量成像的能级范围在40~140keV之间,本研究采用70keV单能量图像的CT值与常规扫描120kVp图像相仿。有能谱参数鉴别胃腺癌分化程度的研究[6]结果表明,仅静脉期参数有统计学差异,本研究亦选取静脉期图像进行影像组学分析,原因是在此时期大部分胃部肿瘤可见增强后明显强化[11],病灶显示最为清晰。
Ba-Ssalamah等[12]基于CT增强图像的纹理特征分析胃肿瘤的研究结果示,提取肿瘤的直方图特征、二阶统计学特征(灰度共生矩阵、游程矩阵)、小波变换及自回归模型特征,进行Fisher系数、分类错误概率等不同方法降维得到的模型,都不能将不同分化程度的胃腺癌、胃淋巴瘤和胃间质瘤一一鉴别开来,但联合不同参数模型可获得一定的鉴别价值。Liu等[10]应用CT直方图预测胃癌的组织病理学特征的研究,结果表明动脉期的标准差、熵值、最小衰减系数可鉴别有无血管侵犯;静脉期的平均衰减、最大衰减、各百分位数、众数可鉴别胃癌的分化程度和Lauren分型。Ma等[13]利用静脉期图像,建立主观信息模型、基于CT组学特征的组学模型和结合模型三种模型,对BorrmannⅣ型胃癌和原发性胃淋巴瘤进行鉴别的结果示三种模型没有统计学差异,即证明组学特征值可以很好地应用于二者的鉴别。
本研究基于能谱成像静脉期70keV单能量图像进行影像组学特征的提取,获取了胃癌不同病理分级下肿瘤异质性的信息,挖掘和分析了图像纹理特征,此前尚未有学者对能谱图像进行影像组学相关分析研究。王夏婉等[6]基于能谱参数进行胃腺癌病理分级的研究得出病灶碘浓度、标准化碘浓度、能谱曲线斜率与分化程度都具有相关性,并取得较高的诊断效能,但业界尚未取得一致性结论。本研究利用常规能谱参数,包括肿瘤大小、碘(水)浓度、标准化碘(水)浓度、能谱曲线斜率等特征,其诊断效能AUC、灵敏度、特异度与已报道结果[14]相仿,低于影像组学模型的结果,这可能与能谱CT数据测量时ROI的勾画有关,而另一方面,也反映了影像组学分析方法的应用前景和推广价值。
本研究的通过Logistic回归分析建立的影像组学模型,两次降维去冗余后得到的6个参数分别为80百分位数、熵值、相关性、总熵值、步长不一致性和表面积体积比,分别来自于对图像亮度特征、统计特征和形态特征的提取和量化。由于不同分化程度的肿瘤其肿瘤微环境不同,分化程度越低的腺癌在自噬现象作为细胞逃逸机制的作用下,促进了肿瘤的生长方式和增殖速度,因此,形态学上表现为细胞密度更高、细胞的核浆比升高、细胞的形态各异、多核化及微核化的异型性更为明显[15]。反映在CT图像上则表现为各个像素分布的均匀性、随机性以及像素间的依赖性和离散度等信息,通过Logistic回归分析,对提取的参数进行不同比例的加权后所建立的模型,可以对图像一阶和二阶参数进行量化和结合,以达到对不同分化类型腺癌鉴别的目的,并可获得较高的效能和准确率。
本研究的不足之处在于能谱成像是一种CT功能成像方式,只利用了单能量成像这一优势,尚未对物质分离分析等其余信息进行综合分析运用,毋庸置疑会造成能谱扫描信息的浪费,且未与常规CT的影像组学特征进行对比,将在未来的研究中再细化;另一方面,本研究选取病灶最大层面对病灶进行二维ROI的勾画,尚未对肿瘤组织进行多层面三维容积测量甚至全肿瘤的研究,虽然尽量囊括病灶信息,仍旧不可避免地会忽略部分信息,后续研究需要在ROI的选择上进一步提升。
综上所述,基于能谱单能量图像的影像组学特征,能够无创地鉴别低分化与中高分化胃腺癌,为临床治疗方案的选择和术前评估提供更多定量、可重复的数据信息。