王 琴,黄东琼,于冬洋,韩 雷
1. 达州市中心医院核医学科,四川 达州 635000;
2. 徐州医科大学附属淮安医院影像科,江苏 淮安 223001
腮腺是唾液腺肿瘤最常见的部位(80%),其中腮腺多形性腺瘤(pleomorphic adenoma,PA)是最常见的良性肿瘤,其次是沃辛瘤(Warthin tumor,WT)[1]。PA与WT的影像学特征存在诸多相似性,但在计算机体层成像(computed tomography,CT)平扫或CT增强表现上仍有所差异[2],不同的磁共振成像(magnetic resonance imaging,MRI)信号强度也可有效地鉴别两者[3]。PA好发于中青年,而WT好发于中老年男性,性别分布也是鉴别PA与WT的重要依据[2,4]。尽管影像学表现结合临床资料常可区分PA与WT,但诊断资料的部分重叠仍使两者的鉴别诊断变得困难。
不同肿瘤由于组织分化程度的高低而表现出不同的异质性[5]。放射组学特征定量分析影像学图像中的灰度分布、像素之间的空间关系等信息[6],以此评估肿瘤内部的异质性,进而区分具有不同异质性的肿瘤[7]。本研究利用CT平扫图像的放射组学特征建立分类模型,探讨CT放射组学特征在PA与WT鉴别诊断中的价值。
回顾并分析2013年1月—2020年11月达州市中心医院、淮安市第二人民医院经病理学检查确诊的28例PA与25例WT患者。PA组:均为单发,男性10例,女性18例,年龄23~75岁;WT组:单发18例,多发7例,男性23例,女性2例,年龄35~78岁。两组患者主要因腮腺无痛性肿块入院,均于术前接受CT平扫检查。
采用德国Siemens公司Somatom Definition AS 64排螺旋CT机,日本Toshiba公司Aquilion 64排螺旋CT机。扫描参数:管电流200 mA,管电压120 kV,层厚5 mm,层间距5 mm,视野240 mm×240 mm,矩阵512×512,行轴位扫描,覆盖整个腮腺。
选取肿瘤横断面最大层面的CT平扫图像(多发者取较大病灶),以DICOM格式导出并储存,像素大小512×512,使用MicroDicom软件(http://www.microdicom.com)转换成BMP格式。使用MaZda ver.4.6软件提取放射组学特征,包括直方图分析(histogram analysis,HA)、灰度共生矩阵(gray-level co-occurrence matrix,GLCM)、灰度游程矩阵(gray-level run length matrix,GLRLM)、绝对梯度(absolute gradient,AG)和自回归模型(autoregressive model,AR),GLCM的步长包括1~5个像素,GLCM和GLRLM均包含4个方向(0°、45°、90°和135°),共259个参数,将感兴趣区(region of interest,ROI)内的图像强度标准化为μ±3σ(μ:图像强度的平均值;σ:标准差),1个月后使用同样方法再次提取组学特征。ROI沿肿瘤边缘勾画(图1)。
图1 MaZda软件勾画肿瘤的ROI示意图
数据分析使用SPSS 25.0软件,特征筛选与模型建立使用R语言(4.0.3)。计量资料以±s表示,比较采用独立样本t检验(符合正态分布与方差齐性检验)或非参数秩和检验;计数资料比较采用χ2检验或Fisher精确概率检验法,P≤0.05为差异有统计学意义。使用组内相关系数(intraclass correlation coefficient,ICC)分析两次测得的组学特征,同时选取PA组与WT组中ICC>0.75的特征[8],然后选取组间差异有统计学意义的特征参数,将参数归一化在[0,1]之间后再通过最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归分析进一步筛选,LASSO回归模型的最优λ值通过10折交叉验证获得。利用筛选的特征参数建立随机森林(random forest,RF)、逻辑回归(logistic regression,LR)与支持向量机(support vector machine,SVM)分类模型,验证方式选择10折交叉验证,应用受试者工作特征(receiver operating characteristic,ROC)曲线评估分类模型的效能,指标包括准确度、灵敏度、特异度和曲线下面积(area under curve,AUC)。ICC分析得出重复性良好的特征参数,后续的数据分析以两次提取的特征参数的平均值进行。
PA组、WT组两组间年龄分布差异无统计学意义(P=0.106),两组间性别分布差异有统计学意义(P<0.001),性别区分两组的准确度、灵敏度、特异度和AUC分别为78.1%、92.0%、64.3%及0.781。
通过ICC分析后选出176个特征参数,其中PA与WT之间差异有统计学意义的特征参数共49个,GLCM数量最多,共39个,GLRLM、HA、AG、AR数量分别为4、3、1、2。图2中间的黑色垂直线代表模型的最优λ值,此时模型最精确,以此模型选出的特征参数共11个(表1),各参数的系数见图3,直方图越长,代表系数绝对值越大。
图2 LASSO模型筛选特征参数图
图3 LASSO模型选出的特征参数系数图
表1 模型特征子集在PA与WT间的比较 M(Q1,Q2)
3种分类模型中,RF分类模型的效能最高,详见表2,ROC曲线见图4。
表2 3个分类模型在PA与WT间的鉴别效能
图4 3个分类模型鉴别PA与WT的ROC曲线
本研究利用CT平扫图像提取259个放射组学特征,筛选出11个特征参数作为特征子集建立RF、LR及SVM分类模型,均得到了良好的分类效果,其中RF分类模型的效能最佳,准确度、灵敏度、特异度及AUC分别达到83.3%、78.6%、88.0%及0.882。
PA患者以女性居多,而WT好发于中老年男性[4,9],本研究结果显示WT组的男性比例明显高于PA组(P<0.001),其准确度、灵敏度、特异度和AUC分别为78.1%、92.0%、64.3%及0.781,表明性别分布可为PA与WT的鉴别诊断提供依据,与既往研究[4,9]结果一致。
放射组学特征中的GLCM在肿瘤的病理学分级及肿瘤间的鉴别诊断中发挥着重要作用。Vamvakas等[10]利用多个MRI序列中的放射组学特征,建立模型对脑胶质瘤进行病理学分级,模型的最佳特征子集中GLCM参数所占比例最高。任继亮等[11]从常规MRI序列中提取放射组学特征对眼眶淋巴瘤与炎性假瘤进行鉴别,T1加权成像与T2加权成像序列的最佳特征主要集中在GLCM与GLRLM,对比增强T1加权成像序列的最佳特征主要集中在GLCM与HA,各序列中GLCM参数在鉴别诊断中均表现出良好效能。本研究提取CT平扫图像中的HA、GLCM、GLRLM、AG和AR这5种特征,在PA与WT间差异有统计学意义的特征中以GLCM数量最多,经过LASSO分析进一步筛选得出分类模型的特征子集,也发现GLCM的特征参数在子集中所占权重最大,结果均与既往研究[10-11]的结果相仿。
放射组学特征包括一阶、二阶和高阶特征,从不同角度反映肿瘤内部的异质性[12],利用这些特征建立不同的分类模型对疾病进行诊断已有广泛的研究[13-15]。Wang等[15]为了预测头颈部鳞状细胞癌非手术治疗后局部复发,提取了CT图像和正电子发射体层成像(positron emission tomography,PET)图像中的放射学特征后建立了SVM、判别分析(discriminant analysis,DA)和LR预测模型,取得了良好的预测效果,最佳AUC达0.76。蔡俊辉等[16]利用CT图像的放射组学特征建立SVM、RF及LR分类模型,预测表现为磨玻璃结节的肺腺癌的浸润性,其中SVM分类模型的效能最佳,准确度、AUC分别为93.30%、0.94。本研究亦利用CT图像的放射组学特征建立了RF、LR及SVM这3种模型,均取得了良好的分类效能,RF分类模型的效能最佳,且效能优于性别的分类效能,但最优模型与既往研究[16-17]并不一致,这可能与研究的数据及模型本身的算法有关。
本研究存在的不足之处:① 纳入样本量较少,仍需扩大样本量以提高分类模型的可信度;② 仅分析了CT平扫图像的放射组学特征,而未研究CT增强图像的放射组学特征;③ 仅利用放射组学特征建立分类模型,未纳入肿瘤形态学特征及临床资料。
综上所述,通过分析病灶的影像学表现与临床资料常可有效地鉴别PA与WT,但在影像学资料不全或鉴别困难的情况下,利用CT平扫图像的放射组学特征建立分类模型,可为PA与WT的鉴别诊断提供参考信息。