徐茂丽, 阮志兵*, 刘欢, 雷平贵, 孟婷, 卜碧玉
(1.贵州医科大学附属医院 影像科, 贵州 贵阳 550004; 2.贵州医科大学 医学影像学院, 贵州 贵阳 550004; 3.通用电气药业(上海)有限公司 高级应用团队, 上海 210000)
肿块型慢性胰腺炎(mass-forming chronic pancreatitis, MFCP)与胰腺癌(pancreatic cancer, PC)的多模态影像学征象及临床表现存在重叠,术前早期鉴别诊断存在困难,两种疾病的治疗手段和预后截然不同,早期根治性手术切除是PC有效治疗方法[1-3]。临床上将MFCP误诊为恶性肿瘤而采取不必要的外科手术或将 PC 误诊为MFCP而延误最佳手术时机的病例不在少数,术前早期鉴别诊断是有效实施精准治疗和改善患者预后的关键[4]。增强CT检查是临床应用最广、鉴别诊断PC及MFCP最重要影像学检查方法,但其准确性又依赖于放射医师的临床经验与主观判断[5];两种疾病鉴别的金标准主要靠穿刺活检,这不仅有创且存在假阴性,亦可能导致肿瘤种植与胰漏等问题[6]。影像组学作为新兴的无创辅助诊断技术,可在传统影像图像中提取大量肉眼无法观察的影像特征,并转化为可挖掘量化的、有重要诊疗价值的数据信息[7-8]。目前已知影像组学在脑肿瘤、乳腺肿瘤、胰腺肿瘤等疾病鉴别诊断中取得了较好的研究结果[9-13],而其在MFCP和PC鉴别诊断方面的报道较少,且一般为单中心回顾性研究、样本量有限[12-13]。本研究探讨基于增强CT影像组学模型在鉴别诊断MFCP和PC中的价值,以期为术前无创鉴别两种疾病提供新的可行科学手段,为临床决策及个性化治疗提供帮助。
选取2010年1月—2020年1月PC患者与MFCP患者分别作为PC组和MFCP组,纳入标准:(1)病理确诊为PC及MFCP;(2)MFCP临床随访2年,团块无进展,无临床恶性表现,肿瘤标志物为阴性;(3)所有受试者均行增强CT检查且资料完整符合研究要求;(4)CT检查前未进行系统治疗及抗肿瘤治疗者。排除标准:(1)存在其他部位恶性肿瘤者;(2)CT图像达不到研究要求者。共纳入PC组患者92例,男50例、女42例,年龄27~81岁、平均(60.3±11.3)岁;MFCP组患者61例,男53例、女8例,年龄9~79岁、平均年龄(48.7±12.1)岁。本研究获得医院伦理学会的批准(2020论审第276-01号)。
1.2.1临床资料 收集2组患者住院期间一般临床资料(性别、年龄)及术前影像增强CT图像资料。
1.2.2CT检查方法 使用西门子 64排128层螺旋CT机(SOMATOM Definition AS)进行常规腹部CT增强扫描,CT扫描参数:管电压120 kV,管电流200~250 mAs,重建层间距及层厚均为5 mm。使用高压注射剂经肘静脉注入对比剂碘海醇(300 g/L),剂量70~100 mL,注射速率2.5~3 mL/s,于注射造影剂后30 s、60 s及120 s时分别进行动脉期、静脉期及延迟期扫描,扫描后将所有图像传入影像归档和通信系统(picture archiving and communication system,PACS)。
1.2.3感兴趣区分割 PC患者CT增强动脉期分割时容易区分肿瘤和正常组织,所以使用动脉期图像进行特征提取,将2组患者的 CT 动脉期图像从PACS系统中导出,导入3 D Slicer软件(http://www.slicer.org,4.8.1版本)。由2名5年腹部CT影像工作经验的放射科医师手动沿病灶轮廓边缘逐层勾画感兴趣区(region of interest,ROI;图1和图2),共同确认并做必要的修改,最后得到病灶的三维体积兴趣区(volume of interest,VOI)。
注:A 为CT增强扫描动脉期轴位显示胰尾部低强化团块,边界欠清;B 为胰尾部肿块病灶单层面标注示意图;C 为胰尾部肿块病灶逐层标注与病灶分割提取后的三维立体图。图1 某MFCP患者胰腺尾部病灶ROI勾画Fig.1 ROI delineation of pancreatic tail lesion in the patient with MFCP
注:A 为CT增强扫描动脉期轴位显示胰体尾部低强化团块,边界不清;B 为胰体尾部PC病灶单层面标注图;C 为胰体尾部PC病灶逐层标注与病灶分割提取后的三维立体图。图2 某PC患者胰腺体尾部病灶ROI勾画Fig.2 ROI delineation of pancreatic body and tail lesions in the patient with PC
1.2.4影像组学特征提取 将获得的VOI图像及原始图像,导入Artificial Intelligence Kit (AK) 软件(version 3.3.0, GE Healthcare) 对VOI进行特征提取,严格参照图像标志物标准化倡议(image biomarker standardization initiative,IBSI),包括一阶特征、形状特征、灰度依赖矩阵(gray-level dependence matrix, GLDM)、区域大小共生矩阵(gray-level size zone matrix,GLSZM)、灰度游程矩阵(gray-level run-length matrix,GLRLM)、邻域色调差异矩阵(neighborhood gray tone difference matrix, NGTDM)、灰度共生矩阵(gray-level co-occurrence matrix,GLCM)、以及图像变换特征、小波变换和拉普拉斯变换特征在内的共1 037个特征。
1.2.5特征筛选及模型建立 数据集按照 7 ∶3 随机分层抽样方法分为106例训练组(MFCP 42例,PC 64例)和47例验证组(MFCP 19例,PC 28例),分析之前先对特征数据进行预处理(包括提出异常值和缺失值使用中值替代),然后对数据做标准化处理。为了避免模型过拟合,将预处理后的获得全部特征通过Spearman相关性分析(阈值为0.9)、曼惠特尼U检验和梯度提升决策树算法、多元逻辑回归分析依次降维筛选掉冗余的特征,保留有效、稳定性高、可重复性的最优影像组学特征参数。建立基于最优影像组学特征参数的逻辑回归模型,通过绘制受试者工作特征曲线 (receiver operating characteristic, ROC)并计算ROC曲线下面积 (area under the curve,AUC),对结果进行评估,验证组独立验证模型的效能。
MFCP组患者中男性比例高于PC组(P<0.001),患病年龄低于PC组(P<0.001),MFCP及PC多好发胰腺头颈部,且二者均可发生坏死、囊变及出现双管征;MFCP组患者假性囊肿发生率高于PC,PC组患者胰周淋巴结肿大发生率高于MFCP,差异均有统计学意义(P<0.001)。见表1。
表1 MFCP与PC组患者的临床资料及CT影像学特征Tab.1 Comparison of clinical data and CT imaging features between MFCP and PC group
总共提取1 037个影像特征。在训练队列中,利用Spearman相关性分析提取的1 037个特征进行第1次特征降维,剔除相关系数影像组学模型的建立及效能评估>0.9的特征,得到386个组学特征;采用曼惠特尼U检验进行第2次降维,得到296个组学特征;采用梯度提升决策树算法进行第3次降维,得到36个影像组学特征;通过多变量逻辑回归分析再次降维,自动筛选出7项纹理特征(表2),包括3个一阶特征(总能量、偏熵、球形度),4个纹理特征(灰度共生矩阵的最大相关系数、区域大小共生矩阵的区域熵、尺寸区域非均匀标准化、邻域色调差异矩),并绘制影像特征相关系数图(图3)。
表2 训练组患者影像组学特征及权重系数Tab.2 Radiomics features and weight coefficients of the training group
注:右侧刻度表示相关系数对应的颜色深浅,刻度线上>0为正相关,<0为负相关(取绝对值),颜色越深值越高。图3 MFCP与PC患者影像特征的相关系数Fig.3 Correlation coefficient of radiomics features between MFCP and PC patients
基于精选的7个系数非零的稳定特征在训练组中构建多元逻辑回归模型,在验证组中进行模型验证,绘制两组的影像组学评分(Rad-score,图4)及ROC曲线(图5),计算AUC、准确度、敏感度、特异度、阳性预测值及阴性预测值。在训练组中影像组学特征构建的预测模型对鉴别MFCP与PC的AUC、准确度、敏感度、特异度、阳性预测值及阴性预测值分别为0.967 、0.905、0.889、0.929、0.949及0.848,在验证组中AUC、准确度、敏感度、特异度、阳性预测值及阴性预测值分别为0.968、0.787、0.679、0.947、0.950及0.667(表3)。
表3 影像组学预测模型对MFCP与PC患者的鉴别诊断效能Tab.3 Efficacy of radiomics prediction model in differentiating MFCP from PC patients
注:红色为MFCP,蓝色为PC。图4 训练组和验证组患者预测模型的Rad-scoreFig.4 Rad-score of the patient prediction model in the training and validation groups
注: A、B分别为训练组和验证组。图5 训练组和验证组预测模型的ROC曲线Fig.5 ROC curves of the training and validation groups
近年来PC及MFCP的发病率有所上升,早期对两者进行鉴别诊断是临床的迫切需求与挑战[13],MFCP与PC在CT上均可发生囊变坏死,甚至均可出现双管征,部分患者两者常规影像存在重叠导致难以鉴别。管霞等[14]研究表明CT在其鉴别诊断准确度为77.50%,敏感度为78.08%,特异度为76.60%,说明常规影像存在不足,诊断结果与诊断医生的主观因素与经验密切相关,容易导致漏诊/误诊。因此探讨新的、可行的、无创快速提高鉴别诊断方法是临床的迫切需求。
影像组学通过高通量、无创的从传统影像图片中提取肉眼无法看到的潜在特征,比如纹理参数、形状特征等,反应不同组织之间的细微差别,从而提供更多有效的诊断信息,可为肿瘤诊疗提供帮助,其在肿瘤的研究已成为全球关注热点[15-17]。大多研究结果表明影像组学在PC的鉴别诊断取得较好的诊断效能[18-22],Li等[23]研究表明CT纹理分析特别是第5百分位数和5+偏斜度对鉴别胰腺导管腺癌与不典型胰腺神经内分泌肿瘤有价值;Park等[24]采用随机森林算法区别89例自身免疫性胰腺炎与93例胰腺导管腺癌,AUC为0.975,准确度高达95.20%;张晶晶等[25]对21例胰头肿块型胰腺炎与47例胰头癌进行纹理分析,提取了160个纹理特征,包括游程矩阵、灰度共生矩阵及直方图参数。与上述研究相比,本研究扩大了样本量,且增加了形状特征、基于滤波变换特征参数,其中滤波变换特征通过改变图像的频率而获得更大信息量,由此提取了更多影像组学特征,更能体现病变的异质性。本研究初步提取出1 037个影像组学特征,再通过4种方法逐步降维及筛选出最佳影像组学特征,最终得到7个最有价值的影像组学特征,分别代表着CT图像中不同的纹理和强度,反映了肿块ROI的细微变化及不均质。其中球形度反映VOI形状与球形度的接近程度,其值越大,越接近球形。PC球形度值高于MFCP,表明PC更接近球形。尺寸区域非均匀标准化反映整个图像中大小区域体积的变异性,特征值越低表示图像中区域大小体积之间的同质性更高。区域熵用来测量区域大小和灰度等级分布中的随机性,特征值越高表示纹理图案中的异质性更高。本研究得出PC的尺寸区域非均匀标准化及区域熵值更高,推测这是因为PC癌细胞、新生血管及肿瘤组织坏死与正常胰腺组织在组织学水平上存在明显异型性,亦符合PC的病理特征。偏度反映单个CT灰度值相对平均值的值分布的不对称性。邻域色调差异矩越高表示像素之间及其附近的强度快速变化,MFCP邻域色调差异矩及偏度值更高,推测可能由于MFCP更容易发生钙化及形成假性囊肿,MFCP钙化多为斑片状及结节状同时存在,PC钙化通常为结节状且数量较少,从而MFCP病灶内密度更加不均匀,其内CT值差异更大,结果符合PC与MFCP不同的生物学行为。最大相关系数反映纹理特征的复杂度,PC由于病理及组织学分型复杂多样,其内纹理特征更加复杂。采用逻辑回归机器学习方法建立影像组学模型及效能评估鉴别诊断MFCP与PDCA,算出训练组AUC值为0.967 ,验证组AUC值为0.968。在训练组和验证组的对照中,阳性预测值二者接近,验证组特异度低于训练组,基于增强CT扫描图像建立的影像学组学特征模型在鉴别MFCP与PC中具有明显价值,证明了此方法的可行性及优效性。
综上所述,基于增强CT影像组学模型对鉴别MFCP与PC具有价值,研究可行,为MFCP与PC鉴别诊断的临床难题提供了新思路及无创有效的定量手段,可作为传统影像诊断模式的有力补充。本研究不足之处包括:(1)本研究为单中心回顾性研究、样本量有限,需要进一步扩大样本量及联合多中心研究提高模型的诊断效能;(2)本研究仅在增强CT动脉期上分析切割图像,采用多期图像联合建模及在MRI上进行是否会获得更有利、更有价值的影像组学特征值得下一步研究;(3)本研究手动勾画感兴趣区存在一定的主观性及不可避免的误差而可能影响研究结果的精准性;(4)本研究仅采用一种机器学习模型,下一步将联合多种机器学习模型进行研究进而提高其模型的鉴别效能。