范海云, 陈基明, 陈亮亮, 吴敬医, 吴莉莉, 周慧
急性胰腺炎(acute pancreatitis,AP)是消化系统常见的急腹症,其发病机制是因胰酶异常激活破坏腺泡细胞及其附近的腹膜,引起胰腺及其周围组织水肿、积液、坏死及感染等病理改变,炎性胰液还可向胰腺外脏器组织内扩散、浸润,引起相应器官及系统功能障碍,促使局部及全身炎症反应的发生[1-3]。如何早期准确预测病程的发展直接影响到患者预后。已有多种评分系统评价AP的不良结果,如急性生理与慢性健康评估(acute physiology and chronic headlthevaluation,APACHE-Ⅱ)、AP床旁严重度指数(bedside index for severity in acute pancreatitis,BISAP)及改良的CT严重度指数(meliorate computed tomography severity index,MCTSI)等,但效能都不高[4]。影像学预测胰腺疾病的进程和预后具有重要作用,影像学精确诊断是临床精准治疗的前提[5]。CT是评估AP严重程度及并发症的主要方法[6],Lankisch等[7]认为胰周积液的存在程度与AP的不良结果显著相关,已有研究[8]证明胰腺外坏死体积能够早期预测AP的严重程度,然而CT表现难以在AP的早期阶段预测进展[9]。
影像组学是一种新兴技术,可从图像中提取人类肉眼难以观察及分辨的大量参数,并通过多种算法将图像数据转化为高维和可挖掘的数据,故能对疾病的异质性进行全面量化分析[10-11]。目前有关急性胰腺炎的影像组学研究较少且都是基于胰腺实质进行分析[12-13],能否基于胰周脂肪间隙影像组学分析早期预测AP疾病进展,尚未有相关研究报道。本研究基于CT平扫及增强图像,通过纳入临床、影像学及纹理特征等多参数,对胰周脂肪间隙进行影像组学分析,探究其预测早期AP疾病进展的价值。
采用回顾性病例对照研究方法。搜集皖南医学院弋矶山医院2013年11月-2021年6月123例根据新修订的亚特兰大分类诊断为AP患者的临床及影像学资料。纳入标准:①首次发病入院;②早期阶段(发病1周内[14-15])接受CT平扫及增强检查;③所有患者均进行2次CT检查。排除标准:①图像不全或质量不佳影响观测;②自身免疫性胰腺炎、胰腺肿瘤或创伤;③难以勾画胰周脂肪间隙的ROI。根据影像学及临床实验室等指标是否出现新的并发症(包括局部并发症:11例急性胰腺周围积液、2例急性坏死性积聚、6例胰腺假性囊肿、2例包裹性坏死、1例感染性胰腺坏死、2例静脉血栓、1例假性动脉瘤;全身并发症:4例全身炎症反应综合征、2例器官功能衰竭)及局部并发症的加重(7例急性胰腺周围积液增多、1例急性坏死性积聚范围增大),将AP患者分为进展组(n=39)与非进展组(n=84)。采用计算机完全随机方法将患者按7:3的比例分为训练组87例(进展组28例,非进展组59例)和验证组36例(进展组11例,非进展组25例)。
搜集患者的临床资料及实验室检查数据,包括性别、年龄、病因、症状、体征、淀粉酶、脂肪酶、血钙、尿素氮、肌酐值,使用急性胰腺炎BISAP对患者进行评分,BISAP评分标准包括 ①血尿素氮;②意识障碍;③SIRS;④年龄;⑤胸腔积液。
采用飞利浦64排螺旋CT机对AP患者进行上腹部或全腹部MSCT平扫及增强扫描,患者取仰卧位,图像采集参数:管电压为120 kV,管电流为220 mA,层厚5 mm,层间5 mm,DFOV为30 cm×30 cm。使用碘克沙醇100 mL:32 g(Ⅰ)对比剂,经右肘前静脉注射对比剂1.5 mL/kg,注射流率2.5 mL/s,分别于注射后动脉期25 s、静脉期40~65 s和延迟期3 min采集图像。
由2名诊断医师(具有5年和15年工作经验)盲法分析CT检查图像,评价AP的影像特征包括胰腺大小、类型(根据病变累及胰腺范围分为弥漫性与局限性)、边缘、胰周脂肪间隙密度及强化程度等,并进行改良的MCTSI评分,意见不一致时,由两名医生讨论后决定。于增强静脉期测量肿大胰腺最大前后径,分别在平扫、动脉期、静脉期和延迟期放置感兴趣区(region of interest,ROI)测量炎症胰腺前方(距胰腺前缘3~5 mm范围)的脂肪间隙密度,并计算动脉期、静脉期和延迟期强化率,所有ROI形状、大小相同,均测量3次,计算其平均值。
图1 CT静脉期图像,用ITK-SNAP软件手动勾画距炎症胰腺前缘3~5mm范围内的单层脂肪间隙的闭合ROI。
将所有患者的CT平扫、动脉、静脉及延迟期图像从PACS系统工作站以DICOM格式导出,再依次导入ITK-SNP软件(3.6.0版本),窗宽、窗位调整为(350、50),由2名放射科医师(具有5年和15年以上工作经验)对各期通过人工手动分割的方法勾画距炎症胰腺前缘3~5 mm范围的单层脂肪间隙(图1),再分别将勾画出图像转入AK(GE Healthcare Analysis Kit,3.2.0版)软件中,通过提取影像组学特征及滤波变换获取图像信息(包括一阶特征、形态特征、灰度共生矩阵特征、灰度区域大小矩阵特征、灰度游程矩阵特征、邻域灰度差矩阵特征、灰度依赖矩阵特征以及拉普拉斯-高斯滤波、小波分析、局部二值模式变换)。通过组内相关系数(intraclass correlation coefficient,ICC)评价2名医师提取纹理特征的一致性,并保留一致性较好(ICC>0.80)的特征,依次使用最小冗余最大相关(minimum redundancy maximum relevance,mRMR)和最小绝对值收敛和选择算子(least absolute shrinkage and selection operator,LASSO)回归对保留的特征进行降维、筛选,获取最佳特征子集。以此分别构建各期影像的组学标签,通过计算各个特征权重得出每个患者的标签得分(Rad-score)。
使用SPSS24.0软件、R软件(版本4.0.4)和MedCalc软件(Version19.0.2)进行统计分析。采用Kolmogorov-Smirnov检验对计量资料进行正态性检验,符合正态分布者以均数±标准差表示,偏态分布者以中位数表示。计量资料组间比较采用独立样本t检验(正态分布且方差齐性),Mann-WhineyU检验(偏态分布或方差不齐);计数资料组间比较采用χ2检验或Fisher检验。采用ICC评价提取纹理特征的一致性。利用mRMR选择纹理特征,然后经LASSO回归进一步筛选纹理特征并构建影像组学标签,根据特征权重计算每个患者的Rad-score;通过100次留组交叉验证(leave-group-out cross validation,LGOCV)评判模型的可靠性。采用多因素logistic回归分析,并使用方差膨胀因子(variance inflation factor,VIF)进行共线性检查,构建预测模型,绘制校正曲线来评价模型的拟合优度,并使用Hosmer-Lemeshow检验评价校准曲线的一致性,计算受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC),通过DeLong检验比较多个模型间AUC,绘制决策曲线分析(decision curve analysis,DCA)比较模型的临床净收益。P<0.05表示差异有统计学意义。
在训练组和验证组中,进展组与非进展组患者间血钙、边缘差异均有统计学意义,其余临床及CT特征变量差异均无统计学意义(表1)。经共线性检查将训练组P<0.05的变量纳入多因素logistic回归分析建立包括临床资料及CT特征的临床模型,临床模型得分=4.078-2.464×血钙+1.749×边缘。结果显示血钙和边缘(OR=0.085,P=0.040和OR=5.750,P=0.020)是独立预测因子。绘制ROC曲线,结果显示临床模型在训练组和验证组中AUC分别为0.70、0.83(表2、图2)。
表1 进展组和非进展组患者在训练组和验证组中的临床和CT特征
表2 临床模型、影像组学标签及影像组学预测模型ROC结果
图2 各预测模型ROC曲线。a)训练组;b)验证组。 图3 采用 LASSO 进行特征筛选。a) 联合序列训练组中使用 LASSO 方法对纹理特征进行降维,左侧垂直虚线代表最佳Lambda值对应的Log(Lambda)值,选取标准为最小化标准,图片顶端数值为特征数; b) 联合序列训练组中不同纹理特征在LASSO收敛系数图,虚线为使十倍交叉运算的Lambda值绘制,每条曲线代表每一个自变量的变化轨迹,图中显示了14个非零系数的纹理特征。
2名医师测量组间ICC为0.831(95%CI:0.716~0.925,P<0.05),ICC>0.80说明特征提取的一致性较好,选取高年资医师提取的特征进行影像组学分析。
AK软件从平扫、动脉、静脉及延迟期每个序列图像经纹理提取和滤波变换后各获得1316个纹理特征,共于4个序列提取5264个纹理特征,经mRMR 去除冗余特征,再经LASSO回归筛选最优超参数λ(图3a)以及在此时λ系数不为0的特征(图3b),于平扫、动脉期、静脉、延迟期及联合序列中分别得到15、12、7、14、14个价值较大的纹理特征(图4),再分别建立影像组学标签,根据各期特征的权重计算出每个患者的影像组学标签得分。100次LGOCV显示单独序列和4期联合序列模型均有良好的稳定性。经ROC曲线分析,平扫序列与联合序列影像组学标签均有相对更好的预测效能。AUC在训练组中均为0.94,在验证组中分别为0.95、0.96(表2),经DeLong检验各序列影像组学标签间差异均无统计学意义(P>0.05),平扫序列及联合序列影像组学标签与临床模型间差异有统计学意义(Z=3.739、3.298,P<0.001、P=0.001)。
图4 联合序列影像组学标签的纹理特征及权重。
图5 联合序列个性化模型的校正曲线。a) 训练组;b) 验证组。
平扫和联合序列影像组学标签预测效能相对较高,本研究将平扫和联合序列影像组学标签分别与临床资料及CT特征通过多因素Logistic回归分析建立个性化预测模型。建立的平扫序列个性化模型预测效能较高,但校正曲线经Hosmer-Lemeshow检验拟合效果较差(训练组χ2=34779,P<0.001,验证组χ2=6.941,P=0.543),因此仅对联合序列个性化模型进行结果分析。联合序列个性化预测模型得分=8.483-4.515×血钙+2.619×边缘+1.300×联合序列影像组学标签。结果显示联合序列影像组学标签(OR=3.668,P<0.001)及边缘(OR=13.719,P=0.033)为预测早期AP患者疾病进展的独立危险因子(表3)。通过ROC曲线分析,在训练组和验证组中联合序列个性化模型的预测效能均相对较高,AUC分别为0.97、0.98(表2,图2),经DeLong检验,联合序列个性化模型与平扫及联合序列影像组学标签间差异无统计学意义(Z=1.139、1.265,P=0.255、0.206),与临床模型对比差异有统计学意义(Z=4.365,P<0.001)。训练组和验证组的校正曲线(图5)经Hosmer-Lemeshow检验都显示了良好的拟合效果(训练组χ2=7.481,P=0.486,验证组χ2=9.103,P=0.334)。DCA显示平扫及联合序列个性化模型与平扫及联合序列影像组学标签预测AP进展的临床净获益明显优于临床模型(图6),其中联合序列个性化模型与联合序列影像组学标签更好。
本研究结果表明平扫、联合序列影像组学标签及平扫、联合序列个性化模型预测早期AP患者病程进展的诊断效能明显优于临床预测模型,有助于临床医生尽早识别可能发生进展的AP患者,对其进行密集监测和制定正确干预措施,改善患者的预后。
目前临床评估AP患者严重程度及预后常采用APACHE-Ⅱ、BISAP等评分标准,但这些评分标准有自己的缺点,如费用高、项目多、使用烦琐等,所需时间长(约48h后)[16]。BISAP评分相对简单易行、准确率高,但在本研究中BISAP评分在预测AP病情进展上差异无统计学意义,可能与样本量较少有关。本研究纳入多种有潜在预测价值的临床资料、CT特征中仅血钙和边缘差异有统计学意义,且二者都是临床模型的独立预测因子。Kawas等[17]认为低血钙是SAP患者多系统器官功能衰竭的早期敏感指标,本研究中AP进展组患者血钙水平低于AP非进展组患者。胰腺边缘模糊或毛糙是AP最基本的CT表现,结果显示进展组患者胰腺边缘模糊的病例数较非进展组的要多,早期阶段胰腺边缘模糊对预测疾病进展存在一定的价值。但基于临床资料、CT特征建立的临床模型在训练组中的AUC为0.70,准确率0.62,诊断效能较低。
表3 训练组预测急性胰腺炎进展联合序列个性化模型的独立危险因素
图6 临床模型、平扫及联合序列影像组学标签和平扫及联合序列个性化模型预测AP进展决策曲线。All表示所有AP进展患者,None表示所有AP非进展患者。
急性胰腺炎因胰酶破坏腺泡细胞,炎性胰液容易向胰周脂肪间隙及胰腺外脏器扩散 、浸润,胰周脂肪间隙可早期受到影响,胰周脂肪间隙的CT值及其特征变化可以反映炎症严重程度,由此预测AP进展。已有研究[7-8]证明胰周积液及胰腺外坏死体积对预测AP的不良结果有显著价值。但CT难以深层细致反映AP病理特征,且存在一定的主观性。影像组学特征能够以较低的成本客观定量地获取更多关于胰周脂肪间隙内部异质性的信息,有助于预测临床结果。本研究对胰周脂肪间隙提取纹理特征分别建立平扫、动脉、静脉、延迟及联合序列影像组学标签模型,预测效能都比较好(训练组中AUC分别为0.94、0.89、0.90、0.88、0.94,验证组中AUC分别为0.95、0.92、0.89、0.92、0.96),其中平扫序列与联合序列影像组学标签诊断效能更好,平扫序列与联合序列影像组学标签效能没有显著性差异(Z=0.234,P=0.815)。由于AP进展过程复杂,受多种临床及病理因素影响,我们将平扫及联合序列影像组学标签分别与临床资料及CT特征结合建立个性化模型,结果显示没有明显提高诊断效能(平扫及联合序列个性化模型在两组中的AUC分别为0.94、0.99,0.97、0.98),说明临床资料与常规CT特征贡献较小。DCA显示平扫、联合序列影像组学标签与平扫、联合个性化模型临床收益均明显优于临床模型,其中联合序列个性化模型与联合序列影像组学标签更好。单层平扫序列影像组学标签在训练组和验证组中诊断效能均较好,相对简单且无需注射对比剂,在日常工作中易操作实行,可作为生物标志物方便预测AP进展。
本研究的局限性:①胰腺周围形态不规则难以准确勾画ROI,本研究提取的影像组学特征都是基于病变胰腺最大层面的胰腺前方脂肪间隙的二维图像特征,对整个胰腺周围脂肪间隙的CT图像进行三维图像特征提取,可能更好反映病变的异质性;②采用回顾性研究,样本可能存在选择偏倚;③样本数还不够大且为单中心研究,还需多中心研究进行验证;④手动勾画ROI及评判影像特征受个人主观因素影响。
综上所述,平扫、联合序列影像组学标签及平扫、联合序列个性化模型预测早期AP病情进展具有较高的价值,明显优于临床模型,均具有较好的临床收益。平扫序列影像组学标签简便有效,是有潜在的应用前景生物标志物。