唐玲玲 黄小华 刘念 胡云涛 成涛 雷力行
随着人工智能的发展,影像组学应运而生,它能高通量地从医学影像中提取宏观及微观特征,反映出肉眼无法识别的影像信息,故能对疾病的异质性进行全面量化分析[1]。胰腺疾病复杂多样,大多起病隐匿且病变异质性强,因此胰腺疾病的早期诊断、风险分层、治疗反应监测及预后等一直是影像组学研究的热点与难点。本文主要就影像组学在胰腺疾病方面的研究进展予以综述。
Lambin 等[2]假设肿瘤的时空异质性可以用基于宏观图像的特征来定量表示,首次提出了影像组学的概念,即“从放射图像中高通量提取影像学特征”。与传统的临床诊断中依靠医师从视觉上解读医学图像相比,影像组学可深入挖掘出图像的定性与定量特征用于提供临床决策支持。影像组学工作流程包括以下方面:①图像采集:应尽量设置相同的条件参数,并尽量减少图像的伪影及噪声,以获得最能反映真实的图像。②图像分割:对目标组织特征精确提取,并减少其他组织的干扰,包括手动分割、半自动分割及自动分割3 种方法。③特征提取:影像组学特征包括表面积、体积等形态特征[3],能量、熵等强度特征,以及灰度共生矩阵、灰度游程矩阵等纹理特征[4]。④特征选择:目的是为了简化模型,通常的方法有非监督方法(常用聚类分析和主成分分析)和监督方法(随机森林、最小绝对收缩和选择算子、逻辑回归等)。⑤模型建立与评估:在将预测模型应用于临床之前,必须评估模型的稳定性和可重复性[5]。
急性胰腺炎(acute pancreatitis,AP)发病率逐年增加,该病易复发且病程和预后很难预测,其中重症急性胰腺炎(severe acute pancreatitis,SAP)的死亡率接近30%[6]。Lin 等[7]采用基于增强MRI 的高维影像组学特征早期预测AP 严重程度,对轻度AP 和中、重度AP 预测的受试者操作特征(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC)在训练队列和验证队列中分别为0.917和0.848,准确度分别为85.6%和81.0%,优于临床常用的几种评分系统(急性生理与慢性健康评分、CT 严重指数等)。Iranmahboob 等[8]对AP 病人的ADC 图进行直方图分析,发现峰度阈值>2.47 时能够预测新的并发症(包括新的液体积聚、胰腺坏死、静脉血栓形成或假性动脉瘤),敏感度为75.0%,特异度为91.9%,AUC 值为0.784。峰度增加能预测新的并发症的确切机制尚不清楚,推测是由于峰度表征了组织偏离正常的程度,这反映了潜在的炎性和黏液性改变使病人更容易出现并发症。
AP 首次发作后的复发率约为22%,其中一些病人最终进展为慢性胰腺炎[9]。Chen 等[10]采用基于增强CT 动脉期和静脉期的影像组学特征预测AP复发,训练队列和验证队列的准确度分别为87.1%和89.0%,AUC 分别为0.941 和0.929。推测AP 首次发作后会引起常规医学方法不易检测到的胰腺实质长期或永久性变化,如显微解剖、表观遗传和/或免疫等方面的变化,这些变化会增加AP 的复发概率,而影像组学能揭示隐藏在常规影像中的细节信息,所以对复发有较强的预测能力。
有研究[11]发现基于增强CT 的影像组学特征中,熵(熵是异质性的一种度量)和对比度(对比度能量化相邻体素之间的强度差异)可以鉴别功能性腹痛、复发性胰腺炎和慢性胰腺炎。功能性腹痛中胰腺的熵和对比度最低;慢性胰腺炎由于纤维化、钙化的存在,熵和对比度最高;复发性胰腺炎的熵和对比度居于两者之间。Zhang 等[12]发现基于18FFDG PET/CT 影像的多模态和多维度的特征集有利于无创性鉴别自身免疫性胰腺炎和胰腺导管腺癌,且在采用支持向量机(support vector machine,SVM)-递归特征消除的特征选择策略的同时,使用线性SVM 分类器进行模型训练,所构建的模型诊断效能最高。
值得注意的是,目前影像组学在胰腺炎中的研究大多为单中心回顾性,且样本量较小,故应用于临床之前还需进行更深入的研究,以验证其可靠性与鲁棒性。
3.1 胰腺癌(pancreatic carcinoma,PC) PC 预后差且治疗反应个体差异大一直是胰腺影像组学研究的焦点。影像组学能够对PC 进行诊断与鉴别诊断。Chu 等[13]应用基于整个胰腺3D 体积的形状和二维纹理特征分析的算法来区分胰腺导管腺癌(pancreatic ductal adenocarcinoma,PDAC)和正常的胰腺组织,准确度为99.2%,AUC 为99.9%;所有PDAC 病例均被正确归类;1 例来自肾供者的正常胰腺组织被归类为PDAC(假阳性),可能是由于病人胆囊切除术后体内钛夹形成的伪影导致影像组学特征的改变。该研究提出可将该算法与器官自动分割算法相结合,以自动检测PDAC,并能区分正常组织与病灶边界,更有利于手术切除。
影像组学方法还可以用于PDAC 的分级及隐匿性转移性疾病的预测。Cassinotto 等[14]对PDAC 病人术前CT 门静脉期影像进行密度测量和纹理分析,发现PDAC 肿瘤内低密度区与高度不典型增生相关,认为低密度区可能与PDAC 坏死相关,或者因为PDAC 的高度纤维化导致对比剂累积延迟。该研究在PDAC 病人队列中使用0.5 cm2圆形ROI 并进行标准化测量,虽然降低了PDAC 大小带来的影响,但会忽略PDAC 外围与组织病理分级相关的重要信号,所以在影像组学研究中ROI 的最优选取方法还需要进一步的探索。Gao 等[15]研究发现18FFDG PET/MR 影像中PDAC 原发肿瘤的多参数和纹理特征是术前预测PDAC 隐匿性转移的可靠生物标志物,PDAC 的PET 影像和ADC 图的不均一性越高,转移的风险越高;且总病灶糖酵解较高的PDAC病人,其ADC 图异质性更高,转移的风险也更高。但这些纹理特征与肿瘤生物学行为之间是否存在内在联系还有待进一步研究。
Yue 等[16]首次将影像组学用于监测PC 病人临床疗效的研究,计算了放疗前和放疗后PET/CT 影像中的代谢纹理变化,基于纹理特征(最大标准化摄取值、均匀性、方差、总均值和聚集趋势)将病人分为总生存期较长的低危组和生存期较短的高危组,从而有助于制定个性化的治疗策略,以实现反应驱动的适应性放射治疗。同样,Chen 等[17]通过观察影像组学特征指标的每日变化情况,发现治疗反应良好的病人平均CT 值和偏斜度往往有较大的降低,而标准差和峰度有较大的增加。Plautz 等[18]进一步研究发现PC 病人的CT 纹理特征测量值在每种特征的特定置信区间内都具有稳定性和可重复性,表明每次CT 影像中提取的影像组学特征的变化可能是治疗引起的。Schott 等[19]则使用经过训练的体素分类器算法进行纹理分析,发现放疗期间的每日CT 影像可以估计当天大体肿瘤体积(gross tumor volume,GTV),所获得的GTV 可以作为放疗靶区重新规划的起点。但是,对于病变对比度较低的胰腺则需要对更大的病人数据集进行进一步的研究,以提高算法的稳健性。
大部分PC 病人在诊断时已处于晚期,PC 的5年生存率仅为8%,而在病变早期完全手术切除并辅以化疗的5 年生存率为32%[20]。影像组学可以较好地预测PC 治疗后的生存率,如Sandrasegaran 等[21]应用CT 纹理分析分析无法手术切除的PDAC 病人的总生存率(overall survival,OS),峰度高(>0.565)且平均正像素值较高(>31.625)的病变OS 较差,这可能是因为更具侵袭性的肿瘤与高度异质性的肿瘤微环境相关,包括血管生成、缺氧和坏死等;Yun等[22]使用空间缩放因子(spatial scaling factor,SSF)为0 到1 的滤波器来提高恶性病变与腹部软组织的空间分辨率,并分析了纹理特征在各个空间缩放因子水平预测无病生存率的性能,发现平均值、标准差、对比度和相关性是SSF 0、1、1.5 和2 的无病生存率(progression free survival,PFS)的预测因子,平均值和对比度是SSF 2.5 的无病生存率的预测因子;Cassinotto 等[14]发现门静脉期肿瘤低密度区的CT值≥62 HU 时,病人的PFS 更好。
影像组学在评估PC 治疗反应和预后中具有潜力,为了确保这些影像组学生物标志物的成功应用,还需要进一步验证影像组学特征的可重复性,这是开发临床相关影像组学算法的关键步骤。基于此,Yamashita 等[23]研究了扫描参数和手动分割对胰腺增强CT 静脉期影像组学特征可重复性的影响,发现增强CT(contrast enhancement CT,CECT)扫描参数的差异对影像组学特征可重复性的影响比手动分割的差异更大,因此在研究中应尽量保持扫描参数的一致性。
3.2 胰腺囊性肿瘤 由于医学成像手段的普遍使用和质量的提高,偶发性胰腺囊性病变的数量在最近几年大幅增加[24]。胰腺囊性肿瘤(pancreatic cystic neoplasm,PCN)分为浆液性囊性肿瘤(serous cystic neoplasm,SCN)、黏液性囊性肿瘤(mucinous cystic neoplasm,MCN)、导管内乳头状黏液性肿瘤(intraductal papillary mucinous neoplasm,IPMN)、实性假乳头状肿瘤(solid pseudopapillary neoplasm,SPN)。胰腺囊性肿瘤性质不一(SCN 为惰性肿瘤,而IPMN 和MCN 被认为是PC 的前驱病变[25]),术前较难准确区分良恶性。因此,对胰腺囊性肿瘤进行准确的风险分层能够指导临床医生做出正确的治疗决策。
Hanania 等[26]发现基于灰度共生矩阵的14 个特征能较准确区分低级别和高级别IPMN,AUC 为0.96,敏感度为97%,特异度为88%。Permuth 等[27]建立影像组学特征与基于血浆的“miRNA 基因组分类器(MGC)”的综合模型,结果显示综合模型的诊断效能高于各自单独的诊断效能,AUC 为0.92,敏感度为83%、特异度为89%。由此可见,纹理特征可以预测IPMN 恶性潜能;但这2 项研究中的样本量较低,引入了潜在的过度拟合。此外,Hanania 等[26]认为灰度共生矩阵预测高度异型增生最佳,而Permuth等[27]认为一阶熵和游程长度纹理特征预测高度异型增生最佳,但这两项研究的数据分别从CECT 动脉期和门静脉期影像中获得,因此不宜直接比较这些研究结果,因为不同的成像阶段会影响纹理分析中使用的衰减值。Chakraborty 等[28]进行了更大样本量的研究,并通过影像观察提出了新的影像学特征(增强边界分数、填充的最大连通成分分数和平均加权偏心率),发现标准纹理特征和新的影像学特征皆能识别分支胰管型IPMN 的恶性潜能,且新的影像学特征表现更佳,所以有必要进行更多的研究来发现新的量化标志物。
Wei 等[29]发现与其他胰腺囊性肿瘤相比,SCN 具有相对较宽的强度范围、较高的总密度和更均匀的局部密度分布,并且这项研究包括的102 例SCN 病例中,只有31 例在术前被准确诊断,表明基于影像组学的计算机辅助诊断方案可以提高SCN 术前诊断的准确性,避免不必要的手术切除。Yang 等[30]也认为采用CT 影像中的3D 纹理特征定量分析是鉴别SCN 和MCN 的可靠方法,此研究还对不同层厚的CT 影像纹理特征在鉴别诊断中的一致性进行了评价,发现层厚为2 mm 和5 mm 的CT 影像纹理参数之间有较好的一致性,这是以前的许多研究所忽略的,研究提示虽然层厚为2 mm 和5 mm 的CT 增强扫描在鉴别诊断中的价值差异不大,仍建议不要混用不同层厚的CT 影像。
3.3 胰腺神经内分泌肿瘤 胰腺神经内分泌肿瘤(pancreatic neuroendocrine tumor,PNET)占胰腺肿瘤的2%~10%,近年该病诊断率呈上升趋势[31]。WHO根据Ki-67 增殖指数和有丝分裂计数将PNET 分为3 个等级(G1、G2、G3),且PNET 的等级与预后显著相关[32],故目前影像组学在PNET 中的应用主要集中在等级的分级预测方面。
Gu 等[33]发现影像组学特征与PNET 组织学分级显著相关,且动脉期和静脉期特征有较好的互补性,基于综合模型(包括影像组学特征和最优临床特征)的诺模图可作为术前预测1 级和2/3 级PNET的有力工具(AUC 在训练队列中为0.974,在验证队列中为0.902)。有研究采取相似的病人选择和影像获取的方法来评估CT 纹理特征术前预测PNET 分级的能力,Choi 等[34]发现2/3 级PNET 在3D 动脉期CECT 上表现为较高的偏斜度,在2D 门静脉期CECT 上表现为较低的峰度;而Canellas 等[35]发现空间尺度滤波器2 的熵是PNET 侵袭性的一个独立的预测因子。产生不同结果的原因可能有两方面:第一,2 项研究的样本量及扫描参数不同;第二,Choi等是在不同维度(2D 和3D)、不同时相(动脉期和门静脉期)CECT 影像上提取纹理特征,而Canellas 等仅在2D 门静脉期CECT 影像上提取特征。因此,建议采用标准化的成像参数,同时对多期相影像进行对比或联合研究。Zhao 等[36]进一步发现相关性可较好地区分G1 与G2 无功能PNET,相关性测量空间灰度共生矩阵元素在行或列方向上的相似程度,G1的相关性大于G2;研究将CT 平扫,增强动脉期、门静脉期与延迟期影像均纳入特征提取与比较,发现平扫和门静脉期相结合的模型具有最好的预测效果,更运用了决策曲线分析来评价影像组学模型的临床适用性,使临床净收益达到最大。
除CT 外,Guo 等[37]研究发现基于MRI(T2WI 和DWI)影像的纹理参数对PNET 的分级也有一定的诊断效能,但医学图像的纹理特征对扫描方案和后处理技术的改变很敏感,且各种插值算法也可能会以不可预测的方式改变MR 的纹理特征,所以Becker 等[38]系统评估了包括胰腺在内的腹部DWI中不同b 值对纹理分析特征的影响,发现大多数灰度共生矩阵和灰度游程长度矩阵衍生的纹理特征与b 值有显著的相关性,所以在对不同b 值获得的DWI 数据进行纹理特征分析时需要考虑这一点。
目前影像组学特别是纹理分析在AP、PDAC、PCN 及PNET 的诊断、风险分层及预后研究中显示出了积极的意义,但未来还需进行大数据或多中心的前瞻性研究来进一步验证。此外,影像组学的纹理特征为统计学术语,其在临床中的可解释性受限,所以还需加强纹理特征的标准化语义规范。同时,目前的研究使用的多是基于CT 影像的特征模型,而忽略了多种成像技术(CT、MRI、PET、US)的联合使用或者多模态、多时相及多维度成像特征的互补性。胰腺自动分割对于提高算法的精度、缩短算法时间及逐步推广影像组学的临床应用具有十分重要的价值,然而胰腺的自动分割算法的研究一直较少,对患病个体进行胰腺自动分割的研究更少。这些都是未来研究的方向。
目前机器学习已经从学习、训练和验证的简单原则发展到使用神经网络方法的深度学习技术[39];同时,许多研究已经能够将提取的影像特征与特定基因或遗传图谱的表达联系起来,形成“影像基因组学”,可以阐明肿瘤内特定基因/突变的存在与否及评估肿瘤微环境,尤其是免疫表型鉴定,能在未来的免疫治疗选择和治疗评价中起到相当大的作用。因此,未来需要将基于人工神经网络的深度学习技术和基因组学、蛋白质组学以及分子标志物等更多地融合于胰腺疾病的影像组学研究中,为临床医学做出更大的贡献。