王霞,彭明洋,王鹏,谢光辉,陈国中,王同兴,陈云云
急性缺血性脑卒中具有发病率高、致残率高及病死率高等特点。机械取栓治疗可使闭塞的血管快速再通,改善卒中患者预后,但有高达35.2%的患者机械取栓后24 h内发生早期神经功能恶化(END),导致预后不良[1]。以往的研究[2-4]显示,梗死范围增大、出血转化及脑水肿等均可引起END。Jiang等[4]的灌注加权成像(PWI)相关研究显示,较大的脑血流量更易发生END。Simonsen等[2]认为,END可通过更大的灌注损伤来预测,但基于DWI和PWI的缺血半暗带在预测END中的价值仍有待研究。近年来,机器学习成为医学诊疗的研究热点,其可综合大数据影像资料,深度挖掘多维影像学信息,实现精准诊断及预测[5]。然而目前基于DWI和PWI的机器学习在急性脑卒中END的评估中尚未见报道。本研究基于DWI和PWI图像,采用影像组学方法获取大量特征,旨在探讨基于机器学习技术构建急性脑卒中机械取栓后END的预测模型。
1.1 对象 收集2017年1月至2020年6月在南京市第一医院就诊的急性脑卒中患者300例,其中男191例,女109例,平均年龄(67.87±15.49)岁。纳入标准:(1)年龄大于18岁;(2)发病时间为24 h以内;(3)机械取栓治疗前接受MRI(DWI+PWI)检查;(4)接受机械取栓治疗。排除标准:(1)颅内出血、肿瘤或创伤;(2)MRI有运动伪影图像无法评估。END定义为机械取栓治疗后24 h内NIHSS评分较前增加≥4分或死亡。采用随机分层抽样的方法将上述300例患者随机分为训练集210例,测试集90例。另以同样入组标准及排除标准纳入2017年1月至2020年6月在东南大学附属中大医院就诊的急性脑卒中患者100例作为验证集,其中男60例,女40例,平均年龄(67.66±14.69)岁。
1.2 方法
1.2.1 MRI扫描方法 所有患者采用3.0 T MR扫描设备(Ingenia, Philips Medical Systems, Nether-lands)进行检查。扫描序列包括Flair、DWI、MRA、PWI。部分扫描参数如下:DWI采用自旋回波序列,TR 2 501 ms,TE 98 ms,矩阵152×122,3个方向,视野 230 mm×230 mm,翻转角90°,层数18,层厚6 mm,层间距1.3 mm,b=0 和 1 000 s/mm2;DSC-PWI采用梯度回波-回波平面序列,TR 2 000 ms,TE 30 ms,矩阵 96×93,FOV 224 mm×224 mm,FA 90°,层厚4 mm,持续时间 88 s。采用Medtron公司双流高压注射器Accutron MR经右侧肘前静脉给药[钆喷酸葡胺(Gd-DTPA,广州康辰药业有限公司),浓度0.05 mmol/kg,流速4 ml/s]后扫描,每个定位扫描60次。
1.2.2 图像分析方法
1.2.2.1 图像分割 应用RAPID软件自动处理PWI图像获得Tmax图进行PWI图像评估。图像分割使用ITK-SNAP软件(版本3.4.0,http://www.itksnap.org),分别对DWI图像上高信号区及PWI图(Tmax图)上灌注异常区进行感兴趣区(ROI)勾画后合成3D ROI。所有ROI均由1名具有5年神经影像诊断经验的放射科医师完成,并由另1名具有10年神经影像诊断经验的放射科医师进行核对。
1.2.2.2 图像标准化 使用μ±3σ方法对ROI进行归一化,然后采用灰度量化来减少计算时间和提高纹理结果的信噪比。最后,使用3D插补技术对容积病灶进行各项同性重采样,以确保获取3D特征的比例和方向保持不变。
1.2.2.3 特征计算 应用A.K.软件(分析版本1.0.3;美国GE Healthcare)对400例患者DWI图像和Tmax图像特征进行提取,最终提取First Order、Shape、GLCM、GLSZM、GLRLM、NGTDM、GLIM等1 316个特征。
1.2.2.4 特征选择、模型构建和验证 应用最低绝对收缩和选择算子(LASSO)回归模型筛选预测END的最佳影像组学特征,同时进行五折交叉验证对模型参数进行最优化。将LASSO筛选出的影像组学特征纳入支持向量机(SVM)机器学习算法进行建模。SVM采用线性核,应用五折交叉验证进行模型训练,构建基于DWI+PWI的预测卒中机械取栓后END的预测模型。然后应用验证集数据对所构建模型进行验证,评估相应模型的效能。
2.1 训练集、测试集和验证集三组间临床资料的比较 见表1。210例训练集中END为94例,90例测试集中END为37例,100例验证集中END为40例。训练集、测试集及验证集三组间年龄、性别、入院NIHSS评分、发病至MRI检查时间及发病至机械取栓时间的差异均无统计学意义(均P>0.05)
2.2 影像组学特征的提取及筛选 基于LASSO回归模型,DWI和PWI图像共提取2 632个影像组学特征,通过LASSO降维筛选出37个特征(表2)。基于LASSO回归模型,利用5折交叉验证中最优的来选择系数非零的最佳影像组学特征,影像组学特征的LASSO系数分布见图1。训练集及测试集热图见图2。
表1 各数据集基本临床特征比较[x±s,例(%)]组别END年龄(岁)性别(男)入院NIHSS评分(分)发病至MRI检查时间(min)发病至机械取栓时间(min)训练集(n=210)94(44.76)68.74±15.08136(64.76)15.81±4.49222.37±77.64272.75±98.45测试集(n=90)37(41.11)63.38±11.1755(61.11)14.19±5.16238.15±87.29298.36±85.36验证集(n=100)40(40.00)67.66±14.6960(60.00)14.96±5.96219.86±79.25283.61±79.16统计值0.7550.3190.7910.693-2.418-4.531P值0.6860.7630.6730.4170.3690.469
表2 筛选的预测急性脑卒中机械取栓后预测END的最佳影像组学特征特征类别特征名称一阶特征四分位数(DWI)、峰度(DWI、PWI)、斜度(DWI、PWI)、均方根(PWI)、最大值(DWI)灰度依赖矩阵相关性非均匀归一化(DWI、PWI)、相关性方差(PWI)、低相关性高灰度级重点(PWI)灰度共生矩阵特征相关性(DWI、PWI)、逆方差(DWI、PWI)、相关性信息测度(DWI)、最大相关系数(DWI、PWI)、簇状阴影(DWI)灰度尺寸区域矩阵小面积高灰度级重点(DWI、PWI)、灰度不均匀归一化(DWI)、大面积低灰度级重点(DWI、PWI)、低灰度区域重点(PWI)、灰度方差(PWI)、区域熵(DWI、PWI)灰度游程矩阵标准化游程不均匀度(DWI、PWI)、长游程重点(PWI)、长游程高灰度级重点(DWI、PWI)相邻灰度差分矩阵对比度(DWI、PWI)、复杂度(DWI)、强度(PWI)
图1 2 632个影像组学特征的LASSO系数分布图
图2 最佳影像学特征分布热图。A:训练集;B:测试集
2.3 急性脑卒中机械取栓后END预测模型构建及测试 基于所得的最佳影像组学特征通过SVM分类器建立END预测模型。应用ROC曲线分析该模型预测训练集患者机械取栓后END的AUC为0.987,灵敏度和特异度分别为0.945、0.958,准确度为0.952;预测测试集患者机械取栓后END的AUC为0.981,灵敏度和特异度分别为0.918、0.916,准确度为0.928(表3、图3)。
表3 基于DWI+PWI预测急性脑卒中机械取栓治疗后END预测模型的效能组别准确度灵敏度特异度预测值阳性阴性AUC训练集0.9520.9450.9580.9450.9580.987测试集0.9280.9180.9160.9180.9160.981验证集0.8240.8250.8240.8160.8570.897
图3 基于DWI+PWI预测急性脑卒中机械取栓后END的ROC曲线
2.4 急性脑卒中机械取栓后END预测模型验证 利用所构建的模型,对验证集进行验证以评估模型的效能。ROC曲线分析显示,基于DWI+PWI的SVM分类器得出的预测验证集卒中患者机械取栓后END的AUC为0.897,灵敏度和特异度分别为0.825、0.824,准确度为0.824(表3、图3)。
最近的临床试验[6-7]证明,机械取栓治疗对于缺血性脑卒中是一种有效安全的再通方式。然而,研究[8]也显示,相当一部分患者功能预后较差(28.6%~67.4%)。影响预后不良的因素涉及多方面,其中END的发生与预后不良密切相关。因此,早期预测END对于快速评估给药方法、治疗方案制定及预后评估具有重要价值。以往的研究[3,9]显示,NIHSS评分、糖尿病、心房颤动、全身麻醉、入院收缩压等为END的预测因素。随着神经影像的发展,DWI和PWI技术已从基本的诊断工具扩展到更重要的作用,目前应用较多的主要为选择再灌注治疗并预测预后[10-12]。本研究从DWI和PWI影像上提取了一系列影像组学特征,使用LASSO回归模型筛选出与END相关的影像组织特征集,并基于所选特征建立SVM分类器模型。本研究发现该模型在训练后经验证集验证对急性脑卒中机械取栓治疗后END的预测具有较高的准确度,同时在外院的测试集中实现了较高的泛化能力。
DWI上高信号区域通常为核心梗死区,PWI上灌注异常区域中包含了一部分可挽救的缺血半暗带。以往的大量研究[2-3,9]认为大血管病变、较大的灌注损伤、梗死体积增长等为END的影响因子,END的发生主要来源于缺血性梗死的生长,而不是出血。尽管这些研究表明一些影像学特征与END相关,但基于传统的影像学参数的预测能力有限,目前基于DWI和PWI预测急性脑卒中机械取栓治疗后END的研究仍存在争议。近年来,提供多参数形态和功能信息的影像组学成为研究热点[13-14]。影像组学突破基于形态学和半定量分析的传统影像医学模式,采用高通量特征提取算法,对影像图像进行定量分析,充分深入挖掘和分析隐含在图像中的额外信息,最高效的利用影像学检查结果,为临床提供个性化治疗提供支持[15]。LASSO回归是变量选择中的压缩估计方法,已广泛用于高维数据的降维和回归分析[16]。本研究通过LASSO回归模型,从2 632个特征参数中筛选出37个有鉴别价值的指标,然后使用SVM建立预测模型。在LASSO回归模型中,当λ变小时,协变量的一些系数可缩小为零。本研究为实现特征筛选和防止过度拟合,在选择交叉验证错误最小时的λ为最优参数。
SVM是一个强大而有效的机器学习分类器,它构建了一个超平面,提供了最佳的分离边界,以最大限度地分离高维物体、空间。本研究通过SVM构建模型发现,训练集和验证集中,基于DWI+PWI预测急性脑卒中机械取栓后END的AUC分别为0.987和0.981,其准确度达0.952、0.928。Sung等[17]研究显示结合临床和神经影像学信息的机器学习算法(Bootstrap决策树、Bootstrap决策林、深度神经网络和逻辑回归分析)可用于预测急性轻微卒中患者的END,具有较高的准确度(ACC=0.966)。但该研究存在纳入的特征为基本临床及影像参数,未通过高通量方法提取影像组学特征。此外,本研究为了验证预测模型的泛化能力,从其他中心收集100例同样入组条件的急性脑卒中患者作为测试集,应用所建模型对测试集进行测试,结果显示基于DWI+PWI的模型预测卒中机械取栓后END的效能较好,其准确率与验证集相仿,达0.824。由此可见,基于DWI+PWI预测急性脑卒中机械取栓后END的模型具有较好的泛化能力。
本研究仍存在一定的局限性。首先,本研究为回顾性研究,为保证两组样本均衡,样本量选择时存在一定的偏倚。其次,患者样本量有限,后期需积累更多样本进一步提高模型的准确度。另外,机器学习的特征选择方法较多,本研究采用LASSO回归法进行筛选,并未比较其他特征筛选法所建模型的差异,后期需进一步选择不同的方法比较模型的效能,以选择最优效能,适合临床应用的模型。
综上所述,基于机器学习技术对DWI和PWI图像进行预测学习,能够较为精确的预测急性脑卒中机械取栓后END,为临床后续干预治疗及预后评估提供依据。
利益冲突:所有患者均声明不存在利益冲突