利用人工智能系统预测脑梗死静脉溶栓后的出血转化*

2021-05-08 07:50李辉萍贺国华童洋萍徐桂兰曾文高刘新峰
中国卫生统计 2021年2期
关键词:灵敏度溶栓计数

徐 伟 李辉萍 贺国华 胡 珏 童洋萍 徐桂兰 曾文高 刘新峰 王 振,4△

【提 要】 目的 利用人工智能系统建立一个有效的预测模型,对脑梗死静脉溶栓后的出血转化进行早期预测。方法 回顾性分析2016年6月至2019年11月南华大学附属长沙中心医院前瞻性注册登记的静脉溶栓患者的资料。收集患者的人口学、临床、理化及影像学指标共53项,利用单因素判别分析建立单因素模型,利用逻辑回归(LR)、朴素贝叶斯(NB)、随机森林(RF)、人工神经网络多层感知机(MLP)建立多因素预测模型,对脑梗死患者静脉溶栓后的出血转化进行预测。用受试者工作特征曲线下面积(AUC)评判预测模型好坏。结果 本研究共纳入283例患者,其中有27例出现出血转化,出血转化率为9.5%。单因素模型中,以年龄作为预测因子的模型预测效果最好,其AUC为0.74,当选择76岁为截断值时,其敏感度为67%,特异度为72%。多因素模型中,RF模型预测效果最好,其AUC为0.90,灵敏度为0.85、特异度为0.89;LR模型的AUC为0.87,灵敏度为0.89、特异度为0.85;NB模型的AUC为0.87,灵敏度为0.76、特异度为0.86;MLP模型的AUC为0.82,灵敏度为0.81、特异度为0.78。结论 基于人工智能的RF模型效果优于其他模型,可用作医学辅助诊断系统来预测脑梗死静脉溶栓后出血转化的发生。

脑梗死是神经内科常见病、多发病,具有发病率高、致残率高、致死率高、复发率高的特点[1]。超早期静脉溶栓是目前最为有效的治疗手段之一[2]。出血转化(hemorrhagic transformation,HT)指脑梗死后缺血区血管重新恢复血流灌注导致的梗死区内继发性出血或远隔部位的出血。HT是静脉溶栓的一个严重并发症,严重影响了静脉溶栓的治疗效果[3],也是脑梗死患者静脉溶栓后出现神经功能恶化[4]、引起医疗纠纷的主要原因之一。早期识别HT高危患者具有重要的临床意义。

近年来人工智能已广泛应用于各个领域,包括化学、工程学、基因学和医学等。各国科学家也在尝试将它应用于神经疾病的预测研究,例如,蛛网膜下腔出血患者迟发性脑缺血的预测[5],大血管闭塞性卒中机械取栓的预后预测[6],大面积脑梗死的转归预测[7]等。本研究的目的是运用人工智能建立一个自动化的预测系统,帮助临床医生早期预测脑梗死静脉溶栓后的出血转化,从而选择恰当的治疗方案。

资料与方法

1.研究人群

回顾性分析2016年6月至2019年11月南华大学附属长沙中心医院前瞻性地连续注册登记的接受静脉溶栓的急性脑梗死患者。

2.入选标准和排除标准

入选标准:年龄>18岁;符合《中国急性缺血性脑卒中诊治指南》[2]中急性脑梗死的诊断标准;在症状出现4.5小时开始溶栓治疗。

排除标准:接受桥接血管内治疗者;溶栓后48小时内未复查头部CT或MRI患者;接受尿激酶溶栓的患者;最后确诊为卒中模拟病(stroke mimics)者。

3.出血转化的定义

脑梗死发生后静脉溶栓前头颅CT未发现出血,而溶栓后48小时内复查头颅CT或MRI时发现有颅内出血。

4.数据采集

(1)人口学变量:年龄、性别;(2)既往病史:高血压、高脂血症、糖尿病、房颤、吸烟、既往脑梗死或短暂性脑缺血发作(TIA);(3)临床变量:发病到溶栓的时间(OTT)、发病时间不明性卒中、院内卒中、入院首次收缩压、入院首次舒张压、溶栓前收缩压、溶栓前舒张压、溶栓期间最大收缩压、溶栓期间最大舒张压、溶栓后收缩压、溶栓后舒张压、溶栓前美国国立卫生研究院卒中量表(NIHSS)评分、体重、阿替普酶总量;(4)卒中病因(TOAST分型):大动脉闭塞型、心源性栓塞、小动脉闭塞型、其他原因型、不明原因型;(5)梗死部位:前循环、后循环、前+后循环混合型;(6)理化指标:白细胞计数、中性粒细胞计数、淋巴细胞计数、单核细胞计数、血红蛋白浓度、入院随机血糖、PT、APTT、纤维蛋白原、血钾、血钠、血氯、血钙、总蛋白、白蛋白、球蛋白、ALT、AST、总胆红素、直接胆红素、间接胆红素、尿酸、肌酐、尿素氮、甘油三酯、总胆固醇、高密度脂蛋白、低密度脂蛋白;(7)影像指标:CT平扫上有早期缺血征象。早期缺血征象定义[8]为溶栓前CT平扫存在以下任何一种征象:<1/3大脑中动脉供血区域的低密度;豆状核模糊征;脑岛带征;外侧裂及脑沟变浅。

5.统计分析方法

(1)采用统计软件进行数据分析

采用STATA 15.0统计软件分析所有数据,检验水准α=0.05(双侧检验)。计量资料如呈正态分布,采用均数(标准差)表示;如呈偏态分布,采用中位数(四分位间距)表示。分别从以下方面进行数据分析:①各指标在组间的比较,计量资料呈正态分布且方差齐性时,采用两样本的t检验,方差不齐时采用近似t检验,呈偏态分布时采用Wilcoxon秩和检验;计数资料的构成比采用卡方(Chi-Square)检验;②经检验有统计学差异的(P≤0.05)变量引入单因素判别分析模型,绘制ROC曲线,选取灵敏度和特异度的和值最大的点为截断值,计算各模型的敏感度、特异度、受试者工作特征曲线下面积(area under receiver operation characteristic,AUC)。认为AUC值越大,其预测效果越好。

(2)使用数据挖掘专业软件Weka工具箱[https://www.cs.waikato.ac.nz/ml/weka/]进行数据分析,数据分析主要包括数据预处理和分类。①数据预处理:使用Resample进行数据重抽样,然后进行特征选择,使用CfsSubsetEval评估器,其搜索算法采用BestFirst。②分类器选择:选用逻辑回归(logistic regression,LR)、朴素贝叶斯(naive bayes,NB)、随机森林(random forest,RF)、人工神经网络多层感知机(multip layer perception,MLP)进行分类预测,采用十折交叉验证,计算各模型的敏感度、特异度、AUC,绘制ROC曲线。AUC值越大,其预测效果越好。

6.预测准确性的判断

运用AUC作为预测性能的判断指标。

结 果

1.数据的特征

2016年6月至2019年11月本中心共有356例急性脑梗死患者接受静脉溶栓治疗,排除57例患者接受桥接血管内治疗,4例患者48小时内未复查头部CT或MRI,5例患者采用尿激酶溶栓,9例患者最终确诊为卒中模拟病,最终纳入283例均采用阿替普酶静脉溶栓的患者(患者可能同时符合多项排除标准)。其中有27例患者出现出血转化,出血转化发生率为9.5%(见表1)。

表1 两组患者基线特征比较

2.出血转化组与非出血转化组各指标的比较

根据有无出血转化,分为出血转化组和非出血转化组。两组患者在年龄、院内卒中、溶栓前NIHSS评分、TOAST分型、单核细胞计数、白蛋白、总胆固醇、甘油三酯8个指标差异具有统计学意义(P<0.05)。具体见表1。

3.单因素模型

通过以上步骤的分析,共筛选出8个指标,其P值≤0.05,提示可以作为HT的预测因子。分别将这些因子纳入单因素模型,计算灵敏度、特异度、AUC。结果以年龄作为预测因子的模型预测效果最好,其AUC为0.74,当选择年龄≥76岁为截断值时,其敏感度为67%,特异度为72%。具体见表2和图1。

表2 单因素模型的灵敏度、特异度和AUC

图1 单因素模型ROC曲线

4.多因素模型

采用广泛使用的数据挖掘软件Weka,采用Resample进行数据重抽样,然后进行特征选择,使用CfsSubsetEval评估器,其搜索算法采用BestFirst,最终选择了10个属性,具体为年龄、院内卒中、溶栓前NIHSS评分、TOAST分型、入院随机血糖、单核细胞计数、白蛋白、总胆固醇、甘油三酯、CT早期缺血征象。选择这10个参数为预测因子分别代入LR、NB、RF、MLP模型进行分类预测,所有参数设置均为系统提供的默认参数。结果显示RF模型预测效果最好,其AUC为0.90,灵敏度为0.85、特异度为0.89;LR模型的AUC为0.87,灵敏度为0.89、特异度为0.85;NB模型的AUC为0.87,灵敏度为0.76、特异度为0.86;MLP模型的AUC为0.82,灵敏度为0.81、特异度为0.78。多因素模型的表现均优于单因素模型。具体见表3和图2。

表3 多因素模型的特异度、灵敏度和AUC

图2 多因素模型ROC曲线

讨 论

良好的预测模型应同时具有良好的灵敏度和特异度。AUC作为综合评判灵敏度和特异度的指标,为判断预测模型的准确性提供了更为直观的标准。AUC越大,其预测效果越好[7,9]。我们采用多种模型对脑梗死静脉溶栓后出血转化进行分类预测。单因素模型,在临床操作中简单易行,但在本次试验中其表现出来的灵敏度和特异度不佳,最好的结果是选择年龄作为预测因子的模型,其AUC为0.74,以≥76岁为截断值时,灵敏度仅67%,特异度仅72%。如将这一结果运用到临床会产生较多的假阳性和假阴性结果。纠其原因,脑梗死静脉溶栓后是否发生出血转化受多种因素影响,患者年龄只是其中一种重要的影响因素。我们将年龄、院内卒中、溶栓前NIHSS评分、TOAST分型、单核细胞计数、白蛋白、总胆固醇、甘油三酯、CT早期缺血征象、入院随机血糖这10个指标加入多因素预测模型,无论选用哪种预测方案其AUC、灵敏度或特异度都有很大提高。RF模型的AUC最高为0.90;NB模型和LR模型次之,AUC值为0.87;MLP模型最差,其AUC值为0.82,明显优于单因素模型中的最佳模型(以年龄为预测因子的模型,AUC值0.74)。

比较RF、NB、LR、MLP四种模型,其中RF表现最佳,其AUC为0.92。在此之前,各国的研究人员也对这四种模型进行过多次比较,由于选择的数据不同,其结论不同[5,10,11]。可见四种模型并没有固定的优劣之分,在实际运用中可根据临床数据的不同,选择不同类型的模型。

本研究为回顾性单中心研究,因此,可能存在选择偏倚;样本量有限,期待多中心大样本研究验证。

猜你喜欢
灵敏度溶栓计数
古人计数
递归计数的六种方式
急性脑梗死动脉溶栓治疗后并发症的观察与护理
古代的计数方法
导磁环对LVDT线性度和灵敏度的影响
这样“计数”不恼人
地下水非稳定流的灵敏度分析
精确制导 特异性溶栓
急性脑梗死早期溶栓的观察与护理
穿甲爆破弹引信对薄弱目标的灵敏度分析