赖海芳,顾琳,纵亚,牛传欣,谢青
1.上海交通大学医学院附属瑞金医院,上海市 200025;2.上海市瑞金康复医院,上海市 200023
我国是世界上脑卒中负担最重的国家,脑卒中的患病率高、发病率高、死亡率高,其中缺血性脑卒中发生率和患病率分别为69.6%和77.8%[1]。对于缺血性脑卒中,多种血清学和临床数据对评估病情严重程度、指导临床治疗和判断预后有重要参考价值[2-4];而如何分析丰富的临床信息,以精准预测患者预后,制定个体化治疗方案,是康复工作的重点之一。
Logistic 回归是常用的分析方法,主要用于寻找疾病的危险因素、预测疾病的发生风险等[5]。Logistic回归采用的是线性模型,当各自变量与因变量为非线性关系时,预测效果不够理想[6]。
人工神经网络是一种仿大脑神经网络结构和功能而建立的信息处理算法,具有很强的非线性函数逼近能力和自组织自学习能力。由于缺血性脑卒中患者的结局涉及复杂的临床指标,存在较强的非线性联系,适合采用人工神经网络模型进行分析[7]。其中,多层感知器(multiple layer perceptron,MLP)神经网络应用范围较广,扩展性也强,使用通用的函数近似方法拟合复杂的函数,可以解决非线性分类问题[8]。本研究分别采用Logistic 回归和MLP 神经网络两种方法构建亚急性期缺血性脑卒中的预后判断模型,比较两种模型的预测效能。
回顾性收集2019 年1 月至2021 年9 月在上海市瑞金康复医院康复科住院的亚急性期缺血性脑卒中患者60 例,均符合《中国急性缺血性脑卒中诊治指南2018》确定的缺血性脑卒中诊断标准,并经头颅CT或MRI确诊。
纳入标准:①首次发作;②病程<30 d[9];③自愿签署知情同意书。
排除标准:①既往脑出血、脑梗死、脑外伤、中枢系统感染、脑肿瘤等;②并发严重肝肾功能不全;③并发严重心血管疾病、自身免疫性疾病、恶性肿瘤等,严重影响身体功能;③近2 周有手术史、全身炎症性疾病;④精神障碍、严重认知障碍等,不能配合检查。
本研究经上海市瑞金康复医院伦理委员会审查通过(No.RKIRB2021-18)。
1.2.1 特征变量
由康复专科医师从电子化病历系统和检验检查管理系统中收集所有入组患者的临床资料,包括性别、年龄、既往史(高血压、糖尿病病史)、个人史(吸烟史、饮酒史)、实验室检查〔C-反应蛋白(C-reactive protein,CRP)、白蛋白、空腹血糖、脂蛋白a、D-D 聚体、B型钠尿肽〕。所有患者根据入院时美国国立卫生研究院卒中量表(National Institutes of Health Stroke Scale,NIHSS)分为低分组(<11 分)和高分组(>11 分)。随访以再次入院的形式进行,采用改良Rankin 量表(modified Rankin Scale,mRS)评估患者首次入院3 个月后的功能结局,0~3 分为预后良好,4~5 分为预后不良。
患者各特征变量见表1。
表1 入组患者特征变量
1.2.2 统计学分析
采用SPSS 20.0 统计软件进行数据分析。采用单因素分析(分类变量采用χ2检验,数值变量采用方差分析,显著性水平α=0.05)筛选出与预后相关的变量,以此作为多因素Logistic 回归分析的自变量和MLP 神经网络的输入节点。计算两种模型的预测准确率,采用接受者操作特征(receiver operating characteristic,ROC)曲线评估预测效应。
60例患者中,预后良好与预后不良各30例,χ2检验结果见表2,方差分析结果见表3。共筛选出5 个与短期预后相关联的变量,分别是年龄、CRP、白蛋白、脂蛋白a和入院NHISS评分。
表2 短期预后相关特征变量的χ2检验结果 单位:n
表3 短期预后相关特征变量的方差分析结果
将单因素分析筛选出的5个特征变量作为自变量,以短期预后(预后良好=0,预后不良=1)为因变量,进行多因素Logistic 回归分析,加入和剔除的显著性水平α 分别为0.05 和0.1,年龄、脂蛋白a 和入院NHISS评分为预后的独立影响因素。见表4。
表4 多因素Logistic回归分析结果
60 例患者任选42 例的数据用于模型训练,另18例的数据用于模型评价。采用多层前馈神经网络结构,共轭梯度优化算法,以单因素分析筛选出的5 个变量作为输入层节点,隐藏层层数1,隐藏层节点数1~50,预后结果为输出层唯一节点,建立MLP 模型。标准化处理后,5个变量的重要性见图1。
图1 各因素标准化后对MLP模型的重要性
两种模型预测结果见表5。MLP 预测模型准确率高于Logistic回归模型。
表5 两种模型预测结果比较
Logistic回归模型ROC 曲线下面积为0.851,MLP模型曲线下面积为0.930。见图2。
图2 两种模型预测效应的ROC曲线
人工神经网络模拟人脑思考结构,在处理非线性复杂关系时有特别的优势[10]。随着人工智能技术发展,越来越多的人工神经网络算法被应用于图像检查、生物信号检测、疾病专家系统等医学领域[10-13]。相比其他神经网络模型,MLP神经网络在处理连续变量关系时有一定优势,本研究采集的指标经单因素分析筛选后均为连续变量,故采用MLP 神经网络。研究显示,MLP 模型不仅预测准确率高于Logistic 回归模型,还能将各影响因素进行重要性排序。多因素Logistic回归筛选出3个短期预后的独立影响因子,分别为年龄(OR=1.090)、入院NHISS 评分(OR=1.228)和脂蛋白a (OR=1.029)。MLP 模型的重要性排序依次为年龄、入院NHISS 评分、脂蛋白a、白蛋白、CRP,两者结论基本一致。
本研究显示,年龄是影响亚急性期缺血性脑卒中患者短期预后最重要的危险因素。多项研究表明[14-15],年龄是脑卒中预后不良和死亡的主要影响因素之一。
NIHSS 有较高的效度和信度,在缺血性脑卒中评估中被广泛使用。入院NHISS评分的高低直接反映患者神经功能缺损程度[16]。本研究显示,NHISS 评分是亚急性期缺血性脑卒中患者短期预后的良好预测因子,与Ahmed等[17]的结果一致。
脂蛋白a 具有多种功能,包括促动脉粥样硬化、促凝血酶原和促炎症[18]。血清脂蛋白a 水平升高与心血管疾病风险增加相关,尤其是心肌梗死、脑卒中和主动脉瓣钙化狭窄[19-21]。Zhang等[22]发现,与健康人相比,急性缺血性脑卒中患者血清脂蛋白a 水平显著升高;功能预后不良的患者血清脂蛋白a 水平更高。与本研究结果一致。
本研究存在一些不足。临床资料只选取13 个变量,而诸如脑卒中部位、认知水平、意识状态、情绪障碍、溶栓治疗以及其他血液标志物等,也可能对脑卒中患者预后发生影响;本研究只随访了首次脑卒中后3个月时的功能状态,未观察长期预后。
现有研究多关注脑卒中急性期的预后相关危险因素[23-25],对亚急性期预后相关危险因素的研究不多。患者进入亚急性期后康复阶段时,如能应用MLP 模型充分了解患者预后及其危险因素和重要程度,有望提升康复治疗方案的精准性和个体化水平。
利益冲突声明:所有作者声明不存在利益冲突。