应用BP神经网络和多重线性回归模型预测颅内出血患者住院天数

2015-01-02 06:28:38许国宇常鹏飞安沂华中国人民解放军第09医院细胞治疗病房北京0009中国人民解放军第09医院放射科中国人民解放军第09医院神经外科通讯作者mailpengfeichaungcom
山西医科大学学报 2015年10期
关键词:天数线性神经网络

伍 刚,许国宇,白 颖,周 青,刘 策,常鹏飞,安沂华(中国人民解放军第09医院细胞治疗病房,北京 0009;中国人民解放军第09医院放射科;中国人民解放军第09医院神经外科;通讯作者,E-mail:pengfei_chaung@6.com)

近年脑血管疾病已经成为严重威胁我国城镇人口生命健康的主要病因之一[1]。流行病学调查显示,我国每年颅内出血发病率高达77.1/10万人,高于欧美等发达国家[2]。颅内出血给患者、家庭和社会带来巨大经济压力和负担。临床路径实施是公认的能够提高疾病治疗效率的临床手段[3]。住院天数是制定临床路径的重要客观指标[3]。分析住院天数的相关影响因素对制定颅内出血诊疗流程有重要意义。

由于住院天数在数据分布上往往不是正态分布,因此应用传统统计学方法分析较为繁琐。误差逆向传播神经网络模型(back propagation,BP)是目前被广泛使用的神经网络模型之一[4]。由于 BP神经网络对于资料的类型、分布等无任何前提条件,且具有一定的容错性,能通过自我学习,自我调整实现输入变量和输出变量之间的复杂映射关系[5]。因此可以考虑将BP神经网络用于对住院天数及其影响因素进行建模,实现住院天数及其影响因素之间的关系拟合。本文拟应用BP神经网络模型和多重线性模型对颅内出血患者住院天数及其影响因素进行分析,找到规律性特点指导临床实践工作。

1 研究对象与方法

1.1 研究对象

回顾调查中国人民解放军第309医院2011-01~2014-05入院诊断为ICH患者共396例(根据1995年全国第四届脑血管病学术会议修订的颅内出血诊断标准),排除脑外伤出血、蛛网膜下隙出血、脑肿瘤出血、脑干出血病例、颅内出血死亡病例、中途自动出院以及信息不完整病例,其中有效病例共计290例,占总病例数的73.2%。其中男性197例,女性93 例,平均年龄(57.3 ±12.9)岁。

1.2 调查内容和方法

收集入院患者临床信息包括:颅内出血体积(ABC/2法),血小板计数,血红蛋白含量、血糖值、凝血指标、入院GCS评分、治疗过程中应激性溃疡消化道出血、肺部感染、深静脉血栓、手术方式、是否进行康复治疗、出院时GOS评分。所有资料进行统一处理并编码(见表1)。

1.3 BP神经网络模型建立

本课题BP神经网络模型采用SPSS19.0软件所提供的BP神经网络模块将表1中1-12作为输入变量,将第13项住院天数作为输出变量进行建模。其中输入层1层,隐含层2层,第一隐含层4个神经元,第二隐含层3个神经元,输出层1层。其中训练集占总样本70%,预测集占30%。传输函数选择LogSig函数。敏感度分析:BP神经网络模型建立后,进行敏感度分析,从而分析输入变量对输出变量的重要程度。其中变量1-12需要进行归一化处理至[0,1]范围[6]。

1.4 统计学方法

利用EXCEL对资料的数据进行双份录入,排除异常数据。资料采用SPSS19.0统计软件进行数据处理。BP神经网络模型获得住院天数预测值与实际值进行相关分析。多重线性回归过程,需要对非正态分布住院天数进行对数转换使之符合正态分布。然后将上述变量1-12作为自变量,变量13作为因变量进行多重线性回归分析。采用R、R2、调整R2、标准误差、平均相对误差对两模型的预测结果进行比较分析。

表1 选取影响颅内出血住院天数的因素项目及编码Table 1 Factors affecting the hospitalized stay for intracranial hemorrhage and their encoding

2 结果

2.1 颅内出血患者住院天数影响因素分析

BP神经网络模型和经ln数据转换多重线性回归模型对颅内出血患者住院天数预测值建立散点图(见图1)。其中BP神经网络模型的R2=0.484,多重线性回归模型的R2=0.467。BP神经网络模型给出了每个变量的敏感度,即研究变量每变化一单位,对住院天数的影响大小(见表2)。BP神经网络模型结果显示,对住院天数影响排前4位的变量分别是肺部感染、康复治疗、血糖水平和出院时GOS评分。多重线性回归模型显示,纳入回归方程的因素有肺部感染、康复治疗、治疗方式和血糖水平(F=62.549,P < 0.001,见表 3)。回归方程:lnY=1.158+0.241 × X7+0.198 × X11+0.181 × X10+0.087×X5。其中有三个相同因素均纳入两模型分析中。

图1 BP神经网络模型和多重线性回归模型预测住院天数散点图Figure 1 Scatter diagram of back propagation neural network versus multiple linear regression for predicting the hospitalized stay in patients with intracerebral hemorrhage

表2 BP神经网络各变量敏感度分析Table 2 Sensitivity of factors in BP neural network

表3 多重线性回归模型对颅内出血住院天数的分析结果Table 3 Results of multiple linear regression models for hospitalized stay of patients with intracranial hemorrhage

2.2 两个模型在预测颅内出血患者住院天数的比较

对BP神经网络模型和多重线性回归模型的预测结果进行配对t检验,其检验结果显示差异有统计学意义(t=4.099,P <0.001),故分别用 BP 神经网络和多重线性回归模型对颅内出血患者住院天数进行预测,其预测结果差异具有统计学意义。两个模型预测能力比较结果见表4。BP神经网络模型R2、调整R2大于多重线性回归,而标准误差和相对平均误差小于多重线性回归。总体而言,在对颅内出血住院天数进行预测时BP神经网络模型的预测性能优于多重线性回归模型。

表4 两模型预测性能比较Table 4 Comparison of the predictive performance between two models

3 讨论

多重线性回归分析结果显示,影响颅内出血患者住院天数的因素有肺部感染、康复治疗、治疗方式和血糖水平。但是多重线性回归模型需要预测变量符合正态分布。如果数据不符合正态分布,需要进行复杂的数据转换。同时该模型也要求变量间相互独立,自变量间的联合作用符合加法模型,而非参数方法虽然对资料特点不做要求,但却不能完全利用资料的全部信息,检验效能较低[6]。BP神经网络对资料特性不做任何要求,且能完全利用资料的全部信息。由于其具有学习性和自适应性两种特性,能调整变量权重以适应样本特性,在数据挖掘中具有一定优势,可不受任何限制地自动学习变量间的任何关系。通过对变量敏感度分析,可以找到对输出变量的影响程度显著的变量,得出的结果较客观[7]。

敏感度分析结果显示,肺部感染对颅内出血患者住院天数的影响最大。肺部感染是颅内出血患者常见并发症,可由颅内出血患者呕吐物误吸、免疫力下降、吞咽障碍、神经源性肺水肿、气管切开机械通气等因素所导致[8,9]。患者一旦出现肺部感染,可造成住院天数延长,住院费用升高[9]。对肺部感染的高危患者及早采取呼吸道管理、肺部护理措施,合理应用抗生素等治疗方案,可达到患者早日出院的目标[9]。康复治疗对颅内出血患者的住院天数影响也较为显著。颅内出血患者康复临床路径显示,标准的康复治疗疗程约28 d左右[10]。一线医院颅内出血患者经常存在临床治疗和康复治疗叠加进行的情况。这种治疗模式虽然有利于患者治疗过程的连续性,便于对病情复杂患者的临床管理,但是客观上延长了临床科室颅内出血单病种的住院时间,也降低了相应医疗效率。因此,在临床路径制定过程中应注意对需要康复治疗患者的临床管理,这将有利于减少颅内出血患者的治疗天数。对颅内出血患者住院天数影响较大的还有血糖水平。这可能是因为罹患糖尿病的患者,更容易合并脑循环缺血、出血后梗死、败血症等情况[11],需要注意此类患者病情监测和处理。

患者出院时的情况(GOS评分)和治疗方式在两个模型中对住院天数的影响作用不同。GOS评分在BP神经网络模型中对住院天数影响作用明显。这可以理解为患者病情的复杂程度与治疗天数有关,病情轻或迅速恶化死亡者住院天数较短,而病情较重者治疗时间较长,即病情轻重和治疗天数的短长不是简单的线性关系。治疗方式选择与患者预后紧密相关[12]。多重线性回归分析显示它对住院天数的影响显著。一般来说,开颅手术患者病情应比钻孔引流和保守治疗的患者复杂,住院天数相对延长,但在实际情况下,住院天数可受到一些非线性因素的影响。这可能造成BP神经网络模型和多重线性回归模型在对一些变量的解释上存在不同。

BP神经网络模型在医学研究领域的应用受到关注,尚存在一些问题有待解决,如权重系数的假设检验,权重系数的可信区间,权重系数的统计学意义,输入变量的选择等[13]。本研究局限于本医院的就诊人群,因此其外推性受到限制。但是,此方法仍可作为复杂因素筛选的参考方案。在制定颅内出血治疗临床路径时,合理评估影响颅内出血患者住院天数的相关因素,将有助于实现减少颅内出血患者住院天数,提高医疗效率的目标。

[1]He J,Gu D,Wu X,et al.Major causes of death among men and women in China[J].N Engl J Med,2005,353(11):1124-1134.

[2]Tsai CF,Thomas B,Sudlow CL.Epidemiology of stroke and its subtypes in Chinese vs white populations:a systematic review[J].Neurology,2013,81(3):264-272.

[3]王佩琦,裴玉玲.临床路径的应用现状及实施意义[J].中外医疗,2013,32(7):191-192.

[4]叶健伟,沈亚诚,黄小玲.基于BP神经网络的肺炎医保住院费用分析[J].卫生经济研究,2013,26(6):38-40.

[5]兰莉,高菡璐,乔冬菊,等.应用BP人工神经网络模型预测急性心梗死亡率与气象因素的关系[J].中国公共卫生管理,2012,28(5):642-644.

[6]武建辉,王国立.BP神经网络与多重线性回归模型在煤工尘肺发病工龄预测中的比较研究[J].中国煤炭工业医学杂志,2014,17(12):1992-1995.

[7]石慧,王玉兰,翁福利.BP神经网络和模糊时间序列组合预测模型及其应用[J].计算机应用,2011,31(2):90-91.

[8]巴庆华,冯树涛,崔月梅.脑卒中肺部感染患者气管切开时机对预后的影响[J].中华医院感染学杂志,2014,24(14):3484-3486.

[9]王蓬莲,赵性泉,刘丽萍,等.急性期脑卒中相关性肺炎的研究进展[J].山西医科大学学报,2012,43(11):873-875.

[10]张通,赵军.脑卒中康复临床路径[J].中国康复理论与实践,2014,20(3):285-288.

[11]刘凤,代雪梅,刘丹,等.糖尿病并发败血症患者54例的临床分析[J].山西医科大学学报,2012,43(10):774-776.

[12]吕新兵,张洪兵,尹连虎,等.高血压基底节区脑出血手术患者预后相关因素分析[J].山西医科大学学报,2012,43(7):514-517.

[13]王俊杰,陈景武.BP神经网络在疾病预测中的应用[J].数理医药学杂志,2008,21(3):259-262.

猜你喜欢
天数线性神经网络
本周连跌天数居前个股
本周连涨天数居前个股
渐近线性Klein-Gordon-Maxwell系统正解的存在性
线性回归方程的求解与应用
神经网络抑制无线通信干扰探究
电子制作(2019年19期)2019-11-23 08:42:00
二阶线性微分方程的解法
生日谜题
基于神经网络的拉矫机控制模型建立
重型机械(2016年1期)2016-03-01 03:42:04
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定