logistic回归结合决策树技术在冠心病患者住院费用组合分析中的应用*

2015-01-27 13:48:53中山大学孙逸仙纪念医院信息科510120
中国卫生统计 2015年6期
关键词:剪枝住院费用决策树

中山大学孙逸仙纪念医院信息科(510120)

薛允莲

logistic回归结合决策树技术在冠心病患者住院费用组合分析中的应用*

中山大学孙逸仙纪念医院信息科(510120)

薛允莲

目的 探讨在logistic回归分析基础上进行决策树分析的风险,分析不同病例组合下冠心病患者的住院费用。方法 采用logistic回归分析动脉粥样硬化性心脏病的影响因素,将有统计学意义的变量纳入决策树分析,用CHAID法进行预剪枝处理,最后进行病例组合分析探讨每种组合的费用。结果 logistic回归结合决策树分析方法的风险分值为0.245,小于单纯决策树分析的风险分值(0.329)。根据住院天数、手术、性别建立病例组合,每种组合的费用差异明显。结论 logistic回归结合决策树分析能降低预测风险分值,提高不同病例组合的费用差异度。

logistic回归 决策树 数据挖掘 冠心病

动脉粥样硬化性心脏病(简称冠心病,亦称缺血性心脏病)是指供应心脏本身的冠状动脉管壁形成粥样斑块,造成血管腔狭窄引起的心脏病变。冠心病是全球死亡率最高的疾病之一,根据世界卫生组织2011年的报告,中国的冠心病死亡人数已列世界第二位,且发病呈年轻化趋势[1]。由此给患者带来了巨大的疾病负担和经济负担。了解该疾病住院费用的影响因素以及不同病例组合时的费用特征,能为卫生行政部门和医院领导提供病种费用情况的直观认识,也为日后医疗预付费制度的实施打下基础。

对象与方法

1.资料来源

数据来源于广东省某三甲医院2009年至2013年诊断为动脉粥样硬化性心脏病的8224例出院患者资料。ICD码四位为I 25.1。将所有可能影响住院费用的因素均导出,本次共导出的因素有住院次数、性别、年龄、住院天数(天数)、婚姻状况、付款方式、是否手术、病人来源、是否转科、是否抢救等十个。

2.研究目的与统计方法

本文旨在分析动脉粥样硬化性心脏病住院费用的影响因素及组合情况。采用SPSS20.0统计软件进行分析。先用logistic回归分析(向前LR)筛选影响因素,再在此基础上进行决策树分析。

结 果

1.住院费用的影响因素分析

将住院费用按照中位数分为两组,低费用组和高费用组。采用向前LR方法分析影响动脉硬化性心脏病住院费用的因素。有统计学意义的变量列于表1中。

2.决策树和病例组合分析

根据logistic回归分析结果,将有意义的变量均纳入进行决策树分析。决策树分析采用CHAID预剪枝的方法进行树的剪枝处理,选取最小个案数:父节点800,子节点600。使用10倍交叉验证进行决策树计算效果的验证。

通过决策树分析,最终决策树纳入天数、手术和性别三个变量。具体的决策树见图1。

3.病例组合情况

根据决策树确定最终的病例组合方式,本文确定了9种病例组合。将每种病例组合的费用数据列表2中。以P75+1.5Q作为费用上线控制标准[2]。本文按该标准共筛选出超额费用患者373例,占4.5%。

讨 论

DRGs(diagnosis related groups)是以病人特征、住院特征和住院期间接受的治疗措施为基础的一种病例分类方案[3]。DRGs已经在很多国家不断探索成熟,我国仍处于探索阶段。本文利用某医院动脉硬化性心脏病患者的病案首页信息进行病例组合分析,先用logistic回归分析进行影响因素筛选,后将有统计学意义的变量纳入决策树分析,进而提出病例组合方案。

logistic回归分析用于因变量为分类变量的影响因素分析,通过P值判断自变量是否有统计学意义,通过OR值判断自变量对因变量的影响大小及作用方向。其主要分析在控制其他变量对因变量影响的前提下,某个自变量对因变量的影响大小。logistic回归分析主要研究变量的主效应,但很难体现变量之间的交互效应,也无法从分类的角度给出直观具体的解释[4]。而决策树(decision tree)是解决实际应用中分类问题的数据挖掘方法,通过训练样本集,建立目标变量关于各输入变量的分类预测模型,全面实现输入变量和目标变量不同取值下的数据分组,进而用于对新数据对象的分类和预测[5]。但是决策树分析时,对数的剪枝处理非常关键,剪枝的效果也影响了对未知数据分类的准确性。当纳入的因素众多时,决策树的剪枝处理会更加困难。

本研究在logistic回归分析基础上,纳入有统计学意义的变量进行决策树分析。研究结果显示决策树的预测风险分值为0.245,小于将所有因素纳入决策树分析的预测风险(0.329)。可见,用logistic回归分析先选定有统计学意义的变量后进行决策树分析,能充分利用两种方法的优点,分类处理的效率更高,预测风险也有所降低。

本文结合决策树制定了影响动脉硬化性心脏病患者住院费用的9种组合,并给出了每种组合下的例数,费用情况以及超额费用情况,不同病例组合下患者的治疗、医疗需求和医疗支出高度相关。这一方面便于医疗机构对患者进行管理,了解疾病住院患者费用情况,提高工作效率;另一方面根据医疗资源消耗强度一致的各病例组合,为医院进行合理的费用补偿制定统一的支付标准。

本研究中,对动脉硬化性心脏病患者住院费用影响最大的是住院天数,其次是是否手术,性别影响较小。这提示在患者医疗费用控制过程中,住院天数的控制非常关键,这也与卫计委缩短平均住院日的要求是一致的。此外,在动脉硬化性心脏病患者费用分析中,可以将手术作为患者分型的基础指标。

[1]刘鸿闽.胺碘酮治疗冠心病室性心律失常的临床疗效.齐齐哈尔医学院学报,2012,33(22):3081.

[2]高子厚,万崇华,蔡乐,等.按DRGs组合方式制定消化系统疾病患者住院费用的研究.中国卫生统计,2006,23(4):323-325.

[3]Dana,Navarro,Maria.Refinement of medicare diagnosis-related groups to incorporate a measure of severity.Health Care Revive,1994,16(2)45.

[4]刘海霞,王玖,田考聪,等.决策树与回归技术在农村居民就诊服务研究中的应用.中国卫生事业管理,2012,5:376-378.

[5]刘海霞,王玖,林林,等.决策树与回归技术在居民就诊影响因素中的应用研究.中国卫生统计,2012,29(4):500-503.

(责任编辑:郭海强)

广东省医学科研基金(B2014126)

猜你喜欢
剪枝住院费用决策树
人到晚年宜“剪枝”
保健医苑(2022年5期)2022-06-10 07:47:22
基于YOLOv4-Tiny模型剪枝算法
我国脑卒中患者住院费用及影响因素研究
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
电子制作(2018年16期)2018-09-26 03:27:06
剪枝
天津诗人(2017年2期)2017-03-16 03:09:39
桑植 卫生院住院费用全报销
中国卫生(2016年9期)2016-11-12 13:28:08
基于决策树的出租车乘客出行目的识别
国家卫计委:2017年实现住院费用异地结算
人民周刊(2016年10期)2016-06-02 15:19:45
基于肺癌CT的决策树模型在肺癌诊断中的应用