基于分位数回归与决策树模型的跌倒患者住院费用影响因素分析*

2021-03-16 10:19重庆医科大学附属第一医院400016
中国卫生统计 2021年1期
关键词:住院日位数决策树

重庆医科大学附属第一医院(400016)

苏飞月 符美玲 谭慭莘 肖明朝△ 赵庆华

【提 要】 目的 应用以多元逐步回归为代表的传统回归分析方法与分位数回归模型分别探究住院费用的影响因素,通过卡方自交互侦测决策树(chi-squared automatic interaction detector,CHAID)建立费用分组模型。为科学分析住院费用、制定针对性的控费措施及体系完善提供参考依据。方法 采用回顾性研究法,收集重庆市两所三级甲等综合医院2016-2019年因跌倒住院的6627例患者基本信息及费用情况,对基本信息进行描述性分析,在单因素分析基础上,分别采用多元逐步回归分析和分位数回归模型筛选纳入决策树的分类节点变量,并比较两者的分析结果。根据比较结果最终选择将分位数回归结果中有影响作用的变量纳入CHAID决策树模型建立住院费用分组模型。结果 单因素分析结果显示,跌倒患者住院费用的影响因素有付费方式、职业、婚姻、年龄、住院日、受伤部位、受伤类型、手术次数及手术类型;经分位数回归分析得的住院费用影响因素包含了多元逐步回归分析结果中的影响因素,显示付费方式、婚姻、年龄、住院日、受伤部位、手术次数、受伤类型和手术类型在住院费用的不同分位数点产生影响(P<0.05)。在分位数回归模型结合CHAID决策树模型建立的费用分组模型中,手术次数、住院日、手术类型、受伤部位和受伤类型为最主要的影响因素,每种组合的费用差异明显。结论 相较于传统回归分析方法,选择分位数回归模型探究住院费用影响因素更稳健全面。在分位数回归模型基础上,结合CHAID决策树模型组构建的住院费用分组模型较为合理,能清楚反应影响住院费用的重点因素,为医院完善控费制度,制定医保费用支付标准提供参考依据。

2017年德国波恩召开的“第二届患者安全全球部级峰会”会议发布了《患者安全的经济学影响——在国家层面上施行基于价值的患者安全改进方法》报告[1-2],强调了从患者安全角度开展卫生经济学研究的必要性。美国疾病控制中心2001年的调查数据显示,跌倒带来的经济负担高达2000万美金[3]。跌倒不仅给患者带来身心伤害,还增加了医疗和照护负担,造成有限的医疗资源和医保基金的浪费。跌倒作为患者安全经济学研究中的一部分,研究跌倒带来的经济损失及影响因素有利于加强对跌倒预防的重视。

目前,国内虽有与跌倒住院患者费用相关的研究[4-6],但研究对象多为老年人群,纳入费用分析的影响因素不全面,也鲜有研究涉及医保基金支付情况,且目前大多研究仍采用传统的线性回归模型分析住院费用影响因素,对分析住院费用这类偏态分布的资料具有局限性。基于此,本研究以卫生经济学为理论依据,从患者安全角度出发,调查因跌倒住院造成的医疗经济负担,采用传统回归分析与分位数回归模型分别探究跌倒患者住院费用的影响因素,并比较两种回归分析法的结果,选择将更可信的回归方法所得的自变量纳入卡方自交互侦测决策树(CHAID)模型构建跌倒患者住院费用分组模型,以期为科学探究住院费用影响因素、合理管控住院费用提供支持。

对象与方法

1.研究对象

本研究通过重庆市两所三级甲等医院的信息系统(hospital information system,HIS)查询并选取2016-2019年跌倒住院患者的病案首页数据。本研究通过了伦理审查委员会的审批(批号:2019-288)。

2.纳入与排除标准

(1)纳入标准

①电子病历中入院诊断为跌倒,或主诉、现病史中筛选出包含“跌倒、摔倒、跌伤、摔伤、跌坠、坠落、跌落、摔落、滑倒、绊倒、跌下、摔下、倒下、倒在”关键词的患者病例。

②已在2016年1月1日至2019年12月31日办理出院结算的患者。

经过上述的纳入后共收集7344例数据。

(2)排除标准

所有收集的数据中存在下列情况之一的予以剔除:①影响研究的关键变量缺失,如:出入院时间不详、住院费用明细或患者基本信息不全等,此类共剔除8例;②住院时间小于2天,如:住院当天因病情变化转院或死亡的数据,此类共剔除14例;③由第三方赔付的跌倒病例(如车祸、高空作业跌落),此类共剔除382例;④既往发生的,跌倒与此次住院无直接相关关系的病例,此类共剔除182例;⑤记录重复的住院费用数据,此类共剔除131例。经过上述的排除后共收集到有效数据6627例。

3.研究方法

采用回顾性病例研究方法,将前期经电子病历查询到的患者住院号导入HIS系统获取患者住院总费用及各单项住院费用明细,如药品费、诊断费、治疗费、医用耗材费、血液费、综合医疗服务费等信息;收集患者基本情况,包括付费方式、职业、婚姻、住院次数、年龄、住院日、住院科室、受伤类型、受伤部位、手术类型等情况,通过医保信息系统获取医保支付费用信息。

4.统计学方法

采用excel 2010软件建立数据库录入数据,运用SPSS 23.0和STATA 15.1统计软件进行分析。

调查对象住院费用相关指标均呈现偏态分布,采用M(P25,P75)描述,将住院费用作为因变量纳入Wilcoxon rank sum检验、Kruskal-Wallis H检验、Spearman′s rank correlation检验进行单因素分析,设定检验水准α=0.05。将结果中差异有统计学意义的项目作为自变量,将跌倒住院费用取对数,变换为近似正态分布的数据后,作为因变量纳入多元逐步回归和分位数回归模型进行分析。为了分析住院费用低、中、高水平下的影响因素,本文参考以往类似研究的经验[7-9],选取住院费用的10%、50%和90%三个分位数点进行分位数回归分析。对比多元逐步回归与分位数回归模型筛选出的影响因素后,选择更全面的分析结果纳入CHAID决策树模型中建立住院费用分组模型。

分位数回归模型:是估计一组回归变量X与被解释变量Y的分位数之间线性关系的建模方法,强调条件分位数的变化[10]。分位数回归的线性回归模型简单表述如下,一个连续随机变量y,起总体t分位数是y(t)的定义是:y≤y(t)的概率是t,即t=P(y≤y(t))=F(y(t))。其中P表示概率,F(y(τ))表示y的累积(概率)分布函数。

CHAID决策树模型[11]:即卡方自动交互检测法,可以快速、有效地挖掘主要影响因素。其核心思想是根据结果变量和解释变量对样本进行最优分割,按检验结果进行多元列联表的自动判断分组。分析会生成一个易于解释的图形,该图形从0或根节点开始,识别出重要的解释变量后,该算法会根据数据的分布在数据集中执行细分(节点)。顺序生成的节点称为子节点,当该节点的数据无法再提供其他子组时,则将其视为终端节点或叶。

5.贴现

采用2016-2019年中华人民共和国国家统计局公布的重庆市居民消费价格指数(consumer price index,CPI)对所有费用数据进行修正,使费用数据对比更有科学性。2016-2019年CPI分别为101.8%、101%、102%、104.7%[12]。

6.质量控制

在研究开始前,与相关领域专家讨论并构建科学合理的调查项目,并对参加课题的两位研究生开展培训。向其讲解研究目的及数据调取流程,加深其对跌倒及费用研究的了解。研究过程中对收集的数据进行编号;数据录入过程中,采取双份独立录入校对的方法,确保数据录入的准确性。

结 果

1.调查对象的一般资料

本研究共纳入跌倒住院患者6627名,男3172例(47.9%),女3455例(52.1%);年龄(60.00±19.83)岁;城镇居民4828例(72.9%),农村居民1799例(27.1%)。入院途径:急诊入院2638例(39.8%),门诊入院3490例(52.7%),转诊入院490例(7.4%),其他方式入院9例(0.1%)。平均住院日(13.88±21.47)天。

2.跌倒患者住院费用构成情况

6627例患者跌倒总住院费用为334812366.25元,每例患者跌倒住院费用117.00~1079873.01元[M=39923.55(P25=14433.68,P75=61255.23)]元。费用构成见表1,其中耗材类费用为主要构成部分。医保支付费用共计166729547.02元,报销比例达49.8%,每例患者医保支付费用为0~1079873.01元[M=11997.92(P25=2366.54,P75=33157.27)]元。

表1 跌倒患者住院费用构成

3.跌倒患者住院费用的单因素分析

采用Wilcoxon rank sum检验、Kruskal-Wallis H检验、Spearman′s rank correlation检验对住院费用进行单因素分析,结果显示,不同性别、城乡类别、住院次数及入院途径的患者跌倒住院费用比较差异无统计学意义(均P>0.05);差异有统计学意义的项目见表2。

表2 住院费用差异有统计学意义的项目

4.跌倒患者住院费用的多元线性逐步回归分析

以经对数转换的住院费用为因变量(Y),以单因素分析筛选出的付费方式(X1)、职业(X2)、婚姻(X3)、年龄(X4)、住院日(X5)、受伤部位(X6)、受伤类型(X7)、手术次数(X8)、手术类型(X9)为自变量进行多元线性逐步回归分析,α入=0.05,α出=0.10。有序变量按照等级的秩序进行赋值,无序变量以哑变量形式赋值,各变量赋值方式见表3。结果显示,影响因素为住院日、年龄、付费方式、受伤部位、手术次数、手术类型。F=753.673,P=0.000,调整R2=0.630,影响因素能解释跌倒住院费用变异的63.0%,结果见表4。

表3 跌倒患者住院费用影响因素自变量赋值方式

表4 跌倒患者住院费用的多元线性逐步回归分析

5.跌倒患者住院费用的分位数回归

为了与多元逐步回归分析相比较,同样基于单因素分析结果,选择付费方式、职业、婚姻、年龄、住院日、受伤部位、受伤类型、手术次数、手术类型为自变量纳入模型,结果见表5。

表5 跌倒住院患者分位数回归估计结果

患者的手术次数、住院日、年龄以及手术类型在其住院费用的三个分位数点上均产生了显著影响(P<0.05),且患者的手术次数、住院日这两个因素在费用的高分位数点上的影响强度高于低分位数点。年龄因素在低分位数点上的影响强度高于高分位数点。手术类型中,接受清创缝合术的患者在50%分位数上高于无手术患者的住院费用(P<0.05),其余手术类型的患者均在低分位数点上高于无手术患者的住院费用(P<0.05)。患者的受伤部位对高住院费用人群的影响更显著(P<0.05)。付费方式为职工医保的患者住院费用在50%分位数点上高于付费方式为商业医保患者的住院费用(P<0.05),且在10%和50%分位数点上高于付费方式为全自费患者的住院费用(P<0.05)。

此外,与多元线性逐步回归分析结果相比,婚姻和受伤类型在患者住院费用的不同分位数点上也产生影响,已婚与丧偶患者的住院费用在50%分位数点上显著低于未婚患者的住院费用(P<0.05),患者的受伤类型中,器官破裂和其他类型对高住院费用人群的影响显著(P<0.05),骨折和脱位对低住院费用人群的影响显著(P<0.05),而关节损伤和挫裂伤对中等住院费用人群的影响更显著(P<0.05)。

6.跌倒患者住院费用的决策树模型

对比分位数回归模型结果与多元逐步回归结果后发现,分位数回归模型结果中的影响因素包含多元线性逐步回归结果中的影响因素,且可反映各影响因素在不同水平住院费用上的作用大小。因此,本研究将分位数回归分析结果中对住院费用有影响作用的变量纳入决策树模型,筛选组合分类节点。决策树分析采用CHAID预剪枝的方法进行树的剪枝处理,本文参考以往类似研究的经验[13-14],选取最小个案数:父节点200,子节点100。最大树状图深度为根以下3层。拆分合并节点的显著性水平的α值为0.05。使用10倍交叉验证进行决策树计算效果的验证。最终构建的跌倒患者住院费用分组模型见图1,决策树模型分析结果排除了婚姻、付费方式和年龄,最终纳入手术次数、住院日、手术类型、受伤部位和受伤类型5个变量。

图1 基于分位数回归模型与决策树模型构建的跌倒患者住院费用分组模型

分组模型显示,住院费用花费最多的是手术次数2次并且住院日在31天以上的患者,未手术、住院天数在14天以内且受伤类型为上肢、假体或无的患者花费最少。各组间假设检验P<0.05,说明各组间费用差异有统计学意义,住院费用在组内变异相对较小,可以证明该模型分组相对合理,决策树的预测风险分值为0.083。

讨 论

本研究中,跌倒造成的住院费用总计达3亿余元,费用高昂。跌倒相关住院费用中位数高于既往相关研究中跌倒受伤的患者[15-17]。一方面可能是因为本研究纳入对象为跌倒住院患者,受伤程度严重,而其他研究多以社区老年人为调查对象,发生跌倒伤害的程度不一,存在部分为轻度伤害的人群;另一方面,本研究选取的样本均来自三甲医院,患者的病情严重程度更高,由此造成的费用差距较大。跌倒住院的患者中超过80%的患者参加了社会医保,医保基金支付了近一半的住院总费用,而跌倒作为可避免的意外伤害事件,其医疗费用是可避免的支出,加强跌倒预防工作,有利于减少不必要的医疗资源和医保基金的浪费。

跌倒患者住院费用构成中,耗材费用占比最高,这可能与本研究中患者跌倒后多发生骨折损伤有关。骨折患者以手术治疗为主,多用内固定装置或人工关节假体,这些耗材本身价格昂贵,不可避免地增加了患者的住院费用。要进一步降低跌倒患者经济负担,需加强骨科科室的高值耗材管控,鼓励医护人员在保障患者安全的基础上优先选用低价优质耗材。

传统回归分析方法描述的是因变量条件均值的变化,容易导致数据的某些信息难以被发现。相比于传统的回归分析方法,分位数回归结果可以估计给定解释变量的被解释变量住院费用的总体条件分布,对于偏态分布的住院费用数据而言,使用分位数回归估计结果更为稳健[7]。在本研究中,除传统回归分析结果显示的影响因素外,分位数结果还提示婚姻与受伤类型在不同水平的住院费用人群中产生了不同程度的影响。较传统回归分析,分位数回归能描述住院费用条件分布的不同分位点上变量间的关系,因此估计结果更加全面、稳健,对政策完善更具指导意义。

本研究最终选择在单因素分析和分位数回归分析基础上,纳入有统计学意义的变量(婚姻、付费方式、年龄、手术次数、住院日、手术类型、受伤部位和受伤类型)进行住院费用分组分析。结果显示,手术次数、住院日、手术类型、受伤部位和受伤类型进入了决策树分组模型。住院日是反应医疗质量的指标[18],住院日的增加意味着床位费、药品费、治疗费等医疗服务费用的增加,加大了医疗资源的消耗。手术次数与住院日除了与患者病情严重程度有关,也受医务人员医疗水平及医院管理制度影响。复杂的手术类型不仅会增加耗材的使用,也会因术后恢复难度大,增加住院日和住院费用。患者受伤部位越致命、受伤类型越严重,其治疗的难度也越大,严重的跌倒伤害会限制患者的活动,易增加褥疮、肺部感染或尿路感染的风险,因此住院费用也相对较高。研究构建的决策树分组模型预测风险较低,费用分组模型能清楚直观反映费用的影响因素,为相关部门制定有针对性的改进措施提供指导意义,帮助减轻患者疾病经济负担的同时,也为完善医保支付标准提供参考价值。

发生跌倒后的医疗费用高昂,医保基金支付比例高,大量医疗资源被占用,但跌倒是可避免的,将治疗伤害的资金投入到预防伤害的工作上将产生更多收益[19]。从预防角度而言,要减少跌倒带来的经济负担,应以跌倒高风险人群为重要宣教对象,丰富预防策略。对已发生跌倒的患者,政府可通过建立救助体系来减少跌倒的不良影响,鼓励有条件的医疗机构设立专门的跌倒门诊。医院需重视对科研型、技能型人才培养,推行多学科团队共研医疗难题;医护人员应严格要求自身,加强技能训练,避免因自身医疗水平不达标造成的患者住院日延长,这与卫计委减少无效住院日的要求一致。本研究所构建的跌倒住院费用分组模型为相关职能部门找准费用管控关键点提供了参考。

本研究对发生跌倒患者的经济负担估计遵循的是经济学稳健估计原则,测算的是住院费用,但实际上还存在患者因经济困难、自身病情复杂等原因在此次住院期间内未完成全部治疗的情况,因此,实际产生的跌倒相关治疗费用应该更高。其次本研究采用的是回顾性调查,调查的研究资料和实际情况可能有误差,未来可进行大样本的现况调查。此外,在跌倒住院患者费用分析中,可以考虑将受伤类型作为患者分型的基础指标。

猜你喜欢
住院日位数决策树
五次完全幂的少位数三进制展开
连续自然数及其乘积的位数分析
多举措缩短平均住院日效果分析
一种针对不均衡数据集的SVM决策树算法
173例儿科超长住院日患儿分布特征及影响因素分析
决策树和随机森林方法在管理决策中的应用
某院1740例超长住院日患者影响因素分析
基于决策树的出租车乘客出行目的识别
基于肺癌CT的决策树模型在肺癌诊断中的应用
遥感卫星CCD相机量化位数的选择