基于E-CHAID算法胆囊结石患者DRGs分组研究

2019-09-17 11:55商丘市第一人民医院病案科476000邵慧丽宁传英
中国卫生统计 2019年4期
关键词:住院费用决策树消耗

商丘市第一人民医院病案科(476000) 邵慧丽 宁传英

【提 要】 目的 探索本地区胆囊结石患者住院费用病例组合模式。方法 收集某医院2015-2017年1448例胆囊结石患者信息,采用单因素分析、多元线性回归分析及决策树模型的E-CHAID算法进行病例组合分析。结果 年龄、住院天数、手术情况三个分类节点将1448例患者分为6个DRGs组合和相应的标准费用、线外费用情况。结论 E-CHAID决策树分类算法能充分反映病情复杂程度对医疗资源消耗的影响及不同病例组合的费用差异度,可使DRGs分组更为合理。

医保改革的关键在于建立科学合理的管理模式和支付方式,以保障医疗服务体系的合理运作,因此,合理控制医疗费用成为改革的重点和难点[1-2]。基于病例组合的付费方式是目前公认的缓解医疗费用最有效的途径,DRGs作为一种新型的病例组合方案是目前公认的较为先进的医疗付款方式,利于医疗资源的合理配置,提升医疗服务质量和医疗服务效率,其在医院管理、医疗费用控制上的优势逐渐得到体现[3-5]。根据形成的DRGs分组方案,探讨胆囊结石患者的住院费用标准,为我市DRGs的应用提供参考依据。为使各项费用具有可比性,以2017年为标准,运用居民消费价格指数(CPI)进行费用合理调整。

资料与方法

1.资料来源与预处理

收集河南省某三甲医院2015-2017年出院的以“胆囊结石”(ICD-10编码亚目为K80.1和K80.2)为主要诊断的医院信息系统病案首页数据。剔除所分析项目存在缺项、漏项、错项、不合逻辑等项目不完整的记录,以及住院费用存在异常值的病例。由于住院费用呈偏态分布的特征,剔除异常值的标准是P50±1.5Q(P50为中位数,Q为四分位间距),过滤后纳入有效病例1448例建立数据库。

2.病例组合及统计分析方法

采用单因素方差分析和多元线性回归分析法确定住院费用的影响因素,然后将筛选出的影响因素作为分类节点纳入决策树模型,E-CHAID法构建决策树。设置决策树的生长规则,最大深度为4层,父节点最少个案100例,子节点最少个案50例,决策树合并和拆分的检验水准α=0.05。使用变异系数(CV)、方差减少量(RIV)等相关指标对分组进行评价,来确定分组的合理性。

结 果

1.一般情况

本研究纳入有效样本1448例,其中2015年461例,2016年463例,2017年524例;患者年龄2~98岁,平均年龄(54.97±15.21)岁,其中年龄≤60岁844例,≥61岁604例;男性患者361例,女性患者1087例;医疗付款方式:城镇医保292例,占20.17%,新农合1143例,占78.94%,全自费10例,占0.69 %;平均住院日(7.02±2.12)天,平均住院费用(9522.47±1385.19)元。

2.分类节点变量筛选

单因素方差分析和多元线性回归分析确定住院费用的影响因素(表1),回归模型具有统计学意义(F=102.588,P=0.001),从标准回归系数知手术、住院天数对住院费用的影响最大,其次是入院途径、出院年份、年龄。其中决定系数R2=0.574,VIF<5,可以认为不存在共线性问题。根据相关经验,以自变量年龄、住院天数、手术情况作为分类节点纳入决策树模型。

3.分组结果及分组结果评价

经E-Chart算法共分为6个DRGs组,分组结果见表2,“腹腔镜,>7天,>60岁”患者次均费用最高。变异系数(CV)指标准差与均数的比值,本文采用中间区段法计算CV,高低位点之间的数据进入变异系数的计算,其中,低位点=Q1-0.5(Q3-Q1),高位点=1.5(Q3-Q1)+Q3,Q1指25分位数,Q3指75分位数[6]。

评价分组效果的合理性可知组间差异具有统计学意义(P<0.00),组内医疗资源消耗同质性指标变异系数CV为0.13,且各组合CV均小于0.8,组间资源消耗异质性指标方差减少量RIV为0.85,故组间异质性高,组内同质性好。即分类节点选择正确,分组效果较好。

4.病例组合费用标准及线外费用情况

病种权重反应医疗资源消耗的相对程度,其计算标准为组内均值与总体均值的比例。有3个组合病种权重大于1,即该组合具有较高的复杂性、病情较复杂,医疗资源消耗较高(表3)。用各组中位数作为住院费用的标准值,用各DRG组合病历住院费用的75分位数加1.5倍四分位间距(P75+1.5Q)作为控制费用上限[7-8]。用费用上限计算线外病人比例及线外费用比例来评价线外资源消耗情况,其中“线外资源消耗”为线外患者所消耗资源之和,“线外费用”即线外病人资源消耗超过标准预测值的费用部分。线外患者26人,占样本总体的1.8%,总体线外费用比例为0.1%,且各组“线外费用比例”均小于5%。相关分析知,线外病人比例与线外费用比例的Pearson相关系数为0.958,两变量呈正相关,因此应重点控制线外费用、线外病人比例高的组合。

表1 胆囊结石患者住院费用影响因素变量赋值及分析

表2 胆囊结石DRGs分组结果

表3 胆囊结石住院费用标准、线外费用情况及病种权重

讨 论

以DRGs为基础的住院费用标准,既是医疗资源利用标准化在医院管理中的具体体现,也为医保的定额支付标准提供一定参考依据。DRGs分组不单纯依赖主要诊断ICD-10编码和手术操作编码ICD-9-CM-3,消除诊断和手术操作相似、住院费用差异较大带来的局限性,把病情、病人、治疗手段等条件纳入疾病诊断相关分组分为不同的DRGs组。病例组合可以有效地把同一疾病的不同特征分开,因此,研究胆囊结石患者的DRGs病例组合方案可以为我市探索科学合理的费用标准提供参考依据。

本研究采用E-CHAID构建决策树模型,选择年龄、住院天数、手术情况三个变量作为分类节点,共分为6个DRGs组,由于患者多伴胆囊炎,故并发症、合并症、伴随症变量没有进入决策树模型,与实际情况较为符合。决策树E-CHAID模型第一层分类节点手术情况,经手术治疗和腹腔镜治疗的患者住院费用明显高于保守治疗患者。在当今循证医学的时代,腹腔镜微创技术被称为“保存生命质量的手术”,可较大限度地减少患者手术损伤,住院时间短、恢复快,医疗资源消耗相对较低,是较为理想的手术方式。第二层分类节点住院天数是影响住院费用的主要因素,住院天数越长,医疗资源消耗越高,缩短住院天数是控制住院费用的有效措施,注重住院过程中各环节的衔接,减少住院过程中的无效等待时间、选择高效的手术方式可有效减少住院天数。第三层分类节点年龄,胆囊结石随年龄的增长发病率增高,60岁以上患者对医疗卫生服务的需求较多,也增加了医疗资源的消耗。

本研究1.8%的线外病人消耗了2.27%的医疗资源。不同DRGs组合线外费用比例和线外医疗资源消耗比例不同,组合“腹腔镜,≤7天,>60岁”和组合“腹腔镜,≤7天,≤60岁”线外病人比例分别是3.52%和2.12%,线外费用比例分别是2.67%和1.40%,线外资源消耗比例分别是4.519%和2.785%,两个DRGs组合应是重点控制的对象。通常情况下,线外病人比例高的DRGs组合,线外医疗资源消耗也高,但是,部分线外病人比例低而线外资源消耗高,因此,要有重点地控制这部分线外病人[9]。

DRGs是当前国际上比较认可的一种支付方式,在卫生体制改革向纵深方向发展的时刻,应不断发挥其在医保、医药、医疗三联动中应有的作用。DRGs的顺利实施需要完善的配套措施,不仅包括完善的医院信息系统和监测医疗行为的预警系统,还有清晰的预算方案和精细化管理制度,更要提高医疗服务的管理和质量。同时,病案首页质量是关键基础,而ICD编码标准化更是直接影响DRGs分组结果,也应加强对其重要性的认知并重点监管。总之,大数据时代,病例组合将会更加准确、有效地指导医疗付费。

猜你喜欢
住院费用决策树消耗
玉钢烧结降低固体燃料消耗实践
转炉炼钢降低钢铁料消耗的生产实践
基于决策树和神经网络的高血压病危险因素研究
新生儿肺炎患者(日龄<1 天)住院费用及影响因素
降低钢铁料消耗的生产实践
我国脑卒中患者住院费用及影响因素研究
我们消耗很多能源
北京市医保局:部分住院费用 4月1日起“无纸化”报销
决策树和随机森林方法在管理决策中的应用
决策树多元分类模型预测森林植被覆盖