李法军
河南省郑州大学第三附属医院病案管理科(450052)
【提 要】 目的 以儿童肺炎作为一个基本DRGs分组探索DRGs细分方法,进一步为专科医院开展DRGs管理工作探索适合的实施路径。方法 利用单因素方差和多元线性逐步回归分析筛选出住院费用的重要影响因素,利用CHAID决策树算法进行儿童肺炎细分组,并对细分组结果进行检验,计算每组预测住院费用。结果 将儿童肺炎细分为8个分组,组内同质性和组间异质性显示分组合理。结论 病案质量和编码标准化是基于统计原理获得合理DRGs分组的关键影响因素。
疾病诊断相关分组(diagnosis related groups,DRGs)是一种运用统计控制理论原理将住院病人分类的方法。其分类基础是住院病人的主要诊断编码和手术操作编码,并在此基础上考虑患者年龄、性别、有无合并症或伴随病等情况的影响,采用适当的统计决策方法将临床特征、住院天数和医疗资源消耗近似的病人归为同一个诊断相关分组。这种病例组合分类方法正逐渐成为各级医疗机构在绩效评价、医保支出及医疗资源配置等管理层面更合理、高效、公平的决策思维模式,DRGs是一套医疗管理工具[1]。本研究拟以妇幼专科医院儿童肺炎患者为研究对象,确定其住院费用的影响因素,并且采用决策树建立DRGs病例分组,获取各分组的标准医疗费用,旨在探索适用于专科医院开展DRGs工作的实施路径。
资料来源于河南省某三级甲等妇幼专科医院病案首页数据,选取2012年1月1日至2016年12月31日主要诊断为肺炎(ICD-10编码为J18),同时年龄在17岁以下的所有病例,建立数据库。数据库中主要变量有住院号、性别、年龄(精确为月、天、小时)、新生儿出生体重、新生儿入院体重、入院日期、住院天数、离院方式、总费用及各项费用、主/次要诊断名称及编码、主/次要手术名称及编码等。对数据库进行初步整理核查,修正或剔除有缺项、明显逻辑错误的病例,剔除住院天数为0天、治疗结果为“未愈”的病例,最后得到有效病例共13883人。
根据专家建议及文献调查结果确定住院费用的可能影响因素,利用excel 2007初步进行数据筛选与整理,利用SPSS 19.0对数据进行单因素方差分析和多元线性逐步回归分析,进一步从相关因素中筛选出住院费用的重要影响因素。在对医院儿童肺炎患者随访中发现,住院患者随年龄增加病例数量呈下降趋势,考虑新生儿及入托、入学等因素将年龄段划分为≤1个月组、1个月~12个月组、1岁~3岁组和4岁以上组;新生儿体重划分为≤2kg极低体重儿组、2kg~2.5kg低体重儿组和2.5kg以上正常体重组。具体影响因素及赋值见表1。
表1 儿童肺炎住院费用影响因素赋值表
使用数据挖掘工具SPSS Modeler 14.1中卡方自动交互检测(CHAID)模型构建决策树,分组评价标准包括组内同质性评价及组间异质性评价。变异系数(coefficient of variation,CV)反映了各分组组内相关情况,数值越小,组内同质性越好。方差减少量(reduction in variation,RIV)是用来检验各分组组间异质性常用指标,数值越大,组间异质性越好[2]。
本研究共收集有效儿童肺炎患者13883例,年龄1天~17岁,平均年龄(1.35±2.23)岁,年龄≤1个月209例,占1.50%,2个月~12个月7467例,占53.79%,1岁~2岁3340例,占24.06%,3岁~6岁2213例,占15.94%,7岁及以上653例,占4.70%。男性患者8890例,占64.04%,女性患者4993例,占35.96%。新生儿中极低体重儿10例,低体重儿4例,正常体重儿192例。平均住院天数(10.25+6.64)天,住院天数中位数为9.00天。平均住院总费用(9457.65±11889.47)元,总费用中位数为6111.09元。
经过单因素方差分析,以年龄、性别、新生儿体重、住院天数、有无伴随疾病、伴随疾病个数、有无手术、手术个数等指标作为自变量,以住院总费用作为因变量,进行多元线性逐步回归分析,结果显示:住院天数、伴随疾病个数、有无手术、性别等4个变量进入方程,其决定系数R2= 0.625,说明4个因素可以解释62.50%的费用变异。由标准回归系数可知,影响儿童肺炎患者住院费用的因素按照影响程度从大到小依次为住院天数、伴随疾病个数、有无伴随疾病、有无手术、性别,见表2。
表2 儿童肺炎患者住院费用影响因素多元逐步线性回归分析结果
本研究采用CHAID决策树算法,以住院总费用作为因变量,以住院天数、伴随疾病个数、有无手术、性别作为分类节点。参数设置为:父/子节点最小样本数900/450,最大树深度3,拆分节点检验水平α=0.05。将13883例儿童肺炎病例共形成8个DRGs分组,各组的均数、标准差、中位数、变异系数见表3。
组间异质性评价RIV=53.28%,说明组间异质性好。DRGs各分组变异系数最大值为0.79,说明组内同质性好。
利用上述方法将病例分组后,尽管各组内费用变异已经较小,但是在实际工作中,还是会出现费用过高或者过低的情况,因此,将住院费用上、下限分别调整至75%分位点加1.5倍四分位数间距和25%分位点减去0.5倍四分位数间距,标准费用为上、下限区间范围内住院费用均数。并计算各DRG组的病种权重,即该种DRG组合的例均住院费用与所有病例平均费用的比值,权重越高,说明病人消耗的资源越多。
表4 DRGs分组标准住院费用预测(元)
DRGs将疾病特征相似、临床过程相近或者医疗资源消耗相当的病例分类组合成为若干个组别,组与组之间制定不同的权重反映各组的特征[3]。因此,DRGs既可以使得管理者在各组权重的基础上恰当地划分医疗服务产品,又可以公平合理地评价不同医疗服务提供者的绩效和医疗资源消耗情况。同时,DRGs在宏观的医疗保险预算中也发挥重要作用。
本地区医疗机构在国家卫计委推动下于2016年开启了DRGs的准备工作,包括:某三级甲等综合医院被指定为本地区DRGs试行单位;各医疗单位派相关病案管理人员参加由中国医院协会医疗质量管理专业委员会举办的全国住院病案首页数据填报质量规范培训。我院于2017年3月启用新版电子病历首页,为下一步实施DRGs管理做好数据基础建设工作。
本研究为我院DRGs工作开展做前期铺垫。一方面,梳理电子病历首页历史数据,并对其中明显的错误及缺项等予以纠错。由于病历首页中主/次要疾病编码及主/次要手术编码是DRGs分组的重要依据,因此电子病历疾病和手术编码质量控制是DRGs实施的首要工作。另一方面,探索基于电子病历首页的DRGs分组方法。选择高发病例之一的儿童肺炎患者作为研究对象,这是因为肺炎是儿童常见病和多发病,发病率较高,并发症较多,属于急性住院病例,和《方案》中ES10(呼吸系统感染/炎症<17岁)分组接近。本研究利用统计分析和CHAID决策树方法将13883例儿童肺炎病例按照伴随疾病和住院天数的不同分成8个组。组间异质性和组内同质性均达到合理范围之内,分组合理。伴随疾病个数和住院天数是影响儿童肺炎住院费用的重要影响因素,DRG1组(伴随疾病个数0~1,住院天数≤4)住院总费用最低,耗费医疗资源最少;DRG8组(伴随疾病个数≥2,住院天数≥18)住院费用最高,耗费医疗资源最多。值得注意的是,在计算各组标准住院费用的预测值时,DRG8组参考值下限2532.66元,小于本组住院费用的最小值,这是由于该组住院天数范围过大,因而住院费用差异过大,导致四分位数距离过大造成的。CHAID算法给出的分组结果,即使变异系数值处于合理范围,但在实际应用中依然需要利用适当手段予以修正[4-9]。