■ 滕佳利 李 星 李心言 林 兴 韩优莉
为应对不合理医疗费用快速增长的压力[1],我国积极探索并深化医保支付方式改革,逐步从按项目付费(fee for service,FFS)为主的后付制向以按病种付费为主的多元复合式医保支付方式转变。目前国内外按疾病诊断相关分组(diagnosis related groups,DRG)付费是一种较为先进和科学的支付方式,虽然有研究证明在我国应用能有效减少医疗费用[2],但DRG付费应用和实施较为缓慢。为了更易实施和快速推出,我国形成了原创的支付方式——区域点数法总额预算和按病种分值付费(diagnosisintervention packet,DIP)。DIP指以总额控制和点数法为基础,在确定地区一个预算年度的医保基金支出总额预算的前提下,利用大数据通过“疾病诊断+治疗方式”确定各病种组合和分值(点数),根据各医疗机构为参保人员提供医疗服务的累计点数进行结算付费,即各医疗机构通过年度获得的医疗服务点数来分配区域总额预算,其实质是医保“点数法”在我国住院病种的具体实践[3-4]。
支付方式改革的目标主要在于引导和激励医疗服务供方行为,改革效果则依赖于医疗服务供方对支付方式的反应。政策分析类文献研究显示,DIP的突出优势体现在基于大数据分组、来自基础条件和分组技术方面的障碍少、更易推广和更具包容性;但可能存在依赖历史病案数据、诱导医疗机构采用复杂技术、高分值治疗方式、高套分组、群体博弈争相“冲点”导致分值贬值等一系列问题[4-7]。在实证研究方面,不少学者通过实地调研分析宿迁、淮安、南昌、银川、广州、揭阳、秦皇岛等试点城市及试点医院的改革情况,研究发现改革地区实施DIP后总体呈现医保基金使用效率提高、医保基金支出增幅放缓、例均住院费用下降或增幅下降、药占比降低和个人自付比例下降的趋势,银川市统筹基金和住院人次流向三级医院趋势明显[8-13]。但研究方法大多采用自身纵向对比的统计学描述或单因素分析,无法消除时间因素及混合因素的影响,结果的真实性有待考量。为增强效果评估的科学性,一些学者运用双重差分法评估DIP改革的控费效果,但结果并不一致[14-16]。
为了克服实证研究的缺点,国内外许多学者运用可控的经济学实验方法探究支付方式对医生行为的影响。一方面,实验研究可避免变量间的内生效应、不断变化的历史政策背景对研究带来的干扰,有利于相对准确地识别支付方式对医生行为的影响;另一方面,可利用实验室实验评估政策效果,提前预测政策可能带来的影响,从而减少政策试错的成本[17]。但目前研究DIP对医生行为影响的实验研究较为缺乏。谭清立等[18]通过问卷调查开展经济学实验分析比较按病种分值付费与按项目付费两种支付方式对医生行为的影响,但仅在实验中设计了按病种分值分组,未考虑区域总额预算和点数法的应用。
本研究旨在分析DIP对医生医疗服务行为的影响,但由于目前国内DIP试点地区DIP改革实践存在差异,因此本研究总结DIP制度设计原理并将其简化,同时考虑总额预算、病种分值及医生博弈,运用经济学实验模拟支付方式改革的效果,通过理解改革政策的作用机制,探讨新的支付方式可能带来的医生医疗服务行为变化的影响,为医疗机构医保质量管理提供依据。
本研究采用经济学实验方法。实验设定虚拟的患者,假定医保支付方式直接作用于医生,患者完全医保报销并完全接受医生决策。实验中共9种患者类型:由疾病类型(k=A,B,C)和疾病严重程度(j=1-轻,2-中,3-重)组合决定。实验组织者将招募到的医学生随机分为4人一组(作为一个实验小组),在实验中,小组内每个受试者i∈[1,4]扮演医生的角色,任务是在DIP的支付方式下对每位患者选择提供的医疗服务数量q∈[0,10]。
实验中支付方式参照DIP的设计理念,总结共性特征并适当简化。首先,考虑到“区域总额预算”,实验设定4名受试者(医生)为一个实验小组(作为一个区域),受试者在实验前被告知每个实验小组每轮实验总支付额为固定值,因此实验小组中4名受试者需要在每轮实验结束后以一定付费标准分配该预算总额。其次,为体现“病种分值”理念,实验中设定了医生对9种类型的患者选择提供的诊断及治疗操作种类组合q相对应的相对权重(点数),即实验中受试者的医疗决策可决定自己获得的医疗服务点数。每轮决策完成后,根据实验小组中4名受试者总医疗服务点数和总支付额计算每一点医疗服务对应的价值即点数价值,可以计算小组内成员各自的支付额及净收益,从而体现了“点数法”的应用。最后,考虑到DIP付费下存在医生群体博弈行为,本研究开展10轮的重复博弈实验。
因此,本研究将医生博弈纳入实验室实验,受试者关于医疗服务数量的决策不仅决定本人最终获得的净收益和患者健康效益,同时也影响实验小组中其他受试者的净收益。
2.2.1 医疗服务点数。根据DIP技术规范,病种分值(RW)为某病种组合平均医药费用与所有出院病例平均医药费用的比值,反映不同病种组合资源消耗程度的相对值,数值越高,反映该病种的资源消耗越高,反之则越低。其中,某病种组合平均医药费用参考Heike等[17]按项目付费时的支付额参数,所有病例平均医药费用参考同一课题的另一研究张馨元等[19]按项目付费下医生平均支付额结果(12.07实验室代币)。由此计算出的病种分值参数在0至1.86范围内波动,为与成本和患者健康效益参数保持在同一量级,便于实验呈现,引入医疗服务点数参数Pjk(q),即Pjk(q)=RWjk(q)*10。医生进行医疗决策时提供的医疗服务量q越大,其医疗服务点数越大。
2.2.2 点数价值。区域总额预算下每个实验小组4名受试者面对9种类型患者获得的总支付额(T)为固定值,小组总支付额T为实验小组受试者数与患者种类和所有病例平均医药费用(12.07实验室代币)的乘积,为434.51实验室代币。因此,每个实验小组的点数价值(v)为小组总支付额与小组总医疗服务点数的比值,即
2.2.3 医生净收益。每轮实验结束后,实验小组中每名受试者i为9种患者做出医疗决策获得的支付额Ri(q)为点数价值与获得的总医疗服务点数的乘积,即成本C采用Ma[20]的理论中所假设的凸成本函数C=0.1*q2,成本不受疾病类型及严重程度影响。因此,每名受试者i每轮实验获得的净收益πi(q)=Ri(q)-Ci(q)。
2.2.4 患者健康效益。患者健康效益参数B基于Heike等[17]设计的实验室实验。对于每位患者来说,存在一个唯一的医疗服务数量使得其健康效益最高,且这一最佳服务量会受到疾病严重程度的影响,疾病严重程度为轻、中、重的患者在医生分别提供3、5、7种医疗服务时可以获得其最佳健康效益,即也就是说,以最优服务量作为最佳医疗服务的数量基准,能够判断过度供给和供给不足(表1)。
表1 DIP付费下参数设置表
本实验通过瑞士苏黎世大学官网Z-tree平台进行编程。实验组织者通过张贴海报及网络宣传的方式招募首都医科大学48名医学生利用计算机作答参与实验,每4人随机分配至一个实验小组,共12组。实验前实验组织者分发知情同意书并讲解实验说明,预实验确认理解后再开始正式实验。为保证匿名独立的决策环境,设2名监督员监督。实验前受试者被告知每个实验小组每轮实验总支付额固定为434.51实验室代币,实验中每名受试者为9种不同类型的患者选择提供的医疗服务数量,且每个医疗决策都会影响自己获得的医疗服务点数和患者健康效益。每轮决策完成后,屏幕上显示本小组点数价值、小组内成员各自总点数、净收益和患者总健康效益,且组内成员互不知晓。每组分别进行10轮实验。实验中所有金额均以实验室代币显示。所有决策完成后,除了基本报酬30元外,每位受试者所有决策净收益折合成现金支付给受试者。
总体来看,在DIP付费下受试者提供的平均医疗服务量为5.67,高于平均最优服务量5,差异具有统计学意义(P<0.001)。从不同疾病严重程度看,DIP付费下受试者为轻、中和重度严重程度的患者提供的平均医疗服务量分别为4.19、5.80和7.03。对于轻和中度严重程度的患者,服务量均显著高于相对应的最优服务量3和5(P<0.001),重度严重程度患者平均服务量与最优服务量7差异无统计学意义(P=0.176>0.05)。
无论是从总体水平还是不同疾病严重程度层面来看,DIP付费下随着实验轮次的增加,平均医疗服务量整体呈缓慢增加趋势(图1)。
图1 DIP付费下平均医疗服务量变化情况
3.2.1 点数呈现上升趋势。受试者10轮实验平均点数为79.69。DIP付费下随着实验轮次的增加,受试者平均点数整体呈上升趋势,由第一轮次的75.15增长至第10轮的82.64,增长了9.96%;但波动幅度较大,尤其在第4轮、第7轮和第10轮实验出现明显增长。
3.2.2 点数价值呈现下降趋势。每个实验小组4名受试者点数价值相同,10轮实验中12个实验小组平均点数价值为1.36实验室代币,每轮实验平均点数价值最大值为1.45实验室代币(第1轮),最小值为1.31实验室代币(第10轮),下降了9.06%。DIP付费下随着实验轮次的增加,平均点数价值整体呈下降趋势,且在第4轮、第7轮和第10轮下降幅度较大。
3.2.3 医生净收益呈现下降趋势。受试者10轮实验平均净收益为76.56实验室代币,每轮实验受试者平均净收益最大值为78.75实验室代币(第1轮),最小值为74.64实验室代币(第10轮),下降了5.22%。DIP付费下随着实验轮次的增加,受试者平均净收益整体呈下降趋势,但波动幅度较大,尤其在第4轮、第7轮和第10轮实验下降幅度较大。
本研究运用患者健康效益损失比分析DIP 付费下医生的医疗服务供给行为给不同类型患者带来的效益损失。其中,患者效益损失比=(最优患者效益-实际患者效益)/最优患者效益。研究发现,DIP 付费下疾病严重程度为轻、中和重的患者健康效益损失分别为0.10、0.07 和0.08,轻症患者较中和重症患者效益损失较大,且随着实验轮次的增加波动幅度较大(图2)。
图2 DIP付费下患者平均效益损失比变化
属于同课题的另一研究开展探究FFS和DRG两种支付方式对医生医疗服务供给行为的影响的经济学实验[19],将本研究DIP付费的结果与前两种支付方式的数据进行对比分析。结果发现:总体水平上,三种支付方式的平均医疗服务量之间差异有统计学意义(P<0.001,进一步两两比较均有差异,P<0.001)。FFS和DIP付费激励医生提供的医疗服务量高于最优服务量,DRG则相反(图3)。
图3 不同支付方式下的平均医疗服务量
从不同疾病严重程度来看,三种支付方式下医生提供的服务量与患者效益最优服务量相比,除了DRG下轻症患者(P=0.079>0.05)、FFS下重症患者(P=0.948>0.05)和DIP 下重症患者(P=0.123>0.05)外,差异均有统计学意义(P<0.001)。也就是说,DIP下医生对轻症和中症患者存在一定程度的供给过度,但相比FFS过度服务的情况有所缓解,而DRG下医生对中症和重症患者存在一定程度的供给不足(图3)。
从患者健康效益方面来看,轻症患者的健康效益损失为DRG<DIP<FFS;中症和重症患者的健康效益损失均为FFS<DIP<DRG(表2)。
表2 不同支付方式下患者平均效益损失比(±s)
表2 不同支付方式下患者平均效益损失比(±s)
支付方式 疾病严重程度-轻 疾病严重程度-中 疾病严重程度-重FFS 0.14±0.16 0.06±0.08 0.04±0.10 DRG 0.03±0.16 0.10±0.18 0.11±0.14 DIP 0.10±0.18 0.07±0.14 0.08±0.17
本研究将DIP付费予以简化,运用经济学实验模拟区域点数法总额预算和按病种分值付费这一支付方式下医生医疗服务行为的变化倾向,基于对这些行为倾向的理解,可以为完善医疗机构医保管理和提升医疗机构内部管理提供依据。
4.1.1 DIP付费可能存在的优势。以DIP为代表的支付方式改革初衷是医保基金的安全,最终是为了提高基金使用效率,高质量地满足参保人的基本医疗服务需求;而医院高质量发展则需保证医疗服务的质量、效率和公平。DIP试点中对医疗服务行为进行监管为医保高质量发展和医院高质量发展的协同提供契机,有效地将医疗服务与医保基金相结合[21]。通过经济学实验中的医生行为研究发现,在患者健康效益方面,对于轻症患者DIP付费优于FFS,对于中症和重症患者DIP付费优于DRG付费。另外,DIP付费中存在一定程度的竞争机制,这使得DIP付费的监管压力要低于FFS和DRG付费。
4.1.2 DIP付费可能存在的问题。根据研究结果,DIP付费下轻症和中症患者仍存在一定程度过度服务的情况。另外,本研究采用累计点数进行结算,每轮实验结束后计算点数价值进行清算,以严格控制医保预算。随着实验轮次的增加,无论医生面对何种疾病严重程度的患者,均呈现出增加点数即增加提供的医疗服务量倾向。但在总额控制的情况下,增加点数带来所在区域医疗服务点数价值下降,医生自身净收益也可能随之下降,存在潜在的资源浪费问题。这与文献中提示的DIP可能诱导医疗机构高套分组等不合理诊疗行为导致分值贬值的现象相一致[4,22-23]。可运用博弈论中“囚徒困境”进行解释,参与者追求个人利益最大化,而不是选择合作,但此时集体利益却不是最优解。
虽然DIP付费可能带来资源浪费的问题,但相比FFS还是较优的支付方式。相较FFS,DIP付费过度服务的情况有一定的缓解,且轻症患者的效益损失也相对较小。而DIP付费由于不合理诊疗行为带来的资源浪费问题需通过医保监管予以控制。
目前我国多地实施DIP付费试点,试点地区医疗机构应加强医保质量监管,避免可能带来的负面效应。可以通过医保智能监控系统动态监测医生行为,加强违规行为过程监管,及时预警和纠正不合理的诊疗行为。DIP付费下医疗机构医保质量监管可考虑医疗服务提供的能力、质量、效率、费用控制,医保基金使用效率、医保管理质量,以及患者受益和满意度及医务人员满意度等方面,并建立定点医疗机构动态管理机制[24]。DIP付费以大数据为基础,为医院管理提供了大量数据信息,但若真正引导医生行为还需将医保质量监管与绩效考核相结合,从而激励医生规范自身医疗行为,提高医生服务的积极性。