顾灵娜,蒋 茜,路 云,常 峰
中国药科大学国际医药商学院,江苏南京,211198
我国医药卫生体制改革已进入深水区,而药品集中带量采购作为药品供应保障体系的重要组成部分,在规范临床用药、降低药品虚高价格、改善药品流通秩序等方面发挥重要作用。自2018年启动“4+7”带量采购试点以来,国家已经组织开展八批药品集中带量采购,品种数量达333种,涉及金额超公立医疗机构化学药、生物药年采购额的35%,平均降幅超50%[1]。同时,地方积极以独立或跨区域联盟的形式开展了50余批药品集中带量采购,我国药品集中带量采购正向着常态化、制度化的方向开展。
医药企业和医疗机构是药品集中带量采购的主要利益相关者。两者在不同政策导向及监管力度下面临的风险与收益不同,同时两者参与集采的策略选择会相互影响,因此不可避免地会形成一系列行为博弈。若缺乏有效的激励机制,两者可能在权衡利弊后采取消极参与集采的策略,包括医药企业消极报价、医疗机构完成约定量后过多使用非中选产品等,导致集采的中选结果和落地效果低于预期。根据学者研究,激励错配是导致英国、荷兰等国家战略性购买实践成功案例较少的关键原因之一[2-4]。
激励约束机制是激励者、约束者与被激励者、被约束者之间的一种特定的关系或相互作用方式,通过这种关系或相互作用,双方都力图达到使对方的行为符合自己效用最大化的目标[5]。为达到提高利益相关者参与集采积极性的目标,按照国务院办公厅《关于推动药品集中带量采购工作常态化制度化开展的意见》文件精神,国家医保部门对医疗机构和医药企业建立了一系列激励约束机制,包括结余留用、医保支付和中选价协同等[6]。在此基础上,上海、辽宁等地方医保部门补充制定了非中选产品梯度降价等政策,旨在控制价差的同时诱导医药企业积极参与集采。本文将此类政策统称为集采的激励约束机制。
目前,已有学者分析药品集中带量采购对利益相关者产生的正负向影响,提出应调动各相关方参与集采积极性的建议[7-9]。舒茜等根据集采各利益相关者和政策目标的关系,确定其是否支持政策的实施[7];庞佳慧等分析在实施药品带量采购和一致性评价双重政策的情况下,利益相关者的合法性、权力性、紧迫性以及损益、立场[8]。也有学者从博弈论的视角研究集采利益相关者的行为选择,例如梁峰等对国内外药企面对集采可能选择的发展策略及政府的价格决策进行演化博弈分析[10];谭清立等运用博弈论分析中标企业的超额供应问题,引导其在供应和创新上寻求动态平衡[11];赵笑妍等通过动态演化博弈模型分析带量采购利益相关者的合谋行为[12]。但鲜有学者研究在此背景下,具体应如何激励集采利益相关者,使其做出更符合政策预期的行为。针对集采的激励约束机制,张星认为目前集采尚未能有效构建起多元参与主体的合作激励约束机制,从而制约了价格治理成果的深化[13];傅书勇等认为集采破坏了医生原有的激励机制,并利用委托代理理论分析激励医生处方“集采”药品的方法[14],即将集采节省下来的费用合理补贴给医生或让医生处方行为变为可观察。关于结余留用、非中选产品梯度降价、医保支付和中选价协同等具体激励约束机制的研究,更多的是针对其法律问题[15]、相关模式[16]、指标及影响因素[17]、实施情况[18],总体上缺乏有关集采激励约束机制对利益相关者行为影响成效的系统分析。
集采激励约束机制的作用效果可以通过机制设计理论中的参与约束和激励相容原理进行检验,其中参与约束指委托人(即信息优势方)支付给代理人(即信息劣势方)报酬带来的效用要不低于代理人从事其他事务所获得的效用(市场机会成本);激励相容指委托人为实现自身效用最大化而要求的代理人努力程度也要使代理人自身实现效用最大化[19-20]。为分析激励约束机制对提高医疗机构和医药企业参与集采积极性的作用,本文构建医疗机构-医药企业的行为偏好博弈模型,求解基础模型下的博弈均衡点,并利用参与约束、激励相容原理分析集采激励约束机制对均衡状态的影响,利用数据仿真验证激励约束机制的政策效果。在此基础上,提出完善激励约束机制的政策建议。
本文根据国家组织药品联合采购办公室2018年以来发布的药品集中带量采购文件、省药品采购平台有关信息等设定演化博弈模型的基本参数,同时充分吸纳傅书勇、李小瑜等学者有关药品集中带量采购中医疗机构、医药企业的获益的分析[14,21],引入销售费用、政府奖励等特殊参数。激励约束机制中指标的设定来自2020年国家医疗保障局和财政部联合发布的《关于国家组织药品集中采购工作中医保资金结余留用的指导意见》等。
本文数据仿真部分采用真实世界数据。为控制变量(包括中选产品价格及中选企业供应地区;非中选产品价格及非中选企业供应地区等)、排除干扰因素(包括地区经济水平;医疗机构的医疗水平、属性、规模等)的影响,选取同一城市同一级别且第二批集采品种对乙酰氨基酚采购量相同的两家医疗机构,两者在实际采购时分别对应博弈模型的两种策略,即一家医疗机构全部使用中选产品,一家医疗机构完成约定采购量后使用较多非中选产品。参数赋值时以此采购数据和价格信息作为论据,同时充分结合医疗机构和医药企业在实际情况中的收益、成本以及博弈模型的约束条件。
本文运用演化博弈分析医疗机构和医药企业在参与集采问题上的利益诉求。假定每次都是从医药机构和医药企业两类群体中随机配对进行博弈,双方都是有限理性的并在长期交互影响中不断调整自身策略直至达到演化均衡[22]。在明确博弈双方期望收益的基础上,本文运用Malthusian复制动态原理构建复制动态方程,求解博弈模型的平衡点[23]。根据Friedman提出的计算微分方程组构成动态系统的群体动态[24],平衡点的稳定性分析可以通过分析该系统的Jaconbian矩阵的局部稳定性得到,当且仅当同时满足detJ>0(行列式条件)和trJ<0(迹条件),均衡点才是演化稳定策略(ESS)[25]。本文以此为依据求解医疗机构和医药企业行为偏好博弈模型的均衡解及其所在的策略集。
集采激励约束机制通过改变基础模型中的相关参数,影响博弈主体的策略选择,引导其在追求自身利益最大化的同时实现最优均衡,具体可分为针对医疗机构方和针对医药企业方的激励约束机制。本文以结余留用政策为例分析针对医疗机构方的激励约束机制。该政策允许医疗机构按一定比例留用因药品集采价格下降、合理使用而节约的费用,以鼓励医疗机构和医务人员在剩余量市场也更多得使用集采中选药品。针对医药企业方的激励约束机制包括国家层面的医保支付和中选价协同政策以及省级层面的非中选产品梯度降价政策。本文以非中选产品梯度降价为例做相关分析,其本质为要求集采同品种非中选产品,根据其与中选产品的价差实现梯度降价后(以中选价托底)方可继续采购使用。梯度降价后的价格成为全国联动挂网价。
本文利用参与约束、激励相容理论分别分析两类激励约束机制实现最优均衡的条件,并通过数据仿真验证两类激励约束机制对提高利益相关者参与集采积极性的作用,这对研究集采激励约束机制的优化策略具有重要意义。在仿真模拟阶段,本文采用matlab中较为常用的ode算法,经典采用四阶、五阶Runge Kutta单步算法[26]。
模型假定涉及医疗机构和医药企业两类群体。由于医疗机构在约定采购量市场不具有选择权,故本文将其策略选择设置为“剩余量市场多用中选产品”(S1)和“剩余量市场少用中选产品”(S2),其中,剩余量市场为完成约定采购量后的市场。而医药企业的策略选择包括“以中选方式销售药品(即中选企业)”(S3)和“放弃以中选方式销售药品(即非中选企业)”(S4)。
模型提出如下假设。①信息是不完全的,博弈医疗机构和博弈医药企业都不能提前预知对方的行动策略,且双方的行动时间一致,无前后顺序。②医疗机构已经执行完成约定采购量,即本文探讨的是剩余量市场分配和对企业的激励问题。③医药企业销售的市场集中在医疗机构,而不存在零售市场。④鉴于2016年药品零加成政策的落地执行,医疗机构药品方面的收入仅来源于企业的销售费用(简称“SE”)和获得的政府奖励。其中,所有医药企业对博弈医疗机构的销售费用均与药品的采购量正相关,且单位销售费用会随着竞争的激烈程度而增加。⑤医药企业收益由单位药品的净获益与销售量共同决定。其中,单位药品净获益受中选降幅、不参与集采增加的销售费用等因素的影响,而销售量受企业性质、竞争实力等因素的影响。模型参数设置见表1。其中0≤x,y,m≤1,其余参数均为正数,且q>qd>qs,pf>pz>c。根据上述模型假设及参数设定,构建出有关医疗机构用药倾向和医药企业策略选择的博弈模型,其收益矩阵如表2所示。
表1 医疗机构和医药企业行为偏好博弈模型的基本参数
表2 医疗机构与医药企业博弈的收益矩阵
2.2.1 博弈主体的复制动态。假设医疗机构多用中选产品的概率是x,则其少用中选产品的概率是1-x;医药企业中选的概率是y,则其非中选的概率是1-y。
医疗机构多用中选产品的期望收益UH1、少用中选的期望收益UH2及平均期望收益分别是:
UH1=[(q-qd)a+R]y+[(q-qd)(a+b)+R](1-y)
(1)
UH2=(q-qs)ay+(q-qs)(a+b)(1-y)
(2)
(3)
同理,医药企业中选的期望收益UC1、非中选的期望收益UC2及平均期望收益分别是:
UC1=(pz-c)qdx+(pz-c)qs(1-x)
(4)
UC2=(pf-c-a-b)(q-qd)mx+(pf-c-a-b)(q-qs)m(1-x)
(5)
(6)
构建医疗机构和医药企业的复制动态方程为:
(7)
(8)
令F(x)=0,F(y)=0,得出(0,0)、(0,1)、(1,0)、(1,1)、(Xp,Yp)为系统的5个局部均衡点,其中:
2.2.2 稳定点分析。依据微分方程依次求关于x,y的偏导,得出雅克比矩阵(J)为:
(9)
其中,t=(qd-qs)[pz-c+m(pf-c-a-b)]x+(pz-c)qs-(pf-c-a-b)(q-qs)m
通过求解,可得出系统局部均衡稳定时的主要参数取值,如表3所示。
表3 均衡点处的a11、a12、a21、a22的取值
在点(Xp, Yp)处有a11+a12=0,不满足trJ<0的条件,故该点肯定不是ESS。排除该点后,均衡点的稳定性判断如表4所示。
表4 演化博弈模型均衡点的稳定性判断
从雅可比矩阵的分析来看,医疗机构的均衡状态为“剩余量市场少用中选产品”,医药企业的均衡状态可能是“中选”,也可能是“非中选”,最终的演化结果取决于相关参数的大小。这表明可能存在医疗机构和医药企业参与集采的积极性低的风险。
2.3.1 结余留用政策。根据结余留用金额的计算公式,构建医疗机构选择S1策略相对于选择S2策略的结余留用差额(R)的关系式为:
R={vdin-in[gzpz+(q-qd)pf]}k-{vdin-in[gzpz+(q-qs)pf]}k=ink(qd-qs)pf
(10)
其中,v表示约定采购量基数,d表示集采前通用名药品加权平均价格(元),i表示统筹地区医保基金实际支付比例(%),n表示集采通用名药品统筹地区参保患者使用量占比(%),gz表示中选产品约定采购量(片),k表示结余留用的比例(%)。
对于医疗机构而言,由于国家药品集中带量采购强制要求区域内所有公立医疗机构参与,故医疗机构方不存在参与约束问题。激励相容原理要求医疗机构的最优选择与机制设计者的最优目标一致。若国家医保部门制定激励约束机制的初衷是引导医疗机构剩余量市场多用中选产品,以增强改革联动效应,则必须满足无论医药企业选择何种策略,医疗机构选择多用中选产品相对于少用中选产品的收益之差应为正,以此定量确定医疗机构选择多用中选策略时的条件式为:
(11)
对式(10)和(11)求解,可知当结余留用比例k>k0时,医疗机构倾向于在剩余量市场多用中选产品,即结余留用政策能够应对医疗机构参与集采积极性低的风险。
为了验证上述理论分析并更加直观说明博弈双方策略的演化稳定性,本文采用MATLAB(2019a)进行数值模拟仿真。在满足情形1的前提下,依据真实世界数据对部分参数进行赋值:q=53760,qd=53760,qs=46080,m=1,pz=0.0492,pf=0.4489,c=0.0299,a=0.0449,b=0.2245(参数说明见表1),并将博弈双方概率初始值设定为50%。改变结余留用差额(R)的大小,分别令R=0、655、1310。仿真结果如图1所示,结余留用的高低不仅影响医疗机构的策略演化趋势,同时会影响医药企业的策略选择。当结余留用比例k超过k0,即结余留用差额超过界限值后,“医疗机构剩余量市场多用中选产品,医药企业采用中选方式销售药品”为演化稳定策略。
图1 结余留用对博弈双方策略演化的影响
2.3.2 非中选产品梯度降价政策。非中选产品梯度降价政策对模型的干预主要体现在减少非中选产品的单价(pf),以此为依据构建pf与梯度降价比例(α)之间的关系式为:
(12)
依据参与约束和激励相容原理,参与集采的医药企业中选后的预期收益不能低于其在同等成本约束条件下自由参与市场竞争所获得的收益。因此,无论医疗机构选择何种策略,医药企业选择中选方式相对于选择非中选方式的收益之差应为正,以此定量确定医药企业选择中选策略时的条件式为:
即
(13)
对式(12)和(13)求解,可知当梯度降价比例α>α0时,医药企业倾向于选择中选策略,即非中选产品梯度降价政策能够应对医药企业参与集采积极性低的风险。
同样,本文用数值模拟仿真验证上述理论分析的准确性,得出非中选产品梯度降价政策干预下的演化稳定性。初始值与初始概率的设定与前文一致(参数设定见表1),将政府奖励差额(R)设定为0,改变非中选产品的单价(pf)的大小,分别令pf=0.4489、0.3036、0.1583、0.0492(0.1583为梯度降价调整后价格,0.0492为中选价)。仿真结果如图2所示,非中选产品梯度降价政策确实能够逆转医药企业的行为选择,但却不会影响医疗机构的行为选择。当梯度降价比例α超过α0,即非中选产品的单价(pf)降低至界限值后,“医疗机构剩余量市场少用中选产品,医药企业采用中选方式销售药品”为演化稳定策略。
图2 非中选产品梯度降价政策对博弈双方策略演化的影响
对于医疗机构,在实施药品零差率政策后,医疗机构主要通过医疗服务收费和财政补助来维持正常运转,但还是能凭借药品供应链业务获取药品收益[7]。而药品集中带量采购的实施,切断了医疗机构与中选药品间的利益链,破坏了原有的不合理的激励机制,降低了医疗机构获得灰色收入的可能性。因此,在基础模型中,医疗机构完成约定采购量后,剩余量市场更倾向于使用非中选产品。其他学者的实证研究也证实,集采任务完成后,部分通用名的非中选产品依旧在临床使用中占据优势地位[27]。
结余留用政策作为国家医保部门对医疗机构方主要的激励约束机制,本质是在医疗机构优先选用中选药品的策略选择上施加额外获益,提高其对中选药品的处方积极性。通过把已经纳入定点医疗机构总额中的集采药品预算单独拿出来,将集采药品使用的激励机制明确化,让社会获益与医疗机构收入之间建立正向关联,实现“帕累托改进”[14,28]。其他可以提高医疗机构使用中选产品获益或对医疗机构使用非中选产品予以惩罚、限制的措施也可以起到类似的效果,例如按病种(病组)等方式付费的地区首年不下调相应病种(病组)医保支付标准、将集采中选产品配备使用情况纳入临床路径管理和绩效考核,加大非中选产品处方审核和点评力度等等。最终,医疗机构方的激励约束机制能否逆转其行为选择,取决于结余留用资金的发放、绩效考核等系列措施能否对等医疗机构使用非中选品种的机会成本,即政策是否符合激励相容原则,这也是保证药品集中带量采购可持续的关键条件[7]。同时,博弈结果表明,针对医疗机构的激励约束机制还具有提高医药企业参与集采积极性的附带效果。医疗机构是药品集中带量采购工作的“落地”环节,是绝大多数医药企业的核心销售市场。在市场规模大致固定的情况下,结余留用等政策在诱导医疗机构多用中选药品的同时,也影响了中选企业用量的预期[29],从而在一定程度上约束医药企业的策略选择,发挥同时提高医疗机构和医药企业参与集采积极性的双向协同作用。因此,国家和地方医保部门需尽快完善针对医疗机构方的激励约束措施,依托本文设计的博弈模型及均衡结果,优化结余留用比例的制定,并通过“两个允许”以及绩效改革等措施逐步建立起新的补偿机制,以切实提高医疗机构和医务人员的政策获益度,实现医疗和医保的良性互动,提高集采政策的落地效果。
药品集中带量采购的本质是通过建立公开透明的市场竞争机制,引导医药企业以质量和价格竞争替代原来灰色的销售渠道竞争[29]。医药企业可以通过降低价格获取中选资格及稳定的市场采购量,中选药品将直接进入医院内部市场,极大程度减少了药品的销售费用[30]。但在另一方面,为满足临床需求、尊重医师处方权,集中带量采购政策允许非中选产品在约定采购量以外的市场销售,即医药企业仍可以选择既往销售模式,在剩余量市场通过药品的高售价获得利润。其策略选择取决于两种模式下经营效益的高低。因此,在基础模型中,医药企业的均衡状态可能是“中选”,也可能是“非中选”。此前开展的八批国家集采确实存在部分药企,尤其是原研药企的降价意愿不强,导致落标甚至废标的情形[31]。
非中选产品梯度降价政策是地方医保部门对医药企业方主要的激励约束机制,其实质是对非中选产品进行价格管控,增加医药企业在非中选策略选择上的成本,是对非中选企业的 “负面激励”。中选产品价格下降将对非中选产品产生波纹效应,从而保证中选和非中选产品价差控制在较合理范围内,促进同通用名药品价格回归合理水平[32]。但是,仿真结果验证,影响价格的政策无法改变医疗机构的行为选择。结合博弈模型看,降低非中选产品价格虽然可以在一定程度上压缩其不合理的销售费用,但在医疗机构缺乏合理补偿机制的情况下,非中选产品对医疗机构带来的获益是始终是高于中选产品的,医疗机构仍具有使用非中选产品的偏好。
医药企业方的收益受到用量和价格两方面的影响[33],因此以医保支付和中选价协同政策为代表的、影响非中选产品用量的激励约束措施同样能逆转医药企业的策略选择。通过逐步以中选价格为基准确定集采品种(含非中选产品)的医保支付标准,提高患者使用高价非中选产品的自付费用,降低非中选产品的市场竞争力,减少其在剩余量市场的用量,削弱非中选企业的获益[34]。由于患者自发诊疗意愿的改变对医疗机构属于强约束力,医疗机构不是通过衡量自身利弊得失而做出策略选择,故此类激励约束措施对医疗机构的影响不做讨论。
尽管两类激励约束措施的作用机制不同,但其均是在合法范围内对中选企业予以优待或对非中选企业施加限制,即符合参与约束原理。为确保更多医药企业参与集采竞争,促进形成更加合理的市场价格,后续需进一步完善针对医药企业的激励约束机制,丰富政策内涵,优化医保支付标准调整方式、调整梯度降价比例等政策细节,保证中选企业在市场上的竞争优势。