卓绮雯 孙 涛 李晓彤 朱 仁 陈丹丹 陈 潜
(深圳药品交易平台 深圳 518057)
“4+7”试点以来,国家组织药品集采工作快速推进,改革成效斐然。但随着带量采购常态化开展,一些潜在问题也在涌现,如报量不精准、监管难度大、信息化程度低等。为有效落实国家集采(以下简称“国采”)政策,深圳药品交易平台以PDCA 循环为基本思路,以国采相关政策和实际监管业务需求为指导,以大数据、云计算、机器学习、互联网等技术为手段,建设了国采药品PDCA 全流程智能监测系统(以下简称监测系统),形成了国采执行前、执行中、执行后各个时期的监测闭环。本文旨在通过介绍监测系统的基础架构、运作流程、分析方法、各子系统功能模块,总结分析监测系统的特点和实践经验,为相关政策设计和系统建设提供思路参考。
深圳药品交易平台着力打造了集数据治理、分析挖掘、应用建模、云计算、可视化设计、系统快速搭建于一体的大数据云中枢(见图1)。这是监测系统的基础,可以实现多来源数据的标准化处理、挖掘分析和应用。
图1 大数据云中枢构架构图
监测系统以大数据云中枢为依托,运用ETL 技术对药品交易平台、医疗机构、零售药店等多来源的数据进行初步收集整合,通过药品智能标准系统和智能匹配系统,结合药品特征库和药品标准编码,完成数据从抽取、清洗、标准、分类、匹配等数据治理步骤,为大数据智能分析提供底层支撑(见图2)。经测试,10 万条数据处理时间在10 分钟内,准确率超95%。
图2 数据治理到分析应用工作流程图
监测系统运用了九大分析方法,涉及100 多个分析维度、30 多个指标、60 多个计算逻辑以及20多个数据模型。其九大分析方法具体为:基于深度学习多因子多重算法融合预测模型、自然语言处理提取全国上市药品信息标识词、帕式价格指数算法建立降幅模型、执行和序时进度变动对比实时监测任务完成情况、均值评估分析执行走势预估结余金额、层次分析法量化监测指标权重体系、大数据聚类区间分析法设立风险阈值、大数据挖掘分析算法建立专题模型、描述性统计法专题分析报告。
监测系统包括国采药品报量预测系统、执行情况实时监测系统、节省金额实时测算系统、结余留用金额实时监测系统、结余留用金额测算系统等五个子系统。几个子系统环环相扣,层层递进,依靠PDCA 闭环管理思路达到循环优化的效果,实现国采全流程闭环智能监控。
利用国采药品的采购数据,运用机器学习算法中随机森林模型、Lasso 模型、岭回归模型等建立国采药品报量预测系统。在国采开始前,通过30 多个药品属性变量预测国采药品的采购规模,为医疗机构合理报量提供数据参考。采购周期结束后,将实际采购量数据再导入模型,进一步矫正优化预测系统。
以深圳、东莞、珠海等8 个城市的药品交易信息数据作为样本进行测试,平均处理时间为126.45秒,不同城市药品数据的处理时间有轻微的波动。预测结果与实际的拟合优度达到80%以上,远高于旧报量方法24%的拟合优度,均方根误差也更低,表明监测系统显著提升了预测效果。
根据相关政策及实际需求建立监测指标库,包括国采药品采购过程中的执行情况、配送情况、回款情况、中选产品使用情况及其可替代药品的使用情况等。监测结果及预警系统测试结果实现可视化展示,如实时监测关键指标的大屏仪表盘,含国采中选品种、非中选品种、可替代品种在医疗机构的使用进度,以及报表报告一键导出功能等。主管部门可根据可视化监测仪表盘实时监测报表报告,实时掌握医疗机构国采药品的执行情况。
在整个国采周期内及结束后,利用帕氏价格指数的原理,根据药品实际的采购情况实时测算国采品种的降价幅度和节省金额情况,为科学评价国采药品降价成效提供数据支持。具体建设步骤如下。
2.3.1 建立药品日均用量数据库。首先对上市药品根据WHO 官网的限定日剂量(def ined daily dose,DDD), 计算日均用量=DDD/产品剂量。若WHO 无该药品DDD,根据药品说明书【用法用量】计算日均用量,公式为:日均用量=(日最小用药量+日最大用药量)/2。其中,日最小用药量=日最小用药次数×每次最小用药量,日最大用药量=日最大用药次数×每次最大用药量。若以上两种情况均不明确,则在同组药品中选择某一药品,统一折算成该药品每克、每毫克、每毫升等的价格“单位可比价”,进行日均费用计算。
2.3.2 目录匹配。根据国采品种目录中的“品种名称”,将国采执行前药品交易数据与国采品种目录进行药品同通用名、同目录剂型的匹配,筛选出国采品种的交易数据。国采执行前药品交易数据通常选取集采开始执行前一年的数据,也可根据实际需求选取不同时间的药品交易数据。
2.3.3 国采药品降幅和节省金额测算。为了计算同通用名、同目录剂型下不同规格的日用药金额(即国采品种的日用药金额),特引入用药天数(D0、D1)的概念。用药天数是指该产品在医疗机构现有用药数量下,按推荐的日均用量计算用药天数,不同规格不同剂型的产品可进行量的转换。明确国采品种执行时每个产品的实际采购数量(M1),根据国采品种在执行前匹配的每个药品分组的采购数据测算执行前采购价格,即日用药金额(S0/∑D0)。在假设采购量不变的情况下,按照国采执行前采购价格计算该品种在执行前的理论采购总金额(SR)。然后用该品种执行时实际采购金额(S1)与SR 对比,计算出国采品种降价幅度和节省金额(见表1)。
表1 国采品种用药天数、降幅和节省金额测算公式表
在国采执行中,根据相关政策及监管需求建立预警指标库,通过实际执行情况与预警指标的对比,将现阶段的执行数据放大至整个采购周期,测算结余留用基数金额,实现异常指标的预警及结余留用金额的预测。医疗机构可根据预警信息和预测结果及时调整采购行为,以事中预警代替事后约谈,落实好国采政策。同时,监测系统可按不同地区的方案和需求选择非中选占比、30 天回款率、可替代药品占比等影响结余留用金额的指标纳入监测,也可自行调整监测频率和颗粒度。
以第三批国采药品头孢地尼(口服常释剂型)为例,如已执行7 个月,其序时进度为58.33%(全年12 个月,7/12=0.5833),但实际执行进度只有49.14%,尚有9.19%未按时执行。进一步监测显示,有两家医疗机构未按时完成进度,其中一家医疗机构未执行进度达40.48%,如不采取改进措施,到采购周期结束后该中选药品采购数量将达不到任务量的50%,按深圳方案将不发放结余留用资金。所以,监测系统预测该医疗机构在这个药品上的结余留用金额为0,预警信息会同步通知医疗机构。
依据国采相关政策,结余留用金额测算主要分为两个步骤:一是对医疗机构评级,确定结余留用基数发放比例;二是完成结余留用基数测算。监测系统可自由组合关键指标和参考指标进行模拟测算,各地区可结合工作实际设置合适的指标评价方案。在采购周期结束后,对医疗机构考核评级和结余留用金额进行一键测算(见图3),并发放结余留用资金。
图3 国采第二批具体医疗机构结余留用金额测算界面
监测系统涵盖了国采执行前、中、后三个阶段,包含了对药品采购规模的预测、采购情况的实时监测、药品降价幅度和节省金额的实时测算、指标超阈值或异常情况的预警、医疗机构的评级以及医保资金结余留用金额的测算等。整个采购周期结束后,再将相关数据应用于监测系统预测模型的训练优化,实现监测系统各个功能模块的循环优化,从而形成全流程监测的闭环系统。
监测系统以数字化思维解构医保法律法规和政策文件,结合实际应用场景,将政策和业务需求转化为数字;搭建大数据分析模型,输出多种形式的分析结果及监测预警信息;运用大数据赋能及可视化平台提升监管效能,有利于数据化决策和精细化管理。该模式可运用于医保业务涉及的数据监测分析,如国家谈判药品监测、短缺药品监测分析、药品价格指数模型建设、药品价格预测、合理用药监测、DIP/DRG 医保药费管控等。对接医疗机构HIS 系统后,监测颗粒度可细化到科室及医生,分析出相关指标不达标的具体原因,实现医疗机构更精细化的管理。
监测系统通过纳入30 多个药品属性变量建模,可以更科学合理地预测采购量,减少报量主观误差,为医疗机构提供报量参考。一方面可以让医疗机构报量更贴近实际,按时完成约定采购量;另一方面,也有利于生产企业合理安排生产,保障国采药品供应。
监测系统构建了大数据分析和监控预警机制,通过分解采购周期指标的序时进度,实现指标的实时监测预警。在采购执行中,监测系统可以实时提醒医疗机构及时依据达标红线调整采购行为,促使结余留用考核达标。监测结果以报告、报表和可视化仪表盘等形式展现,监管部门可以一键锁定不达标项和机构,采取相应的监管措施,使稽核风控更加智能化,有效提高工作效率,节省行政和人力成本。
目前,监测系统已在省内16个城市投入使用,协助6 个城市完成第一批国采药品结余留用资金测算,发放资金1.1 亿元,938 家医疗机构受惠。通过有效的信息化监管手段,第一批和第二批国采任务量已100%完成,节省药品费用103 亿元,药品综合降幅达80.9%。
深圳药品交易平台通过大数据赋能建设国采药品PDCA 全流程监测系统,助力国采全流程闭环智慧监管,实践过程中有三个经验比较关键,需要格外重视。一是数据的标准化治理。只有对多源异构数据进行标准化治理,统一标准编码,按业务分析需求及标准分类信息,才能够让数据不再“沉默”,真正服务于决策和管理。二是政策的数字化解读。监管人员需要对政策、业务、技术融会贯通,充分了解医保法律法规和政策文件,结合实际应用场景,以数字化思维解构法律法规和政策,挖掘典型特征值,建立指标库和违规阈值,构建智慧医保监管数字化应用场景。三是强化监测系统的落地应用。监测系统建设完成后,应在监管部门端、医疗机构端、采购平台端全面落地使用,在实践中不断优化系统,才能有效落实政策数字化、监管精细化,实现各监管环节有效衔接和技术监管闭环。