基于PMC指数模型的我国健康医疗大数据发展的政策环境研究

2022-07-06 13:16顾一纯黄佳妤王昊德
中国卫生政策研究 2022年4期

顾一纯 何 达 黄佳妤 孙 辉 王昊德

1.上海市卫生和健康发展研究中心 上海 201199 2.上海健康医学院 上海 201318

健康医疗大数据,是指在人们疾病防治、健康管理等过程中产生的与健康医疗相关的数据。[1]2016年6月24日,国务院下发了《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》,明确指出健康医疗大数据是国家重要的基础性战略资源,随后多项政策相继出台。近年来,有关健康医疗大数据政策分析的定量评价研究较少,沈慧煌运用文本分析法对我国健康医疗大数据政策的政策目标与相关政策的侧重点与不足点进行分析[2];牟燕采用内容分析方法,分析不同区域在政策制定和实施过程中的重点、共同点和特色之处[3];于琦对相关文本进行文本挖掘与可视化分析[4]。本文在文本分析法与文本挖掘法的基础上引入PMC指标模型,构建我国健康医疗大数据指数评价模型,分析各项政策的优势与不足并提出相关建议,以期为未来健康医疗大数据政策的制定和完善提供一定的参考。

1 资料与方法

1.1 资料来源

以国务院办公厅、国家卫生健康委员会、国家中医药管理局和国家医疗保障局等政府部门官方网站为主要资料来源,辅以中国知网、国脉电子政务网和北大法宝网等文库,选取“健康大数据”“医疗大数据”“健康医疗大数据”等关键词进行检索,分析政策趋势,把握政府指引方向。

1.2 政策文本挖掘分析

利用RostCM6.0和VOSviewer软件对我国健康医疗大数据的政策文本进行挖掘分析,获得高频词汇与高频词网络。

1.3 PMC指数模型

PMC指数模型是RuizEstrada等人[5]于OmniaMobilis假设提出的一种政策评估工具。它的作用一方面在于评价单项政策的内部一致性,另一方面通过分析单项政策的优势与劣势,反映出政策总体与各方面的差异,是目前比较先进的政策评价模型之一。本文在原有模型基础上构建出符合我国健康医疗大数据特点的PMC指数模型用于政策评价,包括变量选取及参数识别、多投入产出表构建、PMC指数计算、PMC曲面绘制四个步骤(图1)。

图1 PMC指数模型的构建

1.4 专家咨询(包括Delphi法)

根据所获得的高频词编制问卷,开展Delphi专家咨询,用于评价指标体系指标的选取和评分。专家咨询对指标评价分为两个部分,一是依据重要性、可获得性、灵敏性对指标进行定量评分,二是对指标内涵及属性进行定性评价。每个评价指标分值设定为1~5分,1分表示最不好,5分表示最好。统计各个指标得分,并以均值与标准差的差值作为指标遴选阈值。

2 结果

2.1 PMC指标模型结果

2.1.1 变量的选取及参数的识别

一级变量的选择参考了RuizEstrada提出的变量分类,选择政策性质、政策效力等在内的9个一级指标。二级指标的选择以收集到的有关“健康医疗大数据”的9项政策(表1)作为设计依据。使用RostCM6.0和VOSviewer软件对政策文本进行处理分析,经过人工筛选生成反映政策重点关注的高频词汇,剔除“健康”“医疗”“大数据”这类对结果影响不大的词汇,同时去掉“以上”“相关”等相关度不高的词汇,选取出现频率最高的50个高频词汇作为指标体系的二级变量(表2)。选取4名健康医疗大数据发展方面的研究专家作为访谈对象,分别来自于高校、研究机构和卫生行政部门,通过对政策文本的研读,基于文本挖掘结果,归纳、总结、分析、比较、调整、筛选出健康医疗大数据的二级评价指标。经过专家打分、计算、补充与完善,最终确立42个二级变量。

表1 我国国家层面有关健康医疗大数据的相关政策梳理(2016—2021)

表2 国家健康医疗大数据政策高频词汇总

2.1.2 多投入产出表的构建

多投入产出表主要是构建一个有选择性的数据分析框架,它可以通过容纳大量的二级变量数据来测量一级变量的值。一级变量表示对政策的不同评价维度,每个一级变量由n个二级变量组成。由于PMC指数模型思想是尽可能不忽视任意一个变量[14],因此这些二级变量不依据重要性进行排列,而是将它们赋予相同的权重,采用二进制(0,1)的形式进行赋值建立多投入产出表。我国健康医疗大数据PMC评价指标体系及评价标准如表3所示。

表3 我国健康医疗大数据PMC评价指标体系及评价标准

2.1.3 PMC指数的计算

计算PMC指数共分为4步:①将一级变量与二级变量放入多投入产出表中;②按照公式(1)(2)的取值方法逐个为二级变量赋值;③计算每个一级变量的值,如公式(3)所示,该值介于0~1之间;④计算PMC指数,如公式(4)所示。健康医疗大数据产业政策评价等级划分标准为优秀(9.00~8.00)、良好(7.99~6.00)、及格(5.99~4.00)和不及格(3.99~0.00)。我国9项健康医疗大数据政策的PMC指数如表5所示。

X~N[0,1]

(1)

X={XR:[0v1]}

(2)

(3)

其中,t为一级变量,j为二级变量

(4)

表4 我国9项健康医疗大数据政策的PMC指数结果

2.1.4 PMC曲面绘制

PMC立体曲面有助于直观立体的展示PMC指数模型评价结果,更有利于分析各项政策的优劣势。[15]根据各项政策的一级变量PMC指数,按照式(5)建立三阶矩阵绘制PMC曲面图, 从宏观角度清晰地显示政策的总体水平。[16]图中数据在z轴的评分指数越高,表明政策的评分结果越优,受篇幅的限制,本文仅列出了PMC指数排名第一和排名最后的PMC曲面图即P2与P5。

(5)

注:x1、x2、x3;y1、y2、y3为分类型变量

注:x1、x2、x3;y1、y2、y3为分类型变量

2.2 评价结果分析

在各项政策对比中加入均值作为参考值进行具体分析,从变量平均得分情况来看,政策性质X1(0.84)、政策内容X3(0.52)、政策对象X4(0.59)、政策功能X7(0.78)变量的平均得分较高。这体现出我国健康医疗大数据政策内容能够普遍覆盖服务体系、支撑体系和监管保障体系等方面,政策对象也广泛涉及政府机构、医疗机构和第三方机构等相关部门,政策也多包括了预测、建议、描述、引导和监管的内容,并起到了监督约束、规范引导、服务优化等作用,有利于规范与促进该行业的发展。效力级别(0.2)平均得分最低,表明国家落实力度不够,在未来的政策制定中,可以考虑加强部门的执行力度。

3 讨论

P5的PMC指数得分为6.11,排名第1,表现良好。9个一级变量中只有政策内容(X3)的得分低于平均值。该政策的目的之一是“坚持以人为本、创新驱动,规范有序、安全可控,开放融合、共建共享的原则,加强健康医疗大数据的标准管理、安全管理和服务管理,推动健康医疗大数据惠民应用,促进健康医疗大数据产业发展”,所以政策目标(X5)能够涵盖资源共享、互联互通、数据融合等方面。此外,P5在政策功能(X7)上得分也较高,该政策在第四章服务管理和第五章管理监督中详细地规定了对于健康医疗大数据的监督约束、规范引导、服务优化相关条例办法,各方面相对比较完善。如果需要对该政策进一步完善,政策内容(X3)有待进一步提高。

P1的PMC指数得分为6.05,在9项政策中排名第2,表现良好。作为在我国健康医疗大数据产业领域一项具有里程碑意义的规划文件,P1中对各个机构提出了要求,“推进健康医疗行业治理大数据应用”和“推进健康医疗临床和科研大数据应用”等,而且明确指出了“大力推动政府健康医疗信息系统和公众健康医疗数据互联融合、开放共享,消除信息孤岛,积极营造促进健康医疗大数据安全规范、创新应用的发展环境”的目标,对人才培养、财政奖补、营商环境和数据安全方面都提出了一定的要求,监督、引导、鼓励与支持行业发展。若想对此项政策进一步完善,可着重考虑政策内容(X3)指标的优化。

P4的PMC指数得分为4.75,排名第3,表现及格。政策性质(X1)和政策对象(X4)在9项政策中得分最高,这与该政策的独特性密不可分。由于P4的主要内容是“深化医药卫生体制改革2018年下半年重点工作任务”,因此政策功能(X7)主要是对各机构的监督约束和规范引导,政策对象(X4)也涵盖了政府机构、医疗机构和第三方机构。若想对此项政策进一步完善,政策目标(X5)、激励约束(X6)和生命周期(X8)都可以进一步完善。

P7的PMC指数得分为4.68,排名第4,表现及格。政策失分点主要在政策内容(X3)、政策目标(X5)、生命周期(X8)三个指标上,需要继续加以完善。针对政策内容(X3)指标可以考虑增加健康医疗大数据的应用基础相关内容。

P8的PMC指数得分为4.39,排名第5,表现及格。9个一级变量中有4个指标可以进一步完善,具体体现为在政策性质(X1)方面,增加对健康医疗大数据的描述性内容;在政策对象(X4)方面,鼓励多方机构参与,进一步满足人民群众就医需求;在激励约束(X6)方面对于人才培养、财政奖补、营商环境和技术支持可以进行完善;在生命周期(X8)方面,可适当增加健康医疗大数据生命周期的相关描述。

P3的PMC指数得分为4.19,排名第6,表现及格。9个一级变量中政策性质(X1)、政策对象(X4)、激励约束(X6)、政策功能(X7)和生命周期(X8)的得分均低于平均值。后期改进可重点考虑生命周期(X8)指标的优化,完善政策中对健康医疗大数据生命周期的规定。

P9的PMC指数得分为4.19,与P3并列排名第6,表现及格。除了政策效力(X2)、政策内容(X3)、效力级别(X9)和政策公开(X10)四个一级变量的得分高于或等于平均值,其余5个一级变量的得分均低于平均值。该政策的构建还需完善,可以着重从激励约束(X6)和生命周期(X8)角度进行优化。

P6的PMC指数得分为4.14,排名第8,表现及格。政策性质(X1)、政策对象(X4)、政策目标(X5)、激励约束(X6)和生命周期(X8)五个一级变量的得分均低于平均值。政策对象和生命周期的分数也拉低了P6的PMC指数结果,可考虑增加对于该政策的目的、针对机构健康医疗大数据的生命周期的相关论述。

P2的PMC指数得分为4.00,排名第9,表现及格。除了政策效力(X2)、效力级别(X9)、生命周期(X8)和政策公开(X10)四个一级变量的得分高于或等于平均值,其余5个一级变量的得分均低于平均值。该政策的构建还需完善,可以着重从激励约束(X6)和生命周期(X8)角度进行完善,此外,政策性质(X1)方面可以增加对未来成果和情况的预判。

4 建议

4.1 政策内容方面

近年来,随着云计算、大数据、物联网、移动互联网、人工智能等新兴技术不断成熟,为进一步推动和规范健康医疗大数据行业的发展与应用,首先,政府应加强通过医疗大数据和人工智能技术有效辅助行业监管者的决策制度和行业监管。建议建立健康医疗行业治理大数据,对居民健康状况等重要数据进行精准统计和预测评价,支撑健康中国建设规划和决策;完善现代医院管理制度与医院评价体系,优化医疗卫生资源布局;形成对医疗、药品、耗材等收入构成及变化趋势的监测机制。另外,政府应通过出台法律法规的办法,鼓励大数据和相关医药新兴产业的融合,加强与生物医药产业和保险等规划的对接。通过激活当前闲置的数据资源,提升产业发展效能,助力相关产业实现数据富集下的规模效应。

4.2 激励约束方面

现阶段国内医疗卫生行业越来越多的业务依赖信息化技术支持,信息化需求呈现加速发展的特征,大数据作为前端技术,其开发和落地均需要资本密集投入。因此,一是建议加强政府投入,拓宽科室的开发经费,有助于我国健康医疗大数据的开发利用;二是建议在医院院长绩效、医院排名评估方面增加对大数据建设和利用情况的权重,推动医疗健康大数据在实际应用上的积极性和创新性。三是建议相关机构通过激活、清洗、完善历史闲置的数据资源,累积新增数据资源,提升产业发展效能,助力相关产业实现数据富集下的规模效应。针对不同产业特点,提出具体的产业和医疗机构合作扶植规划,包括并不限于精准医疗、健康医疗智能设备制造、生物医药精准研发、健康保险、健康服务、智慧健康养生养老服务、健康医疗旅游服务等产业。通过产业的反馈进一步修订、完善医疗机构的大数据治理,成为全国健康服务业和健康产业形成螺旋上升的助推力。

4.3 生命周期方面

首先,建议卫生健康行政机构结合我国实际情况和发展变化,总结地方经验,进一步完善适合我国医疗实践经验和产业发展特点的医疗数据安全共享机制。通过指定数据存储地、掌控数据接口、第三方监管等方法,确保以数据安全为前提的医疗数据应用。

其次,政府应加快出台健康医疗大数据相关法律法规。从国际经验来看,欧盟委员会于2020年通过了关于数据安全保护的《欧洲数据治理条例(数据治理法)》法案,促进各部门和成员国之间的数据共享,并于此前实行了《通用数据保护条例》。建议我国加快已出台相关法律法规的实施细则,对数据处理活动和数据安全做出规范。参考国际上的相关经验,以法律的形式,将各种途径产生的医疗健康大数据的所有权、使用权进行明确和固定,并基于此允许相应机构形成居民医疗健康大数据的有偿使用和付费机制。

同时,加强通过健康医疗大数据和人工智能技术支撑面向医保支付方的诈骗防控、总费用控制,面向一线医务人员的辅助临床决策,面向居民的健康监测等的功能。充分发挥健康医疗大数据作为人工智能的基础作用,加大对其他重要利益相关方需求的支撑。

作者声明本文无实际或潜在的利益冲突。