傅昊阳 徐飞龙 范美玉
摘要:随着大数据、云计算、物联网、“互联网+”等新概念、新方法、新技术的普及,健康医疗大数据早已取代了传统的信息技术基础设施和应用,成为医院的新发展动力和重要资产。然而,目前的数据状态与数据管理水平不一致,在数据管理、数据质量、数据价值、数据安全、数据共享等方面存在诸多问题,健康医疗大数据治理工作迫在眉睫。文章从健康医疗大数据治理的概念出发,分析了医院健康医疗大数据治理面临的机遇与挑战,并从大数据治理保障体系、大数据管理与应用平台、大数据智能处理技术与方法、大数据创新应用4个方面构建了适合医院现行发展需求的健康医疗大数据治理体系,期待能促进健康医疗大数据的理论研究与实践应用。
关键词:大数据治理;健康医疗大数据;治理体系
DOI: 10.3969/j.issn.2095-5707.2019.03.001
中图分类号:R197.3;R-05 文献标识码:A 文章编号:2095-5707(2019)03-0001-05
Abstract: With the popularity of new concepts, new methods and new technologies related to big data, cloud computing, Internet of things and “Internet +”, big data for healthcare has already replaced the traditional IT infrastructure and application, and has become a new driving force and important asset for hospitals. However, it is not consistent between data status and data management level currently. There are many problems in data management, data quality, data security, data sharing and so on. Healthcare big data governance is imminent. Starting from the concept of healthcare big data governance, this article analyzed the opportunities and challenges faced by healthcare big data governance in hospitals, and constructed healthcare big data governance system suitable for existing development demand of hospitals from the aspects of big data governance system, platform of big data management and application, technology and method of intelligent processing of big data, and innovative application of big data, looking forward to promoting theoretical research and practical application of healthcare big data.
Key words: big data governance; healthcare big data; governance system
规模、活性及解释运用能力,成为其发展的决胜因素。数据一直是医疗行业的生命线,医疗健康生态系统中每个成员的每一个动作都依赖于无休止的信息流。医院的管理者早已认识到了数据价值的重要性,积极开展数据质量、数据标准、数据模型、元数据、主数据等管理与数据利用活动[1],力求发现数据内在的关联关系,寻找新的诊疗方法、医院管理模式。然而这些传统的数据管理活动,只限于数据局部问题的解决,难以实现更高层面的统一协调,导致数据利用的效率较低[2]。因此,将医院健康医疗大数据治理引入数据利用活动,让医院管理者、数据利用相关者明确数据治理与管理的区别与联系,探索建立有效的医院健康医疗大数据治理模式,是促进数据管理活动协调一致、有效挖掘健康医疗大数据潜在价值、满足医院整体发展战略目标的重要举措。
1 健康医疗大数据治理的内涵研究
1.1 健康医疗大数据治理的概念演变
治理(goverance)最早来源于拉丁文“掌舵”一词,意指政府控制、引导和操纵的活动或方式,有时被应用于描述国家公共事务相关的管理活动和政治活动,与统治(government)交叉使用。后来,众多学者对“治理”在公共管理领域的概念、目标、内容进行了探讨,发现“治理”在该领域一般强调多利益主体之间的协调和风险管控。随着治理理念的发展与传播,企业管理领域逐渐认同并重视该理念,并将之作为公司治理的基础。在这一领域,对数据治理有深远影响的观点是:⑴治理与管理属于不同的范畴,前者侧重于利益协调,后者强调经营权分配;⑵企业的所有权和经营权是影响企业绩效的重要因素,因此权责分配与制衡是关键問题。当信息技术和信息系统逐渐成为企业的重要资产时,企业管理者开始关注信息技术(IT)和数据资源的权责分配与制衡,伴随着出现了IT治理、数据治理等研究问题。后来,产生于企业领域的“数据治理”理念也就逐渐在银行、保险、电信、医疗等以数据为核心业务的行业中得到重视[3]。
随着大数据、云计算、物联网的快速发展与应用,大数据逐渐成为重要的战略资源,“大数据治理”的研究应运而生[3]。医疗行业是数据丛生的沃土,而患者诊疗、医学科研、医院管理等无一不需要高质量的数据,进而将数据转化为证据,转化为信息,推动健康医疗的发展。“健康医疗大数据治理”由此成为新的研究领域[4]。
1.2 医院健康医疗大数据治理的概念
大数据治理是随着大数据的广泛应用发展起来的,是比较新的一个领域。关于大数据治理的概念还没有一致的定义。根据学者的研究综述,我们得到了宏观层、中观层和微观层对大数据治理的描述[5]。⑴从宏观层面上,大数据治理是对组织的大数据管理和利用进行评估、指导和监督的体系框架。⑵在中观层面上,大数据治理被定义为新兴的一套流程、方法、技术和实践。同时又是广义信息治理计划的一部分,即制定与大数据相关的数据优化、隐私保护与数据货币化的策略。⑶立足于微观层面,大数据治理又可以被描述为不同的人群或组织结构运用不同的技术工具对大数据进行获取、整合、分析与挖掘等全生命周期管理,实现价值和经济管理的组织策略或程序。
立足于大数据治理的概念演变及概念述评,围绕治理理念、主体、客体、工具、目标等关键要素,以医院整体发展为大背景,医院健康医疗大数据治理就是医疗数据相关利益者以数据科学为指导思想,“以患者为中心”为服务理念,运用医疗信息方法、技术与工具,形成采集、管理、整合、分析与挖掘为一体的全生命周期数据分析流程[5-6]。在保障数据安全的基础上,将数据转化为证据(有效信息),推动医院患者健康诊疗、个性化推荐、医疗健康知识图谱等应用的整体策略与行动。
1.3 健康医疗大数据治理与健康医疗大数据管理
在实际工作中,有时会混淆健康医疗大数据治理与健康医疗大数据管理的概念,我们参考ISO/IEC 38500《组织的信息技术治理》,对两者进行了简单比较,以期能为实践工作提供指导依据。
健康医疗大数据管理是针对医院全部数据内容本身(重点是数据质量)的被动式的管理;健康医疗大数据治理是包括对医院全部数据、相关利益主体的主动全面的管理,较前者而言,其管理范围更广泛、体系更加完善、效果更加显著。
2 医院健康医疗大数据治理的机遇与挑战
2.1 機遇
政策方面,国内外发布了一系列与健康医疗大数据治理有关的计划、规划[7-8]。美国早在2012年发布了《大数据研究和发展计划》;英国发布了《英国数据能力发展战略规划》;加拿大发布了《健康医疗大数据分析白皮书》;澳大利亚发布了《公共服务大数据计划》。2015年,我国国务院出台《促进大数据发展行动纲要》《关于促进和规范健康医疗大数据应用发展的指导意见》;随后上海、广东、贵州、厦门、武汉、银川等各省市也根据实际情况,出台了相应的发展规划计划。中国信息通信研究院发布《大数据白皮书(2014年)》《大数据白皮书(2016年)》《大数据白皮书(2018年)》,中国网络安全与信息化产业联盟数据安全治理委员会编写了《数据安全治理白皮书》。
标准方面,国际数据治理研究所(The Data Governance Institute, DGI)制定了《DGI数据治理框架》(The DGI Data Governance Framework);ISO/IEC 38500:2015给出了IT治理的一些原则、模型等:ISO/IEC 38505-1是《基于ISO/IEC 38500(IT治理)的数据治理》,与ISO/IEC 38500:2015保持一致;ISO/IEC TR 38505-2是《数据治理对数据管理的影响》,在数据治理主体和管理者之间建立了沟通机制,同时给出建立数据治理策略的建议。但是,关于健康医疗大数据治理的标准还未见到。
学术组织方面,美国国立卫生研究院(National Institutes of Health, NIH)于2012年成立了大数据转化知识联盟(Big Data to Knowledge, BD2K);牛津大学于2013年成立了李嘉诚卫生信息与发现中心;哥伦比亚大学牵头成立了美国健康观测数据科学和信息联盟(Observational Health Data Sciences and Informatics, OHDSI)。其中,OHDSI目前已经建立了由众多研究人员和观察性健康医疗数据库组成的国际合作网络,成员国超过20个,推出了观察医疗结果合作项目通用数据模型(The Observational Medical Outcomes Partnership Common Data Model, OMOP CDM)、医学术语本体库、术语映射工具Usagi、ETL设计工具WhiteRabbit、数据特征化工具ACHILLES、队列研究工具ATLAS、队列创建工具CIRCE、词汇浏览器工具HERMES等开源研究工具,构建了一整套的数据分析流程,以求分析、整合不同国家地区不同标准的医疗数据,从而利用数据科学和信息学方法,通过大规模数据分析和挖掘来提升临床医学数据价值,实现跨学科、跨行业的多方合作。国内健康医疗大数据研究院、开放医疗与健康联盟(Open Medical and Healthcare Alliance, OMAHA),致力于推动产业开放个人的医疗和健康数据、定义个人健康档案的标准格式等。作为世界性的公益型非盈利研究联盟,OHDSI也受到了中国研究人员的关注,并于2016年12月成立了中国组,旨在推动针对中国的观察性健康医疗数据的方法和应用,目前已有一些应用探索,如南昌大学第二附属医院易应萍研究员与神州数码工程师王强抽取、清洗了医院临床数据,引入OMOP CDM,建立了适合自己的医疗科研数据模型,最终建立了包括精确队列筛选和队列分析、比较等功能的Vinci医疗数据科研分析平台[9];南通大学医学院王理副教授与江苏省人民医院等单位合作[10],试图将基于OMOP CDM在中国的研究,指导更多的临床医疗工作。
2.2 挑战
第一,医院管理者对健康医疗大数据治理的概念认识不到位,难以区分其与数据管理、数据分析、数据质量管理等相关联概念的区别与联系,进而导致组织体系不健全。
第二,医院数据孤岛众多,业务系统无法互联互通和信息共享,再加上数据标准化程度不一致,都给数据的获取及质量管理带来诸多困扰。
第三,医疗行业数据是持续、高增长的复杂数据,蕴涵的信息价值丰富多样。有效的存储、处理、查询和分析,是挖掘大数据价值的关键。但目前仍存在计算资源无法共享、数据资源无法共享、各平台数据多地存储和自主管理、底层数据结构不统一、平台数据处理能力有规模限制、跨平台应用无法得到底层数据全面的支持、未形成一整套的数据分析流程等难点。
第四,数据隐私安全得不到有力的保障。在网上预约诊疗、健康监测等医疗信息惠民服务中,数据的汇聚与系统外包服务带来了数据利用和再利用中的数据权力、权利和权益失控风险;数据整合、大数据分析及结果的公开都可能带来对数据所有权、数据利用权方面的影响;特别是碎片化个人信息再次整合后对个人身份的再识别,可能对个人隐私暴露带来极大的风险。目前虽已有相关的隐私保护条例,但应建立具有针对性的全面的医疗大数据安全防范体系[11]。
3 医院健康医疗大数据治理体系
我们遵循数据治理国际标准,参照DGI数据治理架构,基于“安全是前提,标准是保障,服务是目的”的治理目标,构建了符合实际情况的医院健康医疗大数据治理体系(见图1)。该体系从全局数据治理的角度,基于大数据、云计算、移动医疗、互联网、人工智能、数据科学等信息技术,本着战略一致、风险可控、运营合规、绩效提升原则,针对人与医院为主体、权责分配、规则及规则约定、业务策略与流程等治理关键域,完善医疗健康大数据治理组织、业务流程、评估、治理核心指标等,构建大数据集成清洗、融合存储、交换共享、挖掘应用的标准体系与技术,为医疗健康大数据提供全生命周期的管理服务。
3.1 大数据治理保障体系
打造大数据安全与标准体系,坚持内容安全与技术安全并重,强化医疗与健康大数据安全保障。在标准管理方面,提倡多方参与标准管理,完善医院健康医疗大数据管理与应用平台,对数据标准化处理、数据隐私保护、数据质量评估、开发与应用等层面做出限定,为数据开发利用奠定坚实基础。在安全管理方面,建立分层多域的健康医疗大数据安全管理机制,明确对数据分类、分级、分域的精细化管理要求,实现对数据流转全留痕、数据血缘追溯及数据安全监测与预警等重点环节进行重点把控。
设计健全的大数据治理组织结构,这是医院启动数据治理项目的首要步骤,是全面开展治理工作的基础。该组织的活动内容应主要为:⑴定义角色与职责:选定治理团队人员,根据治理需要严格划分成员类别和分配职责,执行个人问责制;⑵制定战略与规划:制定或调整大数据治理的指导纲领及战略规划;⑶制度与变革管理:制定大数据治理相关的管理办法、管理流程、认责体系等,颁布各阶段的数据治理的规章制度等,并根据治理环境的变化对组织制度或流程进行适当变革。
3.2 大数据管理与应用平台
融合汇集医疗、健康、环境等数据资源,形成多维度全方位的医疗健康大数据,提供有效管理与应用平台,全面管理医院全局数据的可用性、完整性、安全性,试图在获得信息价值最大化的同时,将信息存储、使用风险和使用成本最小化,以满足医院相关利益者近期及长远的需要。主要的工作内容有:利用医院业务系统数据资源、医疗健康优势服务资源、智慧药房等“互联网+”医疗应用项目资源,健康管理慢病管理等云服务平台资源,建设“互联网+”医疗与健康服务的大数据基础平台,完善大数据基础平台的应用功能体系,研究平台资源架构、安全防护的标准体系与技术,同时强化医疗健康大数据全生命周期的服务与管理,为医疗健康大数据管理与应用提供基础平台。
3.3 大数据智能处理技术与方法库
以大数据管理与应用平台为基础,以医疗健康业务需求为导向,构建多维度、全方位、多元化的医疗健康大数据智能处理技术方法库,为医疗健康大数据分析管理与应用提供有效工具。目前主要的实现方法有:智能检索、数据可视化、图像识别、图像分类、手术机器人、医疗健康知识图谱等。
3.4 大数据创新应用
大数据治理的创新应用重点在于为医院提供全周期的“标准+安全+服务”大数据服务整体解决方案,可在慢性病防控与全方位全生命周期健康管理等健康服务管理、影像数据智能管理、导医推荐、临床辅助决策、疾病趋势预测等智能信息化应用场景进行推广应用,形成个性化服务与应用的研究技术路线,为培育医疗健康大数据应用新业态提供示范。
4 小结
随着大数据、云计算、物联网等新概念和技术的出现,医疗行业也迎来了基于数据资产的业务创新和管理创新等发展新契机。伴随着医疗数字化转型过程,越来越多的数据被收集,大数据治理可为医院诊疗、科研、管理等诸多方面提供更多、更全面、更准确的数据,利用数据科学和信息学方法[12],揭示大数据的价值,推动健康医疗事业的发展。但是,健康医疗大数据治理但还需要在更大范围内开展跨学科的健康医疗大数据治理的协作,需要进一步通过医院的實践进行细化完善。
参考文献
[1] 费晓璐,李嘉,黄跃,等.医疗大数据应用中的数据治理实践[J].中国卫生信息管理杂志,2018,15(5):554-558.
[2] 刘桂锋,钱锦琳,卢章平.国内外数据治理研究进展:内涵、要素、模型与框架[J].图书情报工作,2017,61(21):137-144.
[3] 郑大庆,黄丽华,张成洪,等.大数据治理的概念及其参考架构[J].研究与发展管理,2017,29(4):65-72.
[4] 常朝娣,陈敏.大数据时代医疗健康数据治理方法研究[J].中国数字医学,2016,11(9):2-5.
[5] 安小米,郭明军,魏玮,等.大数据治理体系:核心概念、动议及其实现路径分析[J].情报资料工作,2018(1):6-11.
[6] 张宁,袁勤俭.数据治理研究述评[J].情报杂志,2017,36(5):129-134,163.
[7] 朱彦,徐俊,朱玲,等.主要发达国家医疗健康大数据政策分析[J].中华医学图书情报杂志,2015,24(10):13-17,59.
[8] 陈敏,刘宁.医疗健康大数据发展现状研究[J].中国医院管理,2017, 37(2):46-48.
[9] 王强,易应萍.临床医疗大数据治理和应用[J].医学信息学杂志, 2018,39(8):2-6.
[10] WANG L, ZHANG Y, JIANG M, et al. Toward a normalized clinical drug knowledge base in China - applying the RxNorm model to Chinese clinical drugs[J]. Journal of the American Medical Informatics Association, 2018,25(7):809-818.
[11] 张妮楠,史华新,谢琪,等.大数据背景下医学数据共享产生的伦理学问题[J].中国中医药信息杂志,2018,25(8):9-11.
[12] 丁长松,瞿昊宇,吴世雯.大数据背景下基于对象特性的中医药数据管理研究[J].中国中医药信息杂志,2016,23(9):10-14.
(收稿日期:2019-04-08)
(修回日期:2019-04-28;编辑:魏民)