李雯
苏州大学附属第二医院,江苏苏州 215004
大数据时代医学数据管理研究
李雯
苏州大学附属第二医院,江苏苏州 215004
以大数据为时代背景,挖掘我国医学数据管理的研究价值,探讨医学数据管理应用的新方向。通过查阅大量的文献资料,结合自身的工作实践,对国内医学数据管理的现状进行梳理,总结问题并有针对性地提出应对策略。以数据获取、数据挖掘为技术支持,充分发挥医学数据的潜在价值,通过提出“保障信息安全、完善平台架构、优化治疗及研发”的管理举措,解决医学数据管理方面的问题。在大数据时代,重视医学数据管理有利于推动医院管理,提升医疗服务品质。
大数据;医学数据;管理研究
21世纪是一个高速发展的时代,科技发达、信息流通,人与人的交流日益密切,生活也日益方便,大数据是这一时代的必然产物。阿里巴巴的创始人马云曾说过:“未来的时代将不是IT时代,而是DT时代。”在这个数据爆炸式增长、信息高度复杂化的时代,随着计算机科学与网络技术的飞速发展,信息化已融入医疗卫生领域。信息系统被日益广泛地运用于医疗机构,医院的数据库容量不断膨胀,医学数据的信息量飞速增长,然而大数据的价值含量、挖掘成本、管理利用远比数据数量重要的多。因此,如何使海量的医学数据更好地服务于医院管理、治疗优化;如何将医学数据信息转化为知识力量,推动医院发展及医疗建设;如何提升大数据时代医学数据的管理水平,改善医院的服务品质,正日益被人们所关注。
大数据即海量数据,泛指数据量规模大到难以在合理时间内获取、整理、分析并提炼的数据。医学数据主要来源于医院的临床诊治、科研教学和日常管理过程,还包括:基于医学研究或疾病监测产生的专项医疗数据,及基于移动客户端或物联网记录的身高、体重、心跳、血压、呼吸、睡眠、锻炼等有助于疾病识别、防控及临床诊疗的健康数据等。
我国在《国家中长期科技发展规划纲要(2006-2020)》及《国民经济和社会发展第十二个五年规划纲要》中均表现出对大数据研究的重视。在国家“863”计划中,医学研究技术领域还部署了医学大数据开发利用的关键技术研究。随着研究的深入,越来越多的学者开始关注大数据在医疗卫生领域的影响。
医院的数据中心包括HIS、LIS、EMR、CPOE等业务系统,还包括基于临床数据中心(CDR)及运营数据中心(ODR)的科研分析系统及运营管理系统等。仅电子病历系统就涵盖了首页、病程记录、检验结果、医嘱等信息,结合医院门急诊量及住院人数,一般的社区医院就能生成并积累数个TB甚至PB级别的数据。如此庞大的数据信息必将增加数据的维护成本;同时,在数据存储、利用时,还难免会存在信息篡改、删除等影响数据真实性、完整性的行为;此外,某些不当操作及系统漏洞还可能造成信息泄露,侵犯患者隐私及科研成果的知识产权,存在安全隐患。
医院的数据类型繁杂,不仅包括患者的基本数据、入出转院等结构化数据,还包括医学影像数据、诊疗数据等非结构化或半结构化数据。大数据时代,信息爆炸引发医学数据井喷式增长,各类数据存在结构不统一、存储分散等问题。医院层面,职能科室及临床医技部门的各类信息平台难以实现一体化管理;医疗系统层面,各个机构间未建立紧密联系,阻碍资源共享,导致医学数据的利用率较低。
在大数据环境下,数据的价值密度与数据总量成反比,以影像数据为例,在几百兆影像资料中可能仅几个片段有助于医学诊断。医学数据不仅与患者生命息息相关,而且数据之间关系复杂,只有快速分析、及时处理才能使其发挥医疗价值,支持临床诊疗及决策。目前,国内的医疗机构还无法实现海量数据中有效信息的挖掘优化,因此,在大数据背景下,提升信息处理速度是医学数据管理的重要环节。
2.1.1 医学数据获取技术 医学数据含有较多专业术语,包括大量疾病、诊断、手术、药品名称及海量的病例信息、检验影像等结构化数据;同时,医学数据是临床诊疗过程中产生的数据,相互之间关联复杂,且易受主客观因素的影响,导致数据存在一定的偏差。因此,需重视数据获取,确保数据安全、可控。
医学数据包括:关系数据库、文件系统及网络数据等多种数据源,源数据在名称、格式、数据结构上存在差异。因此,在获取数据时要对差异项逐步统一,并注重以下几个方面:首先,非结构化的电子病历、影像报告、网络数据等,应进行概念描述并提取数据特征,尽可能借由相关属性使不同数据源逐步结构化、条理化,便于深入研究。其次,医疗机构大多采用关系数据库作为信息系统的后台数据管理模式,在收集此类数据时,应先将关系数据库中的数据信息剥离,使信息独立于管理系统,并在适当的时机进行联机分析。此外,剥离后的数据必须完整、准确,且元数据间的关系不可缺失[1]。最后,在收集数据的过程中应充分考虑患者个人信息及涉密科研信息的安全性。采取前端控制,对涉及私隐和受知识产权保护的内容进行加密,对相关字段进行替换或添加备注,并设置阅知权限。
2.1.2 医学数据挖掘技术 当下,很多医疗机构对数据的处理仍停留在增、删、改、查等较低层次,在辅助临床诊断、开展科室评估等方面未发挥其潜在价值。因此,医疗机构应对医学数据进行有效存储、处理、查询、分析,借助数据挖掘技术从海量患者信息中发现规律、模式及发展趋势,帮助医生做出更科学、准确的诊断和用药决策,辅助管理者对医疗发展做出预判及引导[2]。
在医学领域,数据挖掘技术的运用主要体现在以下3个方面:①在生物医学上,人类24对染色体的基因测序已全部完成,数据挖掘技术开始运用在DNA序列分类及基因序列数据分析领域中。②在临床诊疗上,由于疾病诊断、治疗及恢复相对复杂,且医生作为个体面对海量临床数据存在一定挑战,所以,借助数据挖掘算法和关联统计技术可以形成诊疗分析模式并完善评估体系,有利于医生开展临床决策,并有效减少误诊、漏诊,提升医疗服务品质。③在疾病预防方面,由于疾病防控建立在实验监测及现场调研基础上,人工统计数据易于出错且工作量巨大,因此,借助数据挖掘技术可以对医学数据做好存储、关联及分析并形成预案,有利于对传染病进行预防和监控,减少生命威胁和财产损失。
2.2.1 重视健康管理,保障信息安全 ①个体医疗。个体医疗以患者信息为基础,通过综合分析、挖掘患者在病理、生理学等方面的特点,个性化制定适用于患者的最佳诊疗、预防方案,提高医疗针对性并追求疗效最优化[3]。Leroy Hood首次提出了“P4医疗”的观点,要求对个体数据进行整合分析,认识个体生物网及分子在疾病产生过程中的作用,并主动建立个性化模型来帮助患者预防或治疗。2003年,人类基因组计划历时13年后顺利完成,并于2012年借由DNA元素百科全书计划尝试填补研究空缺。美国还开展了“肿瘤基因组图谱计划”,为新型肿瘤的预防及早期诊疗提供依据。此外,大数据的获取、分析、挖掘、存储也不断推动临床病理发展,为医生做出个性化诊断提供帮助。
②家庭医疗。家庭医疗与个体医疗密不可分。微软公司在2007年就曾发布“Health Vault”目标,通过开放式接口导入移动便携设备及第三方管理软件的健康数据,集合多源数据,实现个人和家庭的健康管理。据统计,我国65岁以上的老年人住院比例为青年人的2倍,且老年人人均患有2~3种慢性疾病。因此,完善家庭医疗不仅可以利用医学数据实现医养结合,还有利于发现家族病史,帮助家庭成员尽早预防或得到医疗救治。
2.2.2 实现资源整合,完善平台架构 大数据时代,医学数据的平台架构从整体上来看主要包含以下几个部分:①业务架构:具体指医院数据中心支撑的所有应用系统部署和相互间的关系。②CDR架构:具体指数据仓库在运行时的关键功能及服务流程,包括应用系统模块的数据构成、相互关系及存储方式,及数据标准和管控手段等。③物理架构:具体指网络、服务器、存储设施等为应用系统提供硬件支持的基础架构平台。④安全架构:具体指覆盖医院数据中心,涵盖运维、应用、基础设施等各方面安全性的所有服务、技术工具的总和。⑤运维架构:具体指用于管理架构和开发架构,面向信息工作者,为医院信息系统搭建统一平台提供管理维护工具的系统[4]。
目前,较为常用的医院管理平台有:医院信息系统,包括行政管理、医疗管理、决策支持及各类辅助系统;电子健康记录系统,包括个人健康记录系统、电子医疗记录系统及患者电子记录系统;以及医学文献检索系统、数字图书馆系统等独立的医学数据库系统。当然,平台构架也离不开人才支持。因此,在大数据时代,医疗机构需重视数据挖掘技术人才的培养,鼓励技术人员学习大数据知识,为新技术环境的到来提供应对措施,充分利用数据资源为智慧医疗的创建提供保障。此外,宏观层面应加强医疗卫生领域信息化发展标准化、规范化工作的指导,使医疗卫生网络早日实现互联互通。只有卫生系统成功构建了标准统一的医学数据管理大平台,才能真正实现医疗资源的整合与共享。
2.2.3 发挥医学数据价值,推动治疗优化及研发工作 传统的临床研究以病历报告为工具进行书面数据获取(PDC),大数据时代,电子化的数据获取(EDC)将成为临床研究数据获取的主流方式。EDC直接将临床数据录入系统,有利于提高工作效率,保证数据实时、高效;系统自带逻辑检查功能,避免因数据错误造成不可挽回的损失;系统检查发现疑问后会直接输出或标记相关数据项,可直接修改并标注原因;系统在临床研究过程中即可获取全面精准的医学数据,并在安全监测后得出引导性结论,为临床医生或统计专家提供决策支持。此外,采用电子数据获取后,数据将分散于药物临床试验机构,数据管理者可以更专注于管理的设计、教育培训及数据质量的维护等。EDC在国际上已成功推行,虽然我国目前仅有少数临床研究机构尝试,但是完善电子数据的采集、交换、传递标准,完善法律保障并营造良好的工作环境,是大数据时代临床研究及科研、药品研发的必要途径。
目前,借助互联网技术诸多医院已实现患者实名制管理,并提供在线挂号预约、问诊及缴费服务,还实现了电子处方交易及处方药品自动监管配送服务,工作效率日益提高,医疗服务品质日益加强。
在大数据背景下,医学研究应加强与信息技术的融合。引入云计算技术,数据传输、分析及共享技术,异构源数据整合及互操作等技术支撑,在确保数据安全并保障患者隐私的基础上,通过结构化手段提高医学数据的质量,追求基础数据、诊疗数据、研发数据的无缝对接,开发标准统一的数据存储平台,拓展医学数据的关联并深度分析、挖掘,推动数据资源发挥医疗价值最大化。此外,一旦权威机构明确了安全标准并进行有效监管,高质量的医学数据可以脱离医院而存在,通过互联网为人们提供更加便捷高效且有安全保障的实时医疗服务,实现大数据时代的信息惠民。
[1]王静,辛玉明,高鸿雁.档案数据挖掘中数据采集与准备问题浅析[J].现代情报,2012(6):72-74.
[2]徐所凤,乔雅莉,杨斌,等.大数据时代下的智慧医疗建设探讨[J].医学信息,2015(15):1.
[3]Ginsburg GS,Willard HF.Genomic and personalized medicine:foundations and applications[J].Transl Res,2009(6):1-10.
[4]杨志玲,韩荣华,王超.基于大数据的医院数据中心建设思考[J].中国数字医学,2015(4):77-80.
Data Management Research in the Big Data Era
LI Wen
The Second Affiliated Hospital of Suzhou University,Suzhou,Jiangsu Province,215004 China
s]In the context of the big data,the value of medical data management in China has been excavated,and the new directions of medical data management have been discussed.Through consulting a large number of literatures,in combination with the writer’s own work practice,combing the current situation of domestic medical data management,the problems were summarized,and some targeted strategies were put forward.Supporting by the data acquisition and data mining,the potential value of medical data should be given full play,management measures of“ensuring the safety of information,improving the platform architecture,optimizing treatment,research and development”was put forward,the problems in the management of medical data were solved.In the age of big data,medical data management is helpful to promote hospital management and improve the quality of medical service.
Big data;Medical data;Management research
R19
A
1672-5654(2017)08(b)-0048-03
2017-05-15)
10.16659/j.cnki.1672-5654.2017.23.048
李雯(1989-),女,江苏常州人,硕士,助理馆员,研究方向:文档管理与信息开放。