临汾区域健康医疗大数据智能平台的建设与实践

2022-02-15 01:04苏学峰王铁忠赵波张树伟郑俊峰李慧郭伟红王林鹏赵鹏周亚杰刘跃
中国信息化 2022年1期
关键词:数据库医疗区域

苏学峰 王铁忠 赵波 张树伟 郑俊峰 李慧 郭伟红 王林鹏 赵鹏 周亚杰 刘跃

临汾区域健康医疗大数据智能平台的建设与实践,希望打造出符合国家标准又能更好服务当地居民生活健康的区域医疗大数据智能平台,为居民提供全生命周期的健康管理服务;更好的为医疗机构提高诊疗、会诊及转诊的运行效率,提升服务承载能力;为卫生行政部门提供数据,促进临汾区域经济社会健康发展。

健康医疗大数据泛指人类在社会生活中因健康活动产生的相关数据,包含整个健康活动过程,贯穿整个生命周期的健康医疗大数据,已成为国家重要的基础性战略资源。研究表明,到2020年,医疗数据将急剧增长到35ZB,相当于2009年数据量的44倍。目前,各医疗卫生机构数据孤岛现象普遍存在,各机构、系统间数据格式不统一。打造区域健康医疗大数据平台,科学合理地利用健康医疗大数据,能够改进健康医疗服务模式,更好地解决老百姓的迫切需求,进一步推进社会发展。

国务院颁布的《全国医疗卫生服务体系规划纲要(2015-2020年)》、《深化医药卫生体制改革 2019年重点工作任务》、《促进和规范健康医疗大数据应用发展的指导意见》等纲要中要求全面建成互联互通的国家、省、市、县四级人口健康信息平台,将健康医疗大数据应用发展纳入国家大数据战略布局,继续推进全民健康信息国家平台和省统筹区域平台的建设。随着移动互联网、云计算等信息技术的迅猛发展,我省亟待构建医疗大数据平台,解决数据的清洗、存储、挖掘、分析利用问题。

(一)健康医疗大数据智能平台建设思路

通过建设临汾区域大数据平台,对区域内医疗数据进行清洗、存储、挖掘,实行统一整合、管理,解决医疗数据的清洗、采集、传输、存储、处理、检索及计算、分析利用等问题,汇聚整合临汾市区域内市、县、乡、村四级医疗资源,建成医疗健康大数据平台,实现健康数据的提取与应用。

系统顶层架构设计基于国家统一的数据交换标准和业务规范,按照属地化原则和主索引机制,遵循平台级联动的规则,通过数据接口层、平台数据层、服务总线层、业务服务层、平台管理层和应用展示层等六个层面,建立系统平台,实现医疗卫生机构诊疗信息的互联互通,支持跨区域信息查询、医疗服务、综合管理三大业务应用协同。

平台数据部署采用居民属地化原则,数据存储采用分级部署,各级平台的信息资源库主要包含就诊记录、电子病历、检查检验结果等;平台保存区域区居民的健康档案等相关信息。数据库采用MySQL数据库集群构建,区域之间彼此数据与应用完全隔离。

系统设计采用当前先进稳定的技术,充分吸收各级厂商的先进经验,并考虑到本地化情况,不仅满足现有的需求,也抓住未来的发展方向;同时系统设计也满足大并发量的事务需求。

(二)健康医疗大数据智能平台架构设计

(三)健康医疗大数据智能平台子平台模块

系统包括平台管控、双向转诊、家庭医生及远程会诊等子平台,见图3.

1.平台管控

平台管控是临汾区域健康医疗大数据智能平台的核心,包括组织结构、人员管理、权限设置等,是实现平台内子平台见数据交互的桥梁。

2.双向转诊

提供三甲医院向基层医院的下转渠道以及基层医院向三甲医院的上转渠道,拓宽患者就诊渠道,畅通重症患者上转途径,方便较轻患者在家门口就医,节省就医成本。

3.家庭医生

医生端提供给社区医生用来持续记录签约患者的生命体征,形成长期、连续的健康或治疗记录;患者端提供给患者,以便查看自己历次就诊记录,参加健康教育学习。

4.远程会诊

临汾地区三甲公立医院相继托管了多家经营不善的一级及二级医疗机构,医院先后派出多名高级主任医师前往带教,以期提高各一级及二级医疗机构的专业技术水平,随着托管医疗机构的数量增多,实地带教存在实际困难,可以借助远程会诊系统进行远程带教,为患者提供远程会诊,节省时间成本及疾病负担。

(四)健康医疗大数据智能平台建设特点

临汾区域健康医疗大数据智能平台在设计过程中具有以下几方面的特点:

首先是千万级数据分布式存储。千万级数据分布存储技术采用MPP架构的新型数据库集群,重点面向行业大数据,采用Shared Nothing架构,通过列存储、粗粒度索引等多项大数据处理技术,结合MPP架构高效的分布式计算模式,完成对分析类应用的支撑,运行环境多为低成本PC Server,具有高性能和高扩展性的特点。

同时基于Hadoop的技术扩展和封装,围绕Hadoop衍生出相关的大数据技术,应对传统关系型数据库较难处理的数据和场景,例如针对非结构化数据的存储和计算等,充分利用Hadoop开源的优势。随着相关技术的不断进步,应用场景将越来越多,目前最常见的应用场景是通过扩展、封装Hadoop对互联网大数据进行存储、分析。对于非结构、半结构化数据处理、复杂的ETL流程、复杂的数据挖掘和计算模型,Hadoop平台更擅长。

毫秒数据队列并发推送系统层面上,分成三個部分:一是数据层,二是业务层,三是应用层。数据层由多台服务器组成;业务层为每个业务都设立一个(可以多台负载均衡也可以一台服务器完成,依据为业务量);应用层每个客户端都链接着业务层。数据层持有全局数据;业务层负责处理业务流水信息,是应用层与数据层的桥梁;应用层直接连接业务层,不与数据层直接通信,主要完成数据展现和友好界面。

智能化数据来源分捡、医疗数据库查询、统计等功能较为欠缺,信息无法很好地利用。数据挖掘又称数据库中的知识发现,主要包括数据准备、规律寻找和规律表示3个步骤,常见功能包括关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。

智能化医疗数据缓存在配置得当的情况下,关系型数据的响应时间一般在10ms以内甚至更短。当拥有几亿条数据,1wTPS的时候,响应时间也要在10ms以内,关系型数据几乎无法做到。

本地缓存是使用最多的缓存方式,其速度快,成本低。对于web系统的集群负载均衡结构来说,本地缓存使用起来就较受限制,因为当数据库数据发生变化时,没有简单有效的方法更新本地缓存;然而,如果在不同的服务器之间同步本地缓存信息,由于缓存的低时效性和高访问量的影响,其成本和性能可能难以接受。

分布式缓存目的是为了提供比RDB更高的TPS和扩展性,优秀的分布式缓存系统有Memcached、Redis、Tair等。对比关系型数据库和缓存存储,其在读和写性能上差距较大。所以,在技术和业务都可以接受的情况下,尽量把读写压力从数据库转移到缓存上,以保护关系型数据库。

数据库缓存主要指数据库的查询缓存,每种数据库的具体实现细节也会有所差异,基本的原理是用查询语句的hash值做key,对结果集进行缓存,利用地好可以提高数据库的查询效率。

(一)数据风险及应对措施

存在海量医疗数据储存及泄密的风险。通过建立异地容载机制应对数据丢失的风险,在应用过程中对需加密的资料进行MD5加密。

(二)信息安全风险及应对措施

存在患者病历等个人隐私资料泄露的风险。软件间数据的传输通过加密通道,防止第三方读取。对黑客可能进行的网络攻击,通过专业设备防护的同时,采用负载均衡模式实现。

(三)架构风险及应对措施

原始设计架构在无法满足海量数据接入的过程中,通过负载均衡进行读写分离的同时,单台主机采用多线程模式工作。

临汾市人民医院作为临汾地区的龙头医院,占地371亩,编制床位1800张,在职职工2432人,医院秉承“一切为了人民健康”的服务宗旨,以省级第一方阵优秀医院为新的奋斗目标,为临汾市440万人民群眾生命健康保驾护航。2018年医院全年门诊量达86余万人次,住院量达7余万人次。

医院辐射范围达全市17个县市,合作的医联体单位已达205家,有利于推进区域内市、县、乡、村四级区域大数据平台的建设,同时以临汾市为基础,探索建设山西省医疗健康大数据平台。

以医院为主体,“产”、“研”结合自主研发区域健康医疗大数据平台。通过建设临汾区域大数据平台,对区域内医疗数据进行清洗、存储、挖掘,实行统一整合、管理,实现区域内四级医疗机构间的电子病历、检验检查数据的互通。

对于管理机构,大数据平台可以作为战略决策的依据,为医疗、医药、医保的监督管理提供服务,为医疗卫生资源合理流动与配置提供依据,为分级诊疗提供支撑,协助决策者针对性地制定措施解决问题。

对于医疗机构,大数据平台可以辅助临床决策及科研,搭建各级医疗卫生机构之间共享诊疗信息的渠道,使诊疗、会诊、转诊更加高效,实现“以患者为中心”的信息互联互通。

对于社会公众,大数据平台可以对个人进行全生命周期的健康管理,保证健康信息的一致性、连续性、可获得性。

通过建设大数据平台对区域数据实行统一管理,能够最大限度地整合、优化、利用现有信息系统资源,打通各医疗卫生机构信息传递的通道,实现信息系统的协同联动和数据交换,提升资源利用率,实现跨地域、跨机构的信息共享、业务协同、整体联动的服务能力,为全省医疗卫生业务的开展及决策提供有力的信息化支撑,进而促进医疗卫生事业的信息化发展。

作者单位:临汾市人民医院

基金项目:山西省科技厅重点研发计划(201903D11010)

猜你喜欢
数据库医疗区域
分割区域
医疗垃圾包括哪些?医疗垃圾运到哪里,如何处置?
ГОРОДА-ПОБРАТИМЫ ПОМОГАЮТ ХАРБИНУ В БЕДЕ俄友好城市向哈尔滨捐赠医疗物资
擦桌子
数据库
区域发展篇
数据库
遇到疾病,如何医疗
数据库
数据库