重庆三峡医药高等专科学校 向波 郑代坤
区域健康医疗大数据平台通过对健康数据进行数据挖掘数据分析,提高健康医疗数据的再利用价值。设计健康医疗大数据平台的系统架构,探讨平台的环境构建,采用Hadoop架构和软件生态圈,分析健康医疗大数据平台的数据采集模式、数据标准,设计大数据分析和应用系统功能。
近年来,健康医疗大数据发展迅速,其应用受到社会各方越来愈多的关注和重视。国家将健康医疗大数据作为重要基础性战略资源的定位,根据国家的政策导向和激励,全国各个地方纷纷建设区域健康医疗大数据平台或健康医疗大数据中心,为本区域的健康医疗行业提供大数据技术和应用服务。本项目设计在区域“智慧城市”建设大框架下建设区域健康大数据平台,实现有效采集本区域健康医疗数据,对汇聚数据进行治理和集成,数据共享应用[1,2]。
区域健康医疗大数据平台的整体系统架构采用当前流行的大数据技术模式,系统框架设计如图1所示。
图1 系统架构设计Fig.1 System architecture desig
健康大数据平台的系统环境的设计,主要包括物理硬件系统和软件系统两部分。系统环境设计要考虑大数据平台的技术、数据存储模式、数据计算模式,同时要重点关注平台的易扩充性。综合技术调研和发展趋势等各种因素,区域健康医疗大数据平台的系统环境采用现在流行的Hadoop架构和软件生态圈[3]。
硬件系统包括大数据服务器集群、数据存储设备、网络设备、防火墙等。平台采用了大数据标准集群模式,一个大数据集群单元采用Hadoop存储架构,如图2所示,平台整体物理系统根据数据存储量和数据计算处理量,可集成设置多个大数据集群。
图2 Hadoop存储集群Fig.2 Hadoop storage cluster
软件系统包括大数据系统软件、虚拟化软件、大数据技术工具软件、数据库管理系统和数据库处理软件等。软件系统采用Hadoop生态和Spark生态组件,软件基于Apache开源社区。主要包括HDFS、HBase、Yarn、MapReduce、Hive、Zookeeper、Flume、Kafka、Redis、Storm、MongoDB等。
健康医疗数据采集来源多样化。它的采集接口要求能够实现数据接入、数据采集、数据治理、数据服务和数据安全等功能模块。
健康医疗数据的结构也是多样化,例如有结构化数据、非结构化数据等多种形式。在对数据处理前需要对采集的数据进行标准化处理,数据标准要能实现多种结构数据的统一,完成集中式、分布式等多种模式健康医疗数据的统一数据建模。
在汇聚存储海量数据基础上构建多个健康医疗大数据的分析系统,包括公共卫生大数据筛查和分析、基于电子病历的病症相关度大数据分析、慢病大数据分析、青少年健康大数据分析(学生)、妇幼大数据分析、健康产业大数据分析、基于区域环境因素与居民健康相关度大数据分析等。如图3所示。重点举例介绍如下:
图3 健康医疗大数据分析系统Fig.3 Health care big data analysis system
构建相关专题数据库,从各个维度进行统计分析专题服务,支撑相关的数据应用提供服务。统计分析系统能实现以下功能:(1)以数据来源于电子健康档案、电子病历、医学影像和检验数据等为主的健康医疗服务数据统计分析。(2)数据来源于多种类型的医疗保险数据统计分析。(3)数据来源于突发公共卫生事件监测数据、传染病报告数据等公共卫生系统数据统计分析。(4)数据来源于居民在各类药房购买相关药品等数据统计分析。(5)数据来源于区域相关地域内的空气污染物、气候状况等环境和健康相关联数据统计分析。
构建区域内的人口基础信息库,例如包含居民的性别、年龄、职业等信息[4]。通过统计和数据挖掘算法,构建疾病发生和诊疗情况的基本规则,与人口基础信息库中的基础信息数据进行关联比对,通过关联规则得出相应价值的医学关系及规律模式。构建疾病风险评估预警指标,以此指标为基础建立疾病流行预测分析算法模型,能够实现根据时间、区域、人群特征等进行多维度分析重点病例特征,实现通过慢病、传染病病例特征分析进行重点疾病的智能预警[5]。
构建业务数据库,研发多个健康医疗大数据创新应用系统,实现健康医疗数据的挖掘开发利用,达到数据价值的最大化应用。应用系统包括健康医疗大数据科研系统、健康教育大数据AI系统、慢病管理及AI预警系统、公共卫生大数据筛查预测系统、政府健康政策决策系统、医养结合康养大数据系统、区域健康医疗大数据白皮书、区域医药产业发展大数据系统等。如图4所示。
图4 健康医疗大数据应用系统Fig.4 Health care big data application system
区域健康大数据白皮书综合服务系统要实现在区域海量的各种居民健康体检指标数据、医疗诊治数据、医学影像和检验等检查数据、区域流行病数据、区域的环境数据等基础上建立区域健康指数,构建区域健康大数据白皮书,为政府、企业、科研机构、居民提供区域健康综合咨询指导服务。从例如人群、产业、环境等不同的维度,对不同行业、不同地域等人群,关注区域内的重点人群,进行区域内的重点疾病统计分析,结合区域内的主要健康问题,与区域内的环境状况等元素进行综合分析构建区域内的健康全景图,应用大数据分析思想、方法和工具,从多个方面、多个层级来评估区域的健康整体状况,以及预测区域内健康的发展趋势能够比较真实和全面的反映本地区的健康状况、环境状况,以及环境对健康的影响情况。
主要功能是针对区域内的公共卫生领域,对例如艾滋病、结核病等传染疾病进行数据挖掘、大数据分析,预测发展趋势。(1)构建公共卫生应急知识库,包括基础知识库和防控应急知识库,能够提供相应的知识查询功能。(2)构建疾病流行分析预警模型。(3)构建公共卫生大数据智能预测模型,对重点的相关症候群、相关药品、相关检验检查项目等监测数据进行分析,实现动态、实时地可视化展示。
实现科研和健康教育的功能。构建健康医疗教育知识库,主要包括例如常见慢病预防治疗、运动康复、膳食营养、心理保健、中医养生、急救处理、医养咨询等健康专业知识和常识,表现形式包括文字、图片、动画、短视频等,通过网页、载体包括网页、手机App、微信小程序、微博等,或利用手环、平板、可穿戴物联网终端设备等技术手段,让教师、学生、医护人员、社会群众进行检索、咨询、健康知识普及学习,或者利用AI算法进行个性化的精准推送。此系统能发送可能扩大健康医疗大数据平台的服务人群,增强服务效果,提高健康医疗大数据的社会价值。
医养结合康养大数据系统是实现本地区居民康养的大数据管理。在社区基层医院或卫生院等医疗机构建设居民健康检测点,通过物联网技术、健康检测基础设备和互联网实现居民健康指标的数据采集,建立居民健康检测档案,构建相应的业务数据库,将居民的健康检测数据、医疗诊治数据、电子病历数据、日常药品使用数据等进行大数据比对,建立相应的数据模型,设置健康预警值,及时推送健康指标给居民,指导居民的健康判断。
区域健康医疗大数据平台汇聚的海量数据包括健康数据、临床医疗数据、检验检查数据、药品使用数据等涉及个人健康医疗信息,是特别敏感的数据,为了保护个人隐私和数据安全,在数据清洗阶段就要做脱敏处理,在数据应用阶段保障数据安全,需要通过三级等保认证设计,来确定数据安全和大数据平台的安全性。
应用界面主要设计了以主页、移动App、微信小程序、物联网终端为主。主页是区域健康医疗大数据平台的门户网站,主要实现平台信息的发布和认证用户的接口。
需要设计开发平台的移动App、微信小程序,利于平台各类用户通过移动设备使用平台。移动App也可以考虑为用户主要的接口,主便用户减小对使用环境的限制。
随着国家层面大健康发展的政策导向,支持将云计算、大数据技术、人工智能技术、物联网技术、AR增强现实技术等新一代信息技术应用到健康医疗领域的改革和发展中。健康医疗大数据的研究和应用,是对健康医疗行业的强力补充,能够提供新的思想、技术和方法。
引用
[1] 国务院.关于促进和规范健康医疗大数据应用发展的指导意见[Z].2016.
[2] 重庆市市委.重庆市以大数据智能化为引领的创新驱动发展战略行动计划(2018-2020年) [Z].2018.
[3] 李伟,王士泉,于楠,等.区域健康医疗大数据平台解决方案策划与初步设计[J].医疗卫生装备,2018(7):34-40.
[4] 解明.基于Hadoop的医疗健康档案大数据平台构建研究[J].电子世界,2020(10):82-83.
[5] 陈宇翔.智慧城市背景下健康大数据系统搭建探索[J].大众标准化,2021(12):16-18.