医疗大数据可视化系统架构研究与实践

2017-12-07 07:44徐巧云诸纪陆雯珺
现代计算机 2017年30期
关键词:可视化医疗分析

徐巧云,诸纪,陆雯珺

(上海计算机软件技术开发中心,上海201112)

医疗大数据可视化系统架构研究与实践

徐巧云,诸纪,陆雯珺

(上海计算机软件技术开发中心,上海201112)

基于现如今海量的多源异构型医疗大数据,提出一种基于医疗大数据可视化系统架构的研究与实践。数据由原来的二维向三维转化,形成相互连接的立体数据体系,全方位的展现数据之间的相互关系,保证数据信息的具象可视化效果,同时为政府、医院、居民决策提供支撑。

大数据;可视化;医疗大数据

0 引言

随着“互联网+”的迅速发展,医疗大数据受到国家、政府机构等多方面的关注,2016年6月国家发布的指导意见中指出,要大力推进健康医疗信息系统和健康医疗数据互联互通,相互融合,营造良好的创新应用发展环境,必须要坚持实行以人为本、规范有序、创新驱动、开放融合、共建共享的原则。但与此同时,海量的异构数据面临着分析处理的挑战,为此,深入研究医疗大数据重中之重[1]。

国家“十三五”规划指出,推动大数据产业的健康快速发展,必须深度挖掘大数据在各行业领域的创新应用,探索大数据与传统行业相结合的新模式,完善大数据产业链。攻克数据采集、存储、分析、发掘、可视化等前沿关键技术。支撑大数据软硬件产品的研发。在大数据产业公共服务中,完善支撑体系和生态体系,加强标准体系建设、夯实质量技术基础。

1 医疗大数据可视化需求分析

如今越来越多的BI绘制工具已成功上市,这些工具越来越自动化、智能化。但是随着各类可视化新需求的产生,传统可视化形式的限制,隐藏在大数据背后的价值越发难以被挖掘出来,难以被人类所发觉。由于展现形式的局限,降低了数据的可读性和实效性,从而影响了用户的理解和决策。透过平面屏幕来接收信息始终掣肘人们的感官,VR、AR、全息投影,这些最火热的技术早已经被应用到旅游、游戏、房产等各个行业领域,未来大数据可视化必将与这些技术擦出火花,带来更真实的感官体验和更接近现实的交互体验,使用户可以完全“沉浸”到数据之中。相对于枯燥乏味的柱状图、折线图等传统表现形式,全方位的观看、控制、触摸,让数据变得更具冲击力。

随着大数据技术与产业的快速发展,大数据已不仅仅是数据科学家与领域专家研究的技术,而越来越多的企业用户,甚至是普通用户也开始应用、关注大数据分析的结果。例如,如今越来越多的人关注应该去哪个医院就诊,哪个医院的RW标准最符合,甚至是哪个医生的坐诊率最高,都可以通过医疗大数据可视化直观地展示出来。大数据可视化让更多的人能够理解、使用大数据。

2 医疗大数据可视化系统的设计

2.1 工具的选择

新型的大数据可视化产品层见叠出,各类语言也都有自己的可视化库,传统的BI软件和数据分析也在不断扩展可视化功能,再加上专门用于可视化的成品软件和大数据可视化工具逐渐被广泛应用,因此,用户更需要慎重考虑工具的选型标准。基于医疗大数据真实性高、速度快的特点,在工具选型方面需满足快速收集、筛选、分析、归纳以及展现政府、医疗机构所需的信息,实现实时数据图形可视化、场景化以及实时交互。可视化的实现方式主要有编程和非编程两类[2]。

当前市面上可视化编程工具主要包括以下三种类型:从艺术创作的角度,Processing不仅能够为艺术家提供编程语言,同时能够保持着艺术家对创作的追求;从统计学和数据处理的角度,即既能支撑数据的分析处理,又能提供制图功能,如R,SAS等;综合前两类的特点与功能,市面上出现D3.js、Echarts等工具,既能兼顾数据处理,又能展现出多样的可视化效果,能够更友好地在互联网上进行互动和展示数据。

Echarts作为一种前端数据可视化控件,通过调用轻量级Canvas类库Zrender,能够快速清晰地构成可视化图表,在与用户友好交互的同时,满足用户个性化定制需求。具体实现方式是通过script标签引入,执行echarts.init进行初始化,最终实例化出图表对象[3]。目前Echarts已广泛应用于各类商业活动中。

2.2 总体架构设计

对复杂海量数据进行可视分析是数据分析的重要研究内容。在一个传统典型的大数据可视分析过程中,自动分析的初步结果将通过可视化形式展现给用户,新的自动分析结果将通过人机交互技术和改进自动分析模型展示给用户。可视化与可视分析旨在清晰有效地传达与沟通数据,帮助政府、医疗机构等用户利用视觉发现数据的真知灼见,使用大数据可视化技术从解决问题的角度进行服务创新。

(1)研发可视化系统功能及技术架构

研发自助式分析的大数据可视化工具,通过创建并且分享仪表盘的方式为数据分析人员提供一个快速的数据可视化功能,简化数据探索分析操作。同时提升系统数据格式的拓展性、数据模型的高粒度保证、快速的复杂规则查询、兼容主流鉴权模式(数据库、OpenID、LDAP、OAuth或者基于 Flask AppBuilder的 REMOTE_USER等模式)。通过一个定义字段、下拉聚合规则的简单的语法层操作即可实现让数据分析人员将数据源在平台上丰富地呈现。

(2)构建模块化组件设计库

基于EChart工具技术研究,在canvas类库[6]zrender的基础上搭建主题图库,由数据驱动,实现支持数据视图、拖拽重计算、动态类型切换、多图联动、数据区域漫游、多维度堆积、个性化定制[7],通过调用EChart提供的多种图表、模型、地图等来丰富大数据的展现方式。同时提供自定义系列的图表,数据分析人员通过查看自定义的图表数据可以更加清晰直观的获取的特定的信息。研究基于数据文档JavaScript库的可视化数据处理技术,实现数据库中的数据信息与HTML、SVG、CSS结合[8],在立体展示空间内,数据由原来的二维向三维转化,形成相互连接的立体数据体系,全面的体现出数据信息之间的相互关系,数据信息的具象可视化效果得到了有效的保障。

(3)支持多数据源接入的开放接口技术研发

深度整合Druid以保证在操作超大、实时数据的分片和切分都能快速、高效的完成。通过Druid数据技术,基于分布式的快速列式存储,实现海量数据存储查询,保证实时数据低延迟的插入、灵活的数据探索和快速数据聚合。支持多种类数据源,包括Excel、Txt、Csv等多种文本格式,MySQL、SQL Server、DB2、ORACLE、Postgre SQL、Access等数据库,Hive、Spark、ODPS、ADS、Trafodion等大数据集群;Baidu、聚合数据、人人、微博、京东云、通联数据、simplybrand、teambiton、worktile等API类型的数据接入。

2.3 数据库架构设计

通过数据收集、数据清洗、数据分析等过程,对海量的医疗数据进行归纳分析,形成下列相关数据表,从而提升医疗大数据可视化形成的效率、质量。数据库设计是整个大数据可视化系统设计的基础,整个数据库应用系统的软件架构以及数据处理的效率[4]将直接受到数据库设计合理性的影响[5]。根据业务需求,整个大数据可视化系统包含了若干张数据表,储存了各个分析数据。E-R关系图如图2所示:

3 医疗大数据可视化系统的实践

智能导诊、疾病预防等场景向人类展示了医疗大数据非常广阔的应用前景。本系统针对区域医疗改革推行,收集了近200万家庭医生签约信息,以及总计超过100所市、区级医院和社区服务中心签约情况。对区域医疗大数据清洗、切片和储存之后接入本系统。

为了直观感受政策推行态势,系统针对区域医疗改革全区、社区以及团队家庭医生签约情况进行分析。通过地图缩放梯度,设计直方图以及趋势图分级探索月签约人数、签约率变化趋势的影响因子。按照总签约人数对社区、团队、个人进行排序,研究分析区域各区块政策推行力度以及民众关注度。同时对户籍人口、常住人口、60岁以上人口、妇女儿童以及慢性病患者五类人群分别以圆环占比图的形式进行单独分析,了解最直接受益者签约情况、佐证政策的正确性。

对“1+1+1”组合签约居民的就诊行为在政策推行后的变化趋势,系统通过内嵌双层南丁格尔玫瑰图,直观的展示组合内、组合外以及社区首诊、双向转诊人数对比。同时统计分析政策推行以来各数值的变化,以折线图的形式对各个数据拐点、突变点分析。最后筛查异常看病次数以及行为的市民,即时遏制非法看病行为。

图3 家庭医生签约情况展示图

图4 居民就诊行为分析展示图

4 结语

医疗大数据可视系统,一方面通过数据的可视化探索可以帮助理解数据、评估数据的可用性。另一方面,帮助政府在政策影响力、医院在制度管理、居民在对就诊行为等方面做出最适合的预测与判断。为政府提供决策数据支撑;为医院提供面向业务全流程的可视化服务,直观展现从技术、产品研发到市场的企业生态链,发现问题;为居民提供选择医院困难、就诊费用高昂等问题,通过医疗大数据可视化可直观选择适合自己病情的医院。

[1]王艺,任淑霞.医疗大数据可视化研究综述[J].计算机科学与探索,2017,11(5):681-685

[2]雷蕾.常用数据可视化技术分析[J].现代电视技术,2014,9:137-139

[3]王子毅,张春海.基于Echarts的数据可视化分析组件设计实现[J].微型机与应用,2016,35(14):46-51

[4]孙宁,赵维平,王宇飞,王凌[J].现代计算机,2017,1:64-69

[5]代元平,郑君芳.医学实验文档管理系统的数据库设计与实现[J].中国医疗设备,2016,31(4):93-96.

[6]刘嫦娥.数据可视化技术在Web中的研究及应用[J].电脑知识与技术,2017,13:7-8.

[7]陈旭,杨鹤标.医疗保险数据可视化系统设计与实现[J].软件导刊,2017,6(16):59-62.

[8]强津培,戴松.面向教学的数据可视化图表交互系统研究[J].系统仿真学报,2016,9(28):2101-2108.

徐巧云(1990-),女,上海人,本科,助理工程师,研究方向为大数据可视化、大数据成果转化

诸纪(1995-),男,浙江温州人,本科,初级,研究方向为大数据可视化

陆雯珺(1993-),女,上海市人,本科管理学、经济学学士学位,助理工程师,研究方向为数据治理理论、金融领域数据管理应用

Research and Practice of Visualization System for Large Medical Data

XU Qiao-yun,ZHU Ji,LU Wen-jun
(ShanghaiComputer Software Technology DevelopmentCenter,Shanghai 201112)

Based on the big data ofmulti-source heterogeneous medicaldata,proposes a research and practice based on the architecture ofmedical data visualization system.Makes the originaldata from two dimensionalto three-dimensional,and to form a rigorous and interconnected data system,itcan presentthe comprehensive expression ofthe data information mutualrelations,and ensure representationalvisualeffectof the data,itsupports government,hospitaland residentto make decisions efficiently.

Big Data;Visualization;Medical Big Data

1007-1423(2017)30-0027-04

10.3969/j.issn.1007-1423.2017.30.006

2017-08-24

2017-10-15

猜你喜欢
可视化医疗分析
《现代仪器与医疗》2022年征订回执
基于CiteSpace的足三里穴研究可视化分析
《现代仪器与医疗》2022年征订回执
自然资源可视化决策系统
思维可视化
自然资源可视化决策系统
新型医疗废弃物焚化舱
隐蔽失效适航要求符合性验证分析
分析:是谁要过节
电力系统及其自动化发展趋势分析