医疗大数据可视化研究综述

2017-06-05 15:05任淑霞
计算机与生活 2017年5期
关键词:可视化医疗研究

王 艺,任淑霞

天津工业大学 计算机科学与软件学院,天津 300387

医疗大数据可视化研究综述

王 艺,任淑霞+

天津工业大学 计算机科学与软件学院,天津 300387

随着“互联网+”的迅速发展,医疗大数据不仅数据类型繁多、关系复杂,且呈爆炸式增长,一般的数据可视化方法难以对其进行有效的展示,医疗大数据可视化技术面临巨大挑战。概述了医疗大数据的起源、特点及其研究进展,介绍了医疗大数据可视化的相关概念及其研究现状,将现有医疗大数据可视化方法划分为两大类,分类阐述了常见的医疗大数据可视化方法,给出了包括分类、图例、特性的可视化方法比较一览表。最后分析了医疗大数据可视化中存在的问题,指出其未来研究重点,对医疗大数据可视化方法研究与普及应用具有重要的参考价值。

医疗大数据;大数据可视化;互联网+

1 引言

随着“互联网+”的迅速发展,医疗大数据呈爆炸式增长,面临着海量数据和非结构化数据处理的挑战。近年来很多国家都在积极推进医疗信息化发展,医疗大数据的分析和应用发挥了巨大的作用,大大提高了医疗效率和医疗效果。传统医学是患者生病后由医生来治病,而目前疾病预防重于治疗,强调医生应该对“健康人”进行健康管理,把疾病治疗的关口前移。因此,医疗大数据的重要性和有效性突显出来,研究医疗大数据可视化技术变得尤为关键。

2 医疗大数据

自2007年IBM正式提出“云计算”概念以来,许多专家给出“云计算”的定义[1]。各种智能设备、传感器、电子网站、社交网络每时每刻都在产生海量数据,引发数据规模爆炸式增长,从而催生“大数据(big data)”出现。医疗行业[2]将和银行、电信、电商等行业一起迈入大数据时代。

大数据[3-4]被定义为5个“V”(规模Volume、多样Variety、速度Velocity、价值Value、真实Veracity)。第一,数据规模庞大(Volume):大数据的起始计量单位至少是P(1015)、E(1018)或Z(1021)。目前,大数据规模是一个不断变化的指标,单一数据集的规模从几十TB到数PB不等[5-6]。第二,数据类型繁多(Variety):比如社交媒体(图像、音频、视频)、互联网搜索、传感器网络、地理位置信息等。第三,处理速度快(Velocity):即数据被创建和移动传输的速度快,这一点也是和传统的数据挖掘技术有着本质的不同。第四,价值密度低,商业价值高(Value):通过分析大数据可以得出事物发展趋势,从而获取有价值的商业信息[7]。第五,数据真实性(Veracity):大数据的本质就是从庞大的网络数据中科学地提取出能够解释和预测现实事件的过程[8],然而数据内容的真实与否,将影响大数据的有效性,进而影响其价值。

2.1 医疗大数据来源

医疗大数据指的是在医疗行业中产生的数据,它们主要有以下4个来源[9-11]。

(1)临床实验数据

医疗机构的信息系统多而复杂,数据量增长非常快,一张CT图像含有数据量约为100 MB,一个标准病理图接近5 GB,以此计算,仅一个社区医院的数据量就可达数TB甚至数PB之多。

(2)生物医药

药物研发是密集型的过程,中小型的制药企业产生的数据也在TB以上。在生命科学领域,DNA基因序列、生物芯片等研究过程每时每刻都在产生新的数据,比如说,DNA测序每年产生的数据量都在PB级。

(3)电子病例、诊断书

就医过程中对病情的描述,医生的诊断和用药信息,产生的电子病例。例如,EMR是基于一个特定系统的电子化病人记录,该系统提供用户访问完整准确的数据、警示、提示和临床决策支持系统的能力。

(4)个体健康信息

由于移动可穿戴设备正在不断普及,个体健康信息实时上传至互联网,由此也可产生海量数据[12]。

2.2 医疗大数据的研究特点及应用

近年来,医疗大数据理论得到初步发展,但在其应用方向发展缓慢。医疗大数据除了具有大数据5个特点之外,还有多态性、时效性、不完整性、冗余性、隐私性等特点。

多态性是指医师对病人的描述具有主观性而难以达到标准化;时效性是指数据仅在一段时间内有用;不完整性是指医疗分析对病人的状态描述有偏差和缺失;冗余性是指医疗数据存在大量重复或无关的信息;隐私性是指用户的医疗健康数据具有高度的隐私性,泄漏信息会造成严重后果。

乔布斯通过大数据辅助治疗癌症,丹麦癌症协会通过大数据研究手机是否致癌等,美国最大的西奈山医疗中心使用来自大数据创业公司Ayasdi的技术分析大肠杆菌的全部基因序列,包括超过100万个DNA变体,来了解菌株为什么会对抗生素产生抗药性。上述应用研究体现出分析医疗大数据的价值。

3 医疗大数据研究概况

2013年,中国卫生信息学会做出中国健康信息技术的成熟度曲线[13]。通过中国医疗卫生信息技术应用成熟度曲线,可直观得出中国医疗大数据正处于技术触发期和期望膨胀期交界,并且受关注程度比较高,同时该图也显示出未来医疗大数据的技术成熟趋势和发展前景。

3.1 医疗大数据简介

英特尔全球医疗解决方案架构师吴闻新团队提出全球老龄化让医疗行业数据大幅度增长,尤其体现在影像数据和EMR电子病历数据中[14]。对于大幅度增长的医疗数据快速检索和存储均需建立一种全新的数据模式,来满足更大的容量需求和更好的性能要求等[15],如图1所示。

Fig.1 Maturity curve of Chinese healthcare information technology图1 中国医疗卫生信息技术应用成熟度曲线

在这种全新的数据模式基础上,对大幅度增长的医疗大数据进行分析并使用可视化技术进行直观展示变得尤为重要。由此可见,目前是研究医疗大数据可视化的最佳时期。截止到2016年12月,在美国《科学引文索引》(Science Citation Index,SCI)中收录的以医疗大数据为主题的学术论文共有6 497篇,在美国《工程索引》(The Engineering Index,EI)中收录的以医疗大数据为主题的学术论文942篇,在中国知网(China National Knowledge Infrastructure,CNKI)中收录的以医疗大数据为主题的学术论文13 244篇。

以医疗大数据为主题的学术论文数量统计如图2所示。2005年医疗大数据研究刚刚起步,自2007年进入增长期,至今仍处于研究领域的焦点地位。

Fig.2 Number of medical big data literatures图2 医疗大数据文献数量

3.2 医疗大数据国内外研究进展

医疗大数据的研究和应用越来越广泛,对SCI、EI和CNKI中收录的以医疗大数据为主题的学术论文进行统计,发现在精准医疗大数据、生物医药大数据、公共卫生大数据和生命科学等领域都得到不同程度的发展。

(1)国内医疗大数据研究现状

截止到2016年12月,中南大学发表了39篇相关学术论文,研究了大数据分析及其在医疗领域中的应用[16],国外医学大数据研究进展及其启示[17],大数据在医疗卫生中的应用前景[18],显示出在大数据的背景下,医疗大数据量增长之快和发展速度之迅猛。

(2)国外医疗大数据研究现状

截止到2016年12月,在SCI检索系统中,标题中含Big Data和Medical的学术论文共6 497篇。对研究团队进行统计:Causal Discovery团队发表的学术论文影响因子较大,主要研究从大数据的生物医学知识发现的因果关系[19];ACTION研究小组发表相关学术论文,对东南亚8个国家关于卫生支出、死亡率和癌症发病率进行纵向对比研究[20];美国心脏协会通过心血管大数据调查,提出了未来建立心血管疾病和中风疾病相互协作的数字生态系统[21];Participating实验室发表相关学术论文,阐述了由制造商使用大数据技术来监测实验室数据的过程[22];Wang等人发表了MOOC研究机构在高血压医疗大数据研究中扮演重要角色[23];Sun等人发表相关学术论文,研发了用于移动设备的基于网络的医学图像协同处理系统[24]。

通过研究发现,医疗大数据的研究仍处于探索阶段。由于医疗大数据作为跨学科的研究,研究过程存在一定难度,而且医疗系统数据管制体系也导致了医疗大数据难以获取,存在医疗信息孤岛等问题,使得医疗大数据研究难以在一般研究机构开展。目前,相关工作主要集中在工程应用部分,具体体现在数据采集和存储。而在理论研究方面,大多数工作现仅停留在评述医疗大数据规模特点及使用价值上,针对医疗大数据本身的挖掘计算、数据关系分析和可视化技术等基础方面的实质性研究较少。

4 医疗大数据可视化研究进展

在计算机科学的分类中,利用人眼的感知能力对数据进行交互的可视化表达以增强认知的技术称为可视化[25]。大数据可视化不仅利用数据挖掘技术从数据中挖掘有用的信息,而且还要把数据挖掘技术得到的信息向用户直观地展示。

4.1 大数据可视化简介

一幅图胜过千言万语,从此立足点出发,大数据分析的理论和方法研究可以从两个维度展开:一是从机器或计算机的角度出发,强调机器的计算能力和人工智能,以各种高性能处理算法、智能搜索与挖掘算法等为主要研究内容,例如基于Hadoop和Map-Reduce框架的大数据处理方法以及各类面向大数据的机器学习和数据挖掘方法等,这也是目前大数据分析领域的研究主流。另一维度以人作为分析主体和需求主体的角度作为出发点,强调基于人机交互的、符合人的认知规律的分析方法,意图将人所具备的、机器并不擅长的认知能力融入分析过程中,此研究分支以大数据可视化[26]为主要代表。

4.2 医疗大数据可视化技术研究概况

截止到2016年12月,统计以医疗大数据可视化主题搜索的学术论文数:SCI中收录826篇,EI中收录148篇,CNKI中收录61篇。医疗大数据可视化的研究和应用尚处于探索阶段。在SCI等高级检索数据库中从2013年起各个医疗领域可视化文章数量逐年暴涨,如图3所示。

Fig.3 Literatures in various fields in SCI图3 SCI各医疗领域文献数量

4.2.1 国外医疗大数据可视化研究现状

截止到2016年12月,在SCI检索系统中,标题中含医疗大数据可视化的相关学术论文共142篇。其中Yang团队研究精准医疗大数据可视化并发表论文,提出从社会媒体中过滤大数据,建立药物不良反应预警系统[27];Zhang团队研究生物医药大数据可视化并发表论文,进行免疫学中的大数据分析[28];Gaspar团队的论文阐述了大数据增量生成拓扑图的化学数据可视化与分析[29];Alvarez-Moreno团队通过研究化学医药大数据可视化并发表论文,提出使用iochem-BD平台来解决计算化学的大数据问题[30];You团队研究如何使用集成计算模型的生物传感大数据来检测大规模蛋白质的相互作用[31]。Ahlbrandt团队在公共卫生大数据可视化领域中,发表论文并提出大数据的发展需求和病人隐私的平衡点——分散式急救护理研究数据库的一个信息系统基础设施[32];Lupse团队在公共卫生大数据可视化研究中,阐述了大数据处理支持诊断与治疗[33]的必要性。

4.2.2 国内医疗大数据可视化研究现状

目前,国内医疗大数据可视化的研究和应用均处于探索阶段,截止到2016年12月,在中国知网可检索到标题中出现医疗大数据可视化的学术论文共61篇,其中影响较大的浙江大学在医疗大数据可视化方面发表了7篇学术论文:提出了多GPU环境下的并行体绘制[34],分布式医学影像数据的Streaming技术框架研究及实践[35],基于GPU集群的并行体绘制[36],海量数据的曲面分层重建算法[37],海量数据的曲面分片重建算法[38],基于变换编码的压缩体绘制[39]的研究。电子科技大学团队对医疗大数据可视化进行了一系列的研究,发表了什邡市人民医院医学图像三维可视化系统的构建的学术论文[40-43]。南方医科大学的董现玲团队对医疗大数据可视化进行了一系列的研究,提出了实时交互的医学图像可视化[44]、医学图像体绘制及其加速技术研究[45]。

在精准医疗[46]领域中,哈尔滨工业大学的肖永飞提出了医学数据三维交互的可视化方法[47]。在生物医药领域中,刘江涛和邢辉团队阐述了生物大数据可视化的现状及挑战[48];李正和康立源团队进行了中药制药过程数据集成、数据挖掘与可视化技术[49]的研究。在公共卫生领域中,山东大学的王亮完成了基于DSP的心电监护系统的设计与开发[50]。

面对复杂的医疗数据和日渐增长的就医需求,医疗大数据可视化是最为行之有效的工具。它具有挖掘数据价值,预测疾病发展趋势,辅助临床诊断,研发生物医药等方面的作用,从而推动大数据时代背景下智能医疗不断前进。

5 医疗大数据可视化技术

大数据可视化技术包含传统的科学可视化和信息可视化,从大数据分析以挖取信息和洞悉知识作为目标的角度出发,信息可视化技术将在大数据可视化中扮演更为重要的角色。数据信息类型各异,可分为时空数据、非时空数据两大类。这些与大数据密切相关的信息类型与Shneiderman[51-52]的分类交叉融合,将成为大数据可视化的主要研究领域。

大数据分析技术不仅对结构化数据有很强的处理能力,对非结构化数据的分析能力也日益加强。例如医疗影像(X光片、CT、MRI)数据可以借助于图像识别技术,通过区分不同灰度值来判断病灶的精确位置,从而使得临床决策支持系统更加智能化,给医生提供更合理的诊疗建议。

尽管医疗大数据信息类型繁多,但强大而灵活的可视化技术,可以增强医疗大数据的可读性。为便于对医疗大数据进行进一步的理解和应用,对不同类型的医疗大数据可视化方法进行分类研究显得尤为重要。

本文分析了常见的16种医疗大数据可视化方法,根据数据特点将其分为以下两类:时空数据和非时空数据,如图4所示。

5.1 时空数据

时空数据是指具有地理位置与时间标签的数据。传感器与移动终端的迅速普及,使得时空数据成为大数据时代典型的数据类型[53-54]。时空数据可视化与地理制图学相结合,重点对时间与空间维度以及与之相关的信息对象属性建立可视化表征,对与时间和空间密切相关的模式及规律进行展示。大数据环境下时空数据的高维性、实时性等特点,也是时空数据可视化的重点。

Fig.4 Classification tree of medical big data visualization图4 医疗大数据可视化分类树

5.1.1 空间标量场可视化

空间数据[55-56]spatial data)是带有物理空间坐标的数据,其中标量场是空间采样位置上记录单个标量的数据场。

(1)一维标量场可视化

一维标量场可视化[57]是沿某一条路径采样得到的标量场数据,用线图形式呈现出数据的分布规律。在血常规化验单中,血项数值会使用一维标量场可视化呈现出结果,如图5所示。

Fig.5 1-dimensional scalar field visualization图5 一维标量场可视化

此方法适用于各种生物化验结果的显示,如血常规中的红细胞RBC(俗称红血球)、白细胞(俗称白血球)、血小板计数PLT等血项。通过观察数量变化及形态分布判断疾病,是医生诊断病情的常用辅助检查手段之一。另外该方法还适用于佩戴式的移动医疗保健检测仪器中,佩戴者通过观测身体各项指标来及时监控自己的健康状况。

(2)二维标量场可视化

二维标量场可视化[58]通过在二维面上标量数据的分布特征表现出来。比如用于医学诊断X光片的颜色映射法[59],如图6所示。

Fig.6 2-dimensional scalar field visualization图6 二维标量场可视化

此方法适用于X光片技术,由于穿过病灶后映射出灰度图像的深浅不同,可判断出是否有病灶及其精确位置,从而帮助医生快速确诊。

5.1.2 地理信息可视化

地理信息可视化[60]是地理信息传输的关键步骤,其理论与技术的拓展将为地理信息传输效果的提升提供更有效的途径。

(1)点数据可视化

透过地理空间中的离散点(数据对象),具有经纬度的坐标,用于表示数据对象的发展现状。透过数据对象属性(颜色、大小)区分,遵循指定的原则来可视化出其发展程度。Ward等人[61]发现基于地图划分的地理信息点的数据统计中,三维方柱越高,代表该区域空间内交通越忙碌,如图7所示。

Fig.7 Point data visualization图7 点数据可视化图

此方法适用于分析历年病例,通过统计不同时段不同地区各类常见疾病的发病情况,实时预测是否有异常出现,从而推断出是否有新病种或疫情出现。

(2)线数据可视化

线数据可视化地理空间数据中,线数据是连接两个或者多个地点的线段或路径,可展示地区性遗传疾病和流感发病预测的分布情况。为了反映信息对象随时间进展与空间位置所发生的行为变化,可通过信息对象的属性可视化来展现。流式地图Flow map是一种典型的方法[62-64],如图8所示。

此方法适用于控制突发性传染病蔓延趋势,通过分析病疫情的来源及蔓延趋势程度,及时准确收集信息,做出高效的应对方案,切断传染源,控制疫情的发展。

Fig.8 Line data visualization图8 线数据可视化图

(3)区域数据可视化

地理空间的一个区域中有长度也有宽度,是由一系列点所标识的一个二维的封闭空间。目的是为了表现区域[65-66]的属性,在不同区域中,分析人口密集度,便于政府考虑数据分布和地理区域大小对称性,如图9所示。

Fig.9 Visualization map of area data图9 区域数据可视化地形图

此方法适用于区域卫生数据的分析和预测,结合地理位置、环境污染程度和经济形势等因素,监测新生儿死亡率或慢性病的发病情况。同时也可判断是否出现地域性遗传病。

5.1.3 时变数据可视化

随着时间变化、带有时间属性的数据称作时变数据(temporal data)。

(1)时间属性可视化

将时间属性或者顺序当成时间轴变量,每个数据实例是轴上某个变量值对应的事件。按照历史动力学理论,通过人口增长数量、环境污染指数等变量,推断出有经验的规律和周期。

如图10所示,Spinney等人[67]展示了每隔50年美国城市暴力的周期图例。

Fig.10 Temporal attribute visualization图10 时间属性可视化图

如图11所示,基于聚类分析的日历视图和时间序列数据图分析,Wijk等人[68]将小时、日期作为x、y轴,耗电量作为高度,既呈现了全年的耗电量走势,也呈现了每日耗电量的周期性特征。

Fig.11 Calendar view and time series data graph based on cluster analysis图11 基于聚类分析日历视图和时间序列数据图

此方法适用于日常门诊,通过分析每日就诊量及候诊时间等信息,借助日历视图和时间属性图,全面研究和分析日常就诊的每个业务过程的瓶颈,从而改善日常工作就诊的服务质量。

(2)流数据可视化

通过流模式生成流数据,一类特殊的具有无限长度的时间轴的时变型数据。按功能可以把这样的数据分为两类。

第一类为监控型,是用流动窗口固定一个时间区间,把流数据转化成静态数据,数据更新方式是刷新,属于局部分析。

第二类是叠加型,是把新产生的数据可视映射到原来的历史数据可视化结果上,更新方式是渐进式更新,属于全局分析。Luo等人[69]使用增量聚类算法从一系列时间中提取热门话题,用EventRiver在一个布局界面中自然地表达出来,如图12所示。

Fig.12 Flow data visualization of EventRiver图12 EventRiver流数据可视化图

此方法适用于按日期销售药品量,对各大医院、社区医院和网络销售等不同渠道的药品销量进行分析。通过数据流可视化图预测近期高发疾病,以便制药公司、各大医院提前准备药品,防治多发疾病。

5.2 非时空数据

5.2.1 层次和网络数据可视化

层次和网络数据可视化[70]对于具有海量节点和边的大规模网络,如何在有限的屏幕空间中进行可视化,将是大数据时代面临的难点和重点。除了对静态的网络拓扑关系进行可视化,大数据相关的网络往往具有动态演化性。

(1)层次数据可视化

层次数据是一种常见的数据类型,着重表达个体之间的层次关系,可以抽象成树结构,这种关系表达了包含和从属的关系,如图13所示。Robertson等人[71]使用了基于圆锥树方法的树结构数据可视化。对于大层次结构,在树下空间不足的缺陷下,导师节点互相重叠,Lamp等人提出了双曲树的可视化方法,如图14所示。

Fig.13 Tree structure图13 树结构

Fig.14 Hyperbolic tree图14 双曲树

层次数据可视化的要点是对数据中层次关系(即树形结构)的有效刻画。不同的类型关系用不同的视觉符号表示,这决定了层次数据可视化分为以下两种方法。

第一种是节点-链接法,将单个个体绘成一个节点,节点之间的连线表示个体之间的层次关系。代表技术为圆锥树、空间树等,常常表达承接的层次关系。Teoh等人[72]为文件建立目录数据,在径向树中,圆周的大小随层次深度的增加而线性增长,树节点呈几何级数增长。不足之处在于树的底层空间不足,可能会导致节点相互重叠,影响可视化效果,如图15所示。

Fig.15 Rings trees图15 环状径向树法

此方法适用于检测数据之间的排斥反应,通过大量的医学数据分析,找出某几种疾病或某几种药之间的不良反应;同样此方法适用于各种疾病之间的关联以及全基因组关联性分析。

第二种是空间填充法。从空间填充的角度实现层次数据的可视化[73],数据描述采用树的结构。在树图中,采用矩形表示层次结构里的节点,父子节点之间的层次关系用矩形之间的相互嵌套隐喻来表达,此方法可以充分利用全部的屏幕空间。

树图组织比较适合用于层次结构不复杂的数据结构系统。在新闻分类可视化系统的Newsmap新闻树图(http://newsmap.jp/)中使用该方法,来表达各地新闻之间的层次关系,如图16所示。

Fig.16 Newsmap图16 新闻树图

此方法适用于临床决策支持,在医生诊疗过程中,通过大数据分析给出更加合理精准的医疗方案。

(2)网络数据可视化

网络数据不具有自底向上或自顶向下的层次结构,因此表达更加自由。这决定了网络数据可视化分为以下两种方法。

第一种是弧长链接图法,即节点-链接法的变种,采用一维布局方式,节点沿某个线性轴或者环形排列,圆弧表示节点之间的链接关系。文中使用弧长链接图[74]描述《悲惨世界》中的人物关系图谱(http:// hci.stanford.edu/jheer/files/zoo/)效果,如图17所示。

Fig.17 Arc connection diagram图17 弧长连接图

此方法适用于用药情况分析和日常病情监测,能够辅助检测出是否有病变的可能,最终引发其他疾病的情况。

第二种是力引导布局图,用节点表示对象,线表示关系的节点-链接布局,是自然的可视化布局。最早由Eades[75]提出了启发式画图算法,目的是减少布局中边的交叉数量,尽量保持边长度一致。在启发式画图算法基础上,Fruchterman等人[76]提出了力引导图的概念,如图18所示。

Fig.18 Force-directed diagram图18 力引导布局图

此方法适用于基因关联分析,如患II糖尿病人群基因组分析检测,从胰岛代谢、基因表达等角度对病人的敏感位点进行分析,通过分析找出II糖尿病的患病根源。

5.2.2 文本和文档可视化

(1)文本内容可视化

文本信息内容是大数据时代非结构化数据类型的典型代表,是互联网中最主要的信息类型,也是物联网各种传感器采集后生成的主要信息类型。文本可视化的意义在于,能够将文本中蕴含的语义特征形象化表达。根据不同的形态,把文本内容分为以下两种。

第一种是标签云,即一套相关的标签以及与此相应的权重。典型的标签云有30至150个标签。权重影响使用的字体大小或其他视觉效果。标签是典型的超链接,因此标签云[77]是可以交互的,如图19所示。

Fig.19 Tag cloud图19 标签云

此方法适用于医疗领域中所有文本信息的可视化,如病例信息、临床医疗记录、药物清单,甚至是网络论坛中医疗保健信息。通过分析用户在各大网站搜索相关疾病的记录,发现高频出现的疾病名称,并预测疾病的发展趋势,及时准备治疗流行病的方案。

第二种是文档散,又称旭日图法,该图采用关键字作为可视化文本的内容,并且参考关键字在人类词汇中的关系来对不同的关键字进行布局,从而描述出关键词之间的语义层次关系。

Collins等人[78]对DocuBurst作出了解释,文档散中,外圈词汇是里圈词汇的下义词,圆心处的关键字是文章所涉及内容的最顶层概述,如图20所示。

Fig.20 DocuBurst图20 文档散法

此方法适用于疾病的自我检测,通过社交网络,共享自身病例和医疗记录。基于后台大数据处理技术,患者可以测量自我疾病发展程度,参考同病症的患者用药记录决定自己的用药治疗方案。

Fig.21 Word tree图21 单词树法

(2)文本关系可视化

基于文本关系的可视化目的是将文本或者文档里的内涵关系进行可视化描述,如文本之间的应用、网页之间的超级链接关系、文本的相似性和文档集合内容的层次性等。Scharl等人[79]提出单词树(word tree),从句法层面可视化表达稳步词汇的前缀关系。Wattenberg等人[80]利用树形结构来可视化文本中的句子方法,如图21所示。

此方法适用于从大量的电子病历中检索出有价值的字段,通过单词树来分析就医者自述的病症信息,快速推断出患者的疾病。

5.2.3 复杂高维多元数据可视化

复杂高维多元数据是指具有多个维度属性的数据变量,广泛存在于基于传统关系数据库以及数据仓库的应用中,例如病人信息系统及药物智能系统。高维多元数据分析的目标是探索高维多元数据项的分布规律和模式,并揭示不同维度属性之间的隐含关系。

基于几何图形的高维多元可视化方法是近年来主要的研究方向。医疗大数据背景下,除了数据项规模扩大带来的挑战,高维多元所引起的问题也是研究的难点。

(1)散点图及散点矩阵

二维散点图将多个维度中的两个维度属性值集合映射至两条轴,在二维轴确定的平面内通过图形标记的不同视觉元素来反映其他维度属性值。Keim等人[81-83]归纳了高维多元可视化的基本方法,如图22所示。

Fig.22 3-dimensional scatter plot图22 三维散点图

此方法适用于高维多元数据的散点图可视化,横轴为年收入,纵轴为幼儿死亡率,圆点大小和颜色分别表示城市人口和所在区域,便于统计整体数据并进行综合分析。

(2)星形图与雷达图

雷达图方法是基于形似导航雷达显示屏上的图形而构建的一种多变量对比分析技术,许多统计方面的专家用雷达图[84]来分析经济和银行利率、企业风险等。吴颖慧等人[85]提出了2013—2014年香港地区九龙中、九龙东与九龙西医院联网运营雷达图,如图23所示。

Fig.23 Radar chart图23 雷达图

此方法适用于高维多元数据分析,在突发病暴发期间,能够直观地对该过程中地理位置变化、时间变化、发病人数变化以及特殊事件进行立体展现。

5.3 医疗大数据可视化技术分类

对医疗大数据可视化方法及其特性进行分类,可分为时空数据可视化方法和非时空数据可视化方法。

5.3.1 时空数据可视化方法及特性

时空数据可视化如表1所示。

5.3.2 非时空数据可视化方法及特性

非时空数据可视化如表2所示。

Table 1 Spatial-temporal data visualization methods and features表1 时空数据可视化方法及特性

6 总结

综上所述,当前有关医疗健康和生物大数据的研究在基础研究、临床应用及新兴产业中发挥了不可替代的作用。在“医疗健康与生物大数据”论坛中,通过探讨医疗健康和生物医药大数据在基础研究中的价值及面临的挑战,可以释放更多无法衡量的价值。希望通过大数据的应用,引领医疗领域的可视化分析,从而走向医疗大数据可视化的新时代[86]。

6.1 医疗大数据可视化存在的问题

医疗大数据可视化的应用越来越广泛,尤其在精准医疗[87]、生物医药、公共卫生分析中越来越重要。目前,医疗大数据可视化研究仍处于探索阶段,有许多问题亟待解决[88-89]。

(1)医疗信息安全性

医疗大数据可视化,有很多信息安全问题不容忽视,这些都制约着医疗大数据和及其可视化的研究与应用,是一个值得探讨的问题。

(2)系统化可视化方法

在不同的研究领域中医疗大数据可视化的图形化表示方法各不相同,深入研究医疗大数据及其可视化,需要对方法进行深入分析,找出共性,提出一种规范的、抽象层次更高的医疗大数据可视化方法。可视化的表示形式多种多样,对于每一种画法,将其美观地绘制出来是一个难题,因此设计表现力研究也是一个重要课题。

(3)数据冗余问题

随着数据规模的增大,数据信息的网络复杂程度将越来越高,医疗大数据所要解决的问题也会越来越复杂,能否解决医疗大数据数字化、碎片化等实际问题至关重要。

(4)多样性可视化

在大数据分析中,由于数据规模巨大,数据类型繁多,用单一的分析方法进行分析难以表现出其内在特性与价值,将医疗大数据可视化技术与各种大数据分析技术有机地融合是具有挑战性的研究课题。

Table 2 Non-spatial-temporal data visualization methods and features表2 非时空数据可视化方法及特性

6.2 医疗大数据可视化研究重点

(1)视觉噪声

医疗大数据中有很多强关联的数据,每种数据不能将其单独可视化。对这些具有强关联的数据进行处理并将其可视化的过程中,因处理方式、显示程度的不同,导致可视化结果不明显,但不能理解为是数据丢失和数据扭曲。

(2)关系复杂

医疗大数据的网络中,错综复杂的关系导致图像交叉、重叠过多,以至于看起来不是那样的直观。

(3)性能需求

大数据可视化包含静态可视化和动态可视化。尤其动态可视化中,对速度的性能要求非常高。若速度达不到要求,就无法完成实时的数据更新,例如实时观测突发疾病的状况。

(4)信息安全

医疗大数据类型繁多和关系复杂,通过复杂的聚合和过滤过程来分析数据之间的相关性。此过程会消耗大量的时间和性能资源,导致信息不完整,严重影响可视化效果。

未来,医疗大数据规模将越来越大,类型也将越来越多,结构也会越来越复杂,医疗大数据可视化及可视分析面临巨大挑战。医疗大数据可视化及其可视分析技术在精准医疗、公共卫生、生物医药以及生命科学等众多领域将会发挥更大的作用。

[1]Assunção M D,Calheiros R N,Bianchi S,et al.Big data computing and clouds:trends and future directions[J].Journal of Parallel and Distributed Computing,2014,79-80:3-15.

[2]Doctorow C.Big data:welcome to the petacentre[J].Nature, 2008,455(7209):16-21.

[3]Chen C L P,Zhang Chunyang.Data-intensive applications, challenges,techniques and technologies:a survey on big data [J].Information Sciences,2014,275(11):314-347.

[4]Chen Min,Mao Shiwen,Liu Yunhao.Big data:a survey[J]. Mobile Networks andApplications,2014,19(2):171-209.

[5]Lynch C.Big data:how do your data grow?[J].Nature,2008, 455(7209):28-29.

[6]Szalay A,Gray J.2020 computing:science in an exponential world[J].Nature,2006,440(7083):413-414.

[7]Zuech R,Khoshgoftaar T M,Wald R.Intrusion detection and big heterogeneous data:a survey[J].Journal of Big Data, 2015,2(1):3.

[8]Labrinidis A,Jagadish H V.Challenges and opportunities with big data[J].Proceedings of the VIDB Endowment, 2012,5(12):2032-2033.

[9]Liu Ning,Chen Min.Applying themes and related data sources research of healthcare big data[J].China Digital Medicine,2016,11(8):6-9.

[10]Song Bo,Yang Yanli,Feng Yunxia.Review of medical big data research[J].Translational Medicine Journal,2016,5(5): 298-300.

[11]Jin Xing,Wang Yonghong.Applications and development of health big data[J].Chinese Journal of Health Informatics and Management,2016,13(2):187-190.

[12]Li Tianding,Wang Li.Talking about the data mining and data visualizing in big data age[J].Librarianship and Information Science,2016,1(1):100-101.

[13]Zhang Zhen,Zhou Yi,Du Shouhong,et al.Medical data and its opportunities and challenges[J].Chinese Journal of Medical Information,2014,35(6):1-8.

[14]Wu Xueyan,Sun Yongjie.Cloud computing and big data helps medical collaboration[J].Communications World,2013 (10):15.

[15]Tu Xinli,Liu Bo,Lin Weiwei.Survey of big data[J].Application Research of Computers,2014,31(6):1612-1616.

[16]Zou Beiji.Major data analysis and its application in medical field[J].Computer Education,2014(7):24-29.

[17]Yao Shanhu,Luo Aijing,Feng Lin.Research progress of foreign medical big data and its implications[J].Journal of Medical Informatics,2016,37(2):16-21.

[18]Wang Xiao,Zhang Aidi,Yan Jin.Application prospects of big data in healthcare[J].Chinese General Practice,2015,18 (1):113-115.

[19]Cooper G F,Bahar I,Becich M J,et al.The center for causal discovery of biomedical knowledge from big data[J].Journal of the American Medical Informatics Association,2015, 22(6):1132-1136.

[20]Kimman M,Jan S,Yip C H,et al.Catastrophic health expenditure and 12-month mortality associated with cancer in Southeast Asia:results from a longitudinal study in eight countries[J].BMC Medicine,2015,13(1):1-11.

[21]Antman E M,Benjamin E J,Harrington R A,et al.Acquisition,analysis,and sharing of data in 2015 and beyond:a survey of the landscape:a conference report from the American heart association data summit 2015[J].Journal of the American HeartAssociation,2015,4(11):e002810.

[22]Goossens K,Van U K,Twomey P J,et al.Monitoring laboratory data across manufacturers and laboratories—a prerequisite to make“Big Data”work[J].Clinica Chimica Acta, 2015,445:12-18.

[23]Wang Xinyan,Tian Liyuan,Xu Bo,et al.MOOC for medical big data research:an important role in hypertension big data research[C]//Proceedings of the 1st International Conference on Big Data Computing Service and Applications, Redwood City,USA,Mar 30-Apr 2,2015.Washington:IEEE Computer Society,2015:453-455.

[24]Sun Sujun,Ma Dianfu,Shen Hualei.A Web-based medical image collaborative processing system using mobile devices [C]//Proceedings of the 4th International Conference on Software Technology and Engineering,Phuket,Thailand, Sep 1-2,2012.Piscataway,USA:IEEE,2012:52.

[25]Wu Yingbin,Guo Fuliang.Visualization technology basedon the treatment of complicated data[J].Computer&Digital Engineering,2015,43(11):1985-1989.

[26]He Xiaoping,Huang Long.Visualization analysis of evolution path research hotspots and frontiers of big data[J].Journal of Modern Information,2015,35(4):46-51.

[27]Yang Ming,Kiang M,Shang Wei.Filtering big data from social media—building an early warning system for adverse drug reactions[J].Journal of Biomedical Informatics, 2015,54(C):230-240.

[28]Zhang Guanglan,Sun Jing,Chitkushev L,et al.Big data analytics in immunology:a knowledge-based approach[J].Biomed Research International,2014(1):437987.

[29]Gaspar HA,Baskin I I,Marcou G,et al.Chemical data visualization and analysis with incremental generative topographic mapping:big data challenge[J].Journal of Chemical Information&Modeling,2015,55(1):84-94.

[30]Moreno M A,De Graaf C,Lopez N,et al.Managing the computational chemistry big data problem:the ioChem-BD platform[J].Journal of Chemical Information&Modeling, 2015,55(1):95-103.

[31]You Zhuhong,Li Shuai,Gao Xin,et al.Large-scale proteinprotein interactions detection by integrating big biosensing data with computational model[J].BioMed Research International,2014(2):59812.

[32]Ahlbrandt J,Brammen D,Majeed R W,et al.Balancing the need for big data and patient data privacy—an IT infrastructure for a decentralized emergency care research database[J]. Studies in Health Technology&Informatics,2014,205: 750-754.

[33]Lupşe O S,Crişanvida M,Stoicutivadar L,et al.Supporting diagnosis and treatment in medical care based on big data processing[J].Studies in Health Technology&Informatics, 2014,197:65-69.

[34]Shen Cong.Parallel volume rendering under multi-GPU environment[D].Hangzhou:Zhejiang University,2003.

[35]Xie Shunhua.Research and Implementation of streaming technology framework for distributed medial image[D].Hangzhou:Zhejiang University,2013.

[36]Kong Mingming.GPU cluster based parallel volume rendering [D].Hangzhou:Zhejiang University,2007.

[37]Lv Shengmin,Yang Xunnian,Wang Guozhao.A layered surfaces reconstruction algorithm from large volumetric datasets[J].Journal of Software,2003,14(8):1448-1455.

[38]Lv Shengmin,Yang Xunnian,Wang Guozhao.Surface reconstruction algorithm for massive data[C]//Proceedings of the 2002 National Symposium on Geometric Design and Computation,Qingdao,China,2002:1448-1455.

[39]Jiang Peng.Compression volume rendering based on transform coding[D].Hangzhou:Zhejiang University,2008.

[40]Xian Kun.The construction of Shifang city People's hospital medical image 3D visualization system[D].Chengdu: University of Electronic Science and Technology of China, 2015.

[41]Jang Yi.Study on key technologies of routing security in wireless sensor networks[D].Chengdu:University of Electronic Science and Technology of China,2015.

[42]Zu Li.The design and implementation of CCD image acquisition software system[D].Chengdu:University of Electronic Science and Technology of China,2012.

[43]Shen Xin.Design and realization of automatic keeping control system[D].Chengdu:University of Electronic Science and Technology of China,2007.

[44]Wang Wenhua.Real-time interactive visualization in medical[D].Guangzhou:Southern Medical University,2013.

[45]Dong Xianling.Research on medical image volume rendering and its acceleration technique[D].Guangzhou:Southern Medical University,2010.

[46]Gu Yan.According to the“Chinese gene”to create“accurate medical plan”[J].China's Strategic Emerging Industries,2015(17):78-80.

[47]Xiao Yongfei.Research on 3D interactive visualization for medical data[D].Harbin:Harbin Institute of Technology, 2010.

[48]Liu Jiangtao,Xing Hui.Analysis on the present situation and challenges of visualization of large biological data[J]. New Communications,2016(2).

[49]Li Zheng,Kang Liyuan,Fan Xiaohui.Data integration,data mining and visualization analysis of traditional Chinese medicine manufacturing process[J].China Journal of Chinese Material Medical,2014,39(15):2989-2992.

[50]Wang Liang.Design and development of ECG monitoring system based on DSP[D].Jinan:Shandong University,2010.

[51]Ren Lei,Du Yi,Ma Shuai,et al.Visual analytics towards big data[J].Journal of Software,2014,25(9):1909-1936.

[52]Card S K,Mackinlay J D,Shneiderman B.Using vision to think[M]//Readings in Information Visualization.San Francisco,USA:Morgan Kaufmann Publishers Inc,1999:579-581.

[53]Halevi G,Moed H.The evolution of big data as a research and scientific topic:overview of the literature[J].Research Trends,2012,30(1):3-6.

[54]Hey T,Gannon D,Pinkelman J.The future of data-intensive science[J].Computer,2012,45(5):81-82.

[55]Zhou Dongru,Yang Rong,Yang Wei,et al.Algorithm and implementation of 3D data field visualization[J].Engineering Graphics,1993(2):1-6.

[56]Crawfis R A,Max N.Texture splats for 3D scalar and vector field visualization[C]//Proceedings of the 4th Conference on Visualization,San Jose,USA,Oct 25-29,1993.Washington:IEEE Computer Society,1993:261-266.

[57]Zhao Wei.Data visualization technology and its application software[D].Xi'an:Northwestern Polytechnical University, 1998.

[58]Lin Yi,Yan Lei,Gao Wei,et al.Advanced combinatorial algorithm for 2D navigator scalar field modeling[J].Journal of Basic Science and Engineering,2008,16(4):472-477.

[59]Wang Dexin,Huang Xiying.Medical application of X-ray technology progress[J].Medical Journal of Chinese People's Health,2011,23(18):2316.

[60]Hou Suoyuan,An Xiaoya,Xu Jian,et al.An overview and analysis of the new geo-visualization technology[J].Geometrics&Spatial Information Technology,2014,37(1):30-32.

[61]Ward M,Grinstein G G,Keim D.Interactive data visualization:foundations,techniques,and applications[J].Seed& Plant Production Journal,2010,51(4):188-195.

[62]Waldo R T.Experiments in migration mapping by computer [J].TheAmerican Cartographer,1987,14(2):155-163.

[63]Phan D,Xiao Ling,Yeh R,et al.Flow map layout[C]//Proceedings of the 2005 IEEE Symposium on Information Visualization,Minneapolis,USA,Oct 23-25,2005.Washington: IEEE Computer Society,2005:29.

[64]Buchin K,Speckmann B,Verbeek K.Flow map layout via spiral trees[J].IEEE Transactions on Visualization and Computer Graphics,2011,17(12):2536-2544.

[65]Li Xiuyi.A visualization method of regional data based on improved density clustering[J].Computer CD Software and Applications,2014(19):119.

[66]He Zhaocheng,Zhou Yaqiang,Yu Zhi.Regional traffic state evaluation method based on data visualization[J].Journal of Traffic and Transportation Engineering,2016,16(1):133-140.

[67]Spinney L.Human cycles:history as science[J].Nature, 2012,488(7409):24.

[68]Van Wijk J J,Van Selow E R.Cluster and calendar based visualization of time series data[C]//Proceedings of the 1999 IEEE Symposium on Information Visualization,San Francisco,USA,Oct 24-29,1999.Washington:IEEE Computer Society,1999:4.

[69]Luo Dongning,Yang Jing,Krstajic M,et al.EventRiver:visually exploring text collections with temporal references[J]. IEEE Transactions on Visualization and Computer Graphics, 2012,18(1):93-105.

[70]Herman I,Melancon G,Marshall M S.Graph visualization and navigation in information visualization:a survey[J]. IEEE Transactions on Visualization and Computer Graphics, 2000,6(1):24-43.

[71]Robertson G G,Mackinlay J D,Card S K.Cone trees:animated 3D visualizations of hierarchical information[C]// Proceedings of the 1991 SIGCHI Conference on Human Factors in Computing Systems,New Orleans,USA,Apr 27-May 2,1991.New York:ACM,1991:189-194.

[72]Teoh S T,Ma K L.RINGS:a technique for visualizing large hierarchies[C]//Proceedings of the 10th International Symposium on Graph Drawing,Irvine,Aug 26-28,2002.London,UK:Springer-Verlag,2002:268-275.

[73]Stasko J,Catrambone R,Guzdial M,et al.An evaluation of space-filling information visualizations for depicting hierarchical structures[J].International Journal of Human-Computer Studies,2000,53(5):663-694.

[74]Yan Gaofeng.Research on visual analytic system of port transportation based on big data[D].Beijing:Beijing Jiaotong University,2016.

[75]Eades P A.A heuristic for graph drawing[J].Congressus Numerantium,1984,42:149-160.

[76]Fruchterman T M J,Reingold E M.Graph drawing by forcedirected placement[J].Software Practice&Experience, 1991,21(11):1129-1164.

[77]Koh K,Lee B,Kim B,et al.ManiWordle:providing flexible control over wordle[J].IEEE Transactions on Visualization and Computer Graphics,2010,16(6):1190-1197.

[78]Collins C,Carpendale S,Penn G.DocuBurst:visualizing document content using language structure[J].Computer Graphics Forum,2009,28(3):1039-1046.

[79]Scharl A,Hubmannhaidvogel A,Jones A,et al.Analyzing the public discourse on works of fiction-detection and visualization of emotion in online coverage about HBO's game of thrones[J].Information Processing&Management,2015, 179(52):470-479.

[80]Wattenberg M,Viégas F B.The word tree,an interactive visual concordance[J].IEEE Transactions on Visualization and Computer Graphics,2008,14(6):1221-1228.

[81]Keim D,Andrienko G,Fekete J D,et al.Visual analytics: definition,process,and challenges[M]//LNCS 4950:Information Visualization.Berlin,Heidelberg:Springer,2008: 154-175.

[82]Ahlberg C,Shneiderman B.Visual information seeking: tight coupling of dynamic query filters with starfield displays[C]//Proceedings of the 1994 Conference Companion on Human Factors in Computing Systems,Boston,USA, Apr 24-28,1994.New York:ACM,1994:450-456.

[83]Elmqvist N,Dragicevic P,Fekete J D.Rolling the dice:multidimensional visual exploration using scatterplot matrix navigation[J].IEEE Transactions on Visualization and Computer Graphics,2008,14(6):1141-1148.

[84]Ding Jiemin,Li Weibo.Visualization representation and feature analysis of radar-map-based multi-dimensional data[J]. Modern Electronics Technique,2010,33(23):24-26.

[85]Wu Yinghui,Ye Xiaojin.Application of radar image in hospital management under data visualization background[J]. Guangxi Medical Journal,2016,38(7):1050-1052.

[86]Jiang Qiping,Feng Haichao,Gu Fu.Major trend of data service[J].Internet Weekly,2013(7):26-46.

[87]Yang Chunhua,Wang Tianjin,Huang Simin,et al.Precision medicine oriented clinical decision supporting system in foreign countries[J].Chinese Journal of Medical Library and Information Science,2016,25(2):14-19.

[88]Yur'Evich G E,Vasil'Evich G V.Analytical review of data visualization methods in application to big data[J].Journal of Electrical&Computer Engineering,2013(4):1-7.

[89]Khan M,Shah S.Data and information visualization methods,and interactive mechanisms:a survey[J].International Journal of ComputerApplications,2011,34(1):1-14.

附中文参考文献:

[9]刘宁,陈敏.医疗健康大数据应用主题及相关数据来源研究[J].中国数字医学,2016,11(8):6-9.

[10]宋波,杨艳利,冯云霞.医疗大数据研究进展[J].转化医学杂志,2016,5(5):298-300.

[11]金兴,王咏红.健康医疗大数据的应用与发展[J].中国卫生信息管理杂志,2016,13(2):187-190.

[12]李田丁,王莉.浅谈大数据时代的数据挖掘和数据可视化[J].科技情报开发与经济,2016,1(1):100-101.

[13]张振,周毅,杜守洪,等.医疗大数据及其面临的机遇与挑战[J].医学信息学杂志,2014,35(6):1-8.

[14]邬雪艳,孙永杰.云计算和大数据助力医疗协同[J].通信世界,2013(10):15.

[15]涂新莉,刘波,林伟伟.大数据研究综述[J].计算机应用研究,2014,31(6):1612-1616.

[16]邹北骥.大数据分析及其在医疗领域中的应用[J].计算机教育,2014(7):24-29.

[17]姚山虎,罗爱静,冯麟.国外医学大数据研究进展及其启示[J].医学信息学杂志,2016,37(2):16-21.

[18]王潇,张爱迪,严谨.大数据在医疗卫生中的应用前景[J].中国全科医学,2015,18(1):113-115.

[25]吴英彬,郭福亮.基于复杂数据处理的可视化技术研究[J].计算机与数字工程,2015,43(11):1985-1989.

[26]何晓萍,黄龙.大数据领域演进路径、研究热点与前沿的可视化分析[J].现代情报,2015,35(4):46-51.

[34]沈聪.多GPU环境下的并行体绘制[D].杭州:浙江大学, 2013.

[35]谢顺华.分布式医学影像数据的Streaming技术框架研究及实践[D].杭州:浙江大学,2003.

[36]孔明明.基于GPU集群的并行体绘制[D].杭州:浙江大学,2007.

[37]吕晟珉,杨勋年,汪国昭.海量数据的曲面分层重建算法[J].软件学报,2003,14(8):1448-1455.

[38]吕晟珉,杨勋年,汪国昭.海量数据的曲面分片重建算法[C]//第一届全国几何设计与计算学术会议论文集,青岛, 2002-06-01.中国工业与应用数学学会几何设计与计算专业委员会,2002:1448-1455.

[39]江鹏.基于变换编码的压缩体绘制[D].杭州:浙江大学, 2008.

[40]鲜锟.什邡市人民医院医学图像三维可视化系统的构建[D].成都:电子科技大学,2015.

[41]蒋溢.无线传感器网络路由安全技术研究[D].成都:电子科技大学,2015.

[42]祖力.CCD图像采集软件系统的设计与实现[D].成都:电子科技大学,2012.

[43]沈新.自动化守控系统的设计与实现[D].成都:电子科技大学,2007.

[44]王文化.实时交互的医学图像可视化[D].广州:南方医科大学,2013.

[45]董现玲.医学图像体绘制及其加速技术研究[D].广州:南方医科大学,2010.

[46]顾彦.根据“中国基因”打造“精准医疗计划”[J].中国战略新兴产业,2015(17):78-80.

[47]肖永飞.医学数据三维交互可视化方法的研究[D].哈尔滨:哈尔滨工业大学,2010.

[48]刘江涛,邢辉.浅析生物大数据可视化的现状及挑战[J].中国新通信,2016(2).

[49]李正,康立源,范骁辉.中药制药过程数据集成、数据挖掘与可视化技术研究[J].中国中药杂志,2014,39(15):2989-2992.

[50]王亮.基于DSP的心电监护系统的设计与开发[D].济南:山东大学,2010.

[51]任磊,杜一,马帅,等.大数据可视分析综述[J].软件学报, 2014,25(9):1909-1936.

[55]周洞汝,杨荣,杨卫,等.三维数据场可视化的算法及实现[J].图学学报,1993(2):1-6.

[57]赵卫.数据可视化技术及其应用软件研究[D].西安:西北工业大学,1998.

[58]林沂,晏磊,高伟,等.辅助导航二维标量场模拟生成的组合改进算法[J].应用基础与工程科学学报,2008,16(4): 472-477.

[59]王德信,黄希颖.X线技术的医学应用研究进展[J].中国民康医学,2011,23(18):2316.

[60]侯溯源,安晓亚,许剑,等.地理信息可视化新技术综述与分析[J].测绘与空间地理信息,2014,37(1):30-32.

[65]李秀怡.一种基于改进的密度聚类的区域数据可视化方法[J].计算机光盘软件与应用,2014(19):119.

[66]何兆成,周亚强,余志.基于数据可视化的区域交通状态特征评价方法[J].交通运输工程学报,2016,16(1):133-140.

[74]颜高峰.基于大数据的港口集疏运可视分析系统研究[D].北京:北京交通大学,2016.

[84]丁杰敏,李伟波.基于雷达图的多维数据可视化表示及特征分析[J].现代电子技术,2010,33(23):24-26.

[85]吴颖慧,叶小巾.数据可视化背景下雷达图在医院管理中的应用[J].广西医学,2016,38(7):1050-1052.

[86]姜奇平,冯海超,古福.数据业务主营化大趋势[J].互联网周刊,2013(7):26-46.

[87]杨春华,王天津,黄思敏,等.支持精准医疗的国外临床决策支持系统[J].中华医学图书情报杂志,2016,25(2):14-19.

WANG Yi was born in 1989.She is an M.S.candidate at Tianjin Polytechnic University.Her research interests include big data analysis and big data visualization,etc.

王艺(1989—),女,天津人,天津工业大学计算机科学与软件学院硕士研究生,主要研究领域为大数据分析,大数据可视化等。

REN Shuxia was born in 1973.She received the Ph.D.degree in computer application technology from Tianjin University in 2014.Now she is an associate professor at School of Computer Science and Software Engineering,Tianjin Polytechnic University.Her research interests include data mining and big data analysis,etc.

任淑霞(1973—),女,山东梁山人,2014年于天津大学获得博士学位,现为天津工业大学计算机科学与软件学院副教授,主要研究领域为数据挖掘,大数据分析等。

Survey on Visualization of Medical Big Data

WANG Yi,REN Shuxia+
School of Computer Science and Software Engineering,Tianjin Polytechnic University,Tianjin 300387,China

+Corresponding author:E-mail:t_rsx@126.com

WANG Yi,REN Shuxia.Survey on visualization of medical big data.Journal of Frontiers of Computer Science and Technology,2017,11(5):681-699.

With the development of the Internet+,medical big data is showing explosive growth which has multitudinous data types and complex relationships.The general data visualization method is difficult to demonstrate medical big data effectively,the medical big data visualization technology faces the huge challenge.This paper outlines the origin,characteristics and research progress of medical big data,introduces the related concepts and research status of visualization of medical big data.The existing visualization methods of medical big data are studied and divided into 2 types,which give a comprehensive description of the characteristics,legend and common visualization methods of medical big data by using a table.Future research focuses and problems of visualization of medical big data are analyzed and also have important reference value in research methods and universal application of visualization of medical big data.

medical big data;visualization of big data;Internet+

10.3778/j.issn.1673-9418.1609014

A

:TP311

Received 2016-09,Accepted 2017-01.

CNKI网络优先出版:2017-01-16,http://www.cnki.net/kcms/detail/11.5602.TP.20170116.1702.002.html

猜你喜欢
可视化医疗研究
《现代仪器与医疗》2022年征订回执
基于CiteSpace的足三里穴研究可视化分析
《现代仪器与医疗》2022年征订回执
自然资源可视化决策系统
FMS与YBT相关性的实证研究
思维可视化
辽代千人邑研究述论
自然资源可视化决策系统
新型医疗废弃物焚化舱
视错觉在平面设计中的应用与研究