医疗大数据研究现状及其临床应用

2015-03-13 10:52刘友江
医学信息学杂志 2015年5期
关键词:医疗疾病临床

罗 旭 刘友江

(遵义医学院 遵义 563000)



医疗大数据研究现状及其临床应用

罗 旭 刘友江

(遵义医学院 遵义 563000)

介绍医疗大数据的内涵及其对医学研究的影响,指出医疗领域大数据研究的必要性,总结现阶段医疗大数据的研究现状,提出医疗大数据研究中的若干问题。分析医疗大数据如何应用于临床医学,包括临床诊断和临床药效分析等方面。

医疗大数据;研究现状;临床医学

1 引言

随着信息时代的发展,产生了巨量数据。大量的数据来自于各个领域,反映了人们的生活习惯、社会规律、自然规律。数据成为与自然资源、人力资源同样重要的战略资源[1-2]。医疗行业每年会产生大量的医疗数据,一般的医疗机构每年会产生1TB~20TB的相关数据,个别大医院的年数据量甚至达到了300TB~1PB。随着大数据时代的到来,医疗与信息技术(IT)结合越来越紧密。开发这些大数据可以实现智慧医疗,即实现患者求医便利化、疾病诊断自动化、医疗保健信息化。

2 医疗大数据对医学研究的影响

2.1 概述

早在2008年,有研究[3-4]指出庞大的数据流即大数据是新的科学线索,需要新的方法来处理这些数据,而在《大数据时代》一书[4]中,明确指出大数据正在变革人们的生活、工作和思维。大数据时代最大的转变就是放弃对因果关系的渴求,取而代之关注相关关系。只要知道“是什么”,而不需要知道“为什么”。 医疗领域是大数据应用的重要领域,Kayyali B等[5]从多方面阐述了大数据对美国医疗行业产生的影响,指出大数据对医疗行业的影响尚处于初步阶段,许多潜在价值正在逐步被揭示。《大数据时代的个人健康革命》一书[6]指出大数据将对整个医疗系统包括管理与诊断手段都造成“创造性破坏”,进而对大数据医疗带来的新景象进行展望。目前医疗领域内的大数据主要来自制药企业,临床诊断数据,患者就医数据,健康管理、社交网络数据。例如药物研发是一个相对密集的过程,即使对于中小型企业而言,一项药物研发的数据也在TB以上;医疗机构持有的数据增长速度非常快,即使是一张普通CT图像,也含有大约150MB的数据,而一个标准的病理图则接近5GB;患者就医、健康监测的数据量更是每天在高速增长。

2.2 大数据对医学研究的影响

大数据分析为许多医学难题的解决提供了新途径[7],改变了一些疾病诊断方式。例如通过分析大量的诊断数据便于对疾病进行快速识别,如图1所示的心脏疾病分类,首先采集心脏数据并转化为心脏图谱,然后根据数据图谱进行建模(关于僵硬度、压力、张力),最后基于模型分析心脏疾病病型的过程。有些疾病的确诊存在困难,通过基于大数据的数理统计方法辅助疾病确诊,图2示意了利用数理统计方法确诊和分辨复杂的心脏疾病,即首先采集数据得到数据集,然后基于统计特征分辨疾病类型。基于大数据进行虚拟实体建模,可对疾病诊治做出模拟分析,探讨正确的疾病诊断方法,如在图3中利用图像处理技术,将心脏数据建模为一个虚拟实体,通过设置各种参数可以模拟观测药物或者手术对心脏运作造成的影响,为获取疾病诊治方法提供了手段。而且基于大量的流行病数据还可以进行统计研究,预测病情的扩散趋势,为疾病防治提供参考。

图1 心脏疾病分类

图2 基于数据统计的心脏疾病诊断

图3 虚拟心脏建模

2.3 医疗领域大数据研究的必要性

无论是流行病学调查、新药物的研发,还是临床实效研究,都贯穿着对数据的获取、管理和分析。高效地利用研究数据将是决定现代医药学研究成败的关键。当前优质医疗资源有限,患者往往争夺优质资源。由于患者个体差异大,疾病种类繁多且复合疾病常见,诊断很难标准化和自动化,医疗过程缺乏病人的主动参与,再加上医生工作强度大,医疗资源不足,存在许多误诊漏诊现象[8-9],造成了许多医患矛盾。在大数据医疗中,可以使患者主动参与医疗过程,结合患者的健康数据、既往病史,更有利于医生做出正确的疾病诊断,并且由于医院间互通数据,可避免患者在多个不同的医院间进行重复诊治而付出高额医疗成本,同时还节约了医疗资源。基于健康大数据的医疗服务提供了新的医疗模式,可减少医患矛盾。因为有效的数据整合模式,大数据医疗满足了以患者为中心的个性化医疗,提供了卓越的医疗技术平台。医疗大数据的运用从医学研究、临床决策、疾病管理、患者参与以及医疗卫生决策等方面推动了医疗模式的转变,尊重患者的价值观、个体化特征和需求,协调和整合不同专业的医疗服务,保持医疗服务的连续性和可及性,提高医疗质量。

3 医疗大数据研究现状分析

3.1 国内外研究现状

3.1.1 实践探索 医保行业由于所涉及的数据规模较大,问题复杂,一直以来都是大数据公司关注的焦点。据报道:Predilytics公司运用大数据、机器学习技术来分析医保领域透明、公正和业务驱动的结果,相对于传统的统计/回归模型,其提供的异常预测模型的分析深度要高出1~3倍;在流行病预测方面,谷歌公司开发了“谷歌流感趋势”系统,该系统曾成功预测了甲型H1N1流感在美国境内的传播,当然由于大数据研究目前处于起始阶段,该系统还存在许多问题。自我国原卫生部出台《全国卫生信息化发展规划纲要》以来,“医疗大数据”成为我国医疗信息化的重要领域和重点发展方向,中南大学已与移动公司合作,负责开展“移动医疗”相关应用的原型系统设计开发,双方合作利用现代通信、物联网等技术,开展健康管理、医患互动、院前急救、远程医疗等服务,改变医院看病的传统方式。除此之外,还有许多小型企业从事健康数据采集、网上看病预约、网络医生等方面的应用开发。

3.1.2 理论探索 Lin C等[10]提出一种迅速处理、存储、检索、分析大型医疗数据的综合方法。基于NoSQL技术给出一种病人驱使的数据结构以便于快速和灵活的数据扩展,克服不同医院数据记录模式差异带来的问题。Don S 等[11]描述医疗网络物理系统(MCPS)大数据处理框架的初始工作,该框架结合了卫生保健系统以及网络方面的动态配置和完全弹性决策功能。Cowan B等[7]从疾病诊断、流行病预测方面中的多个问题入手,分析了从大数据角度解决这些问题的可行性。蔡佳慧等[12]对医疗大数据的基本概念进行了剖析,归纳总结了医疗大数据中面临的数据整合、数据存储、数据挖掘方面的挑战。高汉松等[13]结合云计算提出一种基于Hadoop的医疗云数据挖掘平台架构,详细阐述其基础层、平台层、功能层以及业务层等各层功能。许德泉等[14]重点介绍了大数据在医疗个性化服务方面的应用并就应用过程中遇到的挑战进行简要分析。

3.2 应用领域

3.2.1 在线医疗 数据医疗的重要实现方式之一,患者通过在网上提供病症数据获得诊断信息。目前网上医院,如39健康网,由在线医生根据提供的病症信息人工给予初步诊断。该医疗途径仅能缓解医疗资源有限的问题。由于常常有非专业人员给出诊断答案以及缺乏详尽的病理数据和诊断经验,该方法目前有很大不足。

3.2.2 健康监测 结合智能穿戴设备以及移动APP实时获取病人的健康信息,建立一个数据库。对病人的健康做出预测和提醒性服务,例如提醒用户及时服药以及用户可能会出现某一方面的健康问题,要求注意饮食和生活习惯。由于医疗物联网由这些智能无线穿戴设备组成,每时每刻都会产生数据,与大数据密切相关。从目前的研究现状来看,智能穿戴设备在当今以至将来,都是信息科技与医疗结合的主要攻关方向。

3.2.3 数据存储、传输与共享 该方向的主要研究内容为如何存储、检索、传输大容量数据,以及搭建数据云平台,实现医院、社区、公共卫生相关部门的信息资源整合和共享。数据共享平台的存在使得医院间互通数据,节省了病患在多个医院间进行诊治的医疗成本。对存储于平台上的大量医疗数据进行分析,可用于流行病、慢性病调查、趋势分析和预警,进而为制定防治、干预计划提供有力的参考依据。

3.3 大数据研究中的一些问题

3.3.1 仍处于初级阶段 由于医疗大数据是一项跨学科的研究,而跨学科进行研究存在一定的难度,并且由于医疗系统数据管制体系带来的医疗数据难以获取和信息孤岛问题,使得医疗大数据研究难以在一般研究机构进行。因此目前医疗大数据研究尚处于初始阶段。有关工作主要集中在工程应用部分,体现在数据采集、存储和医患互动方面。在理论研究方面,大多数工作现仅停留在评述医疗大数据是如何的大以及是如何的有用,针对医疗数据本身的挖掘计算、数据关系分析、数据调用等基础支撑技术方面的实质性研究较少。

3.3.2 数据中的偶然性因素及真实性问题 大数据将对医疗诊断手段造成“创造性破坏”[6]的关键点在于数据挖掘,研究数据间的关系与揭示数据关系反映的科学规律,从而指导医疗自动化与智能化。目前医疗大数据研究尚处于初始阶段,基于目前的研究现状,本文认为在以后的医疗大数据的应用与研究中还需注意如下问题:首先,从数据的角度来说,医疗大数据尤其是医疗监控数据中囊括了太多的偶然事件、小概率事件,而这些信息对于医学上的动态监测没有什么参考意义,容易形成干扰。例如,探讨某种药物对某种疾病的疗效,由于患者对疗效的满意度提高存在多种原因,有些仅仅是患者主观感觉并无实质性好转,有些是因为患者自身免疫力的提高,例如患者患病后有较好的作息习惯提高了机体免疫力使得病情有所好转,如此数据便有很强的干扰性。然后,真实性是基于大数据的相关研究的基本要求,目前许多数据的真实性有待考察,如问卷调查数据、某些单位提供的行政检查数据等。在数据获取中难以保证100%获取真实的数据,这就对正确得到数据映射的科学结果造成困难。

4 医疗大数据应用于临床医学

4.1 在临床诊断中的应用

许多疾病的诊断都归属于“经验性诊断”。 由于患者个体差异大,复合疾病常见,关系复杂,在诊断过程中医生对某些病症难以给出确切诊断,需要对相关疾病做出排查,甚至会出现误诊。利用大数据分析,统计大量的关于某项疾病的正确诊断案例,可以形成模拟“经验”,对患者所患疾病进行自动化辅助诊断。在该问题中,关键在于得到可靠的数据判决经验,其有效性与足量的样本数量密切相关。实现该问题的一种可行的方法为:基于大量(PB级)的正确诊断的病例统计数据,记录数据中的所有病型与症状,先挖掘疾病症状与病型之间的关系得到病型的“典型症状集”,后通过检验病人提供的症状与各病型“典型症状集”间的重合关系给出患者的确诊信息。即通过大数据分析,利用数据反映的病型与症状之间的关系实现基于专家系统的自动诊断。

4.2 在药物临床药效研究中的应用

目前,关于临床药效的研究大多局限于简单的数学统计,例如祁凤娥等[15]评价迈之灵治疗进行性色素性紫癜性皮病的临床疗效,总计研究了96例患者,将迈之灵片与复方丹参片进行对比,得到的结论为迈之灵是进行性色素性紫癜性皮病治疗的良好选择。桂冬辉等[16]评价罗通定联合曲唑酮治疗阿片类物质依赖者稽延性戒断症状的临床疗效及安全性,总计研究了120例患者,得到的结论为罗通定联合曲唑酮是一种疗效高,安全,耐受性好,无潜在药物成瘾性的治疗稽延性戒断症状的治疗方案。黄永兵等[17]对九华痔疮栓治疗内痔的60个病例做简单的统计分析,得到了九华痔疮栓是否对内痔有效的局部性统计结论。这些研究并没有挖掘病人的潜在信息,对于病人的抗药性、即往病史、用药量等信息未做分析,得到了仅停留于数据本身的信息,并且对比药物选择普遍较少。在基于大数据的药效分析中避免少数药物对比后仅能得到局部最优结果的问题,首先从数据库中提取数据,建立针对某病型的结构化的用药案例数据,包括药物名称、类型、患者病重程度、用药后患者的关联临床检验数据、患者过往过敏史等,然后对于某病型,分析数据案例中包含的各类可行药物,包括复合用药对该病型的临床效果,得到某病型的最佳用药。相关药效数据分析可以通过常用的概率统计方法实现。大数据药效分析结合了计算机辅助计算,最终形成的数据训练和经验可以用来实现智能辅助给药系统,为患者与医生提供病症用药参考。在临床药效研究中,还可进一步挖掘临床用药的广泛相关性与药物的潜在特性,如某药物对患者有哪些负面影响,药物的适应人群是哪些等。

医疗大数据作为一种医疗资源,通过对其进行研究,不仅可以在以上两个方面为临床医学提供解决问题的手段,随着数据分析方法的不断丰富,还可用于其它方面,例如可以仅针对某个病人,结合既往病史、抗药性、身体状况以及历史健康数据量身设置疾病诊治方案,而且数据分析可作为病人治疗全过程的病情辅助分析工具,为获取重症病人的阶段性诊治方案提供参考。

5 结语

本文阐述了什么是医疗大数据以及为什么要研究医疗大数据,对医疗大数据的国内外研究应用现状进行了介绍和总结,指出了医疗大数据研究中的若干问题,最后对医疗大数据如何应用于临床医学进行了展望与分析。

1 邬贺铨. 大数据价值堪比石油[EB/OL]. [2014-12-01]. http://www.cn-healthcare.com/conferences/hybd/2012-12-19/content_415555.html.

2 李国杰. 大数据研究的科学价值[J]. 中国计算机协会通讯, 2012, 8(9): 8-15.

3 Felice F, Rosalind R. Big data: distilling meaning from data[J].Nature, 2008, 455(7209): 30.

4 维克托·迈尔·舍恩伯格. 大数据时代[M]. 杭州: 浙江人民出版社, 2012: 1-5.

5 Kayyali B, Knott D and Kuiken S. The Big Data Revolution in US Health Care: accelerating value and innovation [EB/OL]. [2014-05-01]. http://www.mckinsey.com/insights/health_systems_and_services/the_big-data_revolution_in_us_health_care.

6 埃里克·托普·颠覆医疗:大数据时代的个人健康革命[M]. 北京:电子工业出版社, 2014: 1-5.

7 Cowan B. Big Data Medical Imaging[EB/OL]. [2015-01-03]. www.nihi.auckland.ac.nz/sites/nihi.auckland.ac.nz/files/pdf/informatics/bigdata/.

8 张超, 何勍, 阮狄克. 误诊为腰椎退行性疾病的腰腿痛症候告群(附36例报) [J].临床误诊误治,2015, 11(4): 37-40.

9 孟庆义. 论急诊误诊误治问题[J].中国急救医学, 2010, (9): 772-775.

10 Lin C, Huang L, Chou S, etal. Temporal Event Tracing on Big Healthcare Data Analytics[C]. Proceedings of 2014 IEEE International Congress on Big Data, 2014 : 281-287.

11 Don S, Min D. Medical Cyber Physical Systems and Bigdata Platforms[C]. The Fourth Workshop on Medical Cyber-Physical Systems, 2013.

12 蔡佳慧, 张涛, 宗文红. 医疗大数据面临的挑战及思考[J]. 中国卫生信息管理杂志,2013, 10(4): 292-295.

13 高汉松, 肖凌, 许德玮, 等. 基于云计算的医疗大数据挖掘平台[J]. 医学信息学杂志, 2013, 34(5): 7-12.

14 许德泉, 杨慧清. 大数据在医疗个性化服务中的应用[J]. 中国卫生信息管理杂志,2013, 10(4): 301-304.

15 祁凤娥, 许力华, 谢明星, 等. 迈之灵片治疗进行性色素性紫癜性皮病的疗效[J]. 中国临床药理学杂志, 2012, 28(10): 788-789.

16 桂冬辉, 蔡丹丹, 黄燕燕,等. 罗通定联合曲唑酮治疗稽延性戒断症状的临床研究[J]. 中国临床药理学杂志, 2014, 30(4):309-311.

17 黄永兵, 蔡兰兰, 陈国文. 九华痔疮栓治疗内痔60例临床观察[J].中国实用医药, 2009, 11(4): 112-113.

Medical Big Data Research Situation and Its Clinical Application

LUOXu,LIUYou-Jiang,Zunyi

MedicalUniverstiy,Zunyi563000,China

The paper introduces the connotation of medical big data as well as the influences to medical research, points out the necessity of big data research in medical field, summarizes the current research status, points out some existing problems, analyzes how medical big data applying in clinical medicine, including clinical diagnosis and pharmacodynamic analysis.

Big medical data; Research status; Clinical medicine

2015-05-06

罗旭,博士,讲师,发表论文7篇;刘友江,讲师,发表论文3篇。

R-058

A 〔DOI〕10.3969/j.issn.1673-6036.2015.05.002

猜你喜欢
医疗疾病临床
进击的疾病
尿碘与甲状腺疾病的相关性
易与猪大肠杆菌病混淆的腹泻类疾病鉴别诊断
夏季养生之疾病篇
普外急腹症临床治疗的初步探讨
京张医疗联合的成功之路
我们怎样理解医疗创新
医疗扶贫至关重要
元胡止痛膏治疗软组织损伤的临床观察
当归四逆汤治疗虚寒型痛经临床观察