张怡++李柯
摘要:随着卫生信息化建设进程的不断加快,医疗卫生领域也进入了“大数据时代”。该文介绍了大数据的定义、医疗大数据的来源,并分析了医疗领域中的几个重要角色包括医疗机构、卫生行政部门等对大数据分析的应用前景。
关键词:大数据;医疗卫生;应用前景
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2015)21-0010-02
Application of Big Data in the Role of Medical Field
ZHANG Yi,LI Ke
(Wuxi Peoples Hospital, Affiliated with NanJing Medical University, Wuxi 214000, China)
Abstract: With the rapid development of hygienic information construction,medical health field has already entered into “big data era”. The paper introduces the concept of big data, describes the source of medical big data, and analyzes the important roles in the medical field the application prospects in big data era.
Key words: big data; healthcare; application prospects
近几年来,大数据应用在科技界、产业界和政府部门都成为研究热点。2008年《Nature》出版专刊“ Big Data” [1],2011年《Science》推出关于数据处理的专刊“Dealing with data” [2],2012年3月奥巴马宣布美国政府投资2亿美元启动“大数据研究和发展计划” [3]。美国政府认为大数据是“未来的新石油”,将给未来的科技与经济发展带来深远影响,并将“大数据研究”上升为国家意志。大数据之所以如此受关注,主要是因为大数据中隐藏着具有丰富价值的信息,通过数据挖掘等手段对这些数据进行专业的分析,可以挖掘出信息价值来实现数据的“增值”。
医疗卫生领域也进入了“大数据时代”,我国卫生行政部门近几年大力推进以健康档案、电子病历和公共服务信息平台为基础的区域卫生信息化建设工作,医疗信息系统的深入应用和医疗仪器和设备的数字化使得医疗数据在类型和规模上都迅速增长。这些积累起来的数据是宝贵的医疗卫生信息,用信息化的大数据手段对这些数据进行挖掘和分析,将会对医疗卫生行业的诊疗、科研、管理、服务等都具有重要价值。
1 大数据定义
大数据科学家John Rauser给出了一个简单的定义:大数据是任何超过一台计算机处理能力的数据量。大数据有四个特征来定义,一般称之为4V,即:1)Volume大量化,海量的数据规模;2)Velocity快速化,数据被创建和移动的速度,以及数据实时处理的要求;3)Variety多样化,种类多数据类型繁多,来源广泛,既包括数值型,也包括文字、图形、图像、音频等非数值型或者非结构化数据;4)Value价值化,通过深入的大数据分析挖掘,可以为各方面的经营决策提供有效支持,创造经济及社会价值[4]。
关于大数据的应用,“大数据商业应用第一人”维克托·迈尔-舍恩伯格在其《大数据时代》一书中举例甚多,主要是通过找出一个关联物并监控它,就可以预测未来。比如Google如何利用搜索记录进行数据挖掘从而预测流感爆发趋势,亚马逊商店利用购买和浏览记录数据进行针对性地购买推荐以提升其销售量等[5]。大数据的本质不在于更多更快的数据,而在于对数据中蕴含信息价值的巨大掌控和应用能力,更好地认识数据中所蕴含的巨大信息价值。
2 医疗大数据来源
医疗大数据指的是在医疗行业中产生的数据,主要有以下四个来源: 1)临床实验室数据:医疗机构的信息系统多而复杂,数据增长非常快,一张CT图像含有大约150MB的数据,一个标准的病理图接近5GB,以此计算,仅一个社区医院的数据量就可达数TB甚至数PB之多。2)生命科学与制药:药物研发是密集型的过程,中小型的制药企业产生的数据也在TB以上。在生命科学领域,DNA、基因序列、生物芯片等每时每刻都在产生新的数据,比如说,DNA测序每年产生的数据都在PB级以上。3)费用报销:患者在就医过程中产生的费用、报销、保险理赔等信息。4)个体健康信息:移动可穿戴设备正在不断普及,个体健康信息都能连入互联网,由此产生海量数据 [6]。
3大数据应用角色
医疗领域中包含多个重要角色:1)医疗服务提供方,比如公立医院、私立医院、社区医院等医疗机构;2)医疗政策制定和监管方,比如卫计委和地方各级卫生厅局;3)医疗服务和产品的支付方,比如社会保险以及商业保险公司;4)医药和医疗产品生产和销售方,比如药企、医疗器械企业、药店等;5)面向消费者健康的产品生产和服务提供方,比如运动健康管理产品和服务提供商。如图1所示:
图1 医疗行业主要角色
医疗机构如各级医院积累了大量的医疗数据,HIS(医院信息管理系统)、电子病历、LIS(实验室信息系统)、PACS(影像归档和通信系统)以及体检系统等几乎每分每秒都在产生电子化数据,一张CT图像就含有大约150MB的数据,数据量从TB到PB发展,医疗服务方所面临的重要挑战就是如何有效利用这些海量的医疗大数据为医疗卫生行业的诊断、治疗、科研、管理等服务。临床决策支持系统、远程监护医疗、个性化诊疗等都是医疗大数据领域的关注热点。
各地卫生主管部门都在发展区域医疗信息的共享,建设区域卫生信息平台,平台整合了各医疗卫生机构的部分数据来实现数据共享,还通过自己的直报系统搜罗各地卫生数据,用专业的手段对这些数据进行分析,可以对流行病、慢性病等疾病进行趋势分析和预警,从而制定防治、干预计划防止疾病爆发及蔓延,履行卫生主管部门政策制定和监管职能。
政府医疗保险机构和商业保险公司作为医疗支付方积累了病人理赔信息,涉及病人诊断、费用、报销及支付情况等相关数据。医疗支付方可以借这些数据来了解各种疾病的治疗情况和费用情况,通过大数据手段得到的分析结果可以帮助实现理赔运营的精细化管理,为客户定制保险增值服务,指导市场销售和推广。
医药研发企业通过收集临床实验前期和结果的数据,使用预测建模可以评价新药的安全性、有效性、潜在的副作用以及整体的试验结果,降低研发成本,提高研发效率,帮助医药研发部门或企业提早将新药推向市场,最终受益于患者。
近几年,医疗行业涌现出很多面向消费者健康及运动的产品,他们通过可穿戴设备来记录消费者日常活动和生理指标,由此生成大量数字化信息,这也逐渐成为医疗大数据中的一大成员。
4 大数据应用场景
各个角色都期待着借助有效的分析手段来挖掘大数据中蕴含的价值,下面列举了医疗机构、卫生行政部门、医药研发企业三个角色中大数据的典型应用加以简单介绍。
4.1 临床决策支持系统
在传统的诊疗过程中,医生依靠实践经验、各项诊断指标以及检查检验结果对疾病进行诊断和治疗,医生的决策关系到病人的安危。临床决策支持系统将医学知识与临床数据相结合,通过数据分析可以为临床医生提供大量的医学知识和决策,临床医生可以在此基础上进行准确诊断、选择最佳的治疗方案。同时系统还能通过比较医生处方和医疗专家库医学指导,提醒医生如过度使用抗菌药物、药品不良反应等,从而有效降低医疗风险。
大数据分析技术不仅对结构化数据有很强的处理能力,对非结构化数据的分析能力也日益加强,比如医疗影像(X光片、CT、MRI)数据可以使用图像识别技术来分析,从而使得临床决策支持系统更加智能,给医生提供更合理的诊疗建议。
4.2 疫情监测
大数据技术也可以用于疫情监测。自从国家传染病与突发公共卫生事件网络直报系统投入运行后,每年有600多万的个案信息由全国各地上报并存储,现在网络直报系统覆盖了全国所有县级以上疾控机构。上报的海量数据通过大数据技术能够进行全面的疫情监测和分析,并通过集成疾病监测和响应程序,预测传播途径和时间,以便采取有力的措施降低疾病感染率,防止疫情爆发 [7]。
谷歌公司对流感的准确预测就是运用大数据技术的成功案例。谷歌公司把美国人在网络上频繁使用的检索关键字,与美国疾控中心流感传播时期的数据进行比较,通过大数据分析可以辨别出人们是否感染了流感。人们使用特定的检索关键字,如“治疗咳嗽和发热的药物”是为了在网络上得到关于治疗流感的信息[8],这样通过特定检索词条的使用频率与流感在传播的时间和空间上建立联系,能够监测流感传播的路径,而且他们的判断非常及时,比美国疾控中心的数据早一周以上的时间。
4.3医药研发
医药产品公司在大数据方面的应用主要体现在医药研发方面,通过用大数据分析可以提高药品研发效率,加快新药研发入市。以往一种新药从研发到推向市场大约需要13年,通过使用大数据预测模型可以缩短3-5年。在研发新药物之前,可以通过数据建模和分析公众对疾病药品的需求趋势,从而确定最有效率的投入产出比,配备合理的资源组合,一定程度上降低研发成本。在药物研发阶段,通过搜集临床实验前期和结果的数据,可以评价新药的有效性、安全性以及潜在的副作用。药物试验阶段,分析病人数据可以评估招募患者是否符合试验条件,帮助提升临床实验的效率;通过分析临床试验数据和病人记录,可以确定药品更多适应证或副作用[9] [10] 。
5 结束语
大数据分析是各行各业的研究热点,对医疗卫生领域也将产生巨大的影响和推动作用,各个角色都期待大数据来解决以往无法解决的一些问题和难点,然而如何利用好大数据有效发挥其作用还存在很多挑战,比如数据的整合、存储、挖掘和安全保护等。大数据是一把双刃剑,我们在认识到大数据带来机遇的同时,也要认识到大数据可能带来的风险。
参考文献:
[1] Lunch C. Big data:How do your data grow?[J]. Nature,2008,455(7209): 28-29.
[2] Kum HC,Ahalt S,Carsey TM. Dealing with data:governments records[J]. Science,2011,332(6035):1263.
[3] 李国杰,程雪旗.大数据研究:未来科技及经济社会发展的重大战略领域-大数据的研究现状与科学思考[J].中国科学院院刊,2012,27(6):647-657.
[4] 刘晓亮,王坤,马军. 大数据时代的卫生信息化建设思考[J].中国卫生信息管理杂志,2014,11(1):43-46.
[5] 维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].杭州:浙江人民出版社,2013.
[6] 蔡佳慧,张涛,宗文红.医疗大数据面临的挑战及思考[J].中国卫生信息管理杂志,2013,10(4):292-295.
[7] 张昌明,朱红.大数据及其在医疗领域的应用[J].中国医学教育技术,2015,29(3):294-297.
[8] 相海泉.迎接大数据时代[J].中国信息界:e医疗,2013(5):38-39.
[9] 王永炎,谢雁鸣,王志飞.大数据时代中药上市后数据的整合与应用[J]. 中国中药杂志,2013,59(18):2917-2918.
[10] Szlezak N,Evers M,Wang J,et al.The role of big data and advanced analytics in drug discovery,development,andcommercialization[J]. Clin Pharmacol Ther,2014,95(5):492-495.