王通 对外经济贸易大学统计学院在职人员高级课程研修班学员
健康医疗大数据是指与健康医疗及患者相关的数据,包括了患者诊断前后所有流程产生的数据,甚至可以说贯穿于患者的全生命周期。一般医疗方面的数据多事来源于医院的信息管理系统、制药企业在研发药品过程中收集的患者数据及试验数据、医院生命体征监护设备所记录的设备、临床决策支持设备(例如超声、胸透等)记录下的数据等。由于医疗大数据的特殊性,学者克托· 迈尔 - 舍恩伯格提出了医疗数据的四个特点:Veracity(真实)、Real time(实时)、Redundancy(冗余)及Privacy(隐私)。
其中Veracity(真实)是指医疗数据的来源一般是源于真实的生活,同时密度较低。例如在研发药物时收集与产生的海量数据,但是一般成功的药物研发所需要的数据是极大的,最终有效的海量数据也只是有价值的数据中的一小部分。
医疗数据的Real time(实时)特点是指医疗数据的产生速度非常快,并且也会在较短时间内加以变更。
医疗大数据Redundancy(冗余)是指健康医疗相关的数据很大一部分都是相同的或者相似的,被相同的记录方式加以记录,例如患者针对某种疾病展开的诊断及记录在大多数情况下都是相同的。
最后Privacy(隐私)是指在大数据信息时代,信息很容易被泄露,医疗数据同样如此,但是医疗数据中包含大量患者隐私信息或者重要的临床试验数据,为此对医疗大数据的安全性投入高度重视,保证数据的隐私性是非常关键与必要的。
大数据在医疗健康行业中的应用主要体现在对医疗数据的分析与共享,通过应用大数据分析架构与大数据挖掘分析软件,实现对大量医疗数据的收集,接着对医疗数据进行分析与处理,这也是医疗行业应用大数据技术的关键,主要目的就在于提取最有价值的信息,为决策者提供数据基础。大数据分析技术主要就是处理好大数据与分析技术之间的关系,将二者有机结合,挖掘出医疗数据所潜在的最大价值,并且在实际诊断与生产中有效应用。大数据的分析方法主要包括预测分析、数据挖掘算法、回归分析、因子分析、相关性分析等。当前在大数据的分析工作中可以选择多种分析工具,包括数据统计分析、数据可视化、人工智能等分析工具。
在大数据信息时代,云计算、大数据、互联网技术等多种高科技技术与医疗健康行业逐渐融合,逐渐渗透入医疗健康行业中的各个领域,包括医疗器械、健康服务、医疗服务、新药研发等各个方面,下面将对大数据在医疗行业中的具体应用进行说明。
在传统的药物研发环节所需要投入的成本较高,承担更大的风险,研发周期较长,但是成功率仍然非常低。在药物研发的各个环节,包括药物筛选、立项、临床及上市等环节都需要以大量的数据分析为支撑。大数据在药物研发的应用能够提供充分的数据,优化药物研发流程,合理分配资源,提高药品研发效率,缩短周期,降低成本,提高药品营销精准率,降低药品生产及使用风险。
当前医疗行业所应用的大部分器械都非常本中,也无法对患者进行随时监测。随着大数据技术的应用,就能够实现医务人员携带便携式的器械对患者进行实时检测,并且实现检测收据的收集与处理,通过信息技术对数据进行筛选,对患者健康状况进行判断与追踪。大数据的应用将有效推动便携式医疗企业的快速发展,例如飞利浦医疗推出的便携式B超设备“lumify”,为患者检测提供了更为便利的条件。
当前我国各个医院所提供的医疗服务存在着信息不共享、结果不互认、服务难以协同的问题,这导致患者的医疗成本高,治疗效果不佳,影响医疗服务效果。而大数据在医疗行业的应用,能够针对患者建立全国所有医院通用的电子健康档案,在档案中包括患者的基本信息,以往检查数据,用药记录等信息。通过建立准确的医疗足迹,有利于建立一体化电子健康服务体系,为患者提供高效、准确且便捷的医疗服务。
我国人民对于个人健康的关注程度相对较低,尤其是经济较为落后的地区,而针对个人健康所提供的服务也过于单一,主要是通过年度体检发现个人健康异常,但是由于每年才进行的一次体检由于时间跨度较大,缺乏系统性,无法覆盖各个地区,导致无法及时发现与应对重大个人重大疾病。但是大数据时代,可以通过便携式医疗器械对个人健康状况进行实时监测,进一步结合个体的生活形态、饮食习惯、家族病史、遗传特性等基本信息与监测结果相结合,实现对个体健康的预测及管理,提供更为精确的个人健康管理服务。
当前我国医疗行业主要是:看病难、看病贵及病难治三个难题上,通过大数据信息技术的应用有利于构建区域医疗机构联合系统,最大限度的实现优质医疗资源的共享,实现患者治疗的互相联通,有利于推动智慧医疗、远程医疗、移动医疗等新型医疗服务体系的应用及发展。
当前大数据在医疗体系中的研究与应用仍然是以欧美等发达国家为前沿,并且在医疗行业取得了较好的效果。而我国大数据在医疗行业中的应用仍然处于起步阶段,除了大型高水平的医院建立了信息数据平台,在中小企业或者地方卫生机构仍然未认识到大数据应用的重要性。当前,我国医疗体系中的大数据技术应用现状如下:
从事医疗健康的企业与医院构建了O2O协同服务平台,实现对诊断前的健康数据,诊断中的治疗数据以及治疗后的康复指导数据的收集及处理,建立全生命周期的闭环管理。例如东软企业打造的医疗生态系统,通过患者数据的广泛收集为医疗服务提供支撑,为健康管理、疾病诊断、治疗方案、院后康复等服务提供数据基础。
当前企业与医院之间建立了数据战略合作,构建医疗数据研究科室或者研究院,与医院合作展开医疗大数据技术开发与应用研究。例如华为技术公司与郑大附一院合作围绕医疗数据的采集、分析、处理、存储与应用的服务全过程进行研究,针对互联网医疗、远程医学监测设备、医疗数据等相关理论及应用技术展开深入研究与实践,从而实现大数据在医疗行业中的推广。
为了推动医疗行业的进一步发展,政府的支持非常关键,当前企业、政府与医院相互合作,建立了区域医疗平台,基与大数据技术在该区域内展开医疗咨询与监测服务,例如万达信息与上海计生委相互合作推出了上海健康云平台,建立了新型的健康管理模式,在心脑血管疾病、脑卒中、肿瘤等疾病治疗系统中推广了健康云服务。
虽然我国愈发重视大数据在医疗行业中的应用,但是仍然存在较多阻碍问题,主要如下:
我国大数据技术都处于起步阶段,从事大数据分析的技术人员仍然都是新手,缺少相关理论基础,实践经验更是非常少,在医疗行业中应用大数据技术的专业人员还必须要同时掌握医疗知识与大数据知识基础,为此专业性人才更是非常欠缺的。另外,我国大数据人才培养体系欠缺,尤其专业院校展开大数据人才培养的也较少,为此大数据应用于医疗行业的过程中严重缺乏技术人员。
当前针对医疗健康行业实际出现了非常多的数据,但是由于缺乏数据分析技术,无法对数据进行深度挖掘与分析,导致医疗信息无法得到充分发挥。当前我国的数据分析软件在数据收集、处理、分析及存储等方面都需要加强研究。
大数据在医疗行业中的应用水平更大程度上取决于数据的应用情况,我国卫生管理机构缺乏信息化系统的构建,从而导致行业内部缺少统一的信息化标准,从而导致各个机构形成了“信息孤岛”,导致了数据分享效果较差。另外,将海量的医疗信息及数据传输到信息平台上对于网络的挑战是非常大的,无法实现数据的高效存储与维护,更无法有效应用于医疗行业。
信息时代最难以解决的问题就在于信息及隐私的保护,为此如何在大数据应用于医疗行业中的过程中如何更好的保护个人隐私及信息难度非常大。为此,从事医疗健康行业的工作者在应用大数据的过程中要时刻警惕信息泄露这种潜在问题的发生。
人才是第一生产力,在当前也被视为行业核心竞争力。对于大数据应用于医疗行业,所需要的人才必须要同时具备医疗知识、计算机知识、数据统计知识及管理知识等综合性的人才。为此,国家要加强专业人才的培养,包括基础理论知识及实践性俱佳的人才培养体系。医疗部门与高校或者科研结构相合作,共同培养综合性的专业人才。
最佳的大数据生态环境是在数据有效收集与整合的基础上实现数据共享,为此对海量的医疗数据进行科学合理的处理从而营造良好的数据生态环境是非常重要的。为此就需要国家医疗健康机构及科研机构针对大数据在医疗行业中的应用特点制定发展规划及具体实施计划,规范行业的标准制度,将大数据充分融入到医疗行业的各方面实际应用以及行业标准。
我国在大数据处理方面缺少先进的软件及算法等技术,与国外当前广泛应用的Hadoop等大数据处理软件相比较,我国的数据平台无法满足大数据在医疗行业中应用的要求。为此,开发先进的数据软件及算法是亟待解决的问题,具体包括多源异构大数据处理平台、优化分布式存储系统、大数据计算模型、软硬件等方面。当前我国已经出现了科研机构针对大数据计算展开了深入研究,例如东北大学的王国仁教授所主导的“海量异构数据集成管理与分析技术及应用”研究项目,在大数据管理、分析、集成等方面的关键问题方面取得了一定进展,实现了异构大数据的收集、管理及分析设计出了一个较为完整的人机交互数据集成体系,成为国际上较为先进的分布式极限学习机数据分析技术,对于推动我国大数据技术的发展起到了关键作用,我国要加强该类型科研项目的深入开展。
医疗大数据由于数量极大,结构更加丰富多样,为此加强数据加密难度较大,针对中小规模数据加密的技术已然无法满足大数据的加密需求,为此需要针对大数据特点开发科学有效的数据加密技术。在保证多用户同时使用效率的基础上,实现用户数据的充分隔绝。另外,政府还需要加强大数据保护的相关法规政策,加强对用户信息管理的保护制度,从而创造一个良好的数据共享生态环境。