李杰
摘 要:传统循证医学研究中,证据的稀缺、偏倚、不公、过时等缺陷使得循证医学本身遭到了质疑。大数据时代,数据的巨量、高速、多样、价值特性弥补了传统循证医学的这些不足。伴随着大数据产生的云存储、数据挖掘、深度学习等技术推动了循证医学的发展。文章介绍了云存储、数据挖掘、深度学习等信息技术,并探讨了它们对循证医学的影响。
关键词:信息化 大数据 循证医学
中图分类号:R741 文献标识码:A 文章编号:1672-3791(2018)06(a)-0012-02
循证医学是一门以数据说话的学科,证据是循证医学的基础。大数据时代,基于大数据的云存储、非结构化数据抽取技术,有效解决了數据采集、存储和转化问题,数据挖掘和深度学习技术提高了证据提取和决策分析效率,这些信息化技术推动了循证医学的变革和创新。
1 传统循证医学缺陷
传统循证医学在理论体系上具有先天性缺陷。研究中RCT要求的大规模样本量,以及收集的证据必须是完全一致的实验环境下产生的结果,这在实际中很难做到。Meta分析通过合并分析各研究结果得出结论,为循证医学提供了捷径,但纳入的文献质量良莠不齐,文献研究自身的选择性偏倚、实施偏倚、随访偏倚、测量偏倚和报告偏倚都将导致研究结果偏离真值,使得研究结果应用价值颇受争议。传统循证医学证据的稀缺、偏倚、不公、过时,使循证医学发展面临困境,理论本身遭到了质疑。
2 大数据及其特征
大数据,又称海量数据、巨量数据,是指无法在一定时间范围内用常规软件进行收集、存储和处理的数据集合,其本身具有4V特性:Volume(巨量)、Velocity(高速)、Variety(多样)、Value(价值)。
巨量,是指数据规模已经不能用过去的GB、TB为单位进行衡量,必须以PB、EB甚至ZB为单位进行计量。
高速,是指数据创建、移动和处理速度快,可从各种类型的数据中快速获得高价值的信息,并返回给用户。
多样,是指数据种类和来源多样化。包括结构化、半结构化和非结构化数据。
价值,是指价值密度低,要从巨量的数据集中挖掘高价值的信息。
大数据的这些特性弥补了传统循证医学研究的诸多缺陷。巨量和多样化特性解决了传统循证医学证据稀缺和偏倚问题。基于高速特性的数据实时采集、快速传输和处理,有效解决了样本量不足,样本过时问题,并提高了证据提取和分析处理的效率。巨量数据让循证医学不再受小规模样本量的限制,多样化为研究结果验证提供了便利,高速采集为研究提供了即时数据,这些特性都促进了循证医学摆脱传统方法的束缚,使循证医学在技术创新中打开新局面。
下面介绍大数据技术中和循证医学相关的云存储、数据挖掘和深度学习技术。
3 云存储技术
云存储是一种新兴的网络存储技术,它将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问服务。实际应用中,云存储将储存资源放到云上供人存取,用户可以在任何时间和地点,透过任何可连网的装置连接到云上方便地存取数据。
云存储主要包括存储层、基础管理层、应用接口层和访问层。存储层中的存储设备数量庞大,分布广泛,设备之间通过网络连接。基础管理层实现存储设备的协同工作,使它们能对外提供同一种服务。基础管理层中使用的数据加密技术和数据容灾备份技术为数据安全提供了保障,避免了数据非法访问和丢失。应用接口层根据用户需要,开发不同的应用服务接口,提供用户所需的应用服务。用户通过访问层提供的公用应用接口访问云存储系统。
云存储技术彻底变革了传统循证医学证据收集方式。伴随云存储技术产生的移动医疗,使用便携式、可穿戴健康监测设备,如健康手环、智能血压计,手机、平板电脑APP等,极大便利了院外随访数据收集,采集的非结构化数据通过信息抽取,结构化处理等技术,完成了从非结构化向结构化的转变。而基于这些个体化的数据形成的即时更新的大数据样本,使循证医学研究证据更加及时准确可靠,在临床治疗中也更有针对性。此外,中医药研究本身周期长,难以长期、大量采集样本的问题也得到了解决,云储存技术将推动循证医学在中医领域的应用与发展。
4 数据挖掘
数据挖掘,一般是指从大量的数据中通过算法获取隐藏于其中的信息的过程。
该过程主要包括以下步骤:⑴定义问题,明确数据挖掘目的;⑵数据准备,确定目标数据,从数据源中抽取与业务相关的数据集;⑶数据预处理,包括数据清洗、数据转换、数据集成,形成数据仓库;⑷选择算法,构建模型,模型优化;⑸部署模型,确定模型参数和输入变量,对数据进行挖掘;⑹结果分析。数据挖掘利用了统计分析和人工智能技术,将这些技术封装起来,使人们不用掌握这些技术就能完成数据的挖掘,寻找数据间的关系,解决自己关注的业务问题。
数据挖掘技术帮助研究人员从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含的有价值的信息知识,打破了研究人员面对海量的医疗大数据时,没有方法和工具发现其应用价值的尴尬境遇,为循证医学研究人员从医疗大数据中发现数据关系,寻找医学规律创造了条件。
5 深度学习
深度学习的概念来自人工神经网络,通过模拟人脑的机制来识别、解释数据。人工神经网络包含输入层、隐藏层、输出层三大层次,每层由许多神经元构成,每个神经元与下一层所有神经元连接。信息进入神经网络后,经输入层到隐藏层,在隐藏层处理、传递,直到输出层。如果输出和输入一致,神经网络就完成了对该信息的学习。
深度学习中,隐藏层的工作至关重要。隐藏层由若干堆叠的子层构成,构成了学习深度,神经网络的每次学习,子层都记录了该数据的特征值。经过大量学习后,隐藏层通过调整特征值的权重,最终准确还原了初始数据。隐藏层实现了对输入的分级表达,通过组合低层特征形成更加抽象的高层表示。
深度学习能够模拟人脑识别、筛选、提取数据。自动完成海量的高维医疗数据中,患者健康指标和环境数据的提取。深度学习与数据挖掘技术结合,将证据提取与决策分析结合起来,使循证医学向人工智能迈出重要一步,大大提高了循证医学研究人员的工作效率。
6 结语
循证医学是一门重视医学证据的学科,它实现了从传统经验医学向证据医学的转变。但传统循证医学自身存在的证据稀缺、偏倚、过时、不公等缺陷,使其也面临着重大挑战。大数据时代,信息化高速发展,由此催生的云计算、云存储、数据挖掘、深度学习等技术必将促进传统循证医学的重大变革和创新。运用云存储技术,将实现海量医疗数据的实时采集和存储;运用数据挖掘技术,将帮助研究人员从医疗大数据中发现与研究相关的高价值信息;基于神经网络的深度学习,将实现医疗大数据中目标数据提取自动化,使研究人员拥有更高工作效率。大数据时代,信息化技术给循证医学注入了强大活力,循证医学必将借此翻开新的一页。
参考文献
[1] 刘建平.循证医学进展述评[J].重庆医学,2017,46(14):1873-1877.
[2] 吕玉红,范维,程庆元.等.云技术与医学信息化教育[J].现代生物医学进展,2015(6):1126-1129.
[3] 马光志,张晓祥,周彬,等.大数据时代的循证医学[J].世界复合医学,2015(2):120-124.