施媛媛,李 妍,孙向东
(1.中国科学院测量与地球物理研究所,湖北武汉 430077;2.中国科学院大学,北京 100049;3.武汉大学公共卫生学院/武汉大学全球健康研究中心,湖北武汉 430071;4.中国动物卫生与流行病学中心,山东青岛 266032)
流行病学技术代次划分
施媛媛1,2,李 妍3,孙向东4
(1.中国科学院测量与地球物理研究所,湖北武汉 430077;2.中国科学院大学,北京 100049;3.武汉大学公共卫生学院/武汉大学全球健康研究中心,湖北武汉 430071;4.中国动物卫生与流行病学中心,山东青岛 266032)
首先对流行病学的标志事件和技术进行回顾,然后根据当代技术,提出了第四代流行病学技术概念,介绍了其特征、标志性技术和成果,并对其向网络化、自动化、可视化、动态化、精细化和差异化方向的发展进行了分析和展望。
流行病学;第四代;回顾;展望;互联网技术;大数据技术;云计算技术;GIS
流行病学从公元前4世纪出现至今,经历了三个时期的发展,这三代运用的技术涉及到了统计学、数学、社会学、经济学、地理学、人工智能等方面,但是仍然不能满足人们对于疾病防控的需要。以互联网为基础现代通讯技术的快速发展,为发展下一代流行病学技术提供了技术支撑。第四代流行病学技术,也称为流行病学技术4.0,是以大数据为基础、以数学模型为核心、以云计算为数据处理方法式,主要通过改变人的行为模式,来防治疾病。
约公元前4世纪,古希腊医师Hippocrates的《空气、水和地点》一文中描述了自然环境、健康和疾病之间的关系。1662年,英国的John Graunt运用伦敦一个教区的人口死亡数据创制了第一张寿
命表。1850年,全世界第一个流行病学学会“英国伦敦流行病学学会”成立,这标志着流行病学学科开始形成[1]。从那时起,流行病学的发展大约经历了3个时期,详见图1。
图1 流行病学技术发展史
1.1 第一代流行病学技术
1854年伦敦暴发霍乱,John Snow用标点地图的方法揭示了霍乱暴发的传染源,世界上普遍把这次事件作为流行病学实践的开端。直至19世纪后期,这半个世纪为流行病学发展的第一时期[2]。标点地图的方法也称为第一代流行病学技术,即流行病学技术1.0。
1.2 第二代流行病学技术
第二个时期开始于19世纪后期。微生物学的发展以及Koch氏法则的建立,使流行病学逐步建立在病原学单病因理论的基础上。同时,这个时期也形成了传染病在人群中流行过程的3个环节理论[3]。Koch氏法则、传染病在人群中流行过程的3个环节理论为基础的研究方法为第二代流行病学技术,即流行病学技术2.0。
1.3 第三代流行病学技术
第三个时期开始于20世纪中期,标志性技术为病例对照研究、队列研究和随机对照试验。流行病学的研究对象拓宽了,由仅仅对传染病进行研究过渡到对所有疾病和健康问题都进行研究。研究方法也扩展为定量与定性相结合、宏观与微观相结合。第三个时期可分为三段[1]:第一阶段始于20世纪中期,Richard Doll等通过研究吸烟和肺癌的关系开创了生活方式的研究领域;1951年,Jerome Cornfi eld提出了比值比、相对危险度等测量指标;1959年,Nathan Mentel等提出了分层分析法。第二阶段始于20世纪60年代,该阶段的研究有混杂和偏倚的区分、交互作用以及病例对照研究的实用性等。在这一阶段,logistic回归模型成为流行病学常用的分析手段。第三阶段从20世纪90年代开始直至21世纪初,这个阶段流行病学与其他学科相互融合,拓宽了流行病学的应用领域,例如疾病空间自相关关系[4]、病原体毒力进化、抗药性、抗原逃避[5]、以及药物警戒、风险管理以及药物的卫生经济学评价[6]、遗传易感性与药物疗效之间的关系等。在数据分析方面,统计分析方法发展迅速。人工神经网络(Artifi cial Neural network)、结构方程模型(structual equation model)、地理信息系统(geographic information system)、系统综诉和meta分析等技术逐渐应用于流行病学研究。用于进行疾病筛查和辅助诊断、对公共卫生事件进行监测、预测疾病的发病风险,并且能够从整体上把握影响疾病或健康的多因素[7]。随着慢性传染病的出现,加之流行病学研究本身的局限性等因素,利用系统综诉和meta分析总结以往研究结果的流行病学研究日益增多[8]。同时,数学模型也逐渐应用于疾病传播的预测[9]。流行病学第三个时期所用的技术统称技术3.0。
在这一时期,流行病学技术得到突飞猛进的发展,所运用的技术涉及到了统计学、数学、社会学、经济学、地理学、人工智能等方面,但是仍然不能满足人们对于疾病防控的需要。一是数据收集方法主要为随机抽样和个案调查,这种数据收集方法运用不当会产生偏倚,从而影响人们对于结果的判断;二是数据分析方法以统计学方法为主,不能从机理上反应流行病学发展的规律;三是在疾病防治政策制定方面主要以控制为目的,而不是以预防为目的,
起到了治标而不是治本的作用;四是无法准确进行流行趋势预测,进行疾病发展趋势预测,特别是短期预测具有非常重要的意义;五是流行病的防治仍然停留在专家为主体的层面,没有到达通过改变利益相关者行为模式达到疾病预防目的的层面。以互联网为基础的现代通讯技术快速发展,为发展下一代流行病学技术提供了技术支撑。
虽然流行病学技术3.0经过半个多世纪的发展已经得到广泛的运用,在流行病的防控实践中也收到良好效果。但是流行病防控中的核心问题并未得到根本解决,解决这些问题需要大力发展第四代流行病学技术,即流行病学技术4.0。
2.1 流行病学技术4.0的概念
流行病学技术4.0是指以大数据为基础、以数学模型为核心、以云计算为数据处理方法式,主要通过改变人的行为模式为疾病防治手段的流行病技术。发展流行病学技术4.0是个系统工程,需要在流行病学技术3.0基础上,以大数据收集、信息储存与分析和研究结果应用为基础,通过智能感知、识别技术与普适计算等通信感知技术相结合构建动物疫病防治物联网平台。利用局部网络和互联网等通信技术把养殖户、空间分析实验室和决策者通过移动互联网联结在一起,形成人与人、人与物、物与物相联,实现信息化、远程管理控制和智能化的网络,以实现养殖场定位、活动物追溯、监控和动物疫情数据管理,并充分运用互联网在数据收集与传输速度快、点多面广的特点进行大数据收集,以数学模型、统计学模型等技术为内核进行数据分析与计算,运用GIS进行数据可视化表达,在实施云计算基础上进行疾病发生发展趋势预测和防治措施定量评估与优化。
2.2 流行性学技术4.0特征
随着硬件、软件、研究模型的创新,新一代流行病学技术4.0与流行病学技术3.0相比,能够结合流行病相关数据自动化动态化收集、实时化网络化海量化存储、结合统计学地理学数学等学科精细化分析等等功能实现多位一体的信息化综合技术。
(1)数据收集网络化是指数据的收集不仅仅依赖技术人员现场调查,通过随机抽样或者个案跟踪调查等方式,而是更多依赖电脑和手机无处不在的特点,通过互联网(包括无线网和有线网)随时随地进行数据收集与传输,使有关人员及时掌握疫情状况。
(2)数据处理自动化是指在大量收集数据基础上,运用构建的模型,在计算机系统内部将信息初步进行自动处理,并呈现处理结果,人员参与的基础性工作替换为系统的智能自动化服务,既节省了人力又降低了人为操作的误差。
(3)分析结果可视化和动态化是指除了通过表格的形式显示数据的传统形式以外,数据和分析结果还可以在地图上用符号、颜色的形式将计算机处理的结果进行实时差异化表示,这样直观地显示出数据的结构和层次和疫情的空间分布。
(4)防治措施精细化和差异化是指依据分析对象不同地域、年龄等特征进行差异化分析,并且依据实际情况有区别地进行防疫措施的制定和管理。
2.3 标志性技术
实现流行病学技术4.0需要将最新数据收集与分析技术进行综合运用。其中最具标志性的技术是将空间分析技术、物联网技术、大数据技术、云计算技术和数学模型有机结合起来,形成集数据收集、自动化处理和动态显示为标识的现代流行病学技术。
2.3.1 3S与数学模型相结合的空间分析技术。遥感(RS)、全球定位系统(GPS)和地理信息系统(GIS)合称为3S技术。GIS是以地理空间数据库作为基础,在计算机软硬件支持下,运用系统工程的理论方法,对空间相关数据进行采集、存储、管理、操作、分析、模拟和显示,提供多种空间和动态的地理信息,为研究和决策而建立起来的计算机系统。RS和GPS向GIS提供和更新区域信息以及空间定位,GIS进行相应的空间分析,以从RS和GPS提供大量的数据中提取有用信息,并进行综合集成,使之成为决策的科学依据。3S技术已应用于卫生
管理决策和疾病监测中,在自然疫源性疾病的研究中发挥了重要作用[10]。数学模型能够从机理上对疾病的流行进行定量分析、评估和预测,将3S技术与数学模型相结合为流行病领域的研究提供了新的方法与工具。
2.3.2 互联网技术。随着国家“金桥工程”(即信息高速公路,包括由通讯网、计算机、数据库以及各种电子设备组成的,由光缆连接的完备网络)上马和无线互联网的大力发展,互联网技术在各个领域中的运用日渐广泛[10]。2014年中国移动互联网用户达到了8.75亿,通过这么多的互联网用户,能够进行数据收集、健康知识传播等工作。在互联网技术特别是移动互联网技术基础上,兽医流行病学技术4.0实现3个融合,即互联网与传统兽医流行病学的融合、互联网与空间分析技术的融合和互联网与数学模型的融合,实现创新2.0下的互联网与传统兽医流行病学融合发展的新形态、新业态。充分发挥互联网在生产要素配置中的优化和集成作用,将互联网的创新成果深度融合于传统兽医流行病学之中,提升动物疫病防控能力。兽医流行病学4.0重点促进以云计算、物联网、大数据为代表的新一代信息技术与动物疫病防治政策、措施与技术评估方法的融合创新,为动物疫病防治技术创新提供环境,为畜禽养殖业智能化提供支撑,促进畜禽养殖业增效升级。
2.3.3 “大数据”与云计算技术。随着网络技术、通信技术、移动设备技术的融合与发展,信息数据呈现出前所未有的爆发式增长。“大数据”具有“4V”特征:①海量数据(Volume);②类型复杂(Variety);③实时处理(Velocity);④价值巨大(Value)[11]。《Nature》杂志出版的专刊“Big Data”指出,“大数据”时代的到来将引起一次社会革命,必将对政府治理、企业决策、个人生活产生巨大而深远的影响[12]。大数据离不开云计算。云计算是将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和各种软件服务[13]。云计算的“云”就是存在于互联网上的服务器集群上的资源,本地计算机只需要通过互联网发送一个需求信息,远端就会有成千上万的计算机为你提供需要的资源并将结果返回到本地计算机。这样,本地计算机几乎不需要做什么,所有的处理都在云计算提供商所提供的计算机群来完成[14]。大数据时代下的海量数据,以及云计算应用下的更少的成本和更高的整体信息化水平,对流行病学信息化、研究和探索带来了非常巨大和深远的影响。通过选择和构建良好的大数据信息共享系统,从外界获取有价值的数据和知识,是流行病学持续发展和发散研究的重要途径。
2.4 标志性成果
流行性学技术4.0经过大力发展以后,就会形成疾病防治智能服务综合平台。这个服务平台不同于以往的决策支持系统(DSS),实现集动物疫病被动监测、动物疫病诊疗服务、防疫用品(疫苗、药品、试剂等)产品推介、防疫政策措施和技术的推广为一体的综合服务平台。实现各级疫控机构与养殖场/户的深层次信息融合。它不但服务于决策者,还服务于广大养殖群体,是具有的自动化、可视化、动态化、网络化、精细化和差异化等等智能化特征的智能服务平台。智能决策系统结构图详见图2。
图2 疾病防治智能服务综合平台结构示意图
这个系统以互联网技术为基础,以数学模型为核心、以3S技术为外壳,在大数据和云计算技术的支持下,该系统实现数据可以自动化、网络化、海量化和动态化的收集和传输,涉及的数据包括调查数据、RS/GPS测量数据、环境数据、经济数据以及其他数据,利用这些数据可以对疫情有效的分析与控制。在大数据技术、互联网技术和云计算技术的支持下,可以建立分布式存储数据库,将大量数据存储在云端,通过互联网进行高速度的数据传输。获取数据以后,利用空间分析技术、统计学模型、动力学模型以及其他模型可以实现精细化、差异化地进行可视化显示,并且进行疫情疾病监测、数据管理、防控、疾病位置及扩散范围显示等的相关分析研究,进行疫情初步自动分析和自动反应,最终决策提供相应支持,并对利益相关者进行综合服务。
流行病学技术的发展与更新,也是现代科学技术水平发展的表现。前三个时期所运用的统计学、数学、社会学、经济学、地理学、人工智能等方面技术为第四代流行病学技术奠定了良好的基础,第四代流行病学技术,以大数据为基础、以数学模型为核心、以云计算为数据处理方式,利用局部网络和互联网等通信技术,形成人与人、人与物、物与物相联,实现信息化、远程管理控制和智能化的网络,并充分运用互联网在数据收集与传输速度快、点多面广的特点进行大数据收集,以数学模型、统计学模型等技术为内核进行数据分析与计算,运用GIS进行数据可视化表达,在实施云计算基础上进行疾病发生发展趋势预测和防治措施定量评估与优化。随着基础技术的进步,第四代流行病学技术将会广泛应用,拥有无限前景。
[1] 李立明.流行病学[M]. 6版. 北京:人民卫生出版社,2007.
[2] 李立明,王艳红,吕筠. 流行病学发展的回顾与展望[J]. 中华疾病控制杂志,2008,12(4):304-308.
[3] 姜庆五. 路在何方——论流行病学的成功与挑战[C]// 中华预防医学会.预防医学学科发展蓝皮书.北京∶中华预防医学会,2004.
[4] Rosenberg M S,Sokal R R,Oden N L,et al. Spatial autocorrelation of cancer in western Europe[J]. Euro J Epidemiol,1999,15(10):15-22.
[5] 李立明,王艳红,吕筠. 现代流行病学的发展与展望[J]. 中华疾病控制杂志,2010,14(1):1-4.
[6] 吴系科. 药物流行病学[J]. 中国公共卫生,1992,9(10):467-468.
[7] 段广才,黄志刚. 流行病学进展[C]//中华预防医学会.预防医学学科发展蓝皮书.北京∶中华预防医学会,2006.
[8] 杨德富.流行病学发展趋势及面临的挑战[J]. 中外医疗,2009,25(9):172.
[9] Qiang H,Xiang D S,Juan Z,et al. Modeling the transmission dynamics of sheep brucellosis in Inner Mongolia Autonomous Region,China[J]. Mathematical Biosciences,2013,242(11):51-58.
[10] 易彬樘,徐德忠.“3S”及其在流行病学领域中的应用[J].中国公共卫生,2002,18(11):1330-1333.
[11] 李国杰,程学旗.未来科技及经济社会发展的重大战略领域-大数据的研究现状与科学思考 [J]. 中国科学院院刊,2012,27(6):647-657.
[12] Frankel F,Reid R.Big data:Distilling meaning from data[J]. Nature,2008,455(7209):30-30.
[13] 陈国良,孙广中,徐云,等. 并行计算的一体化研究现状与发展趋势[J]. 科学通报,2009 (8):1043-1049.
[14] 严格. 云计算在区域医疗信息化中的应用研究 [D]. 北京∶北京交通大学,2011.
(责任编辑:王伟涛)
Review and Prospect of Epidemiology Technology Development
Shi Yuanyuan1,2,Li Yan3,Sun Xiangdong4
(1. Institute of Geodesy and Geophysics,Chinese Academy of Sciences,Wuhan,Hubei 430077;2. University of Chinese Academy of Sciences,Beijing 100049;3.School of Public Health/Global Health Institute,Wuhan University,Wuhan,Hubei 430071;4.China Animal Heath and Epidemiology Center,Qingdao,Shandong 266032)
Since its appearance in the fourth century BC,epidemiology has experienced three technology development stages. With the rise of modern science and technology,especially the emergence of internet technology,big data technology and cloud computing technology,the development of epidemiology technology has been greatly promoted. In the paper,the three periods of epidemiology development and its technologies are reviewed,and with the support of modern technology,the epidemiology technology development 4.0 is proposed,its features,symbolic technologies and achievements are introduced,and its promoting and turning into networking,automation,visualization,dynamic,elaboration and differentiation are analyzed and prospected.
epidemiology technology 4.0;review;development;internet technology;big data technology;cloud computing technology;GIS
R181.23
C
1005-944X(2015)08-0085-05
孙向东
注:施媛媛与李妍为并列第一作者