孙丽萍+刘巧红+李建华
摘要:本文阐述了大数据时代如何利用这些海量信息为健康医疗服务,已经越来越为人们关注。健康大数据分析技术能在疾病与健康研究、环境与健康研究、医药生物技术研究、卫生宏观决策支持四个方面发挥特殊的作用,因此培养健康大数据技术应用人才具有现实的紧迫性和必要性。
关键词:健康;大数据;人才培养
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2017)30-0224-02
一、培养大数据技术应用人才的紧迫性、必要性
由于社会生活与生产已经被大数据与云计算所笼罩,随之而来的数据仓库、数据安全、数据分析、数据挖掘、数据可视化等技术,正在为大数据与云计算行业带来大量的商业价值,逐渐成为行业人士争相追捧的利润焦点。因此,与之相关的职业需求也必然呈爆发式增长,而现实情况则是大数据职业的相关人才比较匮乏。无论从人才市场反馈信息来分析,还是从国内外高校的有关专业办学动向了解,以及企事业单位对大数据人才的需求调查来看,培养大数据技术应用人才都具有现实的紧迫性、必要性。
二、培养健康大数据技术应用人才的紧迫性、必要性
健康大数据分析技术能在疾病与健康研究、环境与健康研究、医药生物技术研究、卫生宏观决策支持四个方面发挥特殊的作用。
1.疾病与健康研究。在疾病与健康研究方面,又有健康研究、亚健康研究和疾病研究。(1)健康研究。深入研究和分析人群的健康规律,对卫生保健、健康促进、疾病预防和治疗有着重大的指导意义。如:①对体检数据分析和挖掘,以便于精确地确定不同人群的健康标准,打造个性化、地区化的健康评估模型。②對孕妇在孕产期、产后及新生儿的健康数据进行深入分析,研究孕产妇和新生儿的健康规律,给出更科学的孕产妇和新生儿保健的指导。③对老年人的健康数据分析和研究,研究老年人的健康特点,给出更科学的养生指导。(2)亚健康研究。对亚健康进行深入分析与研究对保持健康状态,预防和纠正亚健康状态以及对疾病的预防和治疗都有十分重要的意义。如:亚健康与疾病间的关系、亚健康与健康间的关系。研究各种可观察指标(体检数据)、外部数据(如职业、饮食、习惯、性格、爱好等)在亚健康中的权重、指标之间的关联性。通过数据挖掘,分析导致疾病的影响因素,建立评估模型来预测疾病、治疗亚健康。(3)疾病研究。中国面临的严重危害人民健康的疾病包括:传染性疾病,慢性非传染性疾病,小儿出生缺陷。对病人的医学数据及相关数据的研究分析,对各种疾病的预防和治疗都有十分重要的价值。如:①对传染性疾病、慢性非传染性疾病的研究:应用数据挖掘技术对相关数据进行分析,找出发病规律,揭示疾病的病因,摸索出疾病的变异规律、并发症规律,科学评估各种治疗方案的疗效,建立疾病的预测模型。②对小儿出生缺陷的研究,应用大数据分析技术对儿童出生缺陷的数据进行分析,从广泛的大变量集中找出影响儿童出生缺陷的主要因素,在环境、遗传学、病理学等多方面探索儿童出生缺陷的病因,建立儿童出生缺陷的预测模型。
2.环境与健康研究。环境对健康的影响与公众利益息息相关,环境健康损害如得不到妥善处理还将转化为社会、经济问题。应用大数据分析技术探索环境变迁对人民健康造成危害的预防和治理措施。主要包括发现案例、发病机理和临床治疗研究,预防和治理各类环境流行病在污染源以及污染途径控制的研究等。例如:研究环境污染对儿童的影响,以解决环境对儿童所造成的不健康和疾病迅速增长的问题,从而给予儿童特殊的健康指导。分析各种职业的发病分布和严重程度,开展职业病和职业多发病的预防预测。开展对空气污染显著提高城市人群呼吸道和过敏性疾病的发生率的研究。
3.医药生物技术与健康。医药生物技术最鲜明的特点是大量新思想、新技术、新材料、新方法和新产品引入医学研究和医疗保健之中,如全新的医学成像技术、基因工程技术、纳米技术、生物芯片技术、生物医学工程技术、生物信息技术和中医药技术等及其产品,将大大提高疾病预防、诊断、治疗和药物设计研制水平,以及对突发事件(如传染病等)的检测、预防与治疗水平。以大数据分析技术为核心的生物信息技术在由众多新技术构成的医药生物技术中发挥着其独特的作用。
4.卫生宏观决策支持。卫生宏观决策支持系统是以数据仓库为数据中心、以数据挖掘为技术核心、以商务智能为展现工具的综合卫生信息平台。它可以建立在各级别卫生系统上,如医院、地区卫生系统、全国卫生系统,为各级卫生部门提供智能决策系统,深入了解卫生系统的历史和现在,把握卫生系统业务发展的未来,评估卫生系统内部各部门的业务效绩,帮助各级决策者提供最佳实施方案,如预防接种基本数据,传染病报告,等等。因此,在大健康领域,目前迫切需要两类大数据技术应用人才:(1)健康数据平台建设人才;(2)健康数据挖掘应用人才。需要开设相关专业,使学生能胜任大数据平台搭建、存储和分析等技术工作,同时也能成为“产学研用”一体化的纽带,推动大数据技术在健康领域的具体应用。
三、建议开设健康大数据技术及应用专业
从事数据统计、分析和应用是一类历史悠久且高度职业化的专业。由于大数据具有体量巨大、速度极快、类型众多、价值巨大的特点,对数据采集、存储、处理、传输和应用提出了前所未有的要求,传统的信息学科下的相关专业已经难以适应大数据时代的新要求。
1.必须分析《计算机科学与技术》、《软件工程专业》与《大数据科学与技术》专业的本质区别,因为这两个专业与我们计划开设的《大数据科学与技术》专业有非常密切的关系。《计算机科学与技术》是一个老牌的基础性专业,主要研究计算机原理、计算机体系结构、操作系统、数据结构、计算理论与方法、程序设计理论、计算机软件、数据库、计算机网络、分布式系统、图形学等内容。显然,计算机科学专业一直关注计算机本身的科学技术问题,核心是计算机系统结构所涉及的硬件与软件,而并不擅长海量数据的采集、处理与分析、传输与应用。《软件工程》是从计算机学科分化出来的一个专业,侧重软件需求分析、软件模型、软件设计、软件生命周期管理等知识。与计算机专业一样,也是一个基础性专业,并同样面临对软件系统本身的深入研究以及如何与行业结合的问题。总体上,在《计算机科学与技术》、《软件工程专业》基础上增加大数据专业知识,既不利于这些专业本身的巩固与发展,也没有多少空间实施这种改革。
2.有必要考察其他数据处理相关专业的人才培养情况。《统计学》或《应用统计》是一个在国内外高校均具有长期办学传统的数据处理专业,国内开设此专业的高校达100所以上。《统计学》专业的培养目标大致可分为两类,一类是理论研究人才,另一类偏向实际应用。前者主要包括数学专业下的统计学,后者包含的方向十分广泛。从培养方案与具体实施情况来看,国内外统计学均带有强烈的数学特征,因为它本身是从数学专业分化出来并依托数学专业开办的,提供的课程主要是数学理论与统计方法,同时开展一些专业统计软件、程序设计、数据库系统等方面的训练。显然,尽管该专业在数据统计与分析方面具有理论与方法上的优势,但它并不關注大数据系统的建设问题,该专业在统计软件、程序设计、数据库系统等方面的训练远远不能满足大数据系统建设与应用的需要。健康大数据技术与应用专业是一个以现代计算机与网络系统为依托,专注健康大数据采集与管理、健康大数据分析与应用的新理论和新技术,培养解决健康大数据系统建设整体性问题的高级复合型专业人才的专业。它依托计算机、软件工程专业建设,但是大大拓展、延伸了它们的业务范围,从而获得了新的特色和优势。
四、培养目标
本专业培养健康大数据科学与工程领域的高级应用型专业技术人才。毕业生具有医学的基础知识、系统的信息科学、数据科学知识,掌握大数据科学、技术与工程领域所需要的电子、计算机、网络等相关学科的基本理论和基本知识,掌握大数据处理和管理的基础理论,熟练掌握海量数据采集、存储、处理与分析、传输与应用等关键技术,具备健康大数据工程项目的系统集成能力、应用软件设计和开发能力,具有一定的健康大数据科学研究能力与动手实践能力,能在健康领域内从事健康大数据的应用、功能开发、技术管理、技术维护和技术培训等工作,也可在健康服务机构从事健康数据的服务与管理等技术工作的高端应用型复合人才。
五、结语
随着互联网的发展,医疗机构信息化的全覆盖、云计算、物联网应用的丰富,更多的传感设备移动终端接入到网络,我们将迎来大数据引领的智慧科技时代。大数据时代,我们所要做的事就是对隐藏于大数据中有价值的信息进行分析与挖掘,以利用大数据中蕴藏着的具有丰富价值的信息。未来几年,中国项目数据分析专业人才需求会达到几十万人以上。国内高校应及时关注大数据时代的数据分析人才培养,融基础理论、实验教学、工程实践为一体,为大数据这样的新兴产业发展输出高层次、实用性、国际化的复合型专业人才,确保产业可以科学、持续、高速地发展。