摘 要:人类社会步入大数据时代,基于大数据技术的挖掘和分析在生物医学研究和临床诊治中发挥了重大作用。大数据在为医学研究和诊疗带来便利的同时,数据挖掘和分析过程中的信息安全问题和病患的隐私泄露给生物医学发展带来了风险和隐患,对生物医学研究和诊疗的社会公信产生了冲击,生物医学信息安全和隐私保护应从管理、技术和教育等多方面着手加以解决。
关键词:大数据;生物医学;信息安全;隐私保护
中图分类号:TP309 文献标识码:A 文章编号:2096-4706(2018)10-0156-03
Abstract:Human society has entered the era of big data. Mining and analysis based on large data technology play an important role in biomedical research and clinical diagnosis and treatment. While large data are convenient for above them,the information security and privacy disclosure in the data mining and analysis process bring risks and hidden dangers to the biomedical development,and impact on the social public belief of biomedical research and diagnosis and treatment. Biomedical information security and privacy protection should be solved from various aspects such as management,technology and education.
Keywords:big data;biomedical science;information security;privacy protection
0 引 言
基于计算机技术、信息存储方式、云计算和移动终端设备的高速发展与革新,人类社会步入了大数据时代,并给当代社会发展带来了冲击,正深刻影响着社会生活、工作与思维等各个方面[1]。对于生物医学领域而言,自人类基因组计划完成以来,随着基因组学、脑科学等知识的快速积累,各种实时、定量分析测试技术的推陈出新,大规模临床研究日益增多,以及数据的生成和共享急剧增加,在海量数据分析和解读过程中信息安全和隐私保护逐渐成为生物医学研究领域亟待解决的问题[2]。
1 大数据在生物医学领域的重要性
大数据(Big Data)是指由于容量太大和过于复杂,无法在一定时间内用常规软件对其内容进行抓取、管理、存储、检索、共享、传输和分析的数据集[3,4]。大数据技术的发展以及对数据的研究在社会发展与进步的各个方面发挥支撑促进作用。大数据本身是一种信息资源,具备其他资源无法匹及的趋势预测潜力,基于大数据的分析和应用是使这些资源的效益真正释放出来的关键所在[5]。
生物医学研究不是孤立存在的,具有整体关联性,且个体疾病复杂多样。随着高通量大数据存储技术的革新和基因组测序成本的下降,以及医院信息化和现代数字化研究、诊疗系统的发展,生物医学在发展过程中产生了海量的数据[6]。目前,每年全球产生的生物数据达到EB级别,生物医学科学在某种程度上已经成为大数据科学[7]。
生物医学数据不断积累,促使研究者和临床医生的思维方式已经从数据生产和积累转变为对数据进行深层次的处理[8]。大数据技术的分析和挖掘在医学研究、疾病诊疗、公共卫生管理和健康危险因素分析等方面发挥了重要的作用,生物医学的发展已经离不开大数据的支持。
2 大数据在生物医学领域中的应用
2.1 预测功能
预测功能是大数据挖掘应用于生物医学领域的核心,在生物医学研究和疾病诊治、预防中都得到有效应用。大数据的信息统计分析为医学研究提供方向指引和结果预判,避免重复研究;基于大数据挖掘技术,从大量的生物医学数据中分析某些疾病的病发因,针对疾病发生机制,及时准确确定治疗方式,利于疾病的预防治理[9];同时针对个体健康数据的整理也可为疾病的预防提供参考服务。
2.2 信息共享
数据共享是大数据应用的基石,医学领域积累了海量的数据,但分布相对分散,通过信息共享,把相对分散的信息资源连接起来,最大程度地增加数据量,为更多、更新的应用提供数据支撑。例如,医学健康档案和生物医学专用数据库的构建,极大地便利了临床医生的病患诊治和生物医学研究者的科学研究。
2.3 个性诊疗
基于大数据技术构建个人健康档案、基因信息以及动态网络预测数据库,为实现个性化治疗奠定坚实的基础[2]。大数据时代的生物医学数据共享互通,医生在为患者诊疗时,可从已构建的数据库信息中调用患者的所需参考数据,辅助疾病的诊断与治疗,践行个体化诊治原则。
3 生物医学领域使用大数据存在的风险
3.1 信息安全隐患
随着现代生物医学发展产生的数据不断积累,在享受大数据为使用者提供便利的同时,信息安全问题也频繁发生。2015年2月,美国发生了有史以来最严重的医疗信息泄露事件,第二大保险公司Anthem宣布黑客窃取了公司超过8000万的个人信息;2015年4月,全球最大的漏洞响应平台“补天漏洞响应平台”发布消息称:国内30余省市的社保、疾控中心等系统存在高危漏洞,涉及数据量高达5279.4万条。根据美国卫生公民服务部(HHS)的统计,近年受医疗信息安全影响的人数呈爆炸式增长,仅2015年就有1.1亿人,为过去3年的2.7倍,信息安全问题已经成为生物医学研究中无法避免的内容。
3.2 个人隐私泄露
大数据时代,生物医学研究中病人的隐私问题是不容回避的现实挑战。医疗个人数据会涉及病人的隐私,且极具特殊性和敏感性,对其进行使用时面临一系列法律和伦理问题,因此在大数据环境中保护好个人隐私至关重要[10]。生物医学研究中对大数据的依赖程度越来越高,随着大数据运用和普及范围的日益扩大,人们对病患的隐私,特别是基因组隐私(个人基因组数据)的保密格外关注,现实情况是病人的隐私在大数据的采集、流通和使用过程中存在泄露的隐患。
3.3 冲击社会公信
信息安全隐患和个人隐私泄露给生物医学领域带来了极为恶劣的影响,不仅影响了个人及团体的生物医学研究,同时部分数据的泄露也造成数据提供者的个人信息和隐私暴露的问题,为不法者及其不法行为提供信息渠道,导致严重的社会危害。信息安全和隐私保护关系到广大数据资源提供者及病患的切身利益,其社会关注度持续攀升,一旦因此而产生重大的社会危害事件,必将给生物医学发展研究的社会公信带来严重冲击。
基于大数据技术的研究与挖掘将成为生物医学发展的趋势。大数据已经运用到生物医学的各个方面,正在深刻影响生物医学的发展,面对如潮水般涌来的海量数据,进行合理有效利用的同时,避免风险也至关重要。
4 生物医学信息安全和隐私保护的管控措施
4.1 设置专业机构
生物医学数据的安全和隐私的保护需要专门的机构管理,目前比较著名的是美国的国家生物技术信息中心(NCBI)和欧洲的生物信息研究所(EBI),而国内缺乏类似的专业管理部门。政府应完善机构设置,建立专门的生物医学信息管理部门,从事生物信息数据的管理、汇聚、分析和发布等工作,督导和引领国内生物医学信息的数据安全和隐私的保护,此外,各级单位内部也应设置相应的信息安全管理处(室),逐级防护,确保信息交流的全过程安全。
4.2 完善政策法规
目前国内尚缺乏专门针对生物医学信息安全和隐私保护的政策法规,管理部门应着手加快推进生物医学信息保护的政策法规完善,严格要求生物医学信息管理、储存以及使用,各级单位和部门要注重保护信息安全,加强数据传递过程中的管控和监督,为提供信息数据的病患隐私提供法律保护,对窃取、倒卖重要生物医学数据信息的犯罪人员应该予以严惩。
4.3 研发使用新技术
由于计算机性能的不断提升,以往的数据安全保护技术,如数据加密技术、生物识别和数字水印等投入使用的时间过长,容易被破解。云计算、云储存技术的推广使数据储存的载体已经从过去的物理转向虚拟,这给现代数据保密技术提出了更高的要求。生物医学数据的存储和使用部门应加大对保密软件开发的投入,或者依托互联网公司,研发适合目前计算机环境中所需的信息保密技术。
4.4 构建数据库防御体系
大数据安全和隐私保护技术体系中的安全防护技术主要分四个层次,分别为设施层、数据层、接口层和系统层的安全防护[11]。单纯依靠专项技术已经不能满足现代信息保密的要求,需构建纵深的数据库防御体系,从存储、访问和管理三个角度出发,保障生物医学数据在安全范围内合理地进行挖掘使用;同时构建数据库安全认证和评估体系,对各级数据库的安全性能进行定期评估,发现风险及时反馈到各级管理部门。
4.5 加强信息安全教育
信息安全教育是预防信息安全和隐私泄露问题产生的有效手段。对信息的采集、存储和管理者来说,加强信息安全教育需要掌握相关信息保护的技术和手段,加强对信息传播过程的管控;对信息的使用者来说,有效的信息安全教育能预防使用过程中无意识的泄露;对数据的提供者来说,信息安全教育能够使其了解相关的信息安全政策和法律法规,在出现隐私泄露的问题时,能够维护自己的合法权利。
大数据改变了生物医学的传统实践模式,有利于实现生物医学的共享研究和临床的精准诊疗。大数据环境的生物医学研究基于信息安全和隐私保护的前提,应合理地采集和使用数据,通过数据挖掘和分析,实现信息共享者之间、信息使用者与提供者之间的利益互享,取得大数据环境下生物医学研究的社会公信度。
参考文献:
[1] 秦文哲,陈进,董力.大数据背景下医学数据挖掘的研究进展及应用 [J].中国胸心血管外科临床杂志,2016,23(1):55-60.
[2] 张宁,徐远旭,杨帆,等.大数据时代的生物医学研究 [J].中华医学科研管理杂志,2015,28(1):34-39.
[3] 王波,吕筠,李立明.生物医学大数据:现状与展望 [J].中华流行病学杂志,2014,35(6):617-620.
[4] 郭丽,胡栋,王俊,等.生物医学大数据背景下学习生物信息学的学科特点分析 [J].高教学刊,2016(19):48-49.
[5] 宁康,陈挺.生物医学大数据的现状与展望 [J].科学通报,2015,60(Z1):534-546.
[6] 刘雷.大数据时代的生物医学 [OL].[2014-09-22].https://blog.csdn.net/aimatfuture/article/details/39480617.
[7] 朱蕊,彭龑.医疗大数据的应用 [J].中国西部科技,2015,14(5):95-97.
[8] Levine AG. An explosion of bioinformatics careers [J].Science,2014.
[9] 姚贺文.大数据背景下的生物医学的现状与发展 [J].人人健康,2016(22):296.
[10] 周雪晴,罗亚玲.信息化建设中医疗大数据现状 [J].中华医学图书情报杂志,2015,24(11):48-51.
[11] 吕欣,韩晓露.大数据安全和隐私保护技术架构研究 [J].信息安全研究,2016,2(3):244-250.
作者简介:李全权(1991-),男,助理馆员,硕士。研究方向:科研信息管理。