区域健康医疗数据共享及隐私保护策略研究

2017-10-30 18:45王换换吴响王辉
科技创新与应用 2017年31期
关键词:隐私保护共享

王换换+吴响+王辉

摘 要:本研究针对区域健康医疗数据共享及其隐私保护问题,运用隐私保护理论及系统建模理论,构建区域健康医疗数据共享平台,对健康医疗数据的隐私保护进行系统研究。探索区域健康医疗大数据隐私泄露的可能因素,为构建健康医疗数据共享平台及医疗数据的隐私保护提供对策与建议。

关键词:区域健康医疗数据;共享;隐私保护

中图分类号:R197 文献标志码:A 文章编号:2095-2945(2017)31-0181-02

引言

当前,很多医疗机构,包括医院、妇幼保健所、疾病控制中心、社区卫生服务中心(站)等,已经构建了基层业务信息系统,标志着区域医疗信息化已取得了很大的进展。系统的构建为区域信息平台提供终端数据接入,例如 HIS、EMR、LIS、RIS、PACS等,有效推进了区域医疗业务与科技信息软件服务的广泛使用。

然而,随着区域医疗信息化快速发展的同时也暴露出了很大的安全问题——医疗隐私泄漏。据有关监测平台数据分析,2016年至今全国有关卫生、医疗、儿童、疾控、妇幼、预防、接种、疫苗发生的医疗隐私泄露事件共1322起。

从表1中健康医疗数据泄漏的量级及不同量级所占百分比来看,涉及百万级数据泄漏的事件占比很高,其中不乏有上亿级的数据泄漏事件。大数据、云计算时代,在为我们带来了便利的同时,也为安全带来了巨大的挑战。

作为基础资源之一的居民健康医疗数据,不仅促进区域医疗与公共卫生服务的统筹和融合发展,而且能够预防、监控重大疾病和突发公共卫生事件,健康医疗数据隐私保护体系的构建能够打破隐私泄露的壁垒,提供全面准确科学依据和决策支持。在确保个人健康医疗数据隐私安全的情况下,整合更多的健康医疗资源,形成资源利用的良性循环,从而逐步改善医疗卫生服务需要与服务供给的平衡力,是居民健康需求的重要保障,具有多方重要意义。

1 区域医疗大数据隐私泄漏分析

通过大量的调研及文献查阅,医疗隐私数据泄露主要有以下几点原因:

1.1共享标准不一

医院信息数据的传输标准及方式存在差异,需要通过连接不同“接口”的系统实现健康医疗数据共享。然而由HIS、LIS、PACS、RIS等多个系统组成的医院电子病历系统并不具备规范及安全的医疗数据传输标准。同时,不同部门由于技术水平限制,以“接口”的方式来共享信息也进一步增加了各系统的负荷,造成了较大的安全隐患,病人隐私安全受到严重影响。

1.2 管理不规范

当下各区域还未建成有统一标准及规划的健康医疗共享平台,存在病人隐私被超越权限获取的隐患。通过对“电子病历交换中心”等方式进行密码、权限的科学规范设置来实现健康医疗数据的共享,减少与诊疗无关的人员获取病人信息的发生,从而保护患者隐私安全。

1.3 医疗资源分配不均

医疗资源的分配不均必将衍生出黑市对病患医疗信息数据的旺盛需求,因此居民医疗数据在医疗保健产业链中有着重要的商业价值。如果没有有效的医疗数据隐私保护手段,可能会严重影响居民对医疗机构保障居民信息安全的信心,從而影响医疗保健事业的长远进步和科学发展。

1.4 医务人员法律意识淡薄

针对电子病历系统的个人专用“密码”保管不善或随意透露给他人,这样进一步加大了患者信息泄露的范围,增加了隐私泄露的风险,因此,当前需要对医务人员保密意识的加强,并制定严格的惩罚措施。

因此,在医疗信息化快速发展的今天,医疗信息化大趋势让患者不得不担心个人的病患信息。有调查显示,相关医疗行业的数据泄漏问题要远高于其他行业,约占60%,健康医疗数据在共享过程中的隐私保护问题日趋重要。

2 区域医疗大数据共享平台的构建及隐私保护策略研究

2.1 区域医疗大数据共享平台的构建

构建以居民诊疗档案和健康档案为中心,能够实现医疗卫生信息跨业务、跨地域互联互通的具有拓展业务模式和提升管理水平的区域医疗大数据共享平台。其平台架构见图1,关键技术如下:

(1)医学术语知识库的构建及信息抽取技术

建立服务于机器学习算法的中文医学术语知识库是信息抽取技术的基础,其中,领域相关的语义信息和关系描述是抽取中常用到的两个子语言语法规则,这时受控词汇表中有良好定义的概念就是某一概念的不同表达方式的映射,而这些也要从专业拥有语义网络的医学术语知识库中抽取。本课题基于所建立的中文医学术语知识库和成熟的英文信息抽取技术。在已有的条件之下,统计学方法的训练集可以通过适当的人力标注少量的医学病历,进一步探究新的适用于医学问题识别的统计学算法,构建一个可以表明人物及其相应医学问题的信息表示方案。

(2)Spark分布式并行化算法处理技术

k-匿名算法[1-4]是需要多次对数据操作即多次访问I/O端口,故可以通过减少k-匿名时的I/O操作较少匿名化时间,采用Spark平台把数据存储在内存中,避免了不断从硬盘读取数据,节省了访问I/O端口的通讯时间。

2.2 健康医疗数据的隐私保护策略模型构建

(1)健康医疗数据隐私保护体系构建

在区域医疗大数据共享平台基础上,我们从大数据生命周期的四个阶段进行保护。目的是为健康数据内部管理隐私保护策略的具体实施制定统一规范。同时结合基于角色的访问控制(RBAC:Role Based Access Control)模型中用户角色的理念及初始信息匿名技术[5],构建使用简单业务对象描述隐私策略的表示方法。

(2)隐私保护模型的设计与实现

本文所实现的隐私保护模型首先将原始数据进行匿名化处理,匿名化处理工具主要由共享平台提供,这样即使在数据周期的其他环节数据泄漏,也能在一定程度上保证医疗数据的安全。模型设计的核心,其功能模块封装成块,对于上层业务来说,隐藏了实现细节,实现了不同模块之间的隐私保护及访问控制功能[6]。模块之间不需要知道隐私保护的具体实现,因为模块之间能够实现调用,且各模块只处理较为复杂的业务逻辑。其核心流程设计如下:endprint

a.定义事件:选择受保护对象,包括三要素(用户,实施,实施目标)。b.指明执行该事件的目的。c.定义条件:指定事件执行需要满足的条件。d.提交:从前端页面将隐私策略数据传递到后台。e.策略翻译:将用户提交的数据转为标准的隐私策略定义形式。f.冲突检测:隐私策略创建完毕,检测可能发生冲突的隐私策略组,冲突存在,提示再次修改提交。g.存储:检测完毕无冲突,新建隐私策略存放至隐私策略数据库;结束。

3 结束语

在健康医疗信息化的发展趋势下,信息安全与隐私保护成为医疗数据信息化可持续发展的重要保障,需要通过投入大量资金、建立相应的组织管理机构等方式,统筹、平衡发展医疗数据信息化建设,高度重视数据共享及安全隐私保护问题。与此同时,高效开展组织协调工作,为居民医疗信息安全与隐私保护提供保障,推进整个工作健康有序地施行。

参考文献:

[1]Samarati P,Sweeney L.Protecting privacy when disclosing information: k-anonymity and its enforcement through generalization and suppression.SRI Computer Science Laboratory Technical Report SRI-CSL-98-04,1998.

[2]R.Agraw al, R. Srik ant. P rivacy. Preserving Data Mining[C]//Proceedings of the ACM Conference on Management of Data, 2000:439-450.

[3]曾菊儒,陳红,彭辉,等.参与式感知隐私保护技术[J].计算机学报,2016,39(03):595-614.

[4]张毅荣.大数据背景下的K-匿名隐私保护机制研究[J].农村经济与科技,2017,28(04):289-290.

[5]杨光明,李先国.RBAC模型在医疗系统中的研究与应用[J].现代电子技术,2013,24:25-28.

[6]高涛,朱晓民,沈奇威.基于RBAC的隐私保护模型设计与实现[J].电信网技术,2011(11):115-119.endprint

猜你喜欢
隐私保护共享
基于层次和节点功率控制的源位置隐私保护策略研究
关联规则隐藏算法综述
大数据环境下用户信息隐私泄露成因分析和保护对策
大数据安全与隐私保护的必要性及措施
社交网络中的隐私关注及隐私保护研究综述
谈云计算与信息资源共享管理
褪色的“共享”
大数据时代的隐私保护关键技术研究
挂羊头卖狗肉的“共享”营销
图书馆与出版企业数字资源共享的环境因素分析