基于区块链的电子健康记录隐私保护研究

2021-04-05 09:13刘新宇
现代信息科技 2021年17期
关键词:隐私保护区块链

摘  要:随着电子信息化的普及,电子健康记录管理过程涉及的个人隐私问题显得格外突出。针对医疗领域存在的隐私保护问题和医疗信息记录的存储问题,分析了区块链技术如何处理该问题的方法,对区块链的结构和内部处理方式进行了研究,并给出了基于区块链的电子健康记录隐私保护设计方案。该方案具有较强的可实施性,对个人电子病例的隐私信息具有保护作用。

关键词:电子健康记录;区块链;隐私保护;医疗信息

中图分类号:TP311  文献标识码:A 文章编号:2096-4706(2021)17-0169-04

Abstract: With the popularization of electronic informatization, the personal privacy involved in the process of electronic health record management is particularly prominent. Aiming at the problems of privacy protection and storage of medical information records in the medical field, this paper analyzes the methods of how blockchain technology deals with this problem, studies the structure and internal processing methods of blockchain, and gives the design scheme of privacy protection of electronic health records based on blockchain. The scheme has strong enforceability and can protect the privacy information of personal electronic cases.

Keywords: electronic health record; blockchain; privacy protection; medical information

0  引  言

醫疗云数据泄露事件层出不穷,引发了医疗云存储的信任危机,对医疗数据的保护造成了严重不利的影响。2018年5月22日《巴尔的摩太阳报(Baltimore Sun)》刊登的一则报道:美国医疗公司LifeBridge Health受到恶意软件的攻击,可能导致患者的私人信息暴露超过一年的时间。

区块链技术由于具有去中心化永久记录和便于审计等特点,可用于满足隐私数据的完整性、可限制性以及可审计性等数据安全需求,因此可以作为隐私保护问题的有效解决方案[1]。

没有健全完善的医疗隐私保护相关法律制度规范;患者未参与到电子健康档案[2]的访问控制策略中,不能实现个性化隐私保护;医疗健康数据去隐私化面临广泛多样攻击,无法对数字签名电子健康档案实现数据溯源;大数据知识挖掘存在预测和泄漏潜在隐私信息的风险。

云技术在电子医疗应用方面的高速发展给用户带来了巨大的便利。为有效管理和利用海量的电子病历数据,医疗机构将耗费巨大的人力、物力以及财力。虽然云计算与云存储的出现在一定程度上为医疗机构带来了很大便利,但其仍然面临着海量的数据存储、数据隐私安全以及数据共享问题,因此设计一种安全高效的数据检索方案[3]一直是国内外学者研究的热点。

基于机器学习的数据挖掘和隐私发现等新型攻击手段出现,也使得传统的防御、检测等安全控制措施暴露出严重不足[4,5]。区块链技术作为比特币的底层技术在金融和其他商业领域应用已日趋成熟,同时在医疗领域也具有较大的应用潜力,有助于推动医疗体系变革,医疗数据的安全共享和协作[6]。

信息记录存储的安全和隐私保护问题在医疗信息系统显得格外突出,梅颖结合区块链和云存储技术,提出了一个医疗记录安全存储方案即健康链[7]。

针对区块链保护隐私数据,祝等人[8]提出了分层保护区块链中的隐私问题。在数据加密搜索上,PKES(Public Key Encryption with Keyword Search)[9-11]方案仅仅支持关键字密文的相等查询。Park等人[12]提出了支持关键字逻辑与查询的公钥加密概念(Public Key Encryption with Conjunctive Keyword Search, PECK),并给出了相应的构造。Boneh和Waters[13]扩展了PKES的概念,提出了可搜索公钥加密(Searchable Public Key Encryption)以支持关键字的逻辑与、子集、范围比较等查询。作为后续工作,Hwang等人[14]和Zhang等人[15]提出了更为高效的PECK方案。所有上述的方案都无法支持关键字的逻辑或查询。Katz等人[16]提出了内积谓词加密(Inner-Product Predicate Encryption, IPE)的概念,并注意到内积谓词加密可以用来构造支持复杂逻辑表达的可搜索公钥加密,也即支持任意可用单调布尔逻辑表达式(包含任意多个逻辑与和逻辑或)表示的查询。但也很难解决在云计算环境下,可支持隐私保护、支持复杂逻辑表达的有效可搜索加密方案。

依托云服务器在电子医疗环境中对个人健康记录的使用情况,提出一种基于属性代理重加密技术与容错机制相结合的多关键字检索方案[17]。针对个人隐私保护问题,Swan等人[18]在应用领域方面,针对个人隐私问题的严重性,认为个人健康隐私数据不受侵犯的机制可以通过区块链技术来保护,但是却不能给出应用场景实现细节来解决对于个人隐私保护问题。而利用区块链技术文献[19,20]实现了保护个人隐私数据。Liang等人[21]在移动医疗应用程序中集成区块链技术实现了数据共享和协作。

为了解决区块链效率问题,一种采用轻量级的医疗区块链架构,如LEILA ISMAIL[22]等人提出了通过将网络参与者划分成集群并为每个成员维护一份分类账本来建立共享网络。

1  区块链相关结构

1.1  区块链结构

由于区块链具有防止篡改的特性,因而通过区块链来存取敏感数据如医疗数据等。在区块链中,数据以区块的方式永久存储,具体结构如图1所示。

区块链的时间戳解决了区块的排序问题,新区块生成时便记录着上一个区块通过哈希计算得到的哈希值,实现了区块密码学链接。所有的信息的创建过程都可以通过区块来表达。区块头和区块体组成了区块,以比特币为例,区块头部分记录了版本号、前一个区块的哈希值、默克尔树的根值、时间戳、目标特征值和随机数值;所有发生在区块创建过程中进行的数据的交易信息并经过信息验证构成了区块体部分。区块主标识符是它的加密哈希值,即一个通过SHA256算法对区块进行两次哈希计算得到的数字指纹,产生的32字节哈希值被称为“头哈希”。第二种识别区块的方式是按照该区块在区块链中的位置,即“块高度”,如第一个区块,其块高度为0。

1.2  默克尔树结构

默克尔树的计算过程如图2所示,交易按次序逐对计算,不足部分则自己和自己计算,最终结果称为默克尔树根(Merkle root)。其中sha256d( )指的是两次调用sha256( )函数,即sha256(sha256())。Sha256会把任意长度的字符串变成32Byte(256bit)的哈希值。Block中第一个交易(TA)是挖矿奖励,矿工给自己充值。

2  基于区块链的电子健康记录隐私保护设计方案

电子健康记录隐私保护方案,此方案基于区块链技术来实现,具体设计过程如图3所示。方案的设计过程包括四大部分:电子病例源的形成、电子健康记录的分类提取、电子健康记录的存储和区块链存储保护电子健康记录。

2.1  电子病例源的形成

病人通过自己的手机授权网络设备,此时传感器设备采用感知的方式获取病人的用户认证信息或者直接授权电子设备识别获取个人用户认证信息;另外病人经过医院各种包含CT、核磁共振、B超、化验等检查结果记录,医生诊疗的病例,住院记录等形成的医疗信息。这些信息构成了医疗电子记录的来源。

2.2  电子健康记录的分类提取

对各种途径获取的医疗电子记录按照表征进行分类,提取其临床表现、病原起因、常见病的基本特性等各类特征,然后采用分类器进行特征化并应用数值处理得到特征值,建立被分类样本。

2.3  电子健康记录的存储

下载开源库(http://archive.ics.uci.edu/ml/datasets.php? format =&task=&att=&area =&numAtt = &numIns =&type = &sort = nameUp&view = table 网站和http:/ /people.Dbmi.columbia.edu/ ~friedma/Projects/DiseaseSymptomKB/index.html网站中的公开医疗数据集)集合的各类病例作为源样本集,提取出有效的敏感信息或参数值作为特征值,对被分类样本应用深度学习方式进行分类,存储在深度学习服务器中,针对个人健康电子记录中敏感信息进行特殊处理,并将其安全转存到电子健康记录服务器中。

2.4  区块链存储保护电子健康记录

对于存储在电子健康记录服务器中的病例,提取出时间戳、构造梅克尔树、获取病人ID等信息,构造成区块。利用区块链技术将区块链接起来,对其去中心化处理,进而保护个人隐私。对于医院不能轻易公开电子病例记录相关数据和分享其数据给其他医院和个人。因此,不会泄露病人的用户信息,从而实现了电子健康病例的隐私保护。

病人所携带信息如图4所示,包括用户认证信息,健康状态,既往疾病,生活行为表征,年龄,前期诊断信息。其中用户认证信息为私有信息,包括用户ID,姓名,照片、家庭住址、家属等信息。分析医疗数据个人隐私存在的形式。虽然无用户姓名、身份证号等具体敏感信息,但通常以用户的特征以及相应特征概率的格式存在。例如:Id (包括passportId,cookies,IMEI等),gender:概率,age:概率,各种爱好(如电影:概率,看书:概率,运动:概率),住址(精确到小区):概率。

3  结  论

本文给出了区块链的基本结构,分析了区块链技术应用于电子健康记录隐私保护方面的可行性,并给出了具体的设计方案。

目前,由于区块链处理速度较慢、各大医院的设备条件限制并缺乏相关专业技术人员,此方面的应用还有较大难度。因而,需要建立大型统一标准化的处理框架,提供给用户可操作性强的友好界面,并加快处理速度提高体验感,才能真正应用到医疗平台上。

参考文献:

[1] 章宁,钟珊.基于区块链的个人隐私保护机制 [J].计算机应用,2017,37(10):2787-2793.

[2] 黃永刚.基于区块链技术的电子健康档案安全建设 [J].中华医学图书情报杂志,2016,25(10):38-40+46.

[3] 刘新宇,李浪,肖斌斌.基于属性代理重加密技术与可容错机制相结合的数据检索方案 [J].计算机科学,2018,45(7):162-166+196.

[4] 刘新宇,翁健,张悦,等.基于APK签名信息反馈的Android恶意应用检测 [J].通信学报,2017,38(5):190-198.

[5] 全国信息安全标准化技术委员会.大数据安全标准化白皮书 [R/OL].(2017-04-08)http://www.cac.gov.cn/wxb_pdf/5583944.pdf.

[6] 赵延红,原宝华,梁军.区块链技术在医疗领域中的应用探讨 [J].中国医学教育技术,2018,32(1):1-7.

[7] 梅颖.安全存储医疗记录的区块链方法研究 [J].江西师范大学学报(自然科学版),2017,41(5):484-490.

[8] 祝烈煌,高峰,沈蒙,等.区块链隐私保护研究综述 [J].计算机研究与发展,2017,54(10):2170-2186.

[9] BELLARE M,BOLDYREVA A,NEILL A O. Deterministic and efficiently searchable encryption [C]//CRYPTO 2007:Advances in Cryptology-CRYPTO 2007.Santa Barbara:Springer,2007:535-552.

[10] CRESCENZO G D,SARASWAT V. Public key encryption with searchable keywords based on jacobi symbols [C]//INDOCRYPT 2007:Progress in Cryptology-INDOCRYPT 2007.Chennai:Springer,2007:282-296.

[11] KHADER D. Public key encryption with keyword search based on k-resilient ibe [C]//ICCSA 2007:Computational Science and Its Applications-ICCSA 2007.Malaysia:Springer,2007:1086-1095.

[12] PARK D J,KIM K,LEE P J. Public key encryption with conjunctive field keyword search [C]//WISA 2004:Information Security Applications.Jeju Island:Springer,2004:73-86.

[13] BONEH D,WATERS B. Conjunctive,subset,and range queries on encrypted data. TCC 2007:Theory of Cryptography.Amsterdam:Springer,2007:535-554.

[14] HWANG Y H,LEE P J. Public key encryption with conjunctive keyword search and itsextension to a multi-user system [C]//Pairing 2007:Pairing-Based Cryptography-Pairing 2007.Tokyo:Springer,2007:2-22.

[15] DING M Z,GAO F,JIN Z P,et al. An efficient Public Key Encryption with Conjunctive Keyword Search scheme based on pairings [C]//2012 3rd IEEE International Conference on Network Infrastructure and Digital Content.Beijing:IEEE,2012:526-530.

[16] KATZ J,SAHAI A,WATERS B. Predicate encryption supporting disjunctions,polynomial equations,and inner products [J].Journal of Cryptology,2013,26:191-224.

[17] AU M H,TSANG P P,SUSILO W,et al. Dynamic universal accumulators for DDH groups and their application to attribute-based anonymous credential systems [C]//CT-RSA 2009:Topics in Cryptology-CT-RSA 2009.San Francisco:Springer,2009:295-308.

[18] SWANM M. Block chain thinking:the brain aside centralize dautonomous corporation [commentary] [J].IEEET echnology&Society Magazine,2015,34(4):41-52.

[19] ZYSKIND G,NATHAN O,PENTLAND A S. Decentralizing Privacy:Using Blockchain to Protect Personal Data [C]//Proceedings of the 2015 IEEE Security and Privacy Workshops.Washington DC:IEEE Computer Society,2015:180-184.

[20] MASLUK A,GOFMAN M. Protecting Personal Data with Blockchain Technology [J].Information Technology-New Generations,2018,738:119-125.

[21] LIANG X P,ZHAO J,SHETTY S,et al. Integrating blockchain for data sharing and collaboration in mobile healthcare applications [C]//2017 IEEE 28th Annual International Symposium on Personal,Indoor,and Mobile Radio Communications(PIMRC).Montreal:IEEE,2017:1-5.

[22] ISMAIL L,MATERWALA H,ZEADALLY S. Lightweight Blockchain for Healthcare [J].IEEE Access,2019,7:149935-149951.

作者簡介:刘新宇(1990—),男,汉族,湖南衡东人,助教,硕士,主要研究方向:区块链应用与公钥密码学。

猜你喜欢
隐私保护区块链
基于层次和节点功率控制的源位置隐私保护策略研究
关联规则隐藏算法综述
大数据环境下用户信息隐私泄露成因分析和保护对策
大数据安全与隐私保护的必要性及措施
保险企业的区块链技术应用方向选择研究
区块链技术在金融领域的应用与前景研究
区块链技术的应用价值分析
“区块链”的苟且、诗和远方
社交网络中的隐私关注及隐私保护研究综述
基于区块链技术的数字货币与传统货币辨析