游聪 王利朋 潘常春 贾志娟 姜均茗 吕薇
摘 要: 数据作为21世纪最重要的资源财富,能为人们创造巨大的商业价值,而数据共享能使收益最大化。针对数据共享存在的隐私泄露、第三方信任危机、数据确权等问题,提出一种基于区块链场景的数据安全管理系统。利用区块链共识协议实现去中心化的数据共享,隐私安全是数据共享的关键,采用签密和基于LWE的BGN加密方案解决隐私泄露问题,采用区块链的不可篡改特性解决数据确权问题。最终实现了机密性、完整性、访问控制、数据确权等安全服务,增强了系统性能。
关键词: 区块链; 数据共享; 隐私保护; BGN加密
中图分类号:TP311.13 文献标识码:A 文章编号:1006-8228(2022)04-34-04
Blockchain-based data security management system
You Cong Wang Lipeng Pan Changchun Jia Zhijuan Jiang Junming Lv Wei
(1. School of Information Science and Technology, Zhengzhou Normal University, Zhengzhou, Henan 450044, China;
2. School of Information Science and Technology, Peking University;
3. School of Mathematics and Computer Science, Guangxi Science & Technology Normal University)
Abstract: As the most important resource and wealth in the 21st century, data can create huge commercial value for people, and data sharing can maximize the benefits. Aiming at the problems of privacy leakage, third-party trust crisis, and data confirmation in data sharing, a data security management system based on blockchain scenarios is proposed. The blockchain consensus protocol is used to achieve decentralized data sharing; the signcryption and LWE-based BGN encryption scheme are used to solve the problem of privacy leakage, and the non-tamperable feature of the blockchain is used to solve the problem of data right confirmation. Finally, security services such as confidentiality, integrity, access control, and data authorization are realized, which enhances the system performance.
Key words: blockchain; data sharing; privacy protection; BGN encryption
0 引言
近些年來科技技术不断创新,大数据、云计算等技术愈发成熟,人类生活进入了大信息时代,数据已成为21世纪最重要的资源财富。为实现收益的最大化,进行数据共享是当今时代的形势所趋。在这个时代背景下,各行各业却普遍存在着“人人有数据,人人缺数据”的情况。例如在政府部门中,我国各地方政府部门之间在数据的使用中存在各自为政、信息孤岛[1]等问题,老百姓办理业务需要进行繁多且没有必要的流程,数据资源的不共享,为政务服务制造了麻烦;在医疗行业中,患者的病历信息价值极高,但随着医疗数据的碎片化越来越严重,散在“孤岛”中的病历数据价值不能利用到极致,数据共享整合患者碎片化信息,医院、诊所根据关键数据设计出更优的治疗方案。如何有效地实现数据的安全共享,是目前的热点和难点。
本文利用区块链的去中心化、去信任化、可溯源、不可篡改性等特性,针对数据安全共享系统进行了研究和设计,将数据共享与区块链结合,能够防止数据被恶意篡改,可以有效解决目前数据共享方案存在的因数据集中化管理而导致的单点故障问题,也可以解决数据的确权问题。
1 相关工作
为了最大化地利用数据价值,让隐私问题得以解决,已有大量学者对数据共享做了深入研究,基于区块链的数据共享掀起了热浪。蔡楚君等人[2]通过区块链技术和可逆哈希函数以及EIGama[3]算法的结合,解决了患者隐私数据的安全问题,同时使用智能合约保障了数据提供方的访问控制权,最终方案同时满足了五维一体的安全性能,且具备了更低的计算开销。王冠等人[4]设计了一个基于区块链的业务协同数据安全共享方案,该方案引入了IPFS技术,解决了因大量数据存放在区块链而导致的共识效率低、交易时间长等问题,并且设计了授权令牌Token用于实现数据拥有者对数据使用方的访问权限,但因加入了数据提供者这一存放材料的部门而违背了去中心化的初衷,不适用于数据共享场景。王甜宇等人[5]基于区块链技术设计了一种中医药大数据云存储共享方案,分析了区块链与云计算等技术对当前电子医疗系统的推进,探讨了非对称加密技术在云服务器中的重要性,为中医药大数据安全共享提供了新的思路,但整个方案里没有解决用户的数据确权问题,数据的相关权力不明确,会为日后的数据共享责任追溯带来不便。李健思等人[6]运用区块链、人工智能和安全沙盒等技术了改进了数据共享的模式。李克等人[7]分析了传统电子数据在进行共享时所面临的难题,基于区块链技术构建了一个电子数据共享平台的策略,为共享平台的发展提供了一个参考方向。康彦博等人[8]基于区块链的数据安全技术研究了一个数据共享平台,由于该平台是分布式架构,不会出现单点故障问题而影响系统的稳定性。在数据共享过程中,交易都是在数据提供者节点处执行,数据提供者可全程监控数据的使用情况,拥有绝对的掌握权,有选择地授予不同用户的不同权限,最大程度保障了数据的安全。620CFF32-2306-41A0-82D4-7A00E54E8846
本文以数据安全为研究内容,以设计安全、高效、可追溯、透明的共享机制为主题,以区块链基本框架和技术特性为根基,系统研究出一个数据安全管理系统。为了实现数据的机密性和完整性,采用文献[9]提出的基于椭圆曲线的签密算法,该签密算法可以在一个逻辑步骤中既实现加密、解密操作,又可以实现签名操作[10]。针对访问控制问题,结合智能合约以及密码学技术,使哈希值成为唯一标识符,用户可随时授予或解除使用权,实现权限控制。针对如何实现对加密字段进行数据检索功能的问题,采用文献[11]提出的基于LWE的BGN 加密方案实现数据检索,该方案允许所有解密者共同破解一个密文,但又不会暴露明文的任何关键信息,同时能对密钥泄露攻击做出有效回应。并将该方法适配到数据共享场景中,以实现对加密关键字段执行数据检索操作。
2 背景知识
2.1 区块链
区块链[12-13]是一种新型的信息安全保障技术(结构如图1所示),具有不可篡改、去信任、可信溯源等优良特,因此能够构建一个无需第三方媒介的可信任环境。区块链本质是一个数据库,实质上是一个分布式共享数字账本,允许用户使用P2P协议进行通信交易和数据交换。由于共识机制,每进行一个交易,区块链网络上的节点都会同时更新记录,以此来维护一个公共账本。与此同时,公共账本能够保证所有的数据是公开透明且不容修改的。正如前面所述,区块链里的每个节点都能记录当前的交易,也就是说任意一个节点都能作为中心节点(即去中心化),只要节点够多,即使某个节点被攻破,也丝毫不影响整个系统的安全性,因此可以有效避免因中心节点崩溃而带来的风险,同时也能解决因数据集中化管理而导致的单点故障问题。2008年11月中本聪首次提出了比特币的概念,成为区块链第一个成功应用的数字加密货币,截止到2021年8月,市值已达到8945亿美元。比特币的成功让人们发现了区块链技术带来的巨大商业价值,目前,区块链技术应用于金融、医疗、房地产、汽车、选举、物流等多个领域。
2.2 智能合约
1995年美国著名密码学家尼克萨博(Nick Szabo)首次提出了智能合约模型。智能合约是由用户指定的计算机程序[14],能够以一种数字化的方式来自动执行或验证协议内容。简单来说,这个程序包含了负责控制合约行为的代码,以及记录数字资源、交易的虚拟账户,结构如图2所示。首先,代码就像是一份协议,是事先编写好的,智能合约根据数据信息来运行并判断。当交易达到预先设置的条件时,程序将立即自动执行协议内容,随后在账户记录参与方的资产变动。可惜的是,因缺乏可适配的环境以及平台,智能合约被提出后,并没有得到广泛的应用。区块链技术的出现打破了这一僵局,区块链的安全特性为智能合约提供了可信任的运行环境。有区块链技术加持的智能合约与传统合约相比,在安全上,基于区块链不可篡改的特点,合约公开透明、不可修改;在语义上,智能合约是用严谨的逻辑代码编写而成,不会因语义有歧义而导致赖皮行为产生;在效率上,基于区块链去信任化特点,智能合约在链上有着绝对权威,交易不会因第三方恶意捣乱而终止,提高了执行效率。
3 数据安全管理系统
3.1 系统架构
本系统总共分为三个层次,从上至下分别为页面层、应用层、区块链层,架构如图3所示。
3.1.1 页面层
页面层主要包含用户管理、交易管理、权限管理等三个模块。
⑴ 用户管理模块负责实现用户的注册和登陆功能,当用户注册时,其相关信息会打包到权限管理模块,新用户的注册需要拥有更高权限的老用户审核,审核通过后才能进行登陆,此后才能使用交易管理和权限管理模块。
⑵ 交易管理模块允许用户进行交易和數据检索功能,数据共享过程中,用户在此模块进行数据检索,找到数据提供方的相关信息,通过线上或者线下的方式获得其信任,使用模块的通信交流功能获取密钥,调用接口对数据进行加密、解密。
⑶ 权限管理模块负责审核用户的加入和管理用户数据的使用权、归属权、访问控制权。数据提供方拥有访问控制权,能授予或解除使用方的使用权。此外,为防止高权限用户恶意操作,增强系统安全性,审核通过后,在审核方界面会生成注册记录以及审核人员的签名,这些信息都会上传至区块链上,以便后续的责任追溯。
3.1.2 应用层
应用层主要有智能合约和数据同步两个模块。
⑴ 智能合约模块作为用户和系统之间的桥梁,负责管理区块链上所有的智能合约,当用户进行数据共享时,此模块负责调用相应的合约执行交易。
⑵ 数据同步模块,顾名思义,即同步当前时间段所有区块链节点的数据。当部分节点因宕机而数据丢失时,此模块根据当前多数节点数据进行数据同步,确保区块链上的节点数据保持一致。
3.1.3 区块链层
区块链层是整个数据管理系统的核心所在。区块链作为去中心化的数据库,负责存储所有用户的信息、交易记录、元数据、哈希值以及明确权力。大量数据存储在区块链,会降低其交易效率以及使用性,为了解决这一难题,本文引入了IPFS(InterPlanetary File System)技术[15],IPFS是一种P2P分布式文件管理系统,具有去中心化、去依赖性、永久性等特点。本文用来保存提供方的大型数据,小型数据保存在区块链。
3.2 系统运行流程
本文以共享医院之间的电子病历为例,详细介绍了方案具体的运行流程,如图4所示。
本文的基于区块链的数据安全管理系统具体步骤如下。
⑴ 多密钥分发中心KGC进行初始化操作,生成系统主密钥信息,为参与方认证节点并生成公私钥信息。
⑵ 提供方登录系统之后,在交易模块提取电子病历中的关键字段(如患者身份证信息),并调用接口对其进行基于LWB的BGN同态加密,对其他信息(完整数据)进行签密,形成密文,随后触发智能合约。620CFF32-2306-41A0-82D4-7A00E54E8846
⑶ 智能合约将签密密文存储到IPFS系统中,用于后续使用方的提取。
⑷ IPFS系统接收签密密文后,通过哈希算法计算并返回一个哈希值。
⑸ 智能合约将同态加密后的元数据、提供方信息发送到区块链数据库中,加密后的字段作为索引,后续使用方用于数据检索。
⑹ 区块链存储完毕后,返回结果给智能合约。
⑺ 智能合约执行程序,将哈希值和存储结果打包发送给提供方。
⑻ 使用方登录系统后在交易模块调用接口,向服务器发送请求,在区块链数据库用已有的关键字段解密并进行信息查询。
⑼ 区块链数据库找到对应的完整数据拥有者,将信息发送给使用方。
⑽ 双方进行身份验证,建立信任关系。
⑾ 为防止密钥被窃取,提供方利用使用方的公钥对密钥进行加密,打包发送给使用方,并把数据使用权授予给使用方。
⑿ 提供方用私钥解密获取密钥,在IPFS系统解密提供方存储的电子病历信息。
⒀ IPFS系统将电子病历信息返回给使用方。
⒁ 当使用方从IPFS系统提取电子病历时,IPFS系统会向区块链写入使用方的调取记录,提供方可通过这些记录查询电子病历是否被合法使用,以此来进行责任的追溯。
4 结束语
本文以数据安全为研究内容,以设计安全、高效、可追溯、透明的共享机制为主题,以区块链基本框架和技术特性为根基,系统研究出一个数据安全管理系统。利用区块链技术为系统构建出一个可信任环境,将交易记录保存在链上,解决了数据确权问题;结合智能合约以及密码学,使哈希值成为提供方唯一标识物,可随时授予或解除使用方的使用权,实现访问控制。
参考文献(References):
[1] 翟瑞霞.大数据背景下政务信息资共享问题研究[J].智库时代,2019(42):11,13
[2] 蔡楚君,柳毅.基于以太坊平台的医疗数据安全共享方案[J/OL].计算机应用研究:1-8[2021-09-22].https://doi.org/10.19734/j.issn.1001-3695.2021.07.0240.
[3] ElGamal T. A public key crypto-system and a signaturescheme based on discrete logarithms[J].IEEE transactions on information theory,1985,31(4):469-472
[4] 王冠,丁浩.基于区块链的业务协同数据安全共享方案[J].信息安全研究,2021(7):606-614
[5] 王甜宇,张柯欣,孙艳秋,燕燕.基于区块链的中医药大数据云存储共享方案研究[J/OL].中华中医药学刊:1-7[2021-10-08].http://kns.cnki.net/kcms/detail/21.1546.r.20210910.1641.068.html.
[6] 李健思,杨冰冰,范俐娟,等.基于区块链和AI技术的健康数据管理与技术应用[J].中国公共卫生,2021,37(8):1305-1309
[7] 李克.基于区块链的电子数据共享平台建设研究[J].中小企业管理与科技(上旬刊),2021(10):119-121
[8] 康彦博.基于区块链的数据安全关键技术研究[D].电子科技大学,2020
[9] 崔文军,贾志娟,胡明生,等.基于椭圆曲线的签密方案[J].计算机应用与软件,2020,37(3):304-309
[10] Zheng YL. Digital signcryption or how to achieve cost(signature & encryption)?cost (signature)+cost (encryption). Inter-national Cryptology Conference,1997:165-179
[11] 李菊雁,马春光,袁琪.一种基于LWE的BGN加密及门限加密方案[J].电子科技大学学报,2018,47(1):95-98,111
[12] 邵奇峰,金澈清,张召,等.区块链技术:架构及进展[J].计算机学报,2018,41(5):969-988
[13] 曹傧,林亮,李云,等.区块链研究综述[J].重庆邮电大学学报(自然科学版),2020,32(1):1-14
[14] 刘德林.区块链智能合约技术在金融领域的研发应用现状、问题及建议[J].海南金融,2016(10):27-31
[15] 王纪樟.基于区块链+IPFS的數据共享平台实现[D].浙江工商大学,2018620CFF32-2306-41A0-82D4-7A00E54E8846