邓文丽,方 欢,2
(1.安徽理工大学 数学与大数据学院,安徽 淮南 232001;2.安徽省煤矿安全大数据分析与预警技术工程实验室,安徽 淮南232001)
区块链[1],顾名思义,是一种数据以区块为单位进行生产和存储,并按照时间顺序首尾相连形成链式结构,具有去中心化、不可篡改、可溯源、多方共同维护等特点的分布式数据库[2-].它主要通过对等计算机网络存储资产和交易的注册表,并充当所有权和交易的公共注册表,由密码学[5]保护并由共识机制管理,以验证交易并确保交易的合法性.目前区块链的应用场景主要有:金融、物联网和物流、公共管理、保险、能源、交通、医疗等领域.
区块链有两种类型:状态区块链与无状态区块链[6],状态区块链中的每个节点根据历史区块建立状态信息,并利用状态信息来验证交易的合法性[7].如图1所示,当新区块产生后,根据区块中的具体交易,对状态进行实时更新.
图1 状态区块链系统结构
状态区块链的优点在于,用户不需要保存任何状态就可以发起交易.然而,状态区块链存在一些缺陷:
1)存储冗余度高:由于区块链需要保存所有的状态数据,而且系统状态信息会随着新区块的产生而不断更新[8],随着产生的数据量越来越大,区块体存储的数据就越多,从而导致存储设备成本增加.
2)处理速度慢:由于交易要求区块链上所有节点参与,且节点之间还需要经过网络的加密传输,这就使得交易的速度非常慢.
3)易出故障:由于区块链的交易需要链上所有节点的参与,任意一个节点出现故障,都会影响交易的进行.
与状态区块链不同的是,无状态区块链只保存状态的简要信息,而所有的状态信息都保存在健康数据库中,每当需要具体数据信息时,只需调用健康数据库中的数据即可.它是通过减少节点的状态数据存储量对节点进行压缩来减少存储负载[9]的.如图2所示,每个区块头包含当前状态的摘要信息,每个节点只保存历史区块头,并根据用户提交的有效性证明对交易进行验证.
图2 无状态区块链系统结构
无状态区块链存在的问题有:
1)无状态区块链虽然解决了节点存储率低的问题,使得配置较低的节点能够运行完整的验证节点.但由于信息更新慢,无法适用于吞吐率高的环境下.
2)现有的文献对无状态区块链的研究仅停留在对无状态区块链的性能改进层面,未对其应用在具体的案例上进行分析.
随着电子健康记录、电子病历、可穿戴设备、传感器和医疗物联网数量的不断增加,健康数据正以指数的速度增长.为了有效地记录、跟踪和管理大量健康数据,挖掘海量健康数据背后的价值,为个人、医疗机构和公共政府提供有价值的信息,Dodd在1997提出了健康数据库(Health Data Bank,HDB)的概念,HDB不承担健康数据的“所有权”,并在委托代理模式下运营健康数据,即被视为一种健康数据服务机构,其目标是提供精准医学服务和个人医疗保健管理服务(包括预防性干预和临床干预)[10],如图3所示.
图3 HDB概念模型
HDB由数据集成、知识发现、专家知识等模块组成,通过收集大量的个人健康数据,生成标准的医学知识数据.其中,医学知识数据库由新知识和专家知识组成.新知识是指科学知识,是在数据挖掘、知识发现和知识提炼中通过应用大数据分析技术从个人健康数据中生成的.专家知识是指医学专家的临床经验,如完整的患者治疗过程记录和有效的临床指南.HDB可以分析和更新数据库里的基本信息、健康指数、健康日记和遗传病史.根据个人和机构的需要,检索医学知识数据包,为他们提供有价值的信息.此外,HDB可以在医疗机构之间共享专业的医学知识,从而增加提供精准医疗保健服务的能力,例如准确的风险预测,疾病的精确诊断,疾病的准确分类,药物的精确应用以及疗效的准确评估.
然而,HDB虽然可以有效的管理健康数据,但无法避免数据被攻击的风险,即,健康数据的隐私保护和互操作性无法得到保证;数据生产者、使用者、管理者、受益人的个人产权无法得到确定.针对此问题,文献[10]利用区块链的分布式账本技术、密码算法、智能合约、共识机制等特性与HDB相结合从而保证数据的隐私泄露问题,然而由于区块链存储量高,吞吐率低等缺陷,无法保存与日俱增的海量数据成了研究难题.
针对无状态区块链的缺点,本文采用文献[9]的方法利用RSA累加器的思想,将无状态区块链与HDB相结合,可以有效解决区块链信息更新慢、存储成本高、吞吐量低以及无状态条件下智能合约验证执行问题.并将无状态区块链应用在医疗保健上通过实际案例采用DMN模型形式化对无状态区块链的落地进行分析,以期对日后相关研究人员运用无状态区块链技术提供一定的参考.
无状态区块链技术可以提供一种有效的范式来解决健康数据管理和隐私保护等问题,为医疗领域解决数据存储问题带来了曙光.无状态区块链在医疗领域的优势如下.
1)哈希算法加密技术[11]为医疗数据保驾护航
哈希算法是现代密码学的一个重要组成部分.通过哈希算法,可以将任意长度的原始数据转换成一个固定长度的二进制数据[8].只要有节点恶意篡改,哈希值就会发生变化,即使攻击者能控制系统中51%以上的节点,但其付出的代价是远高于收益的,这对攻击者来说并不明智.因此区块链的数据稳定性和可靠性极高[12].
2)基于RSA累加器的合约有效性证明技术保证医疗数据可追溯
与传统区块链的智能合约不同,无状态区块链只存储各合约的有效证明,不存储智能合约的所有状态数据,即只存储智能合约的状态数据的摘要,并利用RSA累加器的思想,即将有限集合累加为一个简洁的值.对于每个元素,都能够有效地计算出其证据,来证明元素[4].完成各智能合约摘要的累加与合约有效性证明的创建,从而降低系统及系统中单个节点的存储量.此外,无状态区块链将区块共识与区块执行分离,共识节点不再需要保存区块数据而只需保存合约累加值及合约有效性证明,有效降低磁盘和内存的负担[2].因此,只需要将HBD相对应的hash摘要信息存储在无状态区块链中,并利用可验证计算技术检测和监视调用HDB数据的过程,以确保数据可追溯并提高系统吞吐量.
3)非对称加密算法[13]为医疗数据验证身份信息
非对称加密算法是一种通过密钥加密保护信息的一种方法.非对称加密算法包括两个密钥:公开密钥(简称公钥)和私有密钥(简称私钥).公钥和私钥无法相互逆推,公钥用于加密数据,私钥用于解密数据.区块链中的任何节点都可以获取公钥,而私钥则必须由用户私密保存.利用非对称加密算法的公私密钥对[5],可以保障HDB信息的安全性和验证信息发送者的身份.
本节通过中山大学附属肿瘤医院就医案例并结合图4系统模型和图5DMN模型进行阐述无状态区块链在医疗领域的具体应用.
图4 系统模型
图5 DMN模型
首先,患者在网上填写个人信息、病情严重情况并预约就诊时间,后台将患者的医疗数据保存到健康数据库中同时将患者个人筛选存入无状态区块链节点中生成区块,并利用无状态区块链的有效性证明对信息进行验证;然后,患者携带病例等资料去医院就医,医生根据查看患者本人状况,并申请查看病人之前网上记录的就医信息对病人做出诊断.
在医生申请查看网上病人信息阶段,首先要经过无状态区块链的身份验证,核实身份后再调用健康数据库相关具体信息,在将数据传送给医生之前,对数据进行加密、合约有效性证明技术等技术,防止攻击者获取病人信息;最后再将处理后的信息发送给医生并时刻监控数据流向,以防止数据被滥用.
为了更清楚地阐述无状态区块链在医疗领域的落地,本文借助决策模型(DMN)来描述无状态区块链在医疗领域应用的好处.
决策模型(DMN)的好处是为分析人员提供一种工具,用于将业务决策逻辑与业务流程分离,降低业务流程模型的复杂性,允许业务流程或业务规则在不相互影响的情况下进行更改[14].DMN模型由两个部分组成:1)决策需求图(DRD);2)决策逻辑表[15].本文利用DRD可视化决策图对图4的具体流程进行展示,如图5所示.
由于现有区块链存储能力低,无法存储大量数据,本文提出了无状态区块链的概念,通过利用无状态区块链减少节点的状态数据存储量和合约有效性证明等特点将无状态区块链与HDB相集成解决存储量高和数据隐私保护等问题,并研究了无状态区块链在医疗保健的应用,为相关人员研究区块链在医疗上的应用提供一种思路.无状态区块链设计虽然减少了节点执行交易验证的存储负担,但由于在每个交易有效负载中添加了成员资格证明,因此增加了网络通信,加上现有相关人员关于无状态区块链在医疗保健中的研究较少,缺乏相关技术支持,未来对基于HDB的无状态区块链的进一步研究将需要考虑区块链应用的潜在技术的挑战.