盲量子计算为核心的医疗隐私数据共享模型设计*

2023-10-23 02:58武丽娟
计算机时代 2023年10期
关键词:科学计算砖墙量子

魏 晋,降 惠,武丽娟

(长治医学院计算机教学部,山西 长治 046000)

0 引言

利用计算机技术、大数据技术对医疗数据进行挖掘与分析,发现医疗数据之间的潜在联系及规律,是临床诊断、精准医疗、疾病防控决策等领域进行科学研究的重要前提[1]。在这样的背景下,人们对于医疗隐私数据的共享就提出了更高的要求。

当前,医疗数据大多处于“云”模式架构,数据在存储、传输与科学计算等过程中存在被篡改、截取和泄露等较大风险,而且医疗数据具有较强的隐私性,在“云”模式架构下,要实现数据共享,就必须研究满足其需求的具体方案。近年来研究者已提出多种方案,其中以区块链技术为核心的数据共享方案较多[2-6],还有利用数据加密技术、用户访问控制等技术提出的共享方案[7-10]。在这些方案中,利用量子技术构建数据共享模型,实现医疗隐私数据共享的相关研究文献非常少。因此,本文提出一个以通用盲量子计算协议为核心、实现对医疗隐私数据进行科学计算共享服务的模型方案,旨在为医疗隐私数据的共享提供一种新的解决思路。

1 制约医疗隐私数据共享的主要因素

对医疗数据进行整理、统计、挖掘与分析等科学计算,是在大数据技术背景下对医疗数据进行应用的一个重要内容[11]。当前,由于各个医疗机构的网络资源有限,所以要完成大数据量的科学计算,就会上传数据到第三方网络计算服务器。而在数据传输、科学计算、算法执行等多个环节都存在数据泄露与被篡改的风险。这成为制约医疗隐私数据共享的首要因素。

另外,为了避免在各个医疗机构之间传输数据的过程中出现安全问题,大多数的医疗机构采用了闭环管理模式。虽然随着数据量的不断增加,越来越多的医疗机构也采用了由第三方服务商提供对数据进行存储、管理的模式。但是在这样的管理模式下,数据更多的还是在第三方云存储器与医疗机构内部二者之间闭环运行。无法保证在各个医疗机构、医疗区域之间实现数据安全共享,也是制约医疗隐私数据共享的一个重要原因。

2 盲量子计算技术介绍

盲量子计算(Blind Quantum Computation,简称BQC)是指用户将用于计算的数据提交给量子计算服务器,在完成整个数据计算的过程中,量子计算服务器对用户的数据输入、数据计算方法以及计算结果等信息都无法获取。通用盲量子计算协议在2009 年被提出[12],协议利用了量子纠缠、量子坍缩等量子特性,在计算过程中保证了数据在输入、输出与计算方法的保密性和安全性。盲量子计算的核心是:量子计算服务器通过量子比特纠缠构建砖墙态,砖墙态结构如图1所示,构建过程如下[12]:

图1 盲量子计算砖墙态

(S1)将每行中的粒子对(i,j)和(i,j+1),执 行GTRL-Z门操作。

(S2)如果j≡7(mod8),且i(mod2)≡0,则对(i,j)、(i+1,j)、(i,j+2)和(i+1,j+2),执行GTRL-Z门操作。(S3)如 果j≡3(mod8),且i(mod2)≢0,则 对(i,j)、(i+1,j)、(i,j+2)和(i+1,j+2),执行GTRL-Z门操作。

砖墙态构建完成后,量子计算服务器通过测量砖墙态中量子比特的角度来完成计算任务,计算过程如下[13]:

(S4)Bob根据测量角度δx,y、测量基为在砖墙态中对量子比特进行测量,并将测量结果发回给Alice。如果rx,y=1,Alice将测量结果取反,否则保持原结果不变。

(S5)转到(S3)开始下一次测量任务,当砖墙态中所有的量子比特都测量完成后,停止计算过程的循环。

3 医疗隐私数据共享模型设计

我们提出的医疗隐私数据共享模型要解决两个核心问题,一是要实现数据在进行科学计算过程中的保密性和安全性;二是要实现各个医疗机构、医疗区域之间的数据安全共享,使数据不再处于闭环模式。根据以上需求,我们提出的隐私数据共享模型分为数据检索、数据传输与数据科学计算三个逻辑部分,模型结构如图2所示。

图2 医疗隐私数据共享模型结构

3.1 数据检索部分

医疗数据存储具有广泛性和封闭性特点,通常保存在各个医疗机构中,或是第三方代理的云存储中。如果每个请求进行数据共享的用户,都向各个医疗机构或第三方云存储服务器发出申请,并等待回应,这显然是不现实的。为了解决这一问题,我们在提出的隐私数据共享模型方案中,引入了数据资源查询服务器(Data Resource Query Server 简称DRQS)。DRQS不保存实际的医疗数据,只保存着来自于不同医疗机构中的各类型医疗数据的目录索引信息,目录索引信息包含了数据的来源、数量、体积与属性等信息。为了保证目录索引信息的即时性,DRQS 会定期根据各医疗机构发送的更新信息,来更新自己的目录索引内容。数据检索部分由请求进行数据共享的用户、DRQS服务器和各个医疗机构组成。

3.2 数据传输部分

当前我们的网络还是以经典网络为主,所以为了实现隐私数据共享模型的最大化经典,我们引入了可信任中心代理服务器(Trusted Central Proxy Server,简称TCPS)。通过引入TCPS 并应用少量的量子信道,在经典网络的基础上实现了模型中各模块的数据传输任务。数据传输部分由各个医疗机构与TCPS之间的经典信道、TCPS 与盲量子服务器之间的量子信道、请求进行数据共享的用户与TCPS 之间的经典信道共同组成。

3.3 数据科学计算部分

数据科学计算部分由盲量子计算服务器与TCPS服务器组成,它是整个隐私数据共享模型的核心。对隐私数据进行科学计算是根据用户提出的要求、以各个医疗机构发送的隐私数据为基础、按照通用盲量子计算协议,由TCPS与盲量子计算服务器共同完成。

4 医疗隐私数据共享模型的业务流程设计

隐私数据共享模型的业务流程分为提出数据共享请求、数据资源检索、数据传输、数据计算与数据结果查询五个阶段,业务流程如图3 所示。我们通过从用户提出医疗隐私数据共享请求、到最后用户查询计算结果的一次完整过程,来说明隐私数据共享模型的业务流程。

图3 隐私共享模型业务流程

用户首先需要在DRQS 中注册身份,注册完成后就可以根据自己的需求发出数据共享请求。DRQS 收到用户的请求信息后,通过检索数据目录索引内容,确定对应数据资源的数量、来源与体积等信息。DRQS按照检索结果向保存该数据信息的多个医疗机构发出指令,各个医疗机构在收到DRQS发出的指令后,开始在闭环网络内按指令要求对医疗数据进行汇总、整理并做好传输数据的准备。

各个医疗机构将整理好的数据通过专用经典信道传送到TCPS 服务器,TCPS 在确认收到信息后,赋予信息惟一的客户服务编码并发送给DRQS。在隐私数据计算阶段,TCPS 首先将经典信息转换为量子信息,而后,盲量子计算服务器开始构建砖墙态,并与TCPS 共同执行盲量子计算协议来完成计算任务。隐私数据计算完成后,在用户登录DRQS 获取TCPS分配的客户服务编码后,就可以在TCPS 中查看计算结果。TCPS 会在用户查看计算结果后,删除所有的对应于该用户的计算数据。

5 隐私数据共享模型安全性验证

为了验证数据共享模型的安全性,我们从提出数据共享请求与检索、数据传输、数据计算与数据结果查询四个方面进行安全性验证,验证内容如表1所示。

表1 隐私数据共享模型安全性验证表

6 结束语

医疗隐私数据如何能安全的共享,以及将其应用于科学研究,一直受到研究者的关注。本文以通用盲量子计算协议算法为理论基础,从提出共享隐私数据请求、数据资源查询、隐私数据传输、对隐私数据进行科学计算,查看计算结果等流程入手,设计了一个具有医疗数据特点的隐私数据共享模型。该模型以经典网络为基础,在保证了资源投入最小、最大化经典的情况下,实现了对医疗隐私数据的共享。随着研究的不断深入,后期我们会不断地改进医疗隐私数据共享模型方案,使得该方案更加科学与完善。

猜你喜欢
科学计算砖墙量子
2022年诺贝尔物理学奖 从量子纠缠到量子通信
《计算机程序设计》课程中科学计算思维能力的培养
决定未来的量子计算
新量子通信线路保障网络安全
浅谈砖墙砌筑施工技术
关于理科生计算能力培养的探讨
一种简便的超声分散法制备碳量子点及表征
浅析建筑施工中的墙体构造
多孔饰面砖墙体蒸发降温效果试验研究
大学物理教学中培养科学计算能力的研究