医院内网在线档案云存储隐私信息加密技术研究

2022-07-21 02:57陈春燕
自动化技术与应用 2022年6期
关键词:关键字加密技术密钥

陈春燕

(昆明市第三人民医院,云南 昆明 650000)

1 引言

云存储是云计算概念的延伸,是一个以数据存储和管理为核心的云计算系统,它能有效地帮助个人和企业降低数据存储和共享所需的成本,并且能够动态扩展。由于医院内部数据共享的需求日益增长,越来越多的医院应用云存储技术,将医院内网在线档案存储在网上,实现存储、共享和传输。不过,尽管云存储有很多好处,但其往往会面对大范围内外的安全和隐私威胁,云计算的数据安全传输和隐私仍然阻碍了云存储技术的发展。

出于安全考虑,多个学者开展了云存储隐私信息加密技术的研究,如文献[1]中,程晋雪等人研究了一种非安全信道下的高效可搜索加密方案,该方法提出可搜索加密方案,并将双系统加密方法应用到了数据加密中,实现对信息的加密。文献[2]中,韩培义等人研究了一种面向云存储的数据加密系统与技术,该技术将动态程序分析技术应用到其中,对各类云应用敏感数据进行了加密保护。另外,文献[3]中,赵志远等人研究了一种面向云存储的支持完全外包属性基加密方案。上述方法虽能够对信息加密保护,但是存在加密时间过长与加密效果较差的问题,为此,本文设计一种医院内网在线档案云存储隐私信息加密技术,以期为提高医院档案数据的安全性提供一定帮助。

2 医院内网在线档案数据分割

提出一种新的加密方案,在敏感文件上传之前,将文件分割为大、小数据块,将小数据块保存到本地,将大数据加密并上传到云端,用户按照需求选择加密等级。数据分割模型如图1所示。

图1 数据分割模型

将文件分割为数据块,在数据上载之前,主要采用固定大小和非固定大小两种方案,其中对固定大小数据的分割过程如下:

(1) 将小块数据大小固定为1k,则抽取1024 个字符,产生0~N文件大小之间的随机数据序列;

(2) 对生成的随机序列从小到大排列,得到从文件中提取的字节位置;

(3) 从原始文件中分割字节位置对应的字节,并将随机序列保存为小数据块,分割后的数据作为大块数据块;

通过上述过程对最小块数据大小固定[4],但是仅对小块数据固定会导致产生的随机数不均匀,被解密后还会分析出一些信息,为此进一步处理,即抽取非固定大小的小块数据,其流程如图2所示。

图2 抽取非固定大小的数据流程

经过以上程序,将数据所在位置的字节从原始文件中分割出来,并保存为随机序列,数据小块,将其分割为大块数据。在对数据大小块分块后,将用户文件上传到云端后,云存储系统对文件分块操作和分布式存储。

3 模糊关键字检索

此次研究的隐私信息加密技术以档案数据为样本,在提取关键字阶段[5],需要进一步对数据相似性度量。过程如下:

(1) 对关键字集合W中的关键字记作ωiW(i=1,…,|W|),并将原点关键字记作ω01;

(2) 将没有被表示为关键字的相似公式表示为ωjW(j≠i),并在剩余的关键字中选择原点的关键字ω0i,重复此过程,直到所有的关键字被表示为相似坐标值为止;

(3) 在所有数据构建关键字集合完成后,对所有数据进行标准化转换[6],计算公式为:

公式(1)中,X代表映射值。

(4) 在上述处理后,计算关键字与关键字之间的相关度,计算公式表示为:

公式(2)中,dj代表第j个文件,代表文件di中关键字ωi的频率。

经过上述数据集标准化转换,将关键字编辑距离映射到(0,0.5)区间内,并将关键字集合上传到私有服务器中。

4 云存储隐私信息加密机制构建

将关键字集合转换为相似坐标集合,为避免在云服务器中关键字信息泄露,做进一步处理。将医院内网在线档案数据集D进行关键字提取[7],构建已提取的数据,将其记作F,采用LSH构建索引,LSH为局部敏感哈希函数,其能够在高维数据空间中进行邻近查询,这种方法是把目标映射到多个桶[8],然后把相似度高的目标分成一个桶,不同的目标不会被分成一个桶,具体的构建过程如下:

Step 1:身份染色[9],当云存储用户加入到系统时,将其生成全局身份标识,将其记作GIDu。在此基础上,生成不同元素的随机数序列{c1,c2,…,ck},其中k代表属性授权机构的个数[10],然后通过身份染色算法,输出与其相关的有色名color(u,m)。身份染色算法的计算公式表示为:

公式(3)中,cy为第y个数据的链接参数。

Step 2:特征提取,将敏感数据集集合记作Di,Di数据集中特征值集合记作Fi={f1,…,fn},然后特征提取步骤将Di映射到Fi中;

Step 3:度量空间转换p,在经过上述过程对数据特征提取后,需要将特征值转换为特征向量,方便于局部敏感函数族的寻找。

假设Fi={f1,…,fn}是Di的特征值集合,因此度量转换步骤就是将特征值映射为向量集合的过程,即,;

Step 4:桶索引构造,此步骤主要将LSH 应用于矢量,假设有一个局部敏感函数族H可应用到相似机制中,从H中构造局部敏感函数g:(g1,…,)。复合散列函数就是从g1到将特征向量映射到个桶中。桶实质上是一个大小为l的位向量,在此次分析中l是所存储的全部文件数据;

Step 5:密钥生成,当用户第一次加入系统,就为系统分配与查询内容相关的密钥,将属性私钥部件簇表示为:

Step 6:桶索引加密,将数据索引转换为安全索引,目的是在数据查询中只有数据用户才能生成加密桶标识。假设是大小为ψ的加密密钥,为随机排列为,安全加密方案为,桶标识为Bk,Bk的位向量为VBk,安全索引为I,即。

Step 7:陷门生成,即查询请求生成,将需要检索的特征关键字记作,对于每个签名元素相对应的标识利用密钥Kid进行哈希处理,被哈希处理的桶标识记作Q,Q=,查询请求有个元素,是独立于查询关键字数量的,所以信息不会泄漏给服务器;

Step 8:检索,给定查询请求Q,在服务器中找到与Q相对应的加密数据,然后返回到服务器中将加密的向量EV={V1,…,Vn}返回给用户。在收到桶后,用户解密向量按照相关分值对数据表示排序,处理完成后返回所有的文档。

上述为数据加密、检索的整个过程,以此完成对医院内网在线档案云存储隐私信息的加密,以降低用户数据隐私被非法用户窃取后泄露的风险。

5 实验

为验证所研究的医院内网在线档案云存储隐私信息加密技术的性能开销,对其进行多个阶段测试,并将非安全信道下的高效可搜索加密方案、面向云存储的加密技术与其对比。

实验在VMware Workstation 虚拟机的Ubuntu10.10环境中进行,并采用cloudsim平台进行仿真实验,利用其创建数据中心,为实验提供基础,每次对比时间为单独测试结果。

5.1 初始化时间开销

在信息加密时需要对多个属性授权,会增加数据初始化的时间,从而影响整个加密技术的性能,为此将信息初始化处理的时间开销作为对比对象,三种方法在信息加密时初始化时间开销如图3所示。

分析图3可知,所研究的云存储隐私信息加密技术初始化时间最少,原因是所研究技术预先对数据分块处理,降低属性授权机构个数,从而降低初始化处理的时间开销。非安全信道下加密方法、面向云存储的数据加密方法初始化时间较所研究方法多,原因是在每个数据属性授权机构交互时花费了较多的时间。

图3 初始化时间开销

5.2 密钥分发时间开销

三种方法的密钥分发时间如图4所示。

图4 密钥分发时间开销

对比图4能够发现,提出的医院内网在线档案云存储隐私信息加密技术密钥分发时间少于其他两种方法。所研究加密技术密钥分发时间开销少的原因是,加密操作在文件上传之前执行,不涉及属性密钥的生成,所以密钥分发的时间较少。

5.3 加密时间开销

所提出技术与非安全信道下加密方法、面向云存储的数据加密方法的加密时间开销对比结果如图5所示。

通过分析图5 可知,非安全信道下加密方法、面向云存储的数据加密方法加密时间多于提出的加密技术。所提出方法性能更为优越的原因是该方法对数据分块处理,分别对大数据块与小数据块做了处理,并对数据相似性计算,减少了数据加密重复情况的发生,从而降低了数据的加密时间。

图5 加密时间开销

5.4 检索时间开销

三种加密方法在数据检索上的时间开销对比结果如图6所示。

图6 检索时间开销

分析图6 能够发现,三种方法的信息检索时间相差较大,其中非安全信道下的高效可搜索加密方案花费的检索时间最多,所研究技术花费的检索时间最少。原因是所研究的加密技术不复杂,减少了信息检索的时间。

5.5 加密信息被窃取情况对比

对比三种方法加密后的信息安全性,信息被窃取的情况如表1所示。

表1 加密信息被窃取情况

分析表1能够发现,在利用非安全信道下的加密方案、面向云存储的数据加密技术进行加密后,均出现信息被窃取的情况,并且被盗取的信息量较大。而所研究的加密技术信息被窃取情况较少,仅出现两次,由此能够证明所研究的加密技术能够提高信息加密效果。

5.6 信息被更改情况对比

分析表2 能够发现,三种方法均出现信息被更改的情况,所研究的加密技术出现1 次被更改的情况,其他两种方法均出现多次信息被更改的情况,加密效果较差,没有所研究的技术加密效果好。

表2 信息被更改情况对比

综上,所研究的隐私信息加密技术不仅能够降低信息加密时间,还能够提高信息的安全性。所研究方法信息加密安全性较好的原因是,该方法在数据分块处理的基础上,采用局部敏感哈希函数对信息进行加密处理,从而提高了信息的安全性。

6 结束语

本文提出了一种医院内网在线档案云存储隐私信息加密技术,并通过实验验证了所提技术的有效性。该加密技术的创新之处是将上传文件预先分成大小两块,分别进行加密,以提高数据的安全性。但在后续研究中还需要继续研究更优的算法,不断将新技术应用到数据保护机制中,以提高信息加密效果,为医院内网在线档案数据安全提供帮助。

猜你喜欢
关键字加密技术密钥
履职尽责求实效 真抓实干勇作为——十个关键字,盘点江苏统战的2021
运用数据加密技术维护网络安全的可靠性研究
幻中邂逅之金色密钥
幻中邂逅之金色密钥
密码系统中密钥的状态与保护*
成功避开“关键字”
TPM 2.0密钥迁移协议研究
数据加密技术在计算机网络安全中应用研究
数据加密技术在计算机网络通信安全中的应用
守好你的秘密