摘" 要: 针对共享双创网络平台数据传输过程中普遍存在隐私性差且安全性较低的问题,文中基于区块链和数据加密技术提出一种信息共享算法。该区块链模型的网络层使用了多台局域网计算机节点,并在数据传输时采用混合加密算法DES⁃ECC,从而使安全性与加解密效率相比单一加密算法均有所提升。共识机制还通过使用PBFT算法增强了模型的整体鲁棒性。同时,将算法部署在Hadoop分布式存储架构中,以提高数据传输的速度及吞吐量,且利用Namenode容灾机制进一步保证了数据的安全性。实验测试结果表明,所提加密算法的破译难度较高,而加解密时长仅需约1 260 ms,其共识机制吞吐量与时延性能也较为理想,可以实现对双创平台中的大数据进行高效、安全、透明的共享与传输。
关键词: 区块链; DES加密; ECC加密; 拜占庭容错机制; Hadoop平台; 双创数据共享
中图分类号: TN919⁃34; TP391" " " " " " " " " " " "文献标识码: A" " " " " " " " " 文章编号: 1004⁃373X(2025)03⁃0092⁃05
Research on mass entrepreneurship and innovation information interaction technology based on encrypted blockchain
CHENG Shunda1, 2, ZHU Jie2, GUAN Shengjiang2, CHENG Jie2, DOU Tong2
(1. School of Cyberspace Security and Computer Science, Hebei University, Baoding 071002, China;
2. Information Center, Hebei Provincial Hospital of Chinese Medicine, Shijiazhuang 050011, China)
Abstract: In view of the common problem of poor privacy and low security in the process of data transmission of shared entrepreneurship and innovation network platforms, this article proposes an information sharing algorithm based on blockchain and data encryption technology. In the network layer of the blockchain model, multiple local area network (LAN) computer nodes are used and a hybrid encryption algorithm DES⁃ECC is adopted during data transmission, so as to improve security and encryption and decryption efficiency to some extent in comparison with a single encryption algorithm. The consensus mechanism is also used to enhance the overall robustness of the model by using the PBFT algorithm. The algorithm is deployed in the Hadoop distributed storage architecture, so as to improve the speed and throughput of data transmission. The Namenode disaster recovery mechanism is utilized to further ensure the security of data. The results of experimental test show that the decryption difficulty of the proposed encryption algorithm is relatively high, and its encryption and decryption duration is only about 1 260 ms. Its consensus mechanism throughput and latency are also ideal, so it can achieve efficient, secure, and transparent sharing and transmission of big data in the entrepreneurship and innovation platform.
Keywords: blockchain; DES encryption; ECC encryption; Byzantine fault⁃tolerant mechanism; Hadoop platform; entrepreneurship and innovation data sharing
0" 引" 言
在双创平台的建设过程中,所生成的海量数据均会在数字化平台中进行存储与展示,而其中大量信息都涉及到商业机密,需要对数据安全进行有效保障[1]。传统的数据传输与共享主要采用数据聚合与托管的模式,即委托第三方中心化机构来实现。在用户需要查找数据时,第三方机构会开发接口给用户,并将数据转发、传送至用户终端[2⁃4]。由于数据传输的整个过程均依赖于第三方,因此数据的安全性与隐私性难以得到保证。
随着区块链技术(Blockchain Technology, BT)的发展,数据通过分布式存储具有可追溯、透明化及不可修改等特点。同时,使用共识机制和智能合约确保了数据的唯一性以及流向可见性,且采用加密算法保障了数据的安全。本文基于区块链技术提出了一种双创数据安全传输算法,并将数据部署在局域网中,保证数据安全地实现共享与传输。
1" 区块链数据加密系统设计
1.1" 基于区块链的共享平台结构设计
本文设计的双创数据共享平台的结构如图1所示,该平台由网络层、数据共享层及应用层组成。其中,网络层以局域网节点作为主要架构,通常用作数据存储和数据加密的载体;数据共享层包括智能合约策略与共识机制,该层可以保证数据进行透明、唯一且匿名的传输;应用层则为数据上层显示界面,用户通过该层能够进行信息交互。
本文对信息共享过程中的关键技术进行了研究,包括数据加密算法、共识机制以及分布式存储。
1.2" 基于改进椭圆曲线的数据加密算法
本文采用的椭圆曲线加密算法[5⁃8](Elliptic Curve Cryptography, ECC)是一种可用于区块链底层的非对称加密算法,该算法的基本思想是利用椭圆曲线来确定密钥的安全性。
椭圆曲线的函数图像如图2所示。在定义域内,设椭圆曲线方程为:
[y2=x3+ax+b]" "(1)
由图2可知,若[P(xp,yp)]、[Q(xq,yq)]两个不同点均在椭圆曲线中,且[R(xr,yr)]点的坐标为[P]、[Q]点坐标之和,则根据椭圆曲线的数学关系,[P]、[Q]、[R]满足以下关系:
[xr=λ2-xp-xq mod p]" "(2)
[yr=λxp-xr-yp mod p] (3)
[λ=3x2+a2yp mod p," " P=Qyq-ypxq-xp mod p," " P≠Q] (4)
设[k]为私钥、[P]为基点、[Q]为公钥,可有以下推论:
[kP=Q] (5)
椭圆曲线的加解密过程如下。
1) 加密过程,即使用公钥[Q]将数据[D]加密成为密文CD:
[CD=rP,D+rQ] (6)
2) 解密过程,通过利用私钥对密文进行解密处理:
[D+r(kP)-k(rP)=M]" (7)
式中[M]为解密明文数据。
作为非对称算法的一种,ECC算法的准确度较高,但其加解密耗费的时间过长。因此,本文将数据加密标准算法(Data Encryption Standard, DES)与ECC相结合,以减少算法的计算量。
DES[9⁃12]是一种明文分组加密机制,由于加密和解密的密钥相同,因此其也是一种对称算法,本文采用的DES算法的加解密过程如图3所示。
本文设计的DES⁃ECC组合算法结构如图4所示。
DES⁃ECC组合算法的执行步骤如下。
1) DES生成公共密钥。随机生成长度为[m]的字符,并通过Logic密钥的生成方式对其进行加密,以获得密钥,再将其转化为十六进制数。
2) ECC生成私钥。根据ECC密钥生成过程,按照式(6)、式(7)的计算规则对私有密钥进行加解密。
1.3" 基于拜占庭容错的共识机制
对于区块链节点而言,分布式存储不可避免地会遇到传输一致性问题。由于网络延迟等原因,各个存储节点对于事件发生的时间及具体内容等无法实现对等通知。因此,需要设计共识机制使得各节点达成统一。
拜占庭容错机制[13⁃14](Practical Byzantine Fault Tolerance, PBFT)是为了解决节点失效问题而提出的算法。该算法可分为预准备、准备及共识共三个阶段,具体如图5所示。
首先由客户端发出请求,并进入预准备阶段进行处理。当请求超过一定的节点限制时,会将其放入缓存空间;若没有限制,则主服务节点会分配一个序列号[f],同时对所有服务器进行编号,并广播给其他空间节点。在准备阶段,当收到主客户端的广播后,其他节点会对该数据进行检查,主要检查哈希码是否与源数据相符。检查无误后,进入共识阶段,该阶段会验证密钥、签名等是否正确,若正确,则给服务器节点返回许可证明,进而得到最终结果。
从算法的流程可以看出,PBFT中的所有节点均会参与到共识中,由此会导致通信开销过大,不利于系统的稳定运行。因此,本文通过对服务器节点进行分类来解决这一问题,将其分为主要和次要节点,且通常仅使用主要节点进行共识。改进后共识机制的执行过程如下。
1) 通过检查算法,判断系统是否存在主要及次要节点,若存在,则进行后续操作;否则,系统将根据预先设定好的规则对节点进行分类。
2) 客户端转发信息,主要节点参与共识,而次要节点只负责记录共识结果。
3) 主要节点将共识结果反馈给客户端。客户端收到节点信息,从而完成共识。
1.4" 基于Hadoop的并行加速算法
由于双创数据集种类繁多,区块链算法的执行速度通常较慢,因此需要将其部署在并行服务器中,本文使用Hadoop技术对算法进行并行处理。
Hadoop[15⁃16]是一种并行计算框架,主要由HDFS和MapReduce过程组成。其中:HDFS是分布式存储系统,数据将存放在该系统中;MapReduce是数据的处理过程,框架如图6所示。
本文采用的Hadoop主要由数据切片算法、Map过程以及Reduce过程这三部分组成。其中,数据切片算法并非物理切分,而是在逻辑上对数据进行切分,且每个数据切片均对应一个Map任务。假设需处理的数据大小为[S],Posi为数据在整个文件包中的位置,则输入分片的大小由目标尺寸、最小尺寸以及HDFS文件块尺寸共同决定。
[Goal=(S 210)n×210Posi] (8)
式中[n]为Map块的个数。
此外,为了进一步增强数据的安全性,本文使用HDFS的Name Node节点对数据进行硬件容灾,并利用ZooKeeper分布式节点检测算法对HDFS文件存储进行监控,该算法流程图如图7所示。
2" 实验与分析
2.1" 软硬件环境
本实验使用4台服务器对局域网环境进行模拟,同时也将这些服务器作为Hadoop的并行存储节点。服务器的硬件参数如表1所示。
区块链框架及相关算法则使用Java语言开发,并利用SpringBoot框架完成程序块搭建。
2.2" 算法测试
首先对加密算法的安全性与计算效率进行验证。对比算法选择了对称加密算法DES、AES以及非对称算法RSA和ECC,对比实验结果如表2和表3所示。
由表2可知,随着破译时间的增加,本文算法的密钥尺寸基本不变,但AES、DES等算法的密钥尺寸大幅提升,这说明本文算法加密的安全性较高。
从表3中可以看出,对称算法AES、DES的加解密时间最短,这是由算法特性决定的。而本文算法将对称加密算法和非对称算法结合,进而使得加解密时间介于对称算法与非对称算法之间。
共识机制的主要评估指标为算法吞吐量以及算法传输的时延。对比算法选择DPoS、PoW、PoS。本文测试不同数据规模下的数据吞吐量和传输时延,每条数据的大小为50 B且数量不同。重复20次实验后取平均值,吞吐量与时延测试结果如表4所示。
由表4可以看出,在数据源保持不变的情况下,随着数据条目数量的增加,本文设计的共识机制与分布式存储方案可以提供更高的吞吐量。尤其是在数据条目增加至100 000条时,Hadoop的并行存储结构可以提供更为迅速的文件存储速度。在数据写入延迟方面,可以看出4种算法的写入延迟均在毫秒级别,当数据量为50条时,各算法的写入平均时延均在10 ms之内;而当数据量为100 000条时,本文算法的时延最低。因此,对于大规模的数据集,本文共识机制和分布式存储具有更高的数据吞吐量及更低的存储延迟。
3" 结" 语
针对传统数据共享方式容易泄露信息的问题,本文基于区块链技术提出了一种双创数据加密共享平台。该平台网络层由多台处于局域网的计算机组成,数据加密使用DES⁃ECC混合加密算法,而共识机制选择了PBFT算法。本文算法还可以对失效节点进行改进,从而使通信更加顺畅。通过将算法部署在Hadoop服务器中,提高了算法的运行效率,同时实现了服务器的容灾。实验结果表明,本文的加密及共识机制性能在所有对比算法中均为最佳,能够较好地应用于双创数据共享平台。
注:本文通讯作者为祝婕。
参考文献
[1] 于文华.基于大数据的大学生就业创业指导系统[J].微型电脑应用,2021,37(9):37⁃39.
[2] 黄瑞,肖宇,曾伟杰,等.Docker容器下高速总线通信数据实时交互方法[J].沈阳工业大学学报,2022,44(6):667⁃671.
[3] 党增江,宋永立,高玫,等.基于私有协议的单向数据传输设备[J].计算机工程与设计,2021,42(10):2776⁃2783.
[4] 李金科,秦涛,吴爱平.基于ZYNQ的可配置高速数据传输系统设计[J].信息技术,2023,47(1):1⁃8.
[5] 林洁和,张绍华,李超,等.基于ECC的区块链数据共享系统设计[J].计算机工程与科学,2022,44(5):810⁃818.
[6] 刘建英,李洪涛,王波.云环境下基于椭圆曲线的数据加密机制研究[J].山西师范大学学报(自然科学版),2021,35(2):6⁃12.
[7] 沈涵,付鹏.一种应用于椭圆曲线密码的双域模加减运算的优化设计[J].工业控制计算机,2024,37(2):94⁃95.
[8] 薛来军.基于改进的ECC的网络信息安全加密方法[J].太原师范学院学报(自然科学版),2022,21(2):48⁃50.
[9] 周煜轩,曾连荪.动态化DES算法变体研究[J].计算机应用与软件,2022,39(5):342⁃349.
[10] 李斌,周清雷,斯雪明,等.混合可重构的DES算核高效能口令恢复方案[J].计算机工程与科学,2020,42(10):1887⁃1896.
[11] 潘建生,孔苏鹏,程实.实现DES加密算法安全性的分析与研究[J].网络空间安全,2020,11(4):104⁃107.
[12] 朱启成.云计算环境下的DES对称加密算法优化研究[J].贵阳学院学报(自然科学版),2021,16(2):11⁃15.
[13] 江雨燕,邵金,吕魏.一种面向供应链溯源应用的改进PBFT算法[J].安徽工业大学学报(自然科学版),2021,38(1):111⁃117.
[14] 翟社平,廉佳颖,杨锐,等.基于Raft分组的实用拜占庭容错共识算法[J].计算机应用研究,2023,40(11):3218⁃3224.
[15] 陈红顺,马思琪.基于Hadoop的海量图像检索[J].信息技术,2023,47(4):63⁃67.
[16] 潘伟博,汪海涛,姜瑛,等.Hadoop集群异常节点实时检测与诊断算法[J].陕西理工大学学报(自然科学版),2021,37(4):24⁃31.
[17] 蔡玺,张文轩.电网区块链多层次日志数据分布式存储方法[J].电子设计工程,2023,31(23):31⁃34.