基于区块链的数据资源优化分配与调度方法

2023-12-26 08:41王雪丽潘正高
安阳工学院学报 2023年6期
关键词:分配区块调度

王 胜,王雪丽,徐 旭,潘正高

(宿州学院 信息工程学院,安徽 宿州 234000)

0 引言

区块链是由多个网络区块组成的链条结构,由于区块组织具有自主保存文件数据的能力,所以整个链条结构的安全性等级极高,特别是在数据样本总储量相对较大的情况下,只要保证网络环境中有一台主机处于稳定运行状态,整个区块链组织对于数据对象的处理能力就能够得到保障。因此,近些年来,很多企业利用区块链技术将大量的软件资源、存储资源汇集在一起,并对数据进行分配与调度。由于区块链技术在使用过程中面对持续且高速增长的移动设备和数据量,需要更高要求的数据存储与处理技术,同时要满足低时延需求[1-2],因此,对区块链数据资源的高效率、低耗能分配调度成为研究的重点课题。李凡等[3]提出了基于移动边缘计算的区块链资源分配算法;蒋丽等[4]提出了面向数字孪生边缘网络的区块链分片及资源自适应优化机制。本研究基于以上研究成果,进一步提升区块链数据资源的分配与调度效果,提出基于区块链的数据资源优化分配与调度方法。

1 区块链模型构建

区块链由端到端相接的区块组成,区块主要用来记录数据,区块中的创世区块由数据资源网络中的第一个节点构成,随后引入到网络中的节点直接连接到相邻节点或区域之前的历史区块和区块链,由此组合为一条完整的区块链。在各个分布式网络区块链节点上采用相应的哈希算法和数据结构,将在某个时间内收集到的数据实施重新编码,在此基础上打包具有相同时间戳的数据区块,再重新连接到目前最长的主区块链上,从而形成一个全新的交易块如图1 所示。

图1 数据区块链结构

根据图1 所示的区块链结构提高节点部署能力。在区块链下数据传输分配的过程中[5],数据资源在各个阶段都受到不同方面的威胁,需要确保数据资源安全传输分配。所以,结合区块链技术建立区块链下数据资源安全分配模型,如图2所示。

图2 区块链下数据资源安全分配模型结构图

在图2 模型中,可以将区块链下数据资源安全分配划分为以下几个阶段[6]。

(1)数据发布阶段:数据资源拥有者将拥有的数据集利用本原型系统的数据发布功能完成数据集的上传。数据集可以划分为2 个部分,将其分别存储于链上和链下2 个部分,对应的数据资源集合D,如公式(1)所示:

链上主要用来存储数据资源集合中的元数据数据;链下则用来存储数据内完成加密处理的数据。

(2)数据请求阶段:数据请求者在系统中需要发现所需要的数据,同时向数据发布者发送相关的数据请求。

(3)数据分配阶段:数据发送者在接收到数据请求后,假设同意分配数据,则通过访问控制的方式实现数据集的线上分配,由此构建,区块链数据分配模型。

2 基于区块链技术的数据分类提取

对数据资源进行聚类,基于区块链模型根据分配任务对待分配的数据进行分类提取。对区块链各环节发送的上链数据请求进行接收。基于区块链数据分配模型,利用朴素贝叶斯算法完成数据定向分类提取,获取待分类定向数据及其分配概率,实现数据的定向提取。将分配任务作为数据属性,根据分配属性对数据类别进行划分,完成数据资源定向提取分配。设数据类别为F1,F2,…,Fm,类别的数量用m 表示,待分类定向数据R 从属于分配类别Fi的训练元组数用表示,遵循高斯分布,其训练元组均值用λ表示,的界定表达公式为:

式中,e 表示指数函数,依据以上求解的最大概率类别,完成数据的定向分类及提取。

利用Map 和Reduce 函数并行推算下进行朴素贝叶斯定向提取。对于O 个定向数据的连续属性,如为平方和,利用以下公式求加属性均值和标准差,计算公式分别为:

由于区块链上数据种类较多且基数较大,在进行分配数据和分配任务属性连接时容易造成混淆,影响属性连接判定的精准性。所以,在开展属性连接工作前,采用SVM 支持向量机对数据库数据属性进行划分,SVM 划分属于一种非线性算法,从低维空间向高维空间进行变换映射,通过映射尺度来实现划分。在线性可分的基础上,设计二维线性划分算法的划分过程,定义训练样本集:

其中,xi、yi表示数据样本i 的水平和垂直方向;Rn表示样本集合;n 表示样本数量。在线性可分的情况下,会存在一个最优划分面w·x + b2= 0,其中,b2为划分面方差;w 为划分面权重,将样本中不同种类的数据点分割开来,并且离最优划分面最近的向量到最优划分面的距离最大,将最优划分面进行归一化处理,全部样本的间隔最大值为,以此设定划分面训练样本的约束条件为:

从数据划分平面的二维线性分布情况来看,中间划分线中间的平面即为最优划分面,那么在平行面上的最边缘点定义为支持向量,采用二次划分思想计算划分超平面:

式中,φ(w)表示划分超平面。

由于分布式数据库多区块链的数据众多,划分面判定的精准性将直接影响划分精度,并且训练样本的最优划分面和样本中的向量值息息相关,那么就可通过计算样本间的系数向量来求得最优划分面[7-8]。建立考虑划分误差对应问题的拉格朗日函数,通过该系数来约束划分平面上各点偏离系数,定义为:

式中,μi表示拉格朗日系数。μi与实际划分结果与真实结果差值呈对偶关系,当μi最小时,代表实际划分结果与真实结果之间的差距小。μi的最小值表达公式为:

根据上述公式可知,在分布式数据库多区块链样本线性不可分的情况下,通过对偶方法也能实现数据划分面的精准划分,只是需要按照数据属性特征预先标定μi的取值范围0 ≤μi≤C,其中,C 为数据点在二维面上的对角线距离。通过上述推导求解最优划分面函数f(x)为:

其中,sgn 为符号函数;f2为划分阈值。

通过上述过程,将区块链数据代入求解,即可完成数据的分配任务属性最优分类提取。

3 数据资源调度帧配置优化

区块链数据调度帧配置是按照区块链调度任务对于数据样本的需求,安排网络体系中的数据对象调度传输帧节点,从而保障区块链数据的高效调度传输[9-10]。为保证区块链数据调度帧配置结果的准确性,实施数据传输之前,应按照传输标准对传输所需数据样本对象进行取样。满足区块链标准的区块链数据取样条件为:

式中,η表示区块链数据在区块链组织中的传输效率,h 表示满足准确性标准的数据样本取样特征。继而推导区块链数据调度帧配置条件为:

数据资源调度调度帧配置优化即是根据数据调度帧节点配置条件,为数据对象规划最佳调度传输方案。为保证海量区块链数据的高效传输,区块链共识机制筛选数据样本时,要求数据对象必须属于同一传输周期[11]。规定ϑ表示区块链数据样本在同周期内的时间性传输向量,其取值满足条件为ϑ>1 ,则基于区块链的数据资源调度调度帧配置优化表达式为:

其中,z表示基于区块链的区块链数据量化水平评定参量,μ表示数据样本参量的准确性传输系数。数据资源调度调度帧配置优化方案的实施必须遵循区块链共识机制,且在选取区块链数据样本对象时,为保证传输方法的全面性,只能对所涉及数据参量进行随机性取样。

4 数据资源优化分配与调度

区块链根据时间,将数据按一定的次序进行排列,并在各个环节间建立起一个固定的区块链。为了达到区块链数据资源分配与调度负荷最优,在主节点收到来自其他从属节点或群集事务时,主节点需要对事务文件的数字签名数据进行验证。如果验证成功,主节点就会接收这个事务,并把它放到一个等待包装的内存清单中。该列表中对于下一时刻分配调度需要的负荷进行计算:

式中,qt+1、qt分别表示下一时刻和当前时刻的服务器调度负荷;pt+1、pt分别表示下一时刻和当前时刻联络线交换值;Wt表示服务器运行负荷变化量。

主机会根据区块链数据的分配任务属性,产生特定的Merkel 树。此时,主节点会产生一个预准备数据,在预准备数据中加入一个块数据,然后向其他的子节点广播。每个节点都会接收这个区块数据,并把区块与之前的区块连接起来,从而达成共识。在区块链共识前提下,区块链调度数据量应与实际所需数据量一致,那么每台服务器可分配的负荷量为:

邓小平非常强调打击经济犯罪和腐败现象,在实际工作中落实建设社会主义精神文明的要求。“风气如果坏下去,经济搞成功又有什么意义?会在另一方面变质,反过来影响整个经济变质,发展下去会变成贪污、盗窃、贿赂横行的世界。”[4]P154为了使全党重视精神文明建设,他强调搞四个现代化一定要“两手抓”,一手抓物质文明建设,一手抓精神文明建设。这两只手都要硬,两个文明建设都赶上和超过亚洲“四小龙”,才是有中国特色的社会主义。

式中,α表示人工干预系数;v1j、v2j分别表示服务器j 的升负荷和降负荷速率。

该方法能够确保在常规进程中,共识过程能够正常地进行,由此完成区块链数据资源分配调度负荷的优化。

考虑分配调度的资源消耗量,根据用户的请求,采用区块链技术实现数据资源的均衡分配。可将区块链数据资源存在的用户划分为资源需求方和资源供应方。资源供应方将区块链中的数据资源注册到云服务器,服务器根据资源需求方的需求统一分配和调度资源,整个调度过程没有第三方参与,如图3 所示。

图3 基于区块链的数据资源调度过程

为了降低数据资源分配的资源消耗量,所提方法将数据资源与需求匹配,获得资源分配调度模型M'M:

式中,F= {f1,f2, … ,fn},代表的是资源需求方调度子任务的需求量;P= {f11,f12,… ,f1n},描述的是子任务所需的资源;TM= {TM1,TM2, …,TMn},代表的是分配调度每个子任务所需的时间;[R(a,b),H]代表的是资源需求方的签名数据。

数据资源优化分配与调度的具体流程如下:

(1)资源需求方对Q 展开数字签名,并在区块链上广播需求数据和签名数据。

(2)资源需求方的资源请求传输到资源供应方时,首先通过公钥验证数据的合法性,如果合法,资源供应方查看M'M,并向资源需求方回复可以提供的M'M:如果不合法,不发送任何回复。

5 测试与分析

为验证提出的基于区块链的数据资源优化分配与调度方法的有效性,进行了相关测试与分析。选择数据库Mysql 作为测试数据集,并标记为D1、D2、D3,其中,D1 为金融相关信息数据集、D2 为体育相关信息数据集、D3 为娱乐相关信息数据集,从中选取40 000 条数据,数据属性值为70 000,数据类型覆盖较广、包含种类较多。部署一台区块链调度服务器,每间隔10 s 分配一次数据库目标信息。测试所涉及的相关参数如表1所示。

表1 测试软硬件参数

将3 个大数据集划分为多个区块,分别使用文献[3]、文献[4]和所提方法对比分析分配负荷波动数值,以此作为分配负荷优化控制依据,分配负荷越低,说明分配优化效果较好,对比结果如图4 所示。

图4 数据资源分配负荷对比结果

根据图4 可知,对比参考文献[3]方法和参考文献[4]方法下的资源分配负荷结果,所提方法下资源负荷值较小,资源分配负荷较好地控制在了300 MB 以下。这是因为所提方法采用支持向量机(SVM)对数据库数据属性进行划分,减少了需要处理的特征数量,降低了数据维度和计算复杂度。由此说明所提方法的分配效果与速度较快,针对性更强,具有实际的应用价值。

运行文献[3]、文献[4]和所提方法进行区块链数据资源调度,统计方法应用下的资源消耗量和调度时延,结果如图5 和表2 所示。

表2 数据调度时延测试结果 ms

观察图5 可知,针对3 种数据集,所提方法下资源调度能耗控制水平均高于文献[3]方法和文献[4]方法,相同传输功率下具备更少能耗,拥有更好的资源利用率,最大限度延长区块链数据中心服务器寿命。这是因为所提方法采用哈希算法将大量的原始数据映射为较短的哈希值,并将重新编码的数据作为索引完成快速查询。

根据表2 可知,针对3 种数据集,所提方法的数据调度时延最低,均值为148.07 ms。而文献[3] 方法的数据调度时延为170.84 ms,文献[4] 方法的数据调度时延为161.72 ms。这是因为所提方法构建了区块链数据分配模型,将数据分散存储在网络多个节点,根据预设规则执行数据调度操作,确保区块链数据资源优化分配与调度效率。

6 结束语

为了提升区块链数据资源的分配与调度效果,提出基于区块链的数据资源优化分配与调度方法。在构建区块链的数据资源分配模型的基础上,利用区块链技术分类提取数据,优化数据资源调度帧配置,实现数据资源优化分配与调度。测试结果证明,所提方法对区块链数据资源具有较好的分配与调度效果,区块链数据资源分配负荷和资源消耗量较低,调度时延较短。

猜你喜欢
分配区块调度
区块链:一个改变未来的幽灵
《调度集中系统(CTC)/列车调度指挥系统(TDCS)维护手册》正式出版
应答器THR和TFFR分配及SIL等级探讨
区块链:主要角色和衍生应用
一种基于负载均衡的Kubernetes调度改进算法
虚拟机实时迁移调度算法
遗产的分配
一种分配十分不均的财富
绩效考核分配的实践与思考
区块链+媒体业的N种可能