以区块链为基础的电商数据分发技术研究

2023-05-05 03:40王倩倩
电子技术与软件工程 2023年2期
关键词:运算区块向量

王倩倩

(德州职业技术学院 山东省德州市 253104)

现代电商领域的迅猛发展,逐渐出现了越来越多的电商数据,有效对这些电商数据进行管理,不仅可以保障电商客户的权益,而且还会推动电商领域向着更加良好的方向发展。电商数据管理时,持有方应数据分发系统传输电商数据集的规范,客户传输需求说明,之后以此为基础,分发系统会自动采集客户所需的电商数据集。由此发现,数据分发系统在其中占据举足轻重的地位。但对于现有常见电商数据分发系统来说,依然存在一些问题,如数据持有方与客户现在提供信任的过程中,应向系统方提交一定的费用,若不支付费用,则将出现单点失灵的现象,从而使系统中断运行等。针对这一问题,科学领域对此展开了大量研究,得到了诸多研究成果,如OrtizLizcano María Isabel(2023)等人研究中,以区块链技术为依托,开发出了一款分散式的数据分发系统,该系统有效改善了传统分发系统的不足[1]。Joshi Sudhanshu(2023)等人构建出了一个区块链模型,该模型当中,利用访问类的方式,解决应用程序的各种事物[2]。施秦(2023)对数字贸易中的区块链技术进行了研究,通过研究可以发现,应用区块链技术后,可提供国际贸易全流程协议服务,将贸易无纸化管理等,大大提升了贸易数据的管理质量[3]。由此可以发现,将数据块技术应用到电商数据分发系统当中后,将会有效提升整个系统的性能,更好地对电商数据分类与分发。为此,本文以“以区块链为基础的电商数据分发技术”为课题展开了研究。

1 区块链技术

近年来,区块链技术应用得越来越广泛。该技术最早出现在比特币网络中,通过其可自由复制的特点,将相关数据存储到各个节点上,以构建出一个分布式的比特币分布式系统。通过大量实践研究表明,该技术存在诸多优势,具体包括:

(1)权力下放。整个网络内,无第三方机构的参加,不仅减少了系统使用的成本,而且还提高了系统的使用效率。

(2)拜占庭宽容。区块链网络当中,包含了大量拜占庭节点,这些节点能够展示出所有的行为,如崩溃、攻击等。所以,现代分布式系统开发时,拜占庭式容忍度至关重要。

(3)可靠性,将数据录入到区块链系统后,只有满足条件时,才可对数据修改,而修改条件通常非常苛刻,如只有掌握51%以上的节点等[4]。正是由于区块链技术存在上述诸多优势,使其被广泛应用到大数据管理领域当中。

2 基于区块链技术的电商数据分发系统设计

2.1 总体构架

本文为了进一步提升电商数据分类与分发效果,以区块链技术为核心,设计出了一种电商数据分发系统,该系统主要由四层结构构成,由上至下依次为:

(1)应用层,用于信息的处理,其中包含两部分,一个是去中心化应用,是系统的核心应用,相关机构以该应用为基础,对系统应用予以开发,且在系统内,设计了合约的维护接口,为系统维护提供支持。另一个是中心化应用,由实名服务应用与撮合平台构成,前者可用于系统的监督,后者用于各方面用户间的交易活动。

(2)功能层,即设置系统所具备的所有功能,包括协议功能、AI 功能、智能合约功能、存储功能、通信功能与认证功能等。

(3)数据存储层,用于电商数据的索引、查询条件过滤。

(4)数据层,即多个数据库,用于电商大数据的存储。

2.2 系统功能

2.2.1 协议功能

在该系统内,协议功能是较为关键的功能之一,用于对信息通信而提供相应的规则,协议类型有很多,如跨链协议、应用层协议等,其中,跨链协议为最重要的一部分,可对核心链与分任务间的接口进行定义,确保用户对系统使用时,无需连接多条链路,降低了系统的工作量,且可实时掌握数据的去向。在该协议的作用下,能够针对交易的具体类型、时间等因素,自动匹配最佳的核心链与分任务,从而提升系统的运行效率[5]。

2.2.2 存储功能

该功能设计时,选择了SIA 模型。该模型具有诸多优势,不但能够进行开源设计,而且还符合去中心化的要求,以此降低存储开销。存储功能运行时,以智能合约中设置的佣金形式,为存储资源提供方支付相应的租金。在对存储内容分析与提取时,选择的是AI 算法,以此得到大量广告分层。AI 算法处理的数据非常广泛,包含所有与系统相关的数据,如用户行为数据,区块链运行数据等,在保证整个分发系统正常运行的基础上,提升了整个系统的安全性与稳定性,为电商数据管理提供有力支持[6]。

2.2.3 AI 功能

该功能模块为分布系统中的重要内容之一,可用于数据的管理,对数据质量进行控制,以及帮助系统完成数据分发等工作。从数据管理角度来说,系统内部产生数据集群后,AI 功能模块可对该集群予以全面分析,评估数据的影响力与吸引力,进而以此为基础,自动形成相应的提供方向,为数据的应用提供支持。同时,该功能还可对数据的类别予以分析,及时寻找出其中的敏感、冗余等类型信息,并从集群中将这几类数据清除,从而提升数据集的质量。在电商信息话题当中,大部分非常重要,因而需要注重AI 功能的设计与开发。此外,在AI 功能当中,还可以与用户操作习惯为基础,结合不同关键词的访问频率,从数据集中提取出相应的内容,并通过个性化的方式,将其传输给用户。从通信功能角度来说,选择的是P2P协议,并设置了相应的收费模式[7]。相对于免费方案来说,这一方案虽然会收取一定的费用,但通信质量大大提升。

2.2.4 智能合约功能

在本系统当中,设计出了智能合约功能,其可以看作协议功能的一部分,但其作用又高于普通协议功能。从本质上来说,智能合约即为数字形式的承诺,通过承诺定义了合约的本质与目的。若在电子商务交易活动中,卖方承诺向买方提供货物产品,而买方则承诺卖方承诺支付一定的费用。

2.2.5 通信功能

电商数据分发系统由诸多模块构成,各模块运行时,均需要以大量数据为依托,因而本系统设计出了通信功能模块。在信息通信过程中,先数据打包处理,使其成为相应的报文信息,然后按照网络协议中的内容,将数据报文数据传输给其他功能模块或业务层,这些报文信息经过解析处理后,提取出其中包含的内容,并以此为基础,查询并执行与之相匹配的信息分发流程,进而将保温发送给相应的用户端。

2.2.6 认证功能

该模块主要对用户、信息流等进行认证,以保证系统运行的安全性。本系统当中,主要采用的是基于IPTABLES 的WEB 认证模块。该模块具有良好的性能,能够与数据库服务器放入到相同Linux 服务器内,使得模块的运行效率非常高;可通过对IPTABELS日志字段信息的全面分析,确定出准确的认证时间,以此为计费功能的实现提供支持。

3 电商数据处理方法

现代计算机领域内,存在诸多数据处理方法,每种方法具有不同的特点,可应用到不同领域。本系统设计当中,选择的是基于稀疏最小二乘支持向量机算法,该算法的运算效率高,结果较为准确,有利于提升电商数据的精确性。该算法的原理为:获得电商数据样本后,以此为基础,通过不断的迭代计算,完成样本的训练工作,其中,非支持向量索引集合设定为Q,支持向量索引集合设定为P。迭代运算时,每反向拟合1 次,均会增加1 个支持向量。系统运行过程中,因向量集P 不断发生变化,因而每次迭代计算之后,都要对决策函数系数(α)与阈值(b)进行调节,以逐渐提升计算结果的精确性[8]。由此,可确定出电商数据分类的方法,具体为:

3.1 迭代计算过程

由上述介绍可知,每次迭代后,都要确定出新的α与b,为了实现这一目的,先作出以下假设:在支持向量集P 内,导入第s 个训练样本,之后以此为基础,按照下述公式进行计算:

以谢尔曼原理为依据,对上述公式进行推导,从而转换成公式(3):

由公式(3)可知,通过n 次迭代运算后,能够推导出第n+1 次的迭代过程,而不用其他运算,使得整个运算流程大大精简,提升了系统的运算效率。最后,通过上述公式的整理,能够得到最终的计算函数:

3.2 确定支持向量

对于上述算法来说,需要由集合Q 内,提取想用的支持向量s,这一环节进行得好坏,直接影响整个算法的应用结果。为了实现这一目的,本系统设计当中,选择了反向拟合算法的方式,对集合Q 中的数据予以筛选,具体方法为:

利用公式(5),即可推导出支持向量s 的优化问题,具体为:

当迭代结果达到下述条件时,表明结果精确度较高,符合预期要求,可停止继续迭代运算。

3.3 分析模型构建

在数据样本采集时,选择的是电商金融数据,针对研究需求,选择了10 组具有效性、可灌性、合理性的特征当作数据KPCA 特征提取技术的特征输入量,具体为:资金使用情况(A)、用户信用水平(B)、资金流动比率(C)、业务成交量(D)、销售毛利率(E)、净利率(F)、资产收益率(G)、市盈率(H)、资产负债率(I)、关键业务利润率(J)。之后以此为基础,将核参数设定成26,通过高斯核函数的方式,对样本予以计算,从而得到如表1所示结果。

通过表1 的观察能够发现,对于本文选取的10 组特征来说,A、B、C、D、I 五个的贡献率较高,贡献率综合在85%以上,由此,本研究当中,选择这5 个指标作为具体最终的样本特征,以降低运算工作量。安昭相应的分类标准,针对数据的有效性,可将其划分成4 种类型,若有效性是0,表明其属于非法数据,应将其清除。分类时,具体原则见表2。

表2:数据分类原则表

4 系统测试

为了进一步验证本系统的有效性,本文通过模拟仿真的方式,对该系统的电商数据分类效果进行了测试。测试共由2 部分构成,一个是分类的准确率,另一个是通过与常规数据分发平台的对比,确定出本系统在对数据分发时的应用效果,以此判断本系统是否可以大规模推广。

4.1 电商数据分类测试

数据分类测试时,共选择了2000 样本,1000 个用于训练,1000 个用于测试。通过对γ 的调节,确定出合理的运算参数,当ε 为0.4 或0.5 时,则可停止迭代运算。通过测试,能够得到如表3所示结果。通过该结果的观察能够发现,当ε=0.4,且γ2=23时,分类准确性为83.5%。所以,将ε=0.4,且γ2=23当作数据分类参数。

表3:分类测试结果表

4.2 电商数据分发系统性能测试

在测试过程中,由100 个节点作为起点,将节点数量增加到1000 个,以此推导出分配时间的比值。通过测试分析能够发现,节点数量较小时,本系统与常规系统间的差异并不是很大,而随着节点,本系统与常规系统间的差异越来越大,且本系统的性能更加良好,可伸缩性优秀,且分布容量较高。

5 总结

综上所述,本文以区块链技术为核心,开发出了一款电商数据分发系统,该系统共由6大模块构成,分别为:协议功能、存储功能、AI 功能、智能合约功能、通信功能、认证功能,同时,设计出了最小二乘支持向量机的算法,在这些功能与算法的共同配合下,完成数据分类与分发操作,在提升系统安全性的同时,提高了数据分类准确性,扩大了系统容量,强化了系统的伸缩性。

猜你喜欢
运算区块向量
向量的分解
重视运算与推理,解决数列求和题
聚焦“向量与三角”创新题
区块链:一个改变未来的幽灵
有趣的运算
区块链:主要角色和衍生应用
区块链+媒体业的N种可能
读懂区块链
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线