刘璐璐,贾俊强,蒋诗百,杨丽娜,马占军
(国网新疆电力有限公司信息通信公司,新疆乌鲁木齐 830001)
配电终端是指整个配电开关监控终端回路,由输电网络、供电装置、传输线路等多个设备结构共同组成。在实际应用过程中,配电终端既负责调节电力元件两端的负载电压水平,也可以将传输电流的数值水平控制在既定范围内[1]。随着配电终端网络覆盖面积的增大,电力数据的输出量也不断增大。对于加密主机而言,配电终端数据输出量的增大会导致密钥文本的约束作用能力下降,从而造成数据加密耗时的大幅延长。
李春华[2]等提出了OFDM-PON 系统中的基于信道相位信息的动态加密方案。该加密方案只能定义静态密钥文本,虽然保障了加密设备对于同层传输数据的处理能力,但却难以实现对分层传输信息的加密处理,这也是导致密文模板完善水平始终相对较低的主要原因。为解决上述问题,提出基于朴素贝叶斯的配电终端数据联合分层加密算法。朴素贝叶斯是在贝叶斯定理特征条件的基础上建立的独立假设型分类方法,可以在决策树组织的作用下,根据概率统计原则确定样本数据的分类标准[3]。与其他类型的分类方法相比,朴素贝叶斯模型的误判率更低,可以在保障样本数据完整性的同时,建立多个样本集合,一方面实现了对多类型数据信息的按需转存,另一方面也可以避免非同类数据进入同一样本存储集合中。在运算过程中,朴素贝叶斯模型同时结合了先验概率系数与后验概率系数,能够避免主观偏见对于样本数据分类结果造成的影响,既解决了样本信息独立使用而造成的过拟合问题,也使得样本集合的完整性水平得到了保证[4]。
配电终端数据处理以朴素贝叶斯模型和决策树结构为基础,并可以根据挖掘深度指标的取值结果确定加密指令的执行与传输速度。
处理配电终端数据时,朴素贝叶斯模型将明文样本作为未被编码的信息参量,将密文样本作为完成编码的信息参量,在不违背加密原则的情况下,明文样本、密文样本之间存在相互转化的可能,且转化规则的编码形式始终受到朴素贝叶斯模型的直接约束[5-6]。规定表示配电终端数据的编码特征,其定义表达式为:
其中,α表示信息参量标记系数最小取值,n表示标记系数最大取值,β表示编码信息提取系数,iα表示基于系数α的密文样本,in表示基于系数n的密文样本。在式(1)的基础上,设δ、ε表示两个随机选取的贝叶斯节点计数值,且δ≠ε的不等式条件恒成立,ΔU表示配电终端数据密文样本的单位累积量,联立上述物理量,可将朴素贝叶斯模型表达式定义为:
配电终端数据联合分层加密处理需要朴素贝叶斯模型与决策树组织的共同配合,故而在制定加密算法时,需要根据求解所得的模型表达式完善决策树组织的具体连接形式。
决策树组织是实现配电终端数据联合分层加密处理的关键结构,决策树组织的连接形式如图1所示。
图1 决策树组织连接形式
密文数据样本输出量决定了决策树组织对配电终端数据加密的处理能力[7]。在离散节点数量为e1,过渡节点数量为e2的情况下,可以将决策树组织中的密文数据样本输出量求解结果表示为:
式中,η表示配电终端数据的加密有效率,γ表示密码文本分层传输系数的初始赋值。在朴素贝叶斯模型作用下,密文数据样本输出量越大,表示决策树组织对配电终端数据的加密处理能力越强[8]。
数据挖掘深度也称为加密指令的联合执行深度。在分层标准保持不变的情况下,朴素贝叶斯模型对于配电终端数据的编码作用能力也保持不变,而由于决策树组织的存在,待加密数据可以借助离散节点进入过渡节点,此时将挖掘深度指标保持在标准数值区间之内,可以保障主机元件对配电终端数据联合分层加密处理能力[9-10]。设Amax表示配电终端数据在决策树组织中的最大累积量,ϕ表示数据挖掘系数,ι、κ表示两个不为零的加密数据联合度量值,sι表示度量值为ι时的密文信息分层标准,sκ表示度量值为κ时的密文信息分层标准,f表示基于朴素贝叶斯模型的数据样本密钥特征。在上述物理量的支持下,联立式(3),可将配电终端数据挖掘深度表示为:
如果配电终端数据密文模板的编码形式相同,那么这些数据样本的挖掘深度值也相等。
数据分层标准是主机元件完成配电终端数据联合分层加密处理的关键参考条件,根据密文样本取值量的不同,分层标准的划分规则也有所不同,在朴素贝叶斯模型的作用下,待加密的配电终端数据总量越多,分层标准的划分规则越细致[11-12]。规定表示待加密配电终端数据的中位数,求解式为:
设λ表示配电终端数据联合标记系数,表示加密处理过程中的关键分层指标,联立式(5),可将数据分层标准表达式定义为:
推导数据分层标准表达式时,要求系数取值不能等于密码文本分离系数的最小值与最大值。
编码密钥的创建必须参考配电终端数据明文信息的当前输出量,在朴素贝叶斯模型的作用下,更改决策树组织的连接形式,从而在适应配电终端数据分层标准的同时,匹配数据样本信息与密码样本[13-14]。设z表示配电终端数据的原码系数,Cz表示原码z的明文译码结果,μ表示明文编译系数,联立上述物理量,可将原码编译向量表示为:
联立式(6)、式(7),可将基于朴素贝叶斯的配电终端数据密钥表达式定义为:
其中,ϖ表示配电终端数据的分层加密速率。为使密钥文本能够适应配电终端数据的分层加密需求,要求系数ϖ的取值必须大于自然数“1”。
加密系数决定了主机元件对配电终端数据的处理能力。当待加密信息保持分层传输状态时,朴素贝叶斯模型对决策树组织的约束作用能力会不断减弱,不但会导致密钥文本完整性的下降,还有可能造成配电终端数据大量堆积的问题。但在已知加密系数求解结果的基础上,控制配电终端数据的输出量水平,则能够有效促进密钥文本的分层传输能力,使得文本信息的完整性得到保障[15-16]。加密系数求解表达式为:
其中,ρ表示配电终端数据的联合分布密度,m1、m2表示两个不相等的密钥文本转码系数。在配电终端数据联合分层加密处理的过程中,加密系数求解结果大于零,表示数据信息传输方向为正,加密系数求解结果小于零,表示数据信息传输方向为负。
针对配电终端数据加密处理能力的验证,可以对数据样本加密耗时进行分析。在稳定的配电终端运动环境中,数据样本加密耗时影响密文模板的完整性,对于配电主机而言,若数据样本总存储量相对较大,实施加密处理时,如果样本加密耗时较短,那么表示信息参量在加密主机与耗电设备之间的传输速率较快,单位时间内数据样本的传输量较大。由于待筛选数据较多,配电主机可以选择更合适的信息参量用于定义密文模板,故而所得密文模板的完整性也就相对较高。
实验过程中,首先搭建如图2 所示的配电终端数据传输回路,利用560-TX PRO 设备对已输出数据样本进行聚合处理,再借助XT32 处理器去除不满足实验需求的样本参量,完成上述处理步骤后,TR-A3设备再次聚合信息参量,并将这些数据反馈回配电终端主机,以供其进行后续的加密处理。
图2 配电终端数据传输回路
利用基于朴素贝叶斯的配电终端数据联合分层加密算法控制终端主机,在加密处理已筛选数据文本的过程中,记录加密耗时的数值变化情况,所得数据为实验组变量;再利用OFDM-PON 型加密方案控制终端主机,在加密处理已筛选数据文本的过程中,记录加密耗时的数值变化情况,所得数据为对照组变量;对比实验组、对照组变量数据,总结实验规律。
实验的样本对象包含顺序传输数据、逆序传输数据两种。顺序传输情况下,首次聚合的样本总量大于二次聚合;逆序传输情况下,首次聚合的样本总量小于二次聚合。
分别采用实验组、对照组加密方法,得到配电终端数据加密耗时的具体数值对比结果,如图3 所示。
图3 配电终端数据加密耗时
1)顺序数据传输:当配电终端数据传输方向为顺序时,数据加密耗时的均值水平相对较低,当配电终端数据输出量达到9×109MB 时,实验组最大耗时结果为7.5 ms,对照组最大耗时结果为33.4 ms,二者差值为25.9 ms。
2)逆序数据传输:当配电终端数据传输方向为逆序时,数据加密耗时的均值水平相对较高,当配电终端数据输出量达到9×109MB 时,实验组最大耗时结果为27.3 ms,对照组最大耗时结果为53.3 ms,二者差值为26.0 ms。
整个实验过程中,对照组配电终端数据加密耗时始终大于实验组。
综上可得实验结论为:
1)OFDM-PON 型加密方案在处理配电终端数据时,所需的加密耗时相对较长,特别是当数据信息传输方向为逆序时,该方法所需加密耗时超过了50 ms,不能有效解决密文模板完整性较差的问题。
2)基于朴素贝叶斯的加密算法可以较好地解决配电终端数据加密耗时过长的问题,当数据信息传输方向为顺向时,该方法所需加密耗时也不会超过30 ms,对于完善数据样本密文模板能够起到一定的促进性作用。
新型配电终端数据联合分层加密算法以朴素贝叶斯模型为基础,在计算数据挖掘深度的同时,建立完整的分层处理标准,再联合密钥文本,确定加密系数指标的具体计算结果。与OFDM-PON 型加密方案相比,基于朴素贝叶斯模型的加密算法可以有效解决配电终端数据加密耗时过长的问题,对于完善密文模板起到了明显的促进性作用。