赵猛,刘怡
(国网天津市电力公司信息通信公司,天津 300010)
数据采集是指通过传感器及其他待测设备,将模拟信号从被测单元中提取出来的处理过程,其面向电量信号、非电量信号等多种采集对象。随着电力信息改革的不断发展,实现数据信息的多通道采集迫在眉睫。
数据备份是信息容灾处理的基础,是指针对信息传输故障进行的复制文件存储行为。一般来说,待处理的信息文件越多,数据备份指令的执行也就越频繁[1-2]。
在电力信息传输环境中,数据采集与数据备份是两个相互关联的研究课题,前者注重对于传输信息的按需提取,后者则可针对关键传输文件进行指向性存储。
传统电力调度数据网采集方案只能采集到广域状态下的电量数据信息,并不能实现对电力信息数据存储开销的有效节约[3]。而MEMD 和HHT 方法则注重对电力系统的低频振荡模式进行识别,虽然能够实现数据文件的按需转换,但对于信息参量所采取的压缩比数值过小,并不能完全满足电量信息数据的高效性传输需求[4]。
为解决上述问题,该文从信息量采集、数据资源备份两方面同时入手,提出电力信息数据多通道采集与自动备份方法。
在电力信息传输环境中,数据参量的多通道采集包含电压和电流有效值确定、畸变因数计算、功率因数计算三个基本处理环节,具体操作方法如下。
平衡电力信息系统中数据谐波之间的响应关系,是获得多通道数据采集结果的重要处理环节。在频率域环境中,为使电力信息数据多通道采集结果具有较高的应用价值,应同时对电压与电流的谐波分量值进行求解,并将所获数值结果分别相加,从而实现对电压有效值、电流有效值的按需计算。
电压有效值决定了电力信息数据的瞬时传输速率。在多通道环境中,受到电网覆盖面积等因素的影响,该项物理指标的数值结果越大,相应情况下的信息数据输出速率也就越快[5]。
设v代表电力信息数据的实时传输速率,βv代表不同传输速率下电压信号的谐波分量值,Umax代表谐波电压的最大表现数值,联立上述物理量,可将电压有效值表达式定义为:
电流有效值决定了电力信息数据的实际传输距离,在多通道环境中,该项物理指标的实时数值结果可随电信号输出量的变化而不断波动,但最终会趋于持续稳定的表现形式[6]。设λ表示电流信号的谐波分量值,Imax表示谐波电流的最大表现数值,ΔW表示电力信息数据的实时变化量,联立上述物理量,可将电流有效值定义为:
对于电力信息数据而言,信号量多通道采集结果始终受到电压与电流有效值的直接影响。
电压畸变因数是以电压有效值为基础的电量信息数据采集有效性衡量条件,就多通道传输环境而言,电网主机中存储的信息数据量值越多,畸变因数的数值就越大[7]。
设φ代表电压信号采集系数,代表电力信息数据的单位输出均值,Umin代表谐波电压的最小表现数值,联立式(1),可将电压畸变因数计算结果表示为:
电流畸变因数是以电流有效值为基础的电量信息数据采集有效性衡量条件,能够根据电信号数据的实际输出水平,确定主机元件所具备的信息存储能力,从而将待采集的信息参量平均分配至多个不同的通道体系中[8]。
设ξ代表电流信号采集系数,Imin代表谐波电流的最小表现数值,联立式(2),可将电流畸变因数计算结果表示为:
在多通道传输环境下,畸变因数计算量的数值结果越大,最终所能采集到的电力信息数据也就越多。
功率因数是电压畸变因数与电流畸变因数的乘积表现形式,决定了电网主机所具备的信息数据采集能力。若采取多通道同时开发的采集形式,则可认为所有数据信息的采集结果都是唯一且单向存在的[9-10]。
设ΔT代表电力信息数据的单位传输时长,在DU>DI的情况下,功率因数P的计算值结果偏大;而在DU<DI的情况下,功率因数P的计算值结果则偏小;只有在DU数值与DI数值基本相等的情况下,才能得到较为准确的P值计算结果。联立式(3)、式(4),可将功率因数P表达式定义为:
功率因数计算项对于电力信息数据多通道采集结果的影响能力最强,因此在实施采集处理的过程中,应尽可能保证该项指标参量计算结果的真实性。
电力信息数据自动备份是在多通道采集基础上对传输信息进行二次加工与处理,具体实施流程包含信息流量统计、数据模式匹配、备份编码阈值计算三个操作环节。
在电力信息数据多通道传输环境中,由于各级信息量采集结果只能满足最原始的数据请求操作,因此,需要在原有数据信息的基础上,对相关传输参量进行二次备份处理[11]。
信息流量是与数据参量自动备份操作直接相关的干扰项指标,一般来说,随着原数据信息编码条件的改变,整个多通道电力通信环境会进入相对变动的存在状态。在此情况下,若不能及时对传输参量进行采集与提取,不但会造成数据信息总存储开销量的增大,也会在一定程度上促使信息压缩比数值趋于不断下降的变化趋势[12]。而信息流量指标的存在,不但能够在最短时间内确定数据信息所处的实时传输位置,也能通过多通道感知的方式,实现对待备份参量的定向筛选,这也是数据信息存储开销结果能够得到有效控制的最主要原因。设en代表n个不同的电力信息数据备份解码系数,其中n表示电力数据信息量,联立式(5),可将电力信息数据在备份过程中的流量统计结果表示为:
其中,χ表示电力信息数据的存储量,f表示数据信息的实时传输量,表示n个备份解码系数的物理平均值。由于所有电力信息数据都只能存储在单一的备份空间中,所以信息流量值越大,备份空间中数据节点所具备的存储能力也就越强。
数据模式匹配是实现电力信息数据自动备份的关键处理环节,在多通道采集条件的支持下,能够挖掘到的数据信息总量值越大,最终能够收获的匹配模式也就越复杂,与之相关的备份结果也就越完善。在实际处理过程中,数据模式匹配结果能够干预电力信息数据的实际挖掘强度,并可针对各级备份节点,生成多个不同的数据信息阵列,以供通信主机的直接调取与应用。
为获得更为理想的电力信息数据备份结果,数据模式匹配处理应从信息对象之间的子串相似性入手,在排查传输参量之间模式共通能力的同时,建立定向的关系型映射,一方面能够避免已备份数据、未备份数据之间出现混乱存储的情况,另一方面也可在最短时间内获得最为理想的数据模式匹配结果[13-14]。
设κ代表电力信息数据的实时排查系数,c代表信息数据共通参量,cmin和cmax分别代表信息数据共通参量的最小值和最大值,联立式(6),可将电力信息数据备份处理前的模式匹配结果表示为:
其中,μ代表电力数据信息流量的统筹速率,mc代表不同信息参量下的定向匹配系数,ΔK代表单位时间内的电力信息数据传输量。在实际应用过程中,数据模式匹配结果将直接影响电力通信主机所具备的信息备份能力。
由于电力信息数据的实时存储量较大,因此为获得较为稳定的备份处理结果,应针对不同的信息参量进行按需编码,并根据最终的编码结果,确定阈值计算量的真实物理数值[15-16]。
规定在一个备份区段中,电力信息数据的单节点最大通过量只能达到,且随着传输时间的延长,该项物理量的数值结果只会呈现不断下降的变化趋势。设τ代表电力信息数据的原定码源值,联立式(7),可将备份编码阈值计算表达式定义为:
式中,θ代表预设的备份信息量上限编码数值。按照上述操作流程,完成对既定信息数据的编码与调度,再联合已知的处理结果,完成对电力信息数据多通道采集与自动备份方法的设计。
电力信息数据的采集与备份性能通常以存储开销、压缩比两个指标来衡量,以实验数据为基础对上述性能指标进行详细比较,并从中总结出相应的结论。
实验组,首先对测试电力信息数据采取了三种不同的备份方式:该文方法、基于电力调度的数据采集备份方法以及基于MEMD 和HHT 的数据采集与自动备份方法,然后以实验结果作为基础,比较了三种方法在时间方面的总存储开销S(n)(即储存空间占比),n为电力数据信息量,并分别引入了三者的理论值结果作为参照,其具体对比情况如图1 所示。图1 中,上述三种方法的总存储开销都随着电力数据信息量的增大而增大,但是基于MEMD 和HHT 的方法和该文方法的增长趋势明显比基于电力调度采集方案更为缓慢。与该文方法相比,基于MEMD 和HHT 的方法虽未出现阶跃式增长,但其变化曲线始终位于多通道采集与自动备份方法上端。综上可证明,在所选取的三种方法中,该文方法具有最低的存储开销。
图1 总存储开销对比
压缩比能够反映电力信息数据的压缩程度。一般来说,压缩比数值越大则代表所选用方法对于电力信息数据的采集与备份处理能力越强。表1 给出了当电力数据信息量n=3 399.86 MB 时所选取三种方法的压缩比。
表1 压缩比数值对比
分析表1 可知,在总存储开销量相对较小的情况下,上述三种方法的实验压缩比数值均高于理论压缩比数值,其中基于MEMD 和HHT 的方法对于电力信息数据的压缩能力最弱,其实验压缩比数值明显低于另外两种方法。该文方法对于电力信息数据的压缩能力最强,与基于电力调度采集方法相比,其实验压缩比数值增大了1.42。综上可知,在所选取的三种方法中,该文方法对于电力信息数据的压缩能力最强,在信息实时处理方面的应用能力也最强。
电力信息数据多通道采集与自动备份方法从节约电力信息数据存储开销的角度入手,在保持高水平信息参量压缩比数值的基础上,根据电压和电流有效值结果,对畸变因数与功率因数进行按需计算,再通过统计信息流量数值的方式,得到准确的备份编码阈值结果。在实际应用过程中,该方法能够以最低的开销数值对电力信息数据进行存储,不但能够较好满足实际应用需求,也可以将压缩比指标控制在理想化的数值区间之内。