张浩海,王昊,丁耀杰
(北京中电普华信息技术有限公司,北京 100000)
电力物联网应用于电力系统发电、输电等全部环节中,电能数据具有极强的周期性[1],利用历史数据作为电能数据缺失修复方法的依据,对于电能数据修复具有重要意义。DA(Data Augmentation)多重插补法通过缺失电能数据的可能分布值修复缺失数据。DA 多重插补法结合观测数据与数据的先验数据实现数据修复。该文提出基于DA 多重插补法和电力物联网的电能数据缺失修复方法,提升电力物联网中海量电能数据的应用性能。
电力物联网的总体结构图如图1 所示。
图1 电力物联网总体结构图
通过图1 电力物联网的总体结构图可以看出,电力物联网的各个环节共同作用,实现电力物联网在电力系统中的良好应用。电力物联网利用感知层的设备终端采集电能信息,处理电能信息相关数据[2-4]。电力物联网的通信层,利用移动通信技术等网络设施,对感知层采集的信息进行数据接入与传输。平台层将所采集的电能信息整合处理,平台层具有存储数据、缺失电能数据修复、检索数据以及保护电力系统的数据资源安全性的功能。应用层接收用户提交请求后,从平台层调取数据,利用平台层分析处理后的数据,为用户提供服务。电力物联网利用感知层的电能数据采集终端采集电能数据。电力物联网运行过程,是采集电能数据、传输电能数据与处理电能数据的过程[5-7]。电能数据的完整性与可靠性是电力物联网可靠运行的重要前提。电力系统在数据感知与处理过程中,容易出现数据缺失情况,数据缺失对于电力系统电能数据的实际应用具有重要影响。数据缺失将导致很多业务无法顺利开展。如电能数据中的电压波形数据丢失时,无法精准识别电能质量干扰情况,无法精准定位电力系统故障信息[8-9]。及时修复电力物联网中的电能缺失数据,对于保障电力系统中业务正常运行、利用完整数据建设电力物联网具有重要意义。
利用EM 插补算法对电能物联网中的电能数据的缺失值进行初始插补处理。EM(Expectation-Maximum)算法即期望最大化算法,该算法利用极大似然估计方法,估计给定的电能观测数据。假设X为电力物联网中电能数据的观测数据集,Y为电力物联网中的缺失电能数据集,电力物联网中包含缺失电能数据的全部电能数据集Z=(X,Y),该电能数据集Z的概率密度函数表达式为:
式中,p为缺失电能数据的概率,θ为电能数据概率密度函数的缺失电能数据参数,x、y、z分别为电力物联网中电能数据集X、Y、Z中的数据。缺失电能数据y的假设、缺失电能数据参数θ的初始估计值、缺失电能数据y与观测电能数据变量及电能数据边缘密度函数p(x|θ)间的关联,是决定电能数据概率密度函数p(z|θ)的重要因素。依据式(1),获取电力物联网中全部电能数据集的似然函数表达式为:
式中,L为电能物联网中全部电能数据集似然函数的似然性。考虑到电力物联网中,缺失的电能数据存在未知性[10],因此似然函数L(θ|Z)是依据缺失电能数据Y产生的随机数。为提升似然函数估计的准确性,假设缺失电能数据变量为不完全随机缺失[11-12],即该类电能数据的缺失依赖于其他完全电能数据的变量。
给定观测数据集X与缺失电能数据参数θ的初始估计值后,利用EM 算法的E 步骤与M 步骤对电力物联网中的缺失电能数据进行挖掘。E 步骤是计算与完全电能数据对数似然函数lnp(X,Y|θ)关联的缺失数据集Y的期望。完全电能数据对数似然函数期望的表达式为:
式中,θi表示现有已知参数的估计值。其中,Y中的数据服从y→f(y|X,θi)分布。
似然函数h(θ,Y)的最优化表达式如下:
式(4)可以转化如下:
式中,f(y|X,θi)表示电力物联网中电能缺失数据y的边缘密度函数,参数θi和观测数据对边缘密度函数影响较大。
存在式(6)的函数:
参数θ与因子f(X|θi)无直接关联,电力物联网中电能数据缺失修复过程中,将f(y|X,θi) 利用f(y,X|θi) 代替,对式(4)的似然函数最优化不存在影响。
利用EM 算法对电力物联网中的电能数据进行插补处理的第二步M 步骤,通过搜寻θi+1,将期望值g(θ|θi,X)进行最大化处理,令θi+1值满足以下公式:
式中,Θ 表示参数空间。
EM 算法依据算法参数与电力物联网中缺失电能数据间的关系,插补缺失数据。电能缺失数据已知,算法参数未知时,算法参数可以利用电能缺失数据估计;算法参数已知时,利用算法参数可以精准估计电能缺失数据。假设可以利用算法参数估计电能缺失数据,利用电能缺失数据修复算法参数[13-14]。重复迭代以上过程,直至算法参数为收敛状态,利用收敛的算法参数获取电力物联网中的缺失电能数据。EM 算法利用重复迭代过程,获取极大似然估计结果。数据重复迭代过程,可以增加似然函数值,同时将似然函数值快速收敛至局部极大值,该算法具有较高的稳定性,计算简便。
将利用EM算法获取的电力物联网缺失电能数据初始插补结果[15-16],作为DA 多重插补法的插补初始值,获取最终电能数据缺失修复结果。DA多重插补法充分考虑电力物联网中电能数据的时间序列,利用局部加权回归模型修复电力物联网的缺失电能数据。用φ0表示包含利用EM 算法获取缺失电能数据初始插补结果的初始观测数据,DA 多重插补法修复电力物联网缺失电能数据的观测方程表达式如下:
缺失电能数据修复的状态方程表达式如下:
式中,Yt与φt分别观测向量以及期望向量,vt与wt分别表示观测误差与状态误差。DA 多重插补法采用动态正态模型,更好的修复缺失电能数据。相对于φt-1,φt存在一个状态误差,状态误差序列wt与观测误差序列vt为互相独立状态。
DA 多重插补法利用局部加权回归模型,更新电能数据状态,修复电力物联网内海量电能数据的缺失数据。局部加权回归模型可以灵活地探索不同变量间的关系。利用局部加权回归模型修复电力物联网的缺失电能数据时,对电能数据φt进行局部多项式估计处理,构建一元非参数回归模型表达式如下:
式中,yt与m(φt) 分别表示实际电能数据以及模型预测值,ut表示随机误差项。电能数据缺失修复时,随机误差项的期望值为0。
设m(φt) 表示电力物联网电能数据φ0附近的p+1 阶导数。数据φ0的邻域表达式如下:
一元非参数回归模型的加权误差平均和需要满足以下公式:
式中,wt表示模型的权重,t=1,2,…,T,表示局部加权时间参数。
式(13)中的稳健权数表达式如下:
式中,c表示固定时间段内,电力物联网电能数据的中值函数。
利用稳健权数ξ对模型参数估计,获取最新预测误差值et。依据误差最小化原则,获取电力物联网电能数据缺失值修复的插补值,完成电力物联网的电能数据缺失修复。
为了验证所研究方法修复电力物联网的缺失电能数据有效性,选取某电力企业作为研究对象。该电力企业利用电力物联网为用户提供服务,电力物联网缺失电能数据修复性能决定电力企业对用户的服务性能。选取该电力企业供电区域的某用户的电流数据作为研究对象。采集该用户2019年12月1日-12 月31 日的用电电流数据,该用户A 相、B 相以及C相三相电流的额定电流为4 A,电能数据缺失值的取值区间为[0,4]。用户的电流数据具有极强的周期性,缺失电能数据修复有助于分析用户用电情况。
电力物联网的感知层利用电能数据采集终端,采集该用户的三相电流原始数据,如表1 所示。
表1 用户原始三相电流数据
通过表1 电能数据采集结果可以看出,电力物联网利用感知层采集的用户电能数据中的三相电流数据中,存在明显的缺失数据,影响电能数据在电力物联网中的应用。利用文中电力物联网电能数据缺失修复方法,精准修复用户缺失的三相电流数据,提升电力物联网的应用性能。
利用EM 插补算法,依据所采集的电力物联网电能数据,插补计算缺失的电能数据。EM 算法获取缺失数据的初始插补结果如表2 所示。
表2 缺失电能数据初始插补结果
通过表2 实验结果可以看出,采用文中方法可以有效利用EM 插补算法,获取电力物联网中,该用户三相电流数据中的电流插补数据。将利用EM 插补算法获取的缺失电能数据插补结果,作为DA 多重插补法的初始值。DA 多重插补法依据初始插补数据对缺失电能数据进行多次插补。DA 多重插补法的插补结果如图2 所示。
图2 DA多重插补法的插补结果
通过图2 实验结果可以看出,该文方法利用DA多重插补法,可以有效获取电力物联网中三相电流数据的缺失插补值。
计算利用DA 多重插补法,对电力物联网电能缺失数据插补结果的状态误差方差,八次插补的状态误差方差统计结果如图3 所示。
图3 插补状态误差方差统计结果
通过图3 实验结果可以看出,利用DA 多重插补法插补电力物联网的缺失电能数据,三相电流数据的插补结果中,第六次插补的三相电流数据的状态误差方差为8 次插补结果中的最低值,实验结果表明,八次插补中,第六次的插补结果为最优值。选取第六次的插补结果作为电力物联网缺失电能数据的最终修复结果。
电能数据缺失率对电力物联网缺失电能数据修复结果存在明显影响。统计不同缺失率时,采用该文方法修复电力物联网缺失电能数据的观测误差方差,统计结果如图4 所示。通过图4 实验结果可以看出,采用该文方法修复电力物联网中的缺失电能数据,不同缺失率情况下,采用该文方法修复电力物联网中用户的三相电流数据,电能数据缺失修复的观测误差方差均低于0.2。实验结果验证,该文方法具有较高的缺失电能数据修复水平,不受电能数据缺失率影响。不同电能数据缺失率时,缺失电能数据修复性能良好,可应用于电力物联网的实际应用中。
为了进一步衡量该文方法对电力物联网中的缺失电能数据的修复性能,统计采用该文方法对用户于2019 年12 月5 日-12 月12 日的缺失电能数据修复结果,如图5 所示。
图5 电能数据缺失修复结果
通过图5 实验结果可以看出,采用该文方法不仅可以修复电力物联网在短期内缺失的电能数据,对于缺失的长期电能数据同样具有良好的修复性能。该文方法可以有效修复电力物联网中缺失的电能数据。采用该文方法修复电力物联网缺失电能数据,修复性能稳定,电力物联网缺失电能数据修复的应用性较高。
对电力物联网感知层的电能数据采集终端,采集电能数据过程中的缺失数据进行修复,对于提升电力物联网的数据完整度,以及服务质量具有重要意义。选取某电力企业的电力物联网作为研究对象,验证不同缺失率情况下,该方法均可以有效修复电力物联网的缺失电能数据,修复效果良好。该方法充分考虑了电力物联网电能数据的波动特性,不仅可以有效描述电力物联网内电能数据的短期变化,同时可以描述电力物联网电能数据的长期变化规律,对于短期与长期的缺失电能数据,均可以精准修复,提升电力物联网的电能数据质量。