基于多列神经网络的用电行为自诊断技术研究

2023-03-06 11:46王鹏飞汤铭杜元翰李效龙

微型电脑应用 2023年1期

王鹏飞，汤铭，杜元翰，李效龙

(1.国网江苏省电力有限公司信息通信分公司，江苏，南京 210024；2.国电南瑞科技股份有限公司信息系统集成分公司，江苏，南京 211100)

0 引言

当前国内的用电信息采集系统包括居民用电计量系统、企业用电计量系统和变电站负荷流量计量系统。张慧[1]认为居民用电计量系统以居民用电电能表为核心设备，目前国内绝大部分地区均已经普及了实时费控电能表系统，可以将居民用电按照尖峰平谷4个时段进行分别计量，当前部分地区开始逐渐普及拥有远程物联网抄表功能和实时录波功能的电能表系统。妙红英等[2]指出企业用电计量系统包括企业用电专变的电流互感器和电压互感器系统支持的用电负荷计量系统，该计量系统与变电站负荷流量计量系统结构相似，但后者结构更为复杂多变，精密度和难度系数也更高。

马吉科等[3]在实现用电信息采集系统自诊断功能的过程中，其核心原理为对某一负荷的用电数据特征进行大数据画像，当该画像数据出现突变时，即有可能出现计量系统的故障。但也可能会出现用户大负荷用电器的增撤或者用户实施了窃电行为。

使用多列神经网络技术，判断画像数据变化的同时，在不完备数据的前提下[4]，实现对计量系统故障、用电器配置变更、用户窃电等三大主要可能性做出基于大数据深度挖掘的主动判断，是该研究的核心创新点。

1 多列神经网络总体设计

部分居民用电计量系统仅可记录每月的用电量数据，所以考察所有计量设备的每月双向分时用电量数据作为该数据挖掘的数据来源，采用综合差值法对上述数据进行升维，使单一数据来源条件下的数据细节得到充分展现，解决数据不完备问题。

图1中，对数据求取以下多次差值，以实现数据的升维。

图1 基于差值法的数据升维方案

计算双向尖峰平谷计量数据环比差值，得到8个直接环比差值数据；计算双向尖峰平谷计量数据的同比差值，得到8个直接同比差值数据；针对上行或者下行数据，计算尖时与峰时数据差值、峰时与平时数据差值、平时与谷时数据差值、谷时与尖时数据差值，得到8个计量时段间的差值结果；对本月计量时间段差值结果按照第1步和第2步，分别计算其环比差值和同比差值，各得到8个二次差值数据，共16个二次差值数据。至此，得到40列差值升维数据，使可提供给画像模块的数据量得到充分扩充。

基于设计需求，需要对计量系统故障、用电系统变更、窃电行为影响等3种计量数据画像变更的影响原因作出判断，所以构建3列相对独立的多列神经网络进行数据挖掘分析。每列神经网络构建结构2个相同但独立运行的神经网络模块。最终分别输出3个二值化结果[5]。该架构如图2所示。

图2 多列神经网络架构图

图2中，未对48列输入数据进行模糊化处理，其原因为该48列输入结果的量纲统一为kWh，可以在输入神经网络时将其强制转化为最适应神经网络运行的双精度浮点变量(Double)格式，神经网络之间和神经网络节点之间的数据传导，也采用双精度浮点变量(Double)格式数据。经过二值化模块输出的数据虽然收敛到1.000和0.000附近，但其数据结构仍然为双精度浮点变量(Double)格式，需要在后续故障判断模块中给出如式(1)的判断过程将其整理为逻辑型变量[6],

(1)

式中,当神经网络输出值大于0.900时，故障判断模块输出逻辑真值(Logical格式)，当神经网络输出值小于0.100时，故障判断模块输出逻辑假值(Logical格式)，当神经网络输出值介于0.100和0.900之间时，认为该神经网络模块未有效收敛，该神经网络模块自身故障。

即该神经网络模块可能存在2种自身故障模式。

(1)其中1列输出的二值化结果介于0.100和0.900之间。

(2)同时出现2列或3列输出的二值化结果大于0.900。

在对该神经网络模块进行数据训练时，应确保在多次判断过程中，均不出现上述2种自身故障，方认为该神经网络在训练中充分收敛。

2 多列神经网络的模块细节设计

上述多列神经网络整体设计中，每1列神经网络模块均包含1个降维模块和1个二值化模块。3列神经网络中，对应的降维模块和二值化模块内部结构相同但训练收敛过程中的待回归变量赋值内容不同，以形成对3种不同计量系统故障原因的判断功能。以下讨论该降维模块和二值化模块的设计过程。

(1)降维模块

降维模块将经过前置基于差值法升维计算的48列数据进行降维处理，输出1个双精度浮点型变量(Double格式)，因为数据降维过程会造成大比例的信息损失，损失信息量需要使用降维模块的待回归变量进行消化[7]。所以，常规降维模块的节点设计采用多项式回归函数，其基函数如式(2)：

(2)

式中，Xi为输入变量集中的第i个输入量，Y为节点输出量，j为多项式阶数，Aj为第j阶多项式的待回归系数。

因为该多项式回归函数拥有6个待回归系数，所以能有效的处理数据降维过程中的信息损失量。借鉴相关研究的设计方案，采用40%的降维压缩率，每一层隐藏层将数据维度压缩40%，故形成表1中的降维模块分层架构。

表1 降维模块分层架构设计参数表

表1中，除输入层和输出层外，共设计3层隐藏层架构，隐藏层共包含32个节点，整个模块共包含81个节点。所有节点均采用式(2)的六阶多项式回归函数进行节点设计。该降维模块输出的数据，输入到二值化模块中进行二值化处理。

(2)二值化模块

二值化模块的统计学意义在于使降维模块输出的结果实现二值化，即使其投影向1.000或0.000进行偏移。与降维模块需要的较大数据处理量不同，二值化模块的设计较为简单，数据挖掘需求较为单一。大部分数据投影整理工作均交由降维模块处理，二值化模块仅提供一次后置的数据重投影处理[8]。

二值化模块采用二值化函数进行节点设计，其节点基函数可写作式(3)：

Y=∑(A·eXi+B)-1

(3)

式中，Xi为输入变量集中的第i个输入量，Y为节点输出量，e为自然常数，此处取近似值e=2.718 281 828，A、B为节点待回归系数。

因为二值化模块无数据升维与降维操作，其隐藏层设计目的为确保模块内拥有足够的待回归系数资源，且使该模块占用的算力资源足够小。所以，该二值化模块的架构设计采用表2方案。

表2 二值化模块分层架构设计参数表

表2中，该二值化模块的输入层和输出层均为1个节点，隐藏层分别包含3个、7个、3个节点，整个模块含输入层输出层在内，共包含15个节点，所有节点均采用式(3)二值化函数进行节点设计。

3 数据仿真验证结果

该系统在早期系统中并无可参照系统作为仿真验证参照组数据。本实验对比的早期方法指，对居民用电计量系统、企业用电计量系统、变电站负荷流量计量系统进行分别管理，利用较为复杂的工作流程，特别借助计量人员的现场确认和设备拆检确认故障类型[9-10]。所以，仿真验证参照组数据来自早期计量稽查工作的综合日志数据。

观察组数据来自该系统经过充分训练收敛后，带入近3年相关数据进行数据仿真运行，从而确定其实际数据挖掘效能。仿真系统为电力CAE系统中的SimuWorks模块，该模块在电力管理信息系统验证中属于成熟技术，具有较强的稳定性和可用性。

判断人工介入的早期判读结果和该系统给出的判读结果，可以得到表3中的仿真验证对比数据。

表3 判断敏感性仿真验证对比数据

表3中，t值来源与使用SPSS24.0对仿真数据进行双变量t校验的直接输出结果，该结果小于10.000时，认为数据存在统计学差异，且t值越小，认为数据差异性越大。P值来源为使用SPSS24.0对仿真数据进行双变量t校验的log变量输出值，当P<0.05时，认为该双变量t校验结果处于置信空间内，当P<0.01时，认为该双变量t校验结果具有显著的统计学意义。经过分析，上述4组比较结果中，均出现t<10.000，P<0.01的分析结果，证实该系统较早期方法有显著的统计学差异。在计量系统故障、用电系统变更、窃电行为影响和总和敏感性方面，该系统较早期方法分别实现了14.3%、83.7%、36.3%、34.8%的计算效能提升。

4 总结

使用多列神经网络系统可以将功能细分化，在仅考察电能计量系统的上行和下行计量结果中的每月尖峰平谷分时数据，即可判断计量系统的主要故障，给出该故障的实际原因。该系统投入使用后，针对居民、厂矿企业、变电站的计量系统故障自诊断管理将实现统一化，对未来电力计量系统的整体管理效率提升有积极意义。