梁旭常 汪毅 严杰峰 靳光 林健东
摘要:针对配变台区的变户关系梳理的必要性,以及当前获取变户关系的各种方法均受现场条件制约的情况,创新性的提出基于电量守恒原理的大数据配变台区的变户关系梳理分析方法。利用计量自动化系统和营销档案系统的原始数据,通过配变线损成因数学模型的建立、大数据算法应用,在计算过程中不断进行模型调优,对最终结果进行不确定度评估一系列的数学方法,采用纯数据计算的方式实现配变台区的变户关系梳理。最后以事实数据进行实际应用中的案例分析并描述了该技术的扩展性。
关键词:配变台区的变户关系;电量守恒;计算模型;回流数据;
Research and application of transformer customer relationship model based on energy conservation data calculation
LIANG Xuchang 1, WANGYi2, YAN Jiefeng 1, JIN Guang 1,LIN Jiandong 1
(1. Foshan Power Supply Bureau of Guangdong Power Grid Co., Ltd,Foshan 528010,China; 2. Wuhan Guoce D&T Co., Ltd,Wuhan 430223,China)
Abstract: In view of the necessity of sorting out the relationship between distribution transformer and household, as well as the current situation that various methods to obtain the relationship between distribution transformer and household are restricted by the site conditions, an innovative analysis method based on the principle of electricity conservation is proposed. Using the original data of measurement automation system and marketing archives system, through the establishment of mathematical model of distribution transformer line loss causes and the application of big data algorithm, the model is continuously optimized in the calculation process, and a series of mathematical methods are used to evaluate the uncertainty of the final results. The pure data calculation method is used to sort out the distribution transformer customer relationship. Finally, a case study is given to illustrate the scalability of the technology.
Keywords: transformer household relationship; energy conservation principle;computational model; backflow data;
引言
维护配用电网“站线变户”关系准确,靠的是严谨的管理措施和科学的技术手段,一是建立配网工程电子化移交管理机制确保数据录入和共享及时性;二是加强中压单线图管理,实现归档闭环保障,推动中压“站线变”关系的准确性[6-7]。但是对于低压配变的负荷割接、搶修业务等导致的“变户”关系变更暂无硬性规定落实维护工作,将是“站线变户”关系不准确的主要诱因;另外数据迁移及各相关源数据系统间接口功能不完善不稳定所造成数据质量问题是“站线变户”关系不准确的客观因数。档案与现场管理是否一致,没有有效的监督手段。
针对低压配变管理的顽疾,国内学者进行了一些研究,设计出回路测量法[1-2]、出口电压归算法[3]和开关状态分析法[4]方法以及配变识别仪[5]等治理方法及设备,但是这些方法使用的数据如电流数据、电压数据是绝大多数智能电能表无法集抄到的,如果加装设备,治理费用比较昂贵,且需要投入大量现场工作人员进行实地测量。
文章提出的仅使用智能电能表集采的电能量数据,基于同一时刻配变供用电符合电能量守恒关系这一基础建模,使用数学分析算法,梳理出配变正确的变户关系。基于能量守恒的配变台区的变户关系计算模型和算法梳理配变台区的变户关系,可以极大程度上节约实地考察的工作人员人力成本,提高排查效率。
配变台区的变户关系准确的必要性
配变台区变户关系的正确性直接影响自动抄表成功率,更影响配变线损计算的准确。配用电网“站线变户”关系是营配信息集成最基础的数据对象,更被各个专业系统共享应用,支撑着企业涉及计量线损、配网运行、生产维护和规划建设等多个专业的数据分析。因此必须常态化开展配变台区的变户关系监控与分析,确保其准备有限与现场实际一致。
当前获取变户关系的各种方法均受现场安装条件制约——配变识别仪,需要人工逐户排查,成本太高,错乱关系容易反复;载波技术受限于目前佛山局只有30%的配变采用载波技术与终端智能表进行通信,无法在全市推广;瞬时停电法,影响用户用电,负面影响较大,难以实现。
而新技术的配变智能终端应用,也因为更换设备购置计划及施工成本而不能马上全面铺开应用。
在不需要增加现场安装监测采集设备进行排查的情况下,通过纯粹的数据计算,计算配变和用户的变户关系和梳理相当一部分计量异常而造成线损异常的问题,解决配变台区的变户关系紊乱难题,靶向变户关系异常用户或表计,再通过电量守恒原理对变户关系异常进行梳理还原真实的线损数据。有利于指导供电所对投运时间比较长,线路复杂、变户关系畸变的小区开展有针对性的变户关系整改工作。同时在计算过程中,分析低压集抄电能数据质量,定位异常数据和异常终端,为准确计量运维打下良好的基础,将降低员工劳动强度、提升供电效益。
数学建模基础
本研究使用数据挖掘技术,基于电量输送守恒、电量不会突变的原理,在历史数据足够而且数据质量保证的情况下,使用纯粹的数据计算方法,利用线性理论分析和基于机器学习的最小残差二乘法,优化穷举和回归模型,对低压配变计量系统数据进行输入总表及输出分表变户关系精准定位对应,真实反映配变的实际损耗[8-9]。
模型中每个参数对应于配变下每个用户,正确计算出等值左右两边的结果,则推出了配变真实的配变台区的变户关系和串户清单。
配变供用电电量守恒
从电学原理看,配变台区的变户关系正确充分且必要条件是配变输入电电量等于用户用电量之和加上系统网损,即:
w_0 (1+x_0 )=∑_(i=1)^n?〖w_i (1+x_i )+f(w_0,w_i,x_0,x_i,cos?〖φ_0,cos?〖φ_i 〗 〗 ) 〗 (1)
式(1)中,
w_0,w_i分别代表总电能表和用户分表的电电量数值;
x_0,x_i分别为总表和各分表的对应电电量数值的测量误差;
cosφ_0,cosφ_i分别为总表和各分表的对应的功率因数;
f(w_0,w_i,x_0,x_i,cosφ_0,cosφ_i)为系统网损,是多个变量的函数;
忽略电能表误差和网损的情况下,配变台区的变户关系正确的判据可以描述为:
?〖 w〗_(0i )=min{[〖 w〗_(0 ) (1+x_0 )-∑_(i=1)^n?〖w_i (1+x_i ) 〗]-〖 c〗_(i ) } (2)
在电量守恒的条件下,如果能找到一组数据使得等式(2)成立,那么这个数据集对应的变户关系,就是这个配变的正确配变台区的变户关系。
最小残差模型
在所有可能的(不管现状下是不是在本配变的用户电能表)电能表中,利用式(1)求解n元n次方程组,计算电能表计量误差x_i。
利用式(2)寻找min{[〖 w〗_(0 ) (1+x_0 )-∑_(i=1)^n?〖w_i (1+x_i ) 〗]-〖 c〗_(i ) }最优解,对应[〖 w〗_(0 ) (1+x_0 )-∑_(i=1)^n?〖w_i (1+x_i ) 〗]-〖 c〗_(i )的值最小的组合∑_(i=1)^n?〖w_i (1+x_i ) 〗即为最优解。当电量守恒时,最优解即为此时的真实变户关系,从而达到计算串户的目的。
梯度下降算法
在寻找最优解的过程中,需要用到梯度下降算法。利用迭代的思想,不断的更新θ值,最终θ会收缩到某个值上[10]。
θ=θ-α ?J(θ)/?θ
其中,α为步长,即学习率。
在机器学习中,对于很多监督学习模型,需要对原始的模型构建损失函数,再通过优化算法对损失函数进行优化,以便找到最优的参数。
梯度下降法作为机器学习中较常使用的优化算法,在其求解过程中,只需要求解损失函数的一阶导数,计算的代价比较小。
梯度下降法有三种不同的形式:批量梯度下降(Batch Gradient Descent)、随机梯度下降(Stochastic Gradient Descent)以及小批量梯度下降(Mini-Batch Gradient Descent)。其中小批量梯度下降法也常用在深度學习中进行模型的训练。
考虑到计算的前提条件是电量守恒,因此在三种算法中选择批量梯度下降较为合理。批量梯度下降法是最原始的形式,计算过程中在每一次迭代时使用所有样本来进行梯度的更新,其优点是由全数据集确定的方向能够更好地代表样本总体,从而更准确地朝向极值所在的方向。当目标函数为凸函数时,一定能够得到全局最优。
计算模型调优
计算过程中的过拟合问题
过拟合产生的原因是因为θ值过多或者是θ值过大造成的,解决方法可以使用L1正则(又称为lasso回归)或者L2正则(又称为ridge回归,岭回归)或者elastic net(弹性网络)算法[11]。
对于基于电量守恒的模型,Ridge模型具有较高的准确性、鲁棒性以及稳定性,不会丢失特征。
J(θ)=1/2 ∑_(i=1)^m?(h_θ (x_i )-y_i )^2 +λ∑_(j=1)^n?θ_j^2
机器学习调参
在实际工作中,对于各种算法模型来讲,需要获取θ、λ、p的值;θ的求解其实就是算法模型的求解,一般不需要开发人员参与(算法已经实现),主要需要求解的是λ和p的值,这个过程就叫做调参(超参)。
经过不断实践,使用交叉验证可以将训练数据分为多份,其中一份进行数据验证并获取最优的超参。
计算结果的不确定度评估
计算不确定度影响
配变用户用电习惯相似,用电数据自相关和多重共线性严重,将带来计算的不确定性:
配变缺户
配变缺户导致计算精度下降,而计算精度下降的直接后果是需要增加现场核验的次数。计算精度高于82%时,现场核验次数小于2次,计算精度每下降7%,现场核验次数需增加1次。
缺用户计量数据
缺用户计量数据大于3%时,每增加一个百分点,精度约下降15%,因此,缺户数高于3%的配变组团,应先进行预排查清理,再做配变台区的变户关系梳理和线损计算。
有效数据长度影响
所有用户“部分无抄”的并集被排除后的有效数据长度,不应小于整体户数的1.2倍。当“部分无抄”占有效数据的比例大于配变纳入计算户数的5%时,每增加一个百分点,精度约下降12%。
影响计算结果准确率的因素
1)配变台区的变户关系计算基础是电能物理量的守恒,电能数据的真实性将直接影响计算结果的正确性,那就不难理解如下情况将降低计算的准确度:
2)配变内总表或其中某些用户电能表故障、或者存在偷漏电现象,电能表不能正常反应该用户的用电电量;
3)电能表的数据传输(采集)或数据的系统入库异常,令数据异常(衰减或突变);
4)存在电能表更换,电量(表码)不能延续;
5)回流库源数据产生断面,或档案错位。
提高计算结果准确度策略
提前进行数据清洗和修补:
数据源是建模计算的基础,本计算的数据主要来源是计量自动化系统和营销档案系统。对于数据,要求进入模型计算前先进行分析、清洗、修补,对比数据是否一致,需要确认数据异常是否存在传输差异,确认是否系统原因导致数据异常;确认现场工作原因导致数据异常;核对系统表计信息;分析数据缺漏的原因,如果不是计量装置计量的问题所引起的数据,应考虑用历史数据进行拟合修补缺漏。
保证数据质量
1)数据长度足够长
配变取数(时间)长度不少于配变用户数。如果某配变有100户用户智能电能表,数据长度须等于或大于100天。数据长度越长,配变台区变户关系的计算结果越准确。
2)丟失电量足够小
“丢失电量”指的是没有经过电能表计量的电量。当丢失电量达到一定程度时,配变建模前需要先做丢失电量计算(例如,先做窃电计算),然后再做配变台区的变户关系梳理。
例如,奥园8A分表个数是337,线损率是-19,17,分表中有336块数据都不完整,有效天数是32天,所以系统的判断是集中器故障,不能形成守恒计算。
3)获取断面营销数据
所谓“断面”,即计算配变的变户关系,无论配变营销档案关系数据是否正确,只需要调用一次配变营销档案关系数据。该断面营销数据,作为启动计算赋初始值使用。
4)准确获取计量数据与营销档案的关系
从计量自动化系统获取的数据为表码,属于电能表呈现的二次数据,而进行电量守恒计算的是电量,这就要求将营销系统的计量倍率同步准确的对应获取,先对应算准用户的一次电量,才能开展计算,否则将引起很大的计算误差。
建模梳理策略
模型设计
运行中的配变,存在多种影响配变电量不守恒的因素,包括各类智能电能表故障、集中器采集故障、窃电、临时用电、居民自发电、临时用电、电流互感器变比登录错误、营销档案登录错误等,所有的影响因素都会破坏配变供用电的电量守恒关系,破坏建模的基础。
不同的配变,存在的影响因素的种类和数量大小不同,配变的电能数据集的特征就不同。面对配变相互关系缠绕的干扰因素集群,不可能通过一次穷举就梳理清楚所有的配变分表与变压器下总表的变户对应关系。
多重共线性影响分析
多重共线性是指线性回归模型中的变量之间由于存在高度相关而使模型严重失真。配变中许多不同用户有着相似的用电习惯和节奏,夏天同时打开空调,作息时间基本相同等等,这些相似的习惯会导致电能数据之间的强相关。配变电能数据的多重共线性问题,是导致计算电能表计量误差失准的最严重数据问题。
为了克服多重共线性对结果的影响,梳理过程中,需要用到主成分分析、岭回归和对偏最小二乘回归,直到满足模型中电量守恒前后等式一致的要求。
穷举维数影响分析
低压配变智能电能表(分表)越多,穷举的维数越大,当穷举的维数超过计算能力时,寻找min{[〖 w〗_(0 ) (1+x_0 )-∑_(i=1)^n?〖w_i (1+x_i ) 〗]-〖 c〗_(i ) }最优解将变得困难。为了解决一次穷举的维数限制,算法采用了分布式穷举和多维穷举与免疫算法相结合,大大减小了穷举搜索的维度,提高了计算效率。
应用
计算程序
本研究的成果是建立一种可信度高的配变计量适组计算软件,在不需要现场增加现场安装监测采集设备排查的情况下,通过算法软件能够计算配变和用户的变户关系和梳理相当一部分计量异常而造成线损异常的问题,解决配变台区的变户关系紊乱难题,靶向变户关系异常用户或表计,再通过电量守恒原理对变户关系异常进行梳理还原真实的线损数据。
为了有效验证穷举法在配变台区的变户关系梳理中的作用,方式设计了配变台区的变户关系梳理系统,利用计算机的运算能力,对低压配变台区的变户关系进行梳理。方法流程图如图1所示。
应用举例
选取广东省佛山市禅城区的2个配变和顺德区的一个小区进行计算(档案信息做了脱敏处理),数据如下:
备注:现场验证数据来自供电所员工使用配变识别仪的现场核验
从表2的结果不难发现,使用计算梳理配变户变关系的准确率是非常高的。
结束语
电量守恒下的计算实现的条件比较苛刻,需要数据量足够大,并对数据完整性要求比较高,另外面对多种不同季节、不同的用电习惯的用户,计算模型的建立需考虑的不确定因素多,计算结果输出还需经过不确定度的评估。这种应用电电量守恒的原理,通过模型,计算出配变计量组合方式,比设备安装、人工筛查更见准确和成效,值得预期。
随着智能电能表的大量普及和大数据技术的发展,方法不仅可以梳理出正确的配变台区的变户关系,还可以衍生出在线计算智能电能表计量误差、电能表运行状态评价等多项技术,其应用前景广阔,值得进一步深入研究。
本技术是一项新技术,需要进一步改进和提升。下一步的研究一是在算法中使用机器学习进行智能训练,使得模型不断成熟,并按业务类型分类建模,即分成城市小区的模型、城中村模型、乡村模型等,不斷提高其适用性;二是研究寻找最小电量守恒区间的方法,自动搜寻周边配变的电能数据来解决负线损过大这类问题。
参考文献:
[1] 马静,张俣妤,马伟,等.一种新型电网变户关系错误辨识方法[J]. 电力自动化设备,2016,36(1):82-88,96.
[2] 李虹,张占龙,高亚静. 一种配电网变户关系结构辨识方法的探讨[J].中国电力,2015,48(5):133-138,143.
[3] 唐泽洋,周鲲鹏,曹侃,等. 基于配电网运行数据的线变关系校验方法[J]. 高电压技术,2018,44(4):1059-1068.
[4] 阮作伟,李响. 电力网络变户关系错误辨识的一种新方法[J]. 东北电力技术,2004,01:11-13.
[5] 万忠兵,唐明,周一飞,等. 一种配变台区的变户关系辨识方法: 201810783849.9[P]. 2018-12-07.
[6] 黄方芳,王琪. 配电网单线图精益化管理[J]. 农村电气化,2015,02:59.
[7] 董晓峰.低压线损管理中的计量管理[J]. 黑龙江科技信息,2014:137.
[8] 陈崇双,唐家银,何平. 方差分析法的线性回归建模重构[J]. 统计与决策,2018,07:71-75.
[9] 汪峰,廖家平. 基于区域聚类蚁群算法建立电网变户关系研究[J].湖北工业大学学报,2013,28(5):53-57.
[10] 彭波,高炜. 随机梯度下降多重分割本体算法的工程应用[J]. 苏州科技学院学报:自然科学版,2015,32(1):49-53
[11] 陶砾,杨朔,杨威. 深度学习的模型搭建及过拟合问题的研究[J]. 计算机时代,2018,04:14-17,21
作者简介:
[1] 梁旭常,女,1967年3月出生,本科,高级工程师/高级技师,从事营销技术工作
[2] 汪毅,女,1979年7月出生,硕士,高级工程师,从事电力系统自动化技术研究
[3] 严杰峰,男,1985年12月出生,硕士,工程师,从事营销技术与管理
[4] 靳光,男,1984年11月出生,大专,工程师/技师,从事计量自动化系统管理
[5 ] 林健东,男,1990年7月出生,学士,工程师/技师,从事电能计量技术研究