白 勇,熊隽迪,杨 渝,肖 睿
(1.重庆电力高等专科学校,重庆 400053;2.重庆大学 输配电装备及系统安全与新技术国家重点实验室,重庆 400030)
低压配电台区户变关系识别即识别电力用户所归属的低压台区。低压台区户变关系是电力网络的基础性档案,户变关系模糊不清将影响电网企业故障智能定位、故障抢修、停电信息发布等多方面工作,造成不必要的人力和物力消耗。为此,寻找一种高效、准确、易实施的户变关系识别方法很有必要。近年来,随着信息采集系统在电网企业的普遍使用和智能电表的普及,电网企业采集到大量用户的电压、电流等电量数据,结合大数据识别台区户变关系和线损管理成为台区管理未来发展的主流趋势。
当前,主要的台区户变关系识别方法分为3类。第一类方法是基于台区电量数据采用数据预处理、特征提取及降维、聚类方法对台区户变关系进行识别[1-7]。文献[1]采用改进的动态时间规整(FastDTW)算法计算电压序列相似度,采用自组织特征映射(SOM)与K均值聚类方法结合的两阶段聚类方法进行特征聚类以识别户变关系。文献[2]采用导数动态时间弯曲(DDTW)算法对台区低压侧电压与用户电压的时间序列进行相似性分析,采用基于密度的有噪空间聚类应用(BDSCAN)进行聚类以识别户变关系。文献[3]采用自适应分段聚合近似(APAA)的方法对用户电压曲线进行特征提取,采用一种改进的基于密度的有噪空间聚类应用(BDSCAN)方法进行聚类以识别户变关系。文献[4]采用主成分分析(PCA)方法对数据进行降维并采用改进的K-means方法进行聚类以识别户变关系。聚类识别方法避免了复杂梯度和伴随方程的求解,对模型的表达形式和连续性没有严格要求,能有效提取系统特征进行分类,便于实施[6],但聚类方法寻找合适的聚类中心和确定相似度阈值较难,且部分聚类方法较为繁琐,实际工程推广应用较少。第二类方法通过电量信号畸变产生差异信息进行台区户变关系识别。文献[8]通过电能表作为信号发送端通断负载产生谐波电流,提取谐波电流,并采用DFT进行信号解码后与原有特征信息对比确定户变关系。文献[9]在台区低压侧注入小幅值电压改变电压有效值,采用数据分析电压有效值变动点与原信息对比进而识别户变关系。文献[10]在电压过零点时向低压线路叠加改进多载波调频特征信号,并采用离散弗雷歇距离比较电压曲线相似性以识别户变关系。通过信号畸变方式进行户变关系识别准确率较高,但大多需要增加设备,增加了识别成本,且对台区及用户的正常用电有一定影响。第三类方法是通过深度学习等大数据挖掘算法进行户变关系识别。深度学习算法基于大数据而产生,通过大量数据训练神经网络拟合非线性函数关系,在故障诊断、图谱识别等任务中应用广泛[11-17]。文献[18]采用一维卷积神经网络与长短时记忆单元(CNN-LSTM)结合的方式,以台区与终端用户数据为基础数据进行户变关系识别。文献[19]以前向误差传播(BP)神经网络结合电力载波信号进行户变关系智能识别。文献[20]采用K-means聚类方法构建电压序列数据标签,采用BP神经网络进行户变关系识别。目前,采用神经网络的户变关系识别研究主要基于一维信号序列的分类,相关研究较少。
台区用户由低压台区供电,同一台区内用户由于属于相同母线,其电压曲线波动具有很强的相似性[21-22]。由于台区用户数量、供电半径、用户性质等差异,不同台区用户之间电压曲线波动相似性较差。为此,通过分析电压曲线波动相似性区分台区用户,为户变关系的识别提供理论依据。
本文中基于电压曲线波动相似性进行户变关系的识别,提出了一种基于格拉姆角场和改进残差神经网络的户变关系识别方法。该方法采用格拉姆角场和伪彩色处理生成特征图谱并保留电压信号序列时间依赖性。通过在残差网络中引入空间注意力突出电压波动差异特征,使用改进的残差网络分类特征图谱识别户变关系。
低压配电台区户变关系识别的实质是分类问题,而神经网络对于图谱的分类效果普遍优于一维序列分类。若将电压数据转换为特征图谱,并采用图谱分类网络进行分类则识别率可进一步提升。为此,选用合适的图谱分类网络是户变关系识别的关键。
图谱分类神经网络包含Alexnet[23]、GoolgLeNet[24]、2D-CNN[25]、残差神经网络(ResNet)[26]等。其中,残差网络由于残差块的存在可训练深层网络以提取图谱深层次信息,识别准确率较高,在图谱分类任务中被广泛使用[27-29]。本文以残差神经网络为基础引入空间注意力进行改进,使用改进残差神经网络识别图谱。
注意力机制包含自注意力、空间注意力、通道注意力、融合注意力等。引入注意力机制是为突出关键信息,考虑到不同台区用户特征图谱像素点空间差异较大,为进一步突出差异信息、提高识别准确率,选择空间注意力机制对残差网络进行改进。
残差网络(residual network,ResNet)是一种包含卷积层、池化层、残差块和全连接层的深度学习神经网络,其包含的跨层连接将前一层的输出跳过中间部分卷积层直接送入后续网络,避免了网络层数较深时出现的梯度消失等不利于网络训练的问题。
残差块是为解决网络过深导致的信息损失过多问题而提出的。残差块结构示意如图1。
图1 残差块结构示意图
由图1中可知,残差块的输出由多次卷积输出与原输入相加并经激活函数处理后得到。输出的表达式为
out=ReLU(F(x)+x)
(1)
式中:x表示原始信息;F(x)表示经过多层卷积层后对原始信息x的输出;ReLU表示激活函数;out表示残差块输出。
在进行图像分类任务时,并非图像上所有像素点对分类任务的贡献都相同。相较于几乎没有差异的点,差异较大的点更应该被神经网络重视。如同人的视觉注意力总关注对于自己重要的信息而忽略边缘信息,空间注意力机制通过改变识别区域权重以重点关注对分类任务有用的信息。
空间注意力模型见图2。原始包含空间信息的模块分别经最大和平均池化操作,得到2张代表不同信息的特征图,将两张特征图合并后进行卷积操作融合为一张。特征图通过sigmoid函数处理形成权重图,权重图叠加回原始的输入特征图,使得重点关注目标区域得以增强,提升了图像分类识别效果。
图2 空间注意力模型示意图
针对一维序列分类神经网络存在识别准确率低、输入序列易丢失时间依赖性、识别准确率不稳定的问题,结合残差网络可提取深层次信息与空间注意力突出差异信息的优势,由此进一步提出户变关系识别模型。
基于格拉姆角场、残差神经网络和空间注意力提出一种低压配电台区户变关系识别方法。该方法以台区电压数据序列为基础,以格拉姆角场和伪彩色处理方法将电压数据序列转换为特征图谱,采用空间注意力和残差神经网络组合形成的改进残差网络进行图谱分类。网络根据输入图谱输出属于各低压台区的概率,最终实现低压配电台区的户变关系识别。依据此方法,建立了低压配电台区户变关系识别(consumer and transformer relationship identification,CTRI)模型,CTRI模型包含两个部分:图谱生成模块及图谱识别模块。图谱生成模块利用格拉姆角和场及伪彩色处理将电压离散序列转换为特征图谱。图谱识别模块以特征图谱为输入,使用空间注意力进行改进的残差网络ResNet50作为分类网络特征图谱进而识别户变关系。CTRI模型结构见图3。
图3 低压配电台区户变关系识别模型结构示意图
图谱生成模块是将一维信号序列转换为二维特征图谱的模块,其结构见图3第①部分。图谱生成模块包含格拉姆角场矩阵生成和伪彩色处理2个步骤。其中,格拉姆角场矩阵生成包含电压离散序列缩放、序列极坐标表示和特征矩阵计算,伪彩色处理则是由特征矩阵生成特征图谱。整个图谱生成详细流程如图4。
图4 特征图谱生成流程框图
格拉姆角场是将信号序列经过缩放、直角坐标系向极坐标系转换、内积矩阵计算的特征矩阵生成方法。该方法生成特征矩阵的具体步骤如下:
步骤1 假设电压离散序列为Y={y1,y2,y3,…,yN},序列由N个时刻的幅值组成。以N个时刻为横坐标值,每个时刻对应的幅值为纵坐标值,该序列便可通过直角坐标系表示。通过式(2)将序列Y缩放至[-1,1]范围,即余弦函数值域,以便序列Y由直角坐标系向极坐标系转换。
(2)
(3)
(4)
步骤4 考虑不同点之间作角度和或作角度差,格拉姆角场分为格拉姆角和场(GASF)和格拉姆角差场(GADF)。GASF矩阵计算通过余弦函数作角度和,GADF矩阵计算通过正弦函数作角度差,二者矩阵的计算式分别为:
(5)
(6)
观察GASF矩阵可知,原序列的时间相关性通过矩阵的主对角线得到了很好的保留[30]。将矩阵元素对应为灰度图像的灰度生成灰度图像,将不同灰度值与不同彩色对应(即伪彩色处理)得到所需的特征图谱。
图谱识别模块是进行特征图谱分类并输出所属类别概率,进而识别户变关系的模块。图谱识别模块采用改进残差神经网络,模块结构见图3第②部分。整个模块包含卷积层、池化层、空间注意力模块、全连接层。改进残差神经网络基于残差神经网络ResNet50结构,通过在网络ResNet50的起始卷积层及末尾卷积层后增加空间注意力模块进行改进,以空间注意力突出图谱差异性特征,提高网络户变关系识别准确率。
改进残差网络包含5个卷积层组,2个空间注意力模块,具体结构及网络参数见表1。
表1 改进的残差网络结构参数
表1中,Conv_x表示卷积层组,由多个卷积层构成。Maxpool表示最大池化层,Avgpool表示平均池化层,Fc表示全连接层。Kernel_size表示卷积核大小,Stride表示卷积核移动步长,Padding为补零数目,in_channels为输入通道数。
特征图谱通过改进残差网络中卷积、池化、空间注意力模块提取特征后到达全连接层,并经激活函数输出其属于各台区的概率,最终实现对用户所属台区的识别。
提出基于格拉姆角场和残差神经网络的户变关系识别方法,建立低压配电台区户变关系识别(CTRI)模型。以实际数据为基础开展两类实验以对比验证该方法的有效性。3.4节为不同户变关系识别方法的稳定性对比分析,3.3节为不同户变关系识别方法的准确率对比分析。
电压数据来自国网重庆市电力公司市南供电分公司辖区内相邻3个低压台区,电压数据采集频率为每1 h采集1次。选取每台区下辖的30户用户,每户24 d的A相用户电压数据。台区用户性质及所属母线信息见表2。
表2 用户性质及所属母线信息
台区1与台区2属于相同低压母线的不同段,台区3属于另一母线且包含较多工业负荷。数据包含来自3个台区共90户的A相电压数值序列,每一用户包含576点电压数据,每取72点以格拉姆角和场方法形成一张特征图谱,共计形成720张图谱。训练集与测试集比例为4∶1,即训练集包含576个样本,测试集包含144个样本。
神经网络初始学习率设置为0.001,数据批处理大小为20,训练轮次设置为20。线损计算方法选择自适应时刻优化算法(Adam),可根据损失函数值自动调整学习率,从而加快损失函数衰减使网络获得更好的训练效果。
3.3.1基于一维序列的台区户变关系识别方法与本文方法准确率对比分析
基于一维序列的户变关系识别不需将电压数据序列转换为特征图谱,即直接分类一维时间序列,分析序列波动差异性进而识别户变关系。该类方法多采用一维卷积神经网络(1D-CNN)、长短时记忆单元(LSTM)网络、BP神经网络分类台区用户电压序列。为比较基于一维序列的各类户变关系识别方法与本文方法的识别准确率,选择1D-CNN、BP神经网络和CTRI模型进行台区户变关系识别实验。
设立3组分类实验,分别为分类相同母线台区用户(台区1和2)、分类不同母线台区用户(台区1和3)、分类混合台区用户(台区1、2、3)实验,实验分类准确率见表3。
表3 不同模型分类准确率 %
由表3可知,基于一维序列的户变关系识别方法的识别准确率相较于CTRI模型偏低。其原因在于,一维序列在输入1D-CNN及BP等神经网络时被打乱,丢失序列各点之间的时间依赖性,电压波动的差异信息不明显,容易造成误判。
CTRI模型户变关系识别准确率相较于1D-CNN识别方法的混合台区识别正确率提升约18%,相较于BP神经网络识别方法的混合台区识别正确率提升约16%。本文方法识别户变关系准确率优于主流的基于一维序列的户变关系识别方法。
3.3.2基于二维图谱的台区户变关系识别方法与本文方法准确率对比
目前,主流的图谱分类方法多采用二维卷积神经网络(2D-CNN)、AlexNet、残差神经网络(ResNet)等。为比较各基于二维图谱台区户变关系识别方法的准确率,选择相同的图谱生成方法结合不同图谱分类网络构成不同台区户变关系识别方法。图谱生成方法均选择格拉姆角和场及伪彩色处理。3个台区用户电压数据生成的部分特征图谱见图5。
图5 不同台区用户电压特征图谱
选择GASF+ResNet50、GASF+2D-CNN、GASF+AlexNet三种基于二维图谱的户变关系识别方法与文中基于格拉姆角场和残差神经网络台区户变关系识别方法建立的CTRI模型进行识别实验。识别实验分组与3.3.1节相同,图6~8为各组实验识别准确率图。
图6展示了不同的基于二维图谱的识别方法识别相同母线台区用户的准确率曲线。由于台区1与2属同一母线,故二者台区电压波动具有较强相似性,对模型的识别分类造成一定困难。本文方法建立的CTRI模型能保留一维序列时间依赖性,有利于区分相同母线台区。
图6 相同母线台区户变关系识别准确率
CTRI模型在训练轮次15次之后识别准确率达到100%,相较于GASF+2D-CNN方法的识别效果相当,相较于另外2种方法的识别准确率有约3%的提升且收敛速率更快,户变关系识别准确率波动更小。
图7展示了不同的基于二维图谱的识别方法进行不同母线台区用户识别的准确率。台区1与台区3属于不同母线,二者电压波动相似性较差,且台区3包含较多工业用户,也更使得台区之间的电压波动差异性增大。结合图7可知,CTRI模型和GASF+ResNet50方法识别准确率为100%,优于另外2种方法的识别准确率,且识别准确率稳定。
图7 不同母线台区户变关系识别准确率
图8展示了包含属于同一母线和不同母线台区的混合台区用户识别准确率。CTRI模型识别准确率在训练轮次10次之后的识别准确率波动较小,识别准确率均在95%以上,且准确率曲线都位于其他3种方法之上。由图8易知,本文方法相较于其他户变关系识别方法的识别准确率有小幅提升,且网络收敛快、识别准确率波动小。
图8 混合台区户变关系识别准确率
结合图6~8,本文中所提出方法能够分类同一母线和不同母线段台区,针对不同母线段台区分类效果能达到100%准确率。针对混合台区识别网络训练20次,考虑到网络训练收敛,取其后5次平均识别准确率为平均准确率,本文方法的平均识别准确率98.052%,最优识别准确率为99.3%。
经计算可知,CTRI模型在进行混合台区用户分类时,相较于2D-CNN、AlexNet、ResNet50方法的平均识别准确率分别提升10.1%、3.6%、2.64%,表明本文中所提出的方法普遍优于基于二维图谱的主流户变关系识别方法。
神经网络初始化参数是随机的,网络每次训练的参数不一定都理想,故会导致网络识别准确率不稳定。分析识别方法的稳定性需分析多次识别任务下方法的识别准确率的变化(即准确率数值的相对频率)。识别准确率的变化体现了采用识别方法进行具体识别任务时准确率数据的可靠性与稳定性。
为分析采用本文方法识别台区户变关系时的识别稳定性,选用1D-CNN、GAF+ResNet50及本文识别模型分别进行5轮、每轮20次(共计100次)的混合台区户变关系识别实验,分析各方法准确率数值的相对频率。计算100次分类任务中识别准确率的相对频率,并绘制相对频率图(图9~11)。
图9展示了基于一维序列的识别方法1D-CNN的准确率相对频率。其准确率数值在90%以上的次数约占总次数的20%。图10展示了基于二维图谱的识别方法GAF+ResNet50的准确率的相对频率,其识别准确率和稳定性相较于图9的基于一维序列识别方法均有较大提升。采用GAF+ResNet50模型的识别准确率在90%以上的次数约占总次数的70%。
图9 1D-CNN方法识别准确率相对频率直方图
图10 GAF+ResNet50方法识别准确率相对频率直方图
图11展示了采用本文方法建立的CTRI模型识别准确率相对频率。通过与GAF+ResNet50方法相比可知,CTRI模型在ResNet50中引入了空间注意力,识别准确率数值在90%以上的次数约占总次数的77.5%,且95%以上准确率的数值约占总次数的40%,相较于GAF+ResNet50网络提升18%。
图11 本文模型识别准确率相对频率直方图
结合图9~11,本文所建立的CTRI模型相较于1D-CNN及GAF+ResNet50模型识别准确率90%以上的相对频率分别提升20%和7.5%,识别准确率85%以上的相对频率约占总次数的87.5%,表明其识别准确率波动更小、识别稳定性更好。
1)所建立的CTRI模型针对相同母线台区用户平均识别准确率为94.3%,混合台区用户平均识别率准确率98.52%,优于目前主流的基于神经网络的户变关系识别方法。
2)基于格拉姆角场和改进残差网络识别方法的识别准确率在90%以上的相对频率相较于1D-CNN和GAF+ResNet方法分别提升了约20%和7.5%,识别准确率85%以上的相对频率约占总次数的87.5%,说明该方法还具有识别准确率波动较小、识别稳定性较好的特点。