郑成源, 张 梁, 赵振刚, 李 波,廖耀华, 陈 叶, 李 博
(1.昆明理工大学 信息工程与自动化学院, 云南 昆明 650500;2.云南电网有限责任公司 电力科学研究院, 云南 昆明 650217)
电能作为现代社会发展的最基本能源,在社会活动中发挥着重要作用,电能的稳定供应是维持社会正常运转的基本要求,因此需要对输配电线路的故障发生频率进行监测分析,而对输配电线路的故障发生概率进行预测,对于保证电力线路的安全运行具有重要意义,对线路的的运行状态进行一个提前量的预测,可以减少经济损失,提高维修效率。输配电线路的故障发生概率预测主要是根据对历史负荷数据的统计分析,结合天气类型、温度和时间类型等因素,对故障发生概率的发展趋势进行一个提前估计。目前,随着用电规模的不断扩大,通过智能电表采集到的电力数据量也随之增加,而数据类型的单一性和随机性,使得对故障发生概率建立预测模型带来一定的难度[1-2]。
针对低压配电线路的故障发生概率预测主要采用的方法是时间序列分析、机器学习和深度学习。1968年,Billinton等[3-4]阐述了马尔可夫过程的基本概念及其在电力系统可靠性的应用,并首次提出了电力线路故障率的概念,在随后的研究中还考虑了天气条件对故障发生概率的影响。2016年,陆佳政等[5]针对电力线路故障原因不明等问题,通过分析某省级220 kV及以上架空输电线路2005—2014年的故障情况,提出了针对自然灾害输电线路故障发生情况监测和预测的新理论、新技术。2017年,高文生等[6]针对热带气旋引发的自然灾害对输电系统带来的破环,结合小气候预报方法和历史线路数据,提出了一种输电线路的启发式故障预测模型,为在灾害发生前制定合理的运维计划提供有效信息。2019年,黄欢等[7]针对某地区容易出现的覆冰、雷电和污闪三种极端天气情况,提出基于多维云模型的输电线路故障率预测模型,并建立了一套完整的综合风险评估体系,对电力线路的安全运行具有重要意义。2020年,Ozcanli等[8]对负荷预测、故障检测、电力系统设备等领域遇到的一些问题,结合深度学习技术在电力系统中的应用提出了一些有益的方法。
国内外专家学者针对输电线路、电力设备的故障研究取得了一定进展,目前大多考虑天气和自然灾害等因素对电力线路故障发生的影响,考虑的影响因素和选用的数据量相对较少,同时对于电力线路故障发生概率预测的研究偏少,电力企业的管理决策部门在制定政策时缺乏相应的理论支撑,因此本文采用自回归滑动平均模型(Autoregressive Moving Average model,ARMA)和带有外部输入的非线性自回归神经网络(Nonlinear Auto-Regressive model with Exogenous Inputs,NARX)对不同时刻的低压配电线路的故障发生概率进行预测,并与单一的ARMA模型和传统BP神经网络进行比较。
研究中使用的数据集来自云南省某供电局记录的2021年9月份的线路实际运行数据,智能电表每15 min记录一次数据信息,每天最多记录96次,包含用户编号、三相相电压、三相相电流、有功功率、无功功率、视在功率、功率因数、所属线路、数据来源、采集时间等信息,总共收集了8条线路的运行数据;当地的实时温度、天气等数据信息在中央气象台官网统计得知,中央气象台每小时记录一次气温、相对湿度、降水量和风力风向等数据,每小时的气温情况如图1所示,每天最多记录24次,统计了2021年9月份的当地气象信息。
图1 温度情况折线图
电力系统中自动采集到的数据量庞大且种类繁多,研究主要针对低压配电线路的频发故障进行分析,因此需要对输配电线路的运行数据进行筛选和分类,对原始数据进行必要的预处理。根据当地电力科学研究院制定的异常判断公式对数据进行判断,主要针对电压异常(失压、断相、电压过高、电压偏差异常、三相电压不平衡)、功率异常、功率因素异常等故障类型进行研究,对于疑似故障数据进行多次查验,保证数据的可靠性,为后续预测工作的准确率提供保障。为方便统计,计算出一天内每小时的故障发生次数,每天有24组数据,因为时间间隔设置为1 h,而智能电表每15 min自动记录一次数据,所以先根据异常准则判断出15 min一个点的故障类型和次数,然后将4个点数据相加得到所需的数据集,绘制出一个月内线路故障发生次数的时间序列曲线,时序图如图2所示。由此得到一天内不同时刻的故障发生概率,观察在不同时刻下是否在均值附近规律波动,同时对天气类型等数据信息进行归一化处理,把数据映射到0~1范围内,将样本的特征值转换到同一量纲下。数据的标准化处理,常用的方法如下所示:
(1)
图2 故障发生次数时序图
根据从电网收集到的电力数据和气象数据信息展开分析,对原始数据进行预处理,对缺失值进行填补,对异常值进行修正,异常值删除后采用前后5个时间点的平均值,缺失值也用此方法进行填补。将电参量、温度、天气、风速、工作时间等作为特征,电参量数据与线路故障发生概率存在联系,随着人们日常工作时间的推移和生产活动需要,故障发生概率在一天内会出现两次较高的峰值,凌晨时用电量很低,发生的故障次数偏少,从早晨开始持续增加,到中午达到第一个峰值点,午休时有所减少,下午有所攀升并趋于稳定,下班后又持续增加迎来晚高峰,随着时间推移又逐步递减。根据电网统计的大量历史数据,可以看出日基本负荷与线路故障发生概率紧密关联,但是,温度、天气、风速、工作时间等因素也会对故障率产生影响,需对其制定加权数值,以提高预测的准确度。
自回归滑动平均模型(ARMA)是用于研究时间序列的重要方法,可以描述线性的动态过程,在进行预测时,只有平稳时间序列才可以建模,若不满足平稳性要求,则建立的模型是错误的,因此在建模前首先要进行平稳性检验。
目前常用的检验方法有观察法和绘制相应的自相关函数(Autocorrelation Function,ACF)和偏自相关函数(Partial Autocorrelation Function,PACF)。使用故障率时间序列的数据和MATLAB绘制自相关函数,描述该序列的当前值与过去值之间的相关程度,同时还可用于确定ARMA模型的q值。偏自相关函数剔除了中间变量的影响,直接计算两个不同时刻值的相关性,还用于确定ARMA模型的p值,线路故障率时序的ACF和PACF分别如图3和图4所示。
图3 线路故障率时序的自相关函数 图4 线路故障率时序的偏自相关函数
通过分析ACF和PACF函数图,可以为ARMA模型初步定阶,计算出不同阶数下的赤池信息量准则(Akaike Information Criterion,AIC)和贝叶斯信息量准则(Bayesian Information Criterion,BIC),当其取到最小值时,即为最优模型。由于ARMA模型的p和q值无法直接确立,因此先建立不同阶数的模型,再分别计算出AIC和BIC。AIC和BIC对ARMA模型阶数的优化可以通过下式实现:
AIC(p,q)=2k-2lnL,
(2)
BIC(p,q)=klnN-2lnL,
(3)
式中L是似然函数,k表示ARMA模型中p+q的和,N表示数据总量。
ARMA模型将线路历史运行数据中的故障点按照特定的时间序列进行排序,根据故障发生规律建立出相应故障发生率预测模型。使用一个月内不同时刻点的故障发生概率数据,共计720个时刻点来作为训练集,并计算出前20个间隔之间的ACF函数和PACF函数。根据自相关系数图和偏自相关系数图可知p值和q值均在3阶处存在截尾,因此可以确定出9种不同的ARMA模型的阶数。
为了进一步确定出最优的ARMA模型,分别计算出在不同的p值和q值下的AIC值和BIC值,取到一个最小值,具体见表1。
表1 ARMA模型的AIC和BIC值
从表1中可以看出,当ARMA模型的AR为2,MA为3时,模型为最优解。通过MATLAB可以计算出ARMA(2,3)中的参数为
(4)
根据公式(4)建立的ARMA模型,对后面7天的168个时间点进行预测,预测曲线如图5所示。根据图像可以看到ARMA模型的预测结果与实际结果的趋势大体相同,但是在某些时刻点并不能准确预测,与实际值存在较大误差,预测效果不理想,预测结果的均方根误差为0.001 12,平均绝对百分比误差为15.8%。
图5 ARMA模型预测曲线图
非线性自回归(NARX)神经网络是是循环神经网络(RNN)中的一类,是一种具有反馈关联层的动态神经网络。与传统的BP神经网络不同,NARX神经网络增加了多步输入输出的时间延迟环节和反馈机制,具有良好的记忆能力,对历史数据更为敏感。考虑电力数据采集时具有的时序性以及产生的非线性,NARX神经网络适用于对时间序列的预测,采用三层网络模型结构即输入层、隐含层和输出层,在学习能力、收敛速度、泛化性能和预测精度等方面表现出良好的效果[9]。
NARX神经网络属于黑箱建模,在进行配电线路运行数据的故障率预测时,无法找到其内在规律,所以预测时需要先收集输配电线路的历史数据,然后再建立出可以近似表征故障率预测的数学表达式。为满足训练要求,NARX神经网络输入层的激活函数为tansig,输出层的激活函数为purelin线性函数,训练采用Levenberg-Marquard算法。
NARX神经网络是一种用于描述非线性离散系统的模型,一般NARX神经网络的数学描述公式表示为
y(t)=f(y(t-1),…,y(t-n+1),x(t),x(t-1),…,x(t-m+1))+εt,
(5)
式中y(t)表示神经网络的输出,x(t)表示网络的输入,t表示时刻取值范围是训练集的长度,n和m分别表示输入数据的延迟阶数和反馈数据的延迟阶数,εt表示随机误差;x(t),x(t-1),…,x(t-m+1)为相对于t时刻的历史输入,y(t-1),…,y(t-n+1)为相对于t时刻的历史输出,f为网络拟合得到的非线性函数。
前期做好数据处理工作,包含数据采集与预处理,然后进行神经网络结构的选择与参数的优化设置,最后验证模型,通过模型对测试集数据的处理分析处理结果,证明模型的适用性。
使用输配电线路的历史运行数据、实时温度、实时风速和天气类型等信息,对星期类型和特殊事件进行赋值,作为输配电线路故障发生概率预测的特征,即ARMA-NARX神经网络中的输入。根据ACF函数和PACF函数可以确定神经网络中的延迟阶数为3,而输配电线路运行数据每天不同时刻点的故障发生概率,作为神经网络的输出。
根据建立好的ARMA-NARX神经网络模型对后面7天的168个时间点进行预测,最终结果如图6所示。根据图像可以看到ARMA-NARX神经网络的预测结果与实际结果的趋势基本一致,曲线基本贴合。经过计算可知,ARMA-NARX神经网络预测结果的均方根误差为0.000 84,平均绝对百分比误差的平均值为8.9%。
图6 ARMA-NARX模型预测曲线图
研究主要针对故障发生率的预测问题,使用均方根误差(RMSE)、平均绝对百分比误差(MAPE)和确定系数(R2)来检验预测方法的性能。分别定义为
(6)
(7)
(8)
使用ARMA-NARX神经网络模型对电力线路上7天内168个不同时间点发生故障的概率进行预测,根据预测结果,分别计算了实际值与预测值之间的RMSE、MAPE和R2。对不同模型的性能指标进行比较,具体见表2。
表2 不同模型性能指标比对
本文使用非线性自回归神经网络对云南省某地区低压配电线路的故障发生概率进行预测研究。根据电力线路的运行数据,统计出在一天内的故障发生次数,并计算出24个点的故障发生概率。考虑实时温度、天气类型、历史负荷数据等有较大影响的特征,利用ARMA模型和NARX神经网络对故障发生概率进行提前估计。在确定NARX的结构和参数时,对故障序列的ACF和PACF函数图进行分析,利用ARAM模型和MARX神经网络模型对未来168个时间点的故障发生概率进行预测,并对预测结果进行分析。ARMA模型和NARX神经网络预测结果与实际结果的曲线基本贴合,因此采用ARMA-NARX神经网络来预测低压配电线路的故障发生概率效果较好。