郭飞,吴佳静,周怡,高利燕,麦晓庆
(1.国网宁夏电力有限公司,宁夏 银川 750001;2.宁夏信通网络科技有限公司,宁夏 银川 750001;3.国网宁夏电力有限公司信息通信公司,宁夏 银川 750001;4.济南银华信息技术有限公司,山东 济南 250000;5.国网宁夏电力有限公司中卫供电公司,宁夏 中卫 755000)
台区线损管理水平综合反映了电力系统规划设计、生产运行和经营管理的水平,是电网经营的一项重要经济指标。目前影响台区线损的主要因素有技术因素和管理因素。文献[1]研究了基于机器学习的电网台区线损异常诊断方法,提出利用机器学习构建台区线损异常分析模型,从计量差错分析、台区串户等技术方面分析了线损异常的原因。文献[2]利用概率分布的方法对线损异常进行识别,从用户侧判断评估管理对线损的影响程度。文献[3]针对计量失误、计量故障等原因产生的台区线损问题,提出线损在线监管,并给出具体解决方案。文献[4]研究了基于数据知识融合的输电线路线损计算方法,分析了环境影响量对导线损耗的影响和降雨强度对导线表面最大场强、电晕损耗的影响。文献[5]研究了基于K 最邻近法(K-nearest neighbor,KNN)和局部离群因子(local outlier factor,LOF)算法的台区线损异常监测方法,有效提高了供电企业对台区线损的判断效率,但现有研究结果中,很少考虑在地形较为偏远、气候多变的山区,气象因素对台区线损异常波动的影响。基于此,本文建立了考虑气象因素的台区线损异常智能识别模型,利用离群点检测算法建立考虑气象因素的台区线损异常智能识别模型,判断某一段时间内日线损易受异常天气影响的台区,并评估影响程度的大小。最后以某县供电公司532 个台区91天内日线损数据为基础,结合实时和预报气象数据,量化分析异常天气对某县台区日线损波动的影响,识别日线损容易受天气影响的台区,实现线损异常预警分析,为各专业完善线损指标的风险防控机制提供科学依据,助力提升线损精益化管理水平。
线损是线路损耗的简称,即电能通过输电线路传输而产生的能量损耗,包括变压器等配变设备,也会产生电能的损耗。台区线损是指整个台区能量损耗的总和,一般情况下,可根据台区供电量与售电量计算台区的线损情况,即:
台区线损异常主要有高损台区和负损台区。一般情况下,将偏远山区线损率大于10%的台区定义为高损台区,线损率小于-0.5%的台区定义为负损台区。台区线损异常的具体表现有以下方面:
1)“此消彼长”型。某台区线损率连续异常增大,同时,相邻台区的线损率明显较低甚至出现负值,线损率呈现互补的现象。
2)“异常波动”型。台区在某段时间内线损率变化幅度较大,线损率总体不稳定。
3)“异常突变”型。台区线损在一段时间内保持稳定,突然在某一时刻发生突变,之后保持在一定水平。
线损异常关系到电网供电效率,影响供电企业服务质量和经济效益,严重时,会造成巨大的电能浪费,对企业的发展产生负面影响。台区线损异常的主要原因有技术因素和管理因素,但是在某些气候多变的山区,台区线损异常波动也受气象因素的影响。
离群点检测是基于统计、频率、深度、距离等多角度对异常数据进行识别的大数据挖掘算法之一,可快速实现异常信息的高效提取[6]。LOF算法是基于距离和密度的离群点检测方法中一个比较有代表性的算法,该算法对数据集中的每个点计算一个离群因子LOF,通过判断LOF 是否接近于1来判定是否为离群因子[7-8]。具体算法步骤如下。
2.1.1 计算对象p的k距离
对于正整数k,对象p的k距离可记作distk(p)。在样本空间D中,存在对象o,它与对象p之间的距离为d(p,o)。如果满足以下两个条件,则认为distk(p)=d(p,o)。
1)在样本空间D中,至少存在k个对象q,使得d(p,q) ≤d(p,o);
2)在样本空间D中,至多存在k-1个对象q,使得d(p,q) <d(p,o)。
本文选用欧式距离计算p的k距离:
使用distk( )p量化对象p的局部空间区域范围,对于对象密度较大的区域,distk( )p值较小;而对象密度较小的区域,distk( )p值较大,因此用distk( )p值大小可初步识别离群点。
2.1.2 确定对象p的第k距离邻域
在样本空间D中,将与对象k之间的距离小于等于distk( )p的对象集合称为对象p的k距离邻域,记作Nk(p)。该邻域是以p为中心,distk( )p为半径的区域内所有对象的集合(不包括p本身)。由于可能同时存在多个第k距离的数据,因此该集合至少包括k个对象。
2.1.3 计算对象p相对于对象o的可达距离
如果对象p远离对象o,则两者之间的可达距离就是它们之间的实际距离,如果它们足够近,则实际距离用o的k距离代替。
2.1.4 计算局部可达密度
对象p的局部可达密度定义为p的k最近邻点的平均可达密度的倒数。
2.1.5 计算局部离群点因子
式中:Nk(p)是对象p的k距离邻域;lrdk(o)是对象o的局部可达密度;lrdk(p)是对象p的局部可达密度。
如果对象p不是局部离群点,则LOF(p)接近于1,即p是局部离群点的程度较小,对象o的局部可达密度和对象p的局部可达密度相似,最后所得的LOF(p)值接近于1;反之,p是局部离群点的程度越大,LOF(p)值越高。
数据处理主要是对原始数据的清洗,包括数据的完整性、有效性、可代表性等处理过程,使数据包含的信息能更准确、更有效地反映真实情况。
2.2.1 完整性处理
对于提取的原始数据,筛选出所需相关字段,按日期进行重新组合,形成完整的数据表。
2.2.2 有效性处理
对于数据表中的空值数据和错误数据,根据实际情况选择删除该异常值所在记录或对其进行平滑处理,保证数据的有效性。
2.2.3 归一化处理
各台区日线损数据间存在数量级差别大的问题,在数据分析之前,对其进行归一化处理,避免“大数据吞没小数据”的情况,造成最终分析结果的偏差。本文采用Z-score 标准化方法对数据进行处理,表达式为
式中:xˉ为样本数据的均值,S为样本数据的标准差。
通过离群点检测算法建立基于气象因素的台区线损异常智能识别模型,判断日线损易受异常天气影响的台区,并评估影响程度的大小。具体模型运行步骤如下:
1)对台区日线损数据进行完整性、有效性和归一化处理,同时将气象数据按异常天气和正常天气两种情况进行判别分类。
2)将处理后的日线损数据作为样本数据构建样本空间D,依次计算D中所有样本数据x的k距离、k距离邻域Nk(x)、可达距离reachdist(x)、可达密度lrdk( )x,最终计算出离群点因子LOFk(x)。
3)对LOF 进行判断,当LOF 接近于1 时,则日线损正常;当LOF远大于1时,则日线损属于波动较为明显的异常值。
4)将LOF远大于1的线损数据与已分类的气象数据根据日期进行匹配,并按当天是异常天气的日线损异常点,当天是异常天气前后一天的日线损异常点,其他天气的线损异常点三种情况进行分类统计。
5)筛选当天是异常天气的日线损异常点和当天是异常天气前后一天的日线损异常点两种统计类型,根据业务实际情况,判断线损受异常天气影响程度z的大小。然后筛选出样本空间D中异常点占比大于z的情况,即筛选的结果是样本空间中容易受异常天气影响的台区。
6)将易受异常天气影响的台区建立新台账,根据气象预报数据,定期对这些台区线损波动异常情况进行预警,为台区巡视检查及线损治理提供依据。如图1所示。
图1 台区线损异常识别与预警模型运行步骤
对于线损波动的分析,当时间跨度过长时,不易排除技术因素和管理因素的影响,而在一段时间内,比如一个季度,当气象因素差异不大,例如都是晴天时,线损波动不明显,则可忽略技术因素和管理因素对台区线损异常波动的影响。因此,可利用上述模型对偏远山区某段时间内频发的异常气象因素导致线损波动的台区进行识别,并根据实际情况判断影响程度的大小。将上述台区线损异常识别与预警模型运行步骤利用Python 工具编写成相应的代码,实现快速高效智能识别易受异常天气影响的台区,并形成相应的台账,根据当地频发的异常天气情况,建立相应的预警机制。
某县供电公司共管辖532 个台区,对其根据实际情况进行预处理后,有效台区520 个。其所属县地处偏远山区,气候多变,晴雨不定。二季度的天气中,温度波动不大,较为稳定,因此按天气情况进行分类,多云天气33 天、雨天28 天、晴天26 天、阴天2 天、扬沙1 天、阴转晴1 天,如图2所示。其中异常天气中的雨天包含了小雨、中雨及雷阵雨三种情况,且占比较大。
图2 某县二季度天气情况
某县将偏远地区台区线损率大于10%的值定义为高损,但是因为技术和管理方面的因素,存在连续时间段日线损均大于10%的台区,因此本文利用基于距离和密度的离群点检测算法识别异常天气时线损突然升高或降低的台区,并进行筛选标记。
利用基于气象因素的台区线损异常智能识别模型对某县520 个有效台区91 天的日线损数据进行识别,并根据识别结果与气象数据进行匹配,判断线损易受异常天气影响的台区。选取离群点检测结果中存在LOF 远大于1 的某台区,绘制其91 天日线损数据散点图,如图3 所示。圆圈内的离群点较为明显,即此台区二季度中部分日期日线损确实存在异常值,说明离群点检测可有效识别海量日线损数据中的异常值。
图3 某台区91天日线损离群点
随机选取某台区相近的时间点,对离群点检测分析结果与天气情况进行匹配,结果如表1所示。
表1 基于离群点检测算法的某台区部分分析结果
在分析的47 320 个数据点中,分析发现异常点共计17 175 个,与气象数据匹配后总体情况如表2 所示。扬沙引起的日线损均值最高,其次是雨天,第三是雨天前后的阴天或阴转晴。说明在某县二季度内,扬沙天气对台区线损影响波动最大,雨天对台区线损波动影响次之。
表2 某县二季度异常天气日线损波动情况
在某县二季度的天气中,扬沙天气只有一天,占比太小,无法再次进行验证,且扬沙天气对某县台区线损整体波动无法形成预警,因此对某县异常气象因素的分析主要以雨天为主进行分析。对28 天雨天对应的日线损异常数据进行筛选,发现28 天雨天中,至少有17 天部分台区线损率波动明显,说明在某县偏远山区,雨天对部分台区日线损的影响至少有60.72%,且影响超过60.72%的台区共计38个,如图4所示。
图4 受雨天影响的38个台区线损异常次数
提取某县7月份天气情况的数据,雨天共计9天。根据上述离群点检测模型预测上述38 个台区在7 月份雨天发生日线损异常的数量,并与实际发生日线损数据进行比对,判断模型的拟合程度和效果,如图5 所示。虽然预测值与实际值由于不同时间段负荷波动存在一定的误差,但是在可信度范围内,具有一定的实际意义。
图5 某县台区日线损异常值预测数量与实际数量
上述模型验证,说明基于距离和密度的离群点检测算法适用于基于气象因素的台区日线损异常判断。因此,在气候多变的山区,利用离群点检测算法智能识别日线损异常值,并与当地某段时间内频发的异常天气情况进行匹配,当异常天气对应的线损异常超过60%(根据实际情况确定z值),且正常天气线损率波动不大时,将此类台区定义为易受异常天气影响的台区,然后根据时间段内的天气预报,在异常天气前夕,重点关注此类台区,做到及时巡视检修,可有效减少因为当地特殊恶劣天气造成的电量损失,保障电网安全。
利用离群点检测算法构建台区线损异常分析模型,实现考虑气象因素条件下的台区线损异常智能识别。通过对某县台区日线损数据的分析,有效识别台区线损容易受当地频发雨天影响的台区,并评估影响程度的大小。结果表明,针对气候多变的偏远山区,将当地频发的异常气象因素纳入台区线损指标的风险防控机制,并建立气象因素对日线损的预警机制,可为开展台区线损治理提供依据,有效提升线损的精益化管理水平,达到节能降损的目的。随着数据采集终端的升级和数量的积累,未来该方法可以纳入更多对配电网供电质量的外在影响因素分析,助力提升配电网供电质量。