赵永良,章剑光,张永建
(1.国家电网有限公司,北京 100031;2.国网浙江省电力有限公司绍兴供电公司,浙江 绍兴 312000)
随着新一轮电力体制改革的深化推进,供电企业的经营环境日趋复杂,面临着确保供电服务质量和优化投资的双重压力。配电网是联系电网企业与电力客户的最后一公里,电网企业“世界一流电网”的建设目标对配电网建设管理提出了更高的要求,需要统筹考虑配电网建设投入的科学性与精准度,提高质量和效益[1-2]。
随着电网规模日益增大,网架结构日趋复杂,输配电网耦合程度日益加强,电力系统在发、输、变、配、用电等各个环节的信息化进程持续推进,积累了大量宝贵的电网实时、准实时数据以及客户服务数据信息资源,如PMS(生产管理系统)、SCADA(数据采集与监控)、公用变压器终端、用电信息采集系统等数据,各类业务数据无论从总量和种类上都已颇具规模,为配电网整体运行态势分析提供了良好的基础数据支撑[3-6]。但目前供电企业基于全网运行状态的态势感知能力相对缺乏,各子系统管理领域与信息资源相对独立,传统的电网运营辅助分析手段单一,需要综合调取多个系统中相关联的业务信息进行联合分析,缺乏有效的整合利用与整体分析手段方法,存在人力资本投入大、问题分析解决效率不高的问题。
在大数据时代,数据处理面临规模化挑战的同时,数据研究已经成为科学研究的重心,海量数据的分析比数据获取要困难得多[7-8]。对供电企业而言,如何利用数据挖掘方法最大限度地分析数据中包含的有效信息,也将是一件十分有意义而又迫切的工作[9-10]。以下应用GIS(地理信息系统)空间信息与业务数据的融合[11],基于热力图、边缘提取、语义分析等态势感知可视化技术[12-16],构建宏观运行态势、重点区域边缘提取、多业务叠加分析等模型,为配电网科学规划、精准投资、主动服务提供科学量化的决策支撑。
目前,由于采集器重复采集和设备数据上传终端等多方面原因,电网数据存在缺失值和异常值,故在建立模型前,需要全面梳理电网、设备、采集、用户拓扑关联关系,进行多元信息融合和数据清洗。研究运用拉格朗日插值算法、3Sigma统计分析算法等方法清洗数据,建立重要时点负载数据集合,构建富含空间、时间以及多元业务特性的态势分析数据资源(过程详见图1)。
图1 多元信息的融合与数据清洗
针对缺失数据,采用拉格朗日插值算法进行处理,使数据完整,满足建模需求。拉格朗日差值法对实践中的某个物理量进行观测,在若干个不同的地方得到相应的观测值x0,x1,…,xn,它通过一个满足在各个观测的点取到观测到的值的多项式lk(x),进行数据空缺补全。拉格朗日多项式插值算法如下:
主、配电网变压器负荷数据分别来源于SCADA遥测数据、配电变压器(以下简称配变)实时采集数据,数据采集频度分别为5 min,15 min,数据采集时点存在不对应问题。故通过拉格朗日插值算法对缺失数据进行补全,确保关键节点与重要断面数据的完整准确,以支撑开展全网负载能力的联合分析。
针对突变与异动数据,采用3Sigma统计分析算法进行过滤,排除异常数据对分析模型的影响。若随机变量X服从一个数学期望为μ、方差为 σ2的正态分布, 记为N(μ, σ2),3Sigma统计分析算法如下:
实际应用中,X 落在(μ-3σ,μ+3σ)以外的概率小于3‰,属于小概率事件,因此可以把区间(μ-3σ,μ+3σ)看作是随机变量 X实际可能的取值区间,这称之为正态分布的“3σ”原则。通过采用3Sigma统计分析算法,对突变与异动数据进行过滤,可以排除异常数据对分析模型的影响。
区域电网月度、年度最大负荷时刻等重要时点可以调用SCADA系统计算结果,但是配变台区最大负荷在已有的各类系统暂未实现汇总计算。通过滚动计算区域所有配变台区每个时点的负载数据,查找月度、年度地区配电网最大负荷时刻。具体计算规则为:某时间区间内,滚动计算区域内所有配变台区每个时点的配电网总负荷,配电网总负荷最大值所在的时点即为该时间区间的重要负载断面。
2014—2015年区域电网重要负载断面时刻如图2所示,可看到主网最大负荷时刻多发生在中午,配电网最大负荷时刻多发生在傍晚下班以后。
对电网数据进行清洗形成具有多元业务特性的态势分析数据资源后,运用热力图分析、边缘提取等态势感知可视化技术,构建宏观运行态势、重点区域边缘提取、多业务叠加分析等模型(见图3),为配电网科学规划、精准投资、主动服务提供科学量化的决策支撑。
图2 区域电网负载重要时间节点
图3 数据分析模型构建
2.1.1 热力图分析方法
热力图是利用空间统计的算法,从离散的点事件中找到空间聚集区域。热力图分析方法处理的具体步骤如下:
(1)步骤1:为离散点设定一个半径(设定1.5 km),创建一个缓冲区。
(2)步骤2:对每个离散点的缓冲区,使用渐进的灰度带(完整的灰度带是0—255),从内而外,由深至浅地填充。各离散点色彩根据变压器负载率从小而大渐进填充。
(3)步骤3:对于有缓冲区交叉的区域,可以叠加灰度值(值越大颜色越亮,在灰度带中则显得越白),因而缓冲区交叉的越多,灰度值越大,这块区域也就越“热”。
(4)步骤4:以叠加后的灰度值为索引,从一条有256种颜色的色带中(例如彩虹色)映射颜色,并对图像重新着色,从而实现热力图。
2.1.2 电网宏观运行态势模型及应用
选择输配电网某一断面的变压器负载率、空间地理分布情况,通过热力图分析方法,根据负荷高低用不同颜色表示,聚合出可视化的颜色区域,形成全地区主网和配电网负载分布态势图。例如,通过对地区某月网供最大负荷时刻主配变负载率的空间分布进行聚合,形成全地区主网和配电网运行态势(其中深色部分为负荷高密度区域),如图4所示。
图4 区域电网宏观运行态势分布
经过一定时间的积累,形成地区电网指纹档案,提供动画播放展示,可以较为宏观地反映绍兴地区主网与配电网负荷较重区域的空间分布及时间演变情况,也可以有效识别部分区域存在的主重配轻或主轻配重的主配电网协同问题。例如,部分区域呈现主网负荷密度明显高于配电网,表明该区域专线专变用户较多,主网负载较重,有可能存在不满足“N-1”检验的情况,消除该区域负荷瓶颈需要解决主网电源新增与布局优化两个问题;还有部分区域呈现配电网负荷密度明显高于主网负荷,表明该区域主网电源布点充足,配电网输送存在瓶颈,消除该区域负荷瓶颈需要解决配电网合理布局与负荷有效分配两个问题。
2.2.1 边缘提取技术
边缘提取技术是采用图像处理技术中的数学形态学方法进行图像边缘提取处理。其基本思想是用具有一定形态的结构元素去度量和提取图像中的对应形状以达到对图像分析和识别的目的,采用形态学方法可以简化图像数据,保持它们基本的形状特征,并除去不相干的结构。具体处理流程如下:
(1)步骤1:首先提取图像的颜色通道,分别运用中值滤波法对图像去噪处理、色彩空间变化法改进图像质量。
(2)步骤2:然后对图像进行聚类,通过matlab软件自带的K-means算法进行2次聚类,对图像进行分割。
(3)步骤3:最后经过上述预处理后,利用索贝尔算子进行图像边缘坐标提取,对提取的图像进行二值化处理,将边缘信息存储在矩阵中,得到图中每个像素的类标签矩阵。索贝尔算子是一离散性差分算子,通过运算图像亮度函数的梯度之近似值提取图像边缘。
2.2.2 重点区域边缘提取模型及应用
重点区域边缘提取主导思想是将运行态势从定性分析转入定量分析,综合运用图像去噪、色彩与空间、二次聚类等多种图形边缘提取分析算法准确勾画重点区域的轮廓,完成对主配电网负载热力分布图的图像分类与区域判别,实现区域负荷特征的有效识别。
利用上述方法对S地区2016年6月电网运行态势进行边缘提取计算,形成多个重点区域的闭合轮廓区域,如图5所示。这些闭合轮廓标明了重点区域地理分布情况,具有鲜明的地域特点,如1号区域是袜业之乡,大量小微织袜企业聚集,形成配电网负载承载较重的态势,后期予以重点关注分析。
图5 电网运行态势的边缘提取计算结果
通过对区域电网宏观运行态势分布的边缘提取结果开展比对分析,可以获得更准确的各区域电网负载能力分布特征以及主配电网协同配套状况的可视化结果,发现配电网运行薄弱环节和投资需求点,对区域电网诊断分析结果进行综合统计,指导下一步网架建设的规划工作重点。
各区域电网负载能力分布特征:
(1)主重配轻型:代表区域为西北部区域,由于电力西送邻市以及当地大型化工产业布局等原因,主网负载较重,专线专变用户较多,而相应的公变负载较为平稳,负荷瓶颈需要解决电源点新增与布局优化上。
(2)配重主轻型:代表区域为A县地区,表现为主网负载率适度、配电网负荷密度较大的特点,A县供电企业负载率50%以上台区占比最多,负荷瓶颈需要解决配电网合理布局与有效分配。
(3)主配相当型:代表区域为C县、D县地区,主配电网负载率呈现较高一致性,既有区域地形特点因素,也有电源点与网架相对单一的情况。
通过聚焦边缘提取所形成的重点区域,由简入繁,利用语义分析技术提炼客户诉求内容,逐层叠加和穿透分析区域电网运行状态与客户诉求响应,将需求侧响应思维贯穿到电网资源的科学配置中。
在地理信息图上以可视化图形方式展现热点区域内各类型异常状态,如图6所示,对重点区域进行穿透分析,虚线标明了热点区域的边界范围,首先可以看到地理空间区域上实时标注了重过载、低电压的台区分布情况,点击可以了解该台区的异常明细信息,查看异常发生的频次、持续时长等具体信息;其次进一步叠加分析95598故障工单与投诉工单,可以看到95598工单在该区域发生的频次及具体服务响应信息,可以看到在该区域发生的频次及具体服务响应信息,包括其发生地点及热点词频。
图6 热点区域的多业务叠加分析
对于工单内容,通过运用分词技术和自组织学习方法,总结提炼出400余个与电网态势、服务响应相关的关键词,通过语义分析将故障或投诉内容转换成热点词频进行表达。一方面可以快速捕捉问题重点,另一方面有利于后期计算机模型开展统计分析。
通过将客户诉求与电网运行直接建立起紧密联系,可以有效得出不同地区客户对配电网建设需求的具体反映,对区域反复出现的密集点建立预警机制,有针对性地开展配电网建设投资,提高供电可靠率与服务满意度。
通过建立涵盖电网业务交互模式数据价值挖掘模型,实现了电网运行状态、客户诉求信息的紧密融合,将需求侧响应思维贯穿到电网资源的科学配置中,从企业运营的海量离散信息中提炼出众多精炼、有效的知识元素,以丰富的数据、科学的方法、客观的视角全面系统地分析了地区负载能力发展态势,为后续科学规划、精准投资、主动服务能力的进一步提升奠定了坚实的实践基础与数据保证。