杜 江,陈锦龙,陈 龙,伍仕红,杨 福
(贵州电网有限责任公司电力调度控制中心,贵州 贵阳 550002)
电网调度是电网安全运行的重要环节,电网调度运行直接影响到供电的安全稳定。电网调度是一种24h 精力高度集中的工作,一整天的工作高压状态,以及调度员个人技术能力差异等情况的存在,使得电网调度员操作失误成为引起设备损坏、人员生命财产损失、供电可靠性降低等一系列安全事故事件的原因之一,陈碧云等人论述了调度操作正确性对电网安全的重要性,并对影响调度操作的人为因素进行了建模分析[1];肖勇等人研究了电网数据可视化常用的3 类数据,以及这些数据面向的4 种可视化任务[2]。但是针对操作数据挖掘并分析造成安全事故事件原因的文献很少,因此对调度操作数据进行深度研究以及对调度人员操作趋势分析,总结和探讨电网调度操作趋势大数据挖掘结果的应用方向是非常有必要的。实时、全面、准确地把握电网调度操作趋势是保障电网安全运行的重要手段,也是近年来调度工作风险把控的重要技术瓶颈。
近年来,随着电网建设规模的迅速扩大,社会经济建设对电力的依赖程度不断增加,对电力供应的安全可靠性要求越来越高,电网调度员操作安全风险防范工作面临着巨大的挑战,主要问题表现在以下几个方面:
(1)电网调度工作的相关操作风险防范主要依靠日常培训,以及对工作流程严格监督等人为管理方式,然而电网调度风险中人员的操作风险影响因素众多,机理复杂,用传统的建模方式难以建立完善、精准的操作趋势分析模型。充分说明人为因素对调度操作风险的影响,同时也表明在现有的调度趋势研究中,仍未能实现全面、完善、精确的调度操作趋势研究与应用[3]。
(2)传统的电网调度操作趋势分析很大程度上是依靠专家分析和建议,过分的依赖于个人的技术能力和工作经验,不能完整的反应调度操作趋势,除此之外,依赖人工的模式也大大降低了安全风险分析的效率。
(3)由于各信息平台之间的数据交互壁垒、数据分析技术欠缺的等问题,使得电网调度操作分析在数据集成过程中存在着较大的困难,影响了最终的结果[4]。
随着电网信息化建设的发展,各平台数据逐渐在统一的信息平台上集成共享,大数据分析技术在电网调度的应用,为保障电网安全提供了全新的解决思路和技术手段。在电网建设中,大数据分析技术已在设备故障分析检测、用户用电预测、负荷预测、客户服务分析等多方向取得了阶段性的进展,对电力数据的深入挖掘已成为解决电网实际问题的重要手段,依托大数据技术在其他领域应用的经验,开展电网调度操作趋势大数据挖掘与应用研究具有重要的现实意义。
本文基于大数据技术及数据挖掘分析方法,将其运用于电网调度操作趋势分析与应用探索中,阐述了电力数据挖掘的目的与意义、分析过程、基本框架,最后对未来研究应用的发展趋势和挑战进行了分析。
电网调度操作趋势大数据挖掘主要是通过日渐完善的电力调度信息化平台获取大量的调度人员信息、历史调度过程、调度人员考核、调度操作票等数据,基于关联分析、统计分析、机器学习等大数据挖掘分析方法进行融合分析和深度挖掘,从数据内部进行电网调度过程操作趋势分析、诊断、预测,建立多源数据综合分析的电网调度操作趋势分析预测模型,实现对电网调度人员的监管和对调度工作的综合评估,全面、准确、高效的管理电网调度人员操作趋势,为电网调度工作提供更多的工作风险评估和人员考核依据,项目的主要目的和价值意义体现为:
(1)提升电网调度工作管理效率,及时把控调度工作风险发展趋势,第一时间纠正电网调度操作问题,减少电网企业经济损失和人员生命财产安全隐患[5]。
(2)大数据分析挖掘技术的应用,有利于提高电网调度工作向智能化发展,对未来实现全面智能化的电网调度工作具有重要的意义。
电网调度操作趋势大数据挖掘分析的数据来源主要包括:调度操作历史过程数据、调度员个人信息数据、电网设备参数、个人培训考核数据、外部环境数据等,涵盖了能够直接和间接影响电网调度操作趋势的信息[6]。根据不同的数据来源和性质,可将其分为静态数据、动态数据、准动态数据。静态数据包括调度人员个人数据、技术参数等信息;动态数据是指在记录过程中通过时间作为标尺进行更新的数据,反映操作动态变化的重要数据[7];准动态数据是按月按年等长时间跨度更新的数据。以贵州中调为调度操作趋势大数据分析为例,目前,贵州中调调度科人员47 人,调度操作趋势大数据分析挖掘所包含的部分静态数据示例如表1所示,部分动态数据示例如表2所示,部分准动态数据示例如表3所示。
表1 部分静态数据示例
表2 部分动态数据示例
表3 部分准动态数据示例
电网调度操作趋势大数据具备了来源多、数据量大、结构多样、数据关系复杂等数据挖掘的基本条件[8]。
数据来源多:数据来源于不同的系统和计量设备,还有外部的天气等数据;数据量大:电网调度数据及相关的数据系统都在不停的进行数据更新,长年累月形成了巨大的数据量;数据结构多样:电网调度及相关系统数据中包含了结构化、半结构化、非结构化等多种的数据形式;数据关系复杂:各种数据之间相互影响,相互关联,分析难度较大。调度操作趋势大数据挖掘的基本特征如图1所示。
图1 调度操作趋势大数据特征
根据电网调度操作趋势的数据来源进行相关的分析筛选,得到大数据挖掘与应用的基本架构。首先数据来源于在线监测、调度收发令、人员培训管理、工作考核记录等多系统;然后将对所采集的数据进行转换和清洗处理,利用统一的数据存储、检索和实时处理对数据进行处理;建立数据处理分析需求大数据挖掘分析数据库,根据实际应用需求搭建电网调度操作趋势预测分析模型,对数据进行关联分析,实现电网调度操作趋势的监测与预测、调度发受令人员工作考核、调度设备操作趋势预测等功能;最后,通过多维度、多视角的可视化技术实现对分析挖掘结果的展示,为电网调度工作提供有力的数据理论支撑和决策优化支持。
由于电网调度操作趋势大数据挖掘来源较多、格式多样,在数据使用之前需要对数据进行集成和预处理来保证数据质量,主要步骤包括如图2所示。
图2 数据集成与预处理过程
多源数据集成和规范化转换:通过多系统和多种采集方式获取需要的数据,对数据进行统一规范化的集成,保证数据的完整性、可用性、安全性等要求;非结构化数据转换:由于所采集的数据中存在着较多的非结构化数据形式,需要利用文本识别、自然语言处理、语义分析等多种技术进行数据特征的提取和数据结构的转换;数据质量评估:针对数据质量开展数据完整性、冗余、遗漏、偏差较大等问题的评估,避免由于数据质量较差导致分析结果偏差较大的问题出现;数据清洗:数据清洗是数据分析挖掘重要的环节,通过基本的统计分析、聚类、关联分析、时间序列等技术手段进行数据检验、缺失值修复等多种数据清洗过程。
数据的集成和清洗旨在将所收集的数据能够完整的实现所要挖掘的价值,避免在数据收集环节中出现较大的偏差,导致结果可信度降低。
电网操作趋势大数据挖掘与应用过程对数据处理分析应用有较高的性能需求,所以在数据储存与处理技术上需要建立完善的高效储存和应用分析基础数据库,传统的数据储存通常使用关系型数据库或者并行数据库,这种方法在处理大数据时已经难以满足现实问题的需求。针对现有储存的缺陷,电网调度操作趋势预测与应用的储存系统将搭建满足结构化和非结构化数据,并且满足可靠性高、容量大、速度快等多种要求的数据储存与处理数据库。除此之外,针对传统方式下检索速度慢、检索困难等问题,设计基于增量检索和动态索引的数据检索方式,满足资源利用率高、稳定性好、容错性好等特点的检索需求。
调度操作趋势大数据挖掘是基于经典的数据统计和融合挖掘算法技术。构建电网调度趋势大数据分析平台,将建模过程与内存计算框架结合,形成多个分布式共同并行计算来提高计算速率,达到实时分析应用的需求。
由于调度分析挖掘所用到的数据具有的数据量大、数据种类复杂、实时性要求较高等特点,传统的数据模型单一的计算过程不能满足较大计算量的实际需求,所以在电网调度操作趋势大数据挖掘分析的过程中采用了经典算法结合多点分布式并行计算的方法,使得在数据量不断增大的情况下也能够满足较大规模数据的实时计算要求。
电网调度作业趋势大数据挖掘经典算法包括:相关性分析、预测分析、灰色关联分析、错周期分析等。相关分析是研究数据变量之间的相关关系,通常可以分为正相关、负相关、曲线相关、无相关性等,例如电网调度操作趋势研究中的调度人员操作时间趋势与调度人员工作年限指标就是密切相关的,但两个指标之间的相关程度则需要进行回归分析来进行判断;预测分析在电网调度操作趋势研究中,强关联的指标之间存在着内在的关系,通过指标间的多次函数矩阵拟合方法,进行相关指标的预测,提前对目标指标进行预警;灰色关联分析:是通过对含有不确定因素指标的系统进行预测的方法,针对指标因素之间的不同程度,用相同时间内获取的数据预测目标对象特征的一系列数值构建灰色预测模型,预测未来某段时间内事物发展的趋势,在电网调度操作趋势预测研究中,可通过灰色预测模型对调度发受令人员操作时间趋势,操作结果趋势进行预测;错周期分析:由于电网调度工作受时间周期、季节性变化等影响较大,可能会造成不同时间段的分析结果不同,综合分析可能导致结果偏差较大,所以利用周期交错的方式对调度操作趋势进行分析,针对不同周期内的数据分析结果差异进行评估,会发现不同季节周期内的影响因素指标、分析结果存在着较大的差异,可以对未来电网调度操作趋势进行周期差异化预测分析,使得更加符合实际应用需求。
在电网调度趋势大数据挖掘成果的应用过程中可结合可视化展示、增强现实等技术,将实际成果输出展示。
电网调度趋势大数据挖掘分析的结果一般使用可视化技术方式实现,可视化分析技术涉及到展示图形意义构建、人机交互设计、分布式认知等可视化认知理论。大数据分析可视化技术可以使得电网调度操作趋势分析挖掘成果的应用人员能够更加直观清晰的了解实际数据反映的情况,发现各种数据之间的关系、预测趋势、实际偏差等,及时把控电网调度工作中的问题。
在电网调度操作趋势大数据挖掘应用的可视化过程中,针对不同成果使用者建立不同的展示窗口,可在调度控制室实时展示监测数据驾驶舱,使调度员能直观掌握的电网具体情况,使用折线图、柱形图、饼图、气泡图、雷达图等多种展示方式不同的数据趋势,正常数据与预警数据使用不同颜色进行区分。
增强现实技术的应用是为未来智能化调度工作开展奠定基础,将现有的可视化展示数据结合增强现实技术和设备相结合达到不受时间、地点限制的电网调度操作趋势大数据分析成果应用需求,满足不同人员对可视化数据的差异化需求。
在电网调度实际工作中,调度受令发令人员的操作是否顺利,将直接影响检修工作能否安全圆满的完成,通常由于调度员操作时间过长、操作经验不足、工作环境不熟悉等因素导致的有调度责任的安全事故时有发生,直接威胁到人身、设备及电网安全运行,针对电网调度操作过程中的安全隐患进行的电网调度操作趋势大数据挖掘研究,是有效解决当前问题的有效手段。
4.2.1 人员管理
(1)人员操作趋势监测与预测
对调度员历史调度操作、个人历史培训、实操演练等大量数据进行多维度的分析和关联挖掘,从调度发令和受令人员操作时间趋势、不同设备操作熟练度趋势等多层面多目标对人员操作习惯进行预测,并将调度操作与人员技术能力进行匹配度分析,实现对人为因素造成调度操作失误风险概率趋势和操作习惯的实时预测监管,提前预知风险,制定解决方案。
(2)调度人员工作考核
对调度员的考核一直只停留在人员工作年限、本月工作数量、培训考试成绩等传统因素进行评判,通常是以月度、年度的方式进行,这种方式具有时间较长,考核结果准确度较低等问题的存在。针对传统方式中的不足,结合调度操作趋势大数据挖掘分析,为调度人员工作考核提供准实时的考核数据支持,做到调度人员工作动态考核评估。
4.2.2 设备调度操作趋势分析
在电网调度操作过程中,针对不同的设备调度操作过程、操作难度、操作注意事项、所需时间、设备所处环境、作业风险、环境因素等进行分析挖掘,对设备调度操作趋势进行评估分析,根据评估难度制定相应的作业流程、作业注意事项等提前防范措施,在调度工作分配时自动评估人员与调度操作之间的匹配度,预测该次操作的风险趋势。
4.2.3 多部门协调应用
调度操作趋势大数据挖掘分析结果不仅仅适用于调度工作中,更多的是可以通过系统进行数据互通,实现分析挖掘结果共享,给其他部门提供如设备调度操作过程中的故障分析诊断、停电预测等一系列的高级应用,消除原有的信息孤岛、各自为政的局面。
当前,电网调度操作趋势大数据分析与应用已经开展了初步的研究,如何完善研究的成果,满足电网调度工作的实际需求,在管理和技术上还面临着较多的问题需要解决。例如,现阶段虽然能够获取多部门的数据,满足基本的研究需求,但想要真正的实现研究目标,在数据方面还需要解决较多的数据难题,包括现阶段的数据实时联动获取,数据获取,数据转换,数据质量提升等工作都需要进一步开展大量的协同工作,这就涉及到多学科交叉配合,学科交叉的复合型人才是当前电网调度操作趋势大数据挖掘与应用急需的人才,人才的培养也是当前重要的难题之一;另一方面,现阶段的研究成果应用需要得到实际的检验才能保证正确性,相关的管理部门协调沟通是否顺畅,使用的效果如何,都是面临的较大问题。
虽然当前的研究还面临着较多的技术和管理难题,但我们有理由相信在未来电网调度工作的研究会取得较大的进展。一方面,在未来5G技术、增强现实技术、物联网技术、边缘计算技术、数据湖、AI 技术等技术的快速发展下,在电网调度操作趋势大数据挖掘与应用过程中数据的获取、数据的采集、模型的快速分析、成果的应用展示、人机交互等都将取得较大的进步;另一方面,未来随着电网信息化和智能化的建设取得伟大进展,电网调度工作无论是在技术还是管理上都将焕然一新,将为未来的调度操作大数据分析挖掘提供良好的研究环境。
电网调度操作趋势大数据分析挖掘是大数据技术在电网调度的重要应用探索,在智能电网建设的背景下显得尤为重要,可以为电网调度工作中的人员管理、设备操作分析等提供智能化分析决策。
目前电网调度操作趋势大数据分析挖掘与应用研究还处于起步和探索阶段,数据的高效融合存储,分析技术的研究落地都需要开展大量的工作,现阶段的研究表明:大数据分析挖掘可在未来有效提高人员调度操作趋势预测分析、设备操作趋势预测分析、多部门数据协同应用的效率,在提炼历史调度知识、个性化评价、调度操作趋势分析等应用场景中表现良好,应用前景广阔。