张英华
(国网山东省电力公司莘县供电公司,山东 聊城 252400)
本文研究的电网调度数据分析和挖掘系统以数据仓库为基础,并对调度的指标进行了梳理,同时运用多维数据在线分析处理技术,能够很好地揭示电网运行的规律,从而为相关的工作人员提供科学的依据。
一般而言,电网运行过程的定量分析,需要依靠对相关指标的计算,从而得到客观、全面和准确的参数。下面对电网调度涉及的主要指标进行分析。
对于分类电网而言,运行指标需要根据EMS 和其他自动化系统的记录生成相应的报告,之后归入电网指标统计资料中,便于后期的检查和分析。运行类指标主要包括:频率指标,比如最高频率、最低频率、运行的时间频率等,在实际工作中,频率的合格率为50±0.05Hz;备用指标,比如旋转备用容量的最大值和最小值,FM 单元数的百分比天数、负载率以及可用投资容量等;电压指标,电网的电压合格率,最高电压下电站的比例。
典型的调度指标有以下几大类:第一,负荷特性,涉及内容包括最大和最小的负荷、TS 负荷等;第二,功率平衡,涉及内容主要是每天供电量;第三,维护计划,涉及内容主要是维修计划的合理性;第四,低频减载,涉及内容主要是低频加载分片分区;第五,安全装置,涉及内容主要是设备配置的合理性;第六,传输电压,涉及内容包括运行时间、电压平均值等。
性能指标的英文缩写为KPI,主要有以下3 方面的功能:第一方面,能够反映目标,并且提供与目标相契合的激励措施,设置销售团队的目标,并且定期更新联系人,同时合理安排访问时间,而生产经理可以根据目标的具体情况对产出、废品率等内容进行设定和规范。第二方面,明确审核日期,并且与之前的业务计划、预算标准等进行比较,出现异常时能够及时回溯,并且找到问题的原因。第三方面,形成统计报告,并且在内部流通业绩数据,形成良好的竞争环境,使得KPI 能够真正反映取得的成绩。
经过对上述几类指标进行分析,掌握指标的内容和要求之后,常用的统计方法有3 种:第一种,总体统计。比如统计固定时间段内一项指标的累积数量,以故障出现的频率为例,可以记录不合格的天数,以及当天的故障时间,之后与每月维修单号进行对比,对计划以外的故障时间、电线跳闸等情况进行统计。第二种,均值统计。顾名思义,这种统计方法是对一定时间内平均指标的统计,比如输送水电站的耗水率、火电网的输煤率以及电网损耗等。另外,对于停电次数和平均日容量的统计也常用这种方法。第三种,比例统计。对于一段时间内的两类指标,必要时需要确定两者之间的比例,以便更好地分析电网运行的情况。常见的设备动作正确率、频率控制合格率、负荷预测精度以及低频减载通过率等,都可以进行比例统计。
数据仓库平台能够为决策和在线分析提供数据存储和查询的服务,并且这种在线系统在电网数据调度运行分析中主要负责数据指标的收集工作,比如收集网络参数、机组信息、发电功率以及负荷计划等,特别是计划可能与实际数据有出入,那么就需要对AGC 机组的各项指标进行评估,围绕市场交易制定交易报告,并且处理好跨地区的贸易问题。可以说,数据仓库的基础是数据库技术,但是它比数据库更全面,并且运用专门的管理系统整合数据。数据仓库中的数据主要来自数据库,但是这些数据需要借助正确的工具才能发挥作用,本文以在线分析处理方法为例。
在线分析处理就是人们常说的OLAP,它能够对数据进行多维的提取。比如时间维度,将时间进行分类,按照年、季、月、周、日、时、刻、分钟进行分类;又比如空间维度,对不同地区的数据进行分类;再比如变电站维度,需要将单个电网的输出功率与多个变电的输出功率进行分类;还比如周期维度,根据周期的峰值和谷值进行分类。对于分布式发电单元的DG 容量、线路的类型、天气的变化等,都可以进行灵活的分类,同时也可以增加和创设新的数据分类,比如添加负载因子以及变电站类型等。OLAP 流程图如图1 所示。
图1 OLAP 流程图
整体而言,电力系统进行数据分析的基础是控制模型的计算结果,并且数据仓库在对历史数据进行统计和分析的过程中能够发现电网运行的规律。在对电网进行分析时,主要按照月份和年份展开,报告系统属于自动化系统的一种,并且能够自动生成指标记录表,同时对这些指标进行量化分析和统计,便于值班人员和管理人员随时了解和掌握基本的内容指标,从而提高电网的控制水平。电网数据分析的类型和优点如下:对于日分析OLAP 报表类型而言,其优点是能够找到当日电网控制的问题和昨日的偏差,分析原因后采取补救措施,提高控制水平;对于月分析OLAP 报表类型而言,其优点是对月份运行的方式进行分析后,能够研究适应性和偏差的问题,并提出改进意见,从而提高调度的精细程度;对于年分析OLAP 报表类型而言,其优点是能够分析年度经营模式,制定下一年的规划。
对于电网而言,领导者需要加强公司各个部门之间的联系和沟通,围绕基础设施、安全生产、营销交易等展开互动,着重解决电网电力系统反映的突出问题。
显而易见,数据挖掘涉及的数据比较混乱,类型复杂多样,而且有一部分数据不够完整,随机性很强,那么电网调度运行分析中的数据挖掘需要对指标进行统计分析,甚至可以根据分析的需要,合理创新指标,同时计算数据的极值、均值、方差以及标准差等,并且对指标的结果进行评估和预警,合理确定预警阈值。另外,还可以将定量分析和定性分析相结合,对多个视图进行分组,之后让各个指标之间发生关联,并分析相互的影响。这里简单介绍一下定性分析和定量分析的区别:定性分析指的是,利用可视化技术,将数据显示在二维或者三维图形中,并对数据进行旋转处理,观察曲线变化情况;而定量分析主要针对相关系数以及协方差的计算问题,并分析影响的因素。数据挖掘旨在通过数学方法,从数据中找到规律,可以说,数据挖掘涵盖统计信息、计算机图形学以及人工智能等领域,而且不断细化,能够满足不同形式的数据挖掘需求。比如聚类分析法、预测法和回归法,在应用中都取得了很好的效果。近两年,我国自主研发出了全景分布式一体化的电网调度技术支持系统SG-OSS,其中D-5000 是系统的核心,能够实时进行监控和预警,并且实现了数据的统一存储和管理。另外,存储设备采用万兆体系架构,配合多核处理器技术,特别是12Gb 的SAS 总线,能够发挥磁盘最佳的读写性能。
调度数据挖掘可以对电网电力系统的合理性进行分析,并且找到局部发电规划和负荷变化之间的相关性,而对电网合同的分析更为重要,因为这样能够保证调度公平合理,同时电网合同的实施有序进行。在具体的数据挖掘工作中,需要对全部电网合同的执行和完成情况进行监测,将计划与实际偏差进行对比,并完成测序分析。这里需要提一下CPS,它是低压电器中的新型产品,采用模块化的单一产品结构型式,集成了传统的断路器、接触器、过载保护继电器、起动器、隔离器的主要功能,而数据挖掘可以对CPS 中的各种因素进行分析,并进行排序,找到最佳的控制建议,提高CPS 的效率。
综上所述,本文通过对电网调度运行分析和数据挖掘系统进行分析,并围绕调度指标展开计算,可以帮助调度人员全面掌握电网的运行情况,从而解决实际工作中遇到的问题。