徐晓虹,郑 昀
(北京市化工职业病防治院,北京 100093)
配电设备处于电力配电系统的末端,直接向企业与用户分配与供应电能,其稳定性与可靠性对于工业生产及人类生活均十分重要。为了将人工操作失误率降低,减少人力资源浪费,提供便利且可行的控制方式于配电设备的自动化监控与维护,必须以合理的控制逻辑为支持,对配电设备施以计算机管理[1]。目前,我国不少供电公司存在着配电设备类型多、人员配置紧凑的问题,致使公司面临较大的设备运行维护与故障抢修压力,故障抢修时间长,一旦有大面积多点故障出现,将会难以应对。所以,需要借助先进的科技手段进行配电设备运行监控与故障诊断系统的设计,在远程故障诊断与预(告)警系统的支持下缩短故障抢修时间,实现配电设备监控智能化[2]。刘明祥等[3]提出一种配电设备运行状态综合评估方法,并以此为基础进行了设备状态多维度评估指标体系的构建,但体系涉及的设备自身运行状态因素中的关键硬件状态与环境因素等数据通常在配电设备中并未采集,故此评估方法很难在实际应用中取得理想结果。张铁峰等[4]通过研究一体化配电网智能运行与维护系统,明确了系统的技术架构及实现技术,但该项研究主要以配电网一次系统的运行与维护为重点,并未涉及到配电设备运行状态的监控与维护管理。针对配电设备传统运行与维护存在的不足以及所需解决的相应问题,文章提出一种以大数据为基础的配电设备运行状态监控与故障预警系统设计方案,以此方案为指导,利用大数据技术对所采集的配电设备运行数据进行实时分析,实现对配电设备的采集监控、预警分析与闭环管理,提供可靠的决策支持于检修策略的优化、设备的选型以及备品备件等的管理。
配电设备运行状态监控与故障预警系统主要由数据采集层、集成计算层、数据分析层以及应用层组成[5],在集成信息通信一体化调度运行支撑平台的基础之上,统一管理配电设备资源,高效挖掘大量的配电设备数据信息,及时定位、分析、预警并解决设备运行故障,达到全面提升配电设备运行与维护整体水平的目的。系统总体架构如图1所示。
图1 配电设备运行状态监控与故障预警系统总体架构Fig.1 Overall architecture of power distribution equipment operation status monitoring and fault early warning system
数据采集层以数据采集协议为基础采集配电设备的运行与应用数据,系统采集的各种数据信息主要涉及基础设施数据、系统运维数据以及外部数据等;集成计算层汇聚、存储并清洗多元异构数据,提供批量数据以及实时流数据计算服务;数据分析预警层基于大数据挖掘技术及海量的配电设备运行状态历史数据对设备的先期故障特征进行分析,在实时分析设备状态数据的基础之上发布设备异常预警[6];应用层基于底部支撑实现上层应用,提供前台交互服务,系统主要包括采集监控、预警分析、闭环管理与决策辅助4大功能应用。
基于大数据的配电设备运行状态监控与故障预警系统通过实时流处理技术以及自行编写的业务模块完成数据挖掘分析(异常检出)、预警通知与可视化3项功能。
配电设备运行数据日志的异常检测应将非结构化原始日志向结构化日志模式的转化作为首要任务[7]。根据异常检测算法的输入要求,日志模式提取程序将结构化数据输入生成,在分析端以分布式流处理技术为支持执行对日志模式的提取任务,结合全局异常检测算法以及综合时序模型的具体输入生成经过聚合与转换的结构化输入。
日志模式提取任务由在Storm集群中部署的定制化Topology来执行。Storm集群基于Kafka消费者模式进行流数据源(Spout)的建立,连续读取存储于消息队列的日志。Topology完成日志模式提取之后,将生成的分类结果存储于Redis中,为数据挖掘模块的查询与调用提供便利。Storm集群与Zookeeper集群共同担负起对分布式流式处理过程的监控与任务分配职责。
分布式流处理程序为模式分类计算的并行化实现提供保证,与传统批处理算法相比有更为突出的实时性特点。全部分类结果均在Redis中存储,并接受globalinfo的维护,全局数据的一致性由此能够得到保证。
在完成日志模式化与统计工作之后,各类配电设备及相关模块的日志模式化信息以及分时间窗的统计信息全部暂存于Redis中。此时,综合时序分析模块与全局异常检测模块对Redis上的结构化日志数据进行读取,执行时序分析与异常检测的任务。大量结构化中间数据存储于Redis上,可结合异常检测模块的差异化需求提取并调用这些数据。具体抽取方法及聚合粒度通过程序模块来实现,综合时序分析模型根据系统配置的日志模式进行各时间单元内日志模式的抽取,生成时间序列,以此为基础执行综合时序分析与异常检测任务。全局异常检测模块利用Storm集群在高维场景下计算异常因子,并结合设定好的阈值对异常点作出判别。如果日志模式有较多分类,则采用数据降维法降维处理全局异常检出模块的数据输入,达到节省算法计算时间的目的。如果检测结果为异常,预警通知模块将会发出短信或邮件告警,提醒运维人员及时采取措施规避故障的发生。
出于对配电设备故障发生具有紧急性与时效性特点的考虑,系统采用短信形式优先向运维人员发出通知,为其提前做出响应提供便利。为了在故障解决过程中提供有效参考于故障的恢复,系统还应将可能出现故障的配电设备的基础信息、异常检出结果等采用邮件的方式发送给运维人员与设备供应商,为问题的快速定位提供便利。
在解决相应故障之后,业务人员与数据分析人员还要执行对日志的溯源与经验归纳任务,对此,系统应采用可视化方式将日志统计信息、异常检测数据结果等呈现出来,便于形成有效的知识进行真实环境的部署。
采集监控模块对数据的采集频率为5 min/次,模块采集的内部数据信息包括基础设施数据以及系统运维数据2种类型,前者由各类配电设备、数据库以及中间件的实时与历史数据构成;后者则主要包括配电设备运行状态监控与故障系统各主要页面的响应数据以及响应时长等指标。
针对实时产生的数据,使用Flume实时数据采集技术进行收集,此方式可将最新数据发送至分布式集群执行实时处理操作,快速生成分析结果;针对历史数据,使用Storm对其进行分析,通过Kafka消息生成器对历史数据流进行逐条读取,并将其发送至分布式集群作进一步的分析,该模式可复现与回溯以往发生的故障案例,有利于故障的复核及问题归因。采集监控模块的功能在于监控并采集各类数据信息,对内外部数据进行高效传输与汇聚,为上层应用奠定基础。
原始数据的产生到故障预警的生成需要经历模式化、指标计算以及算法分析等流程,以分布式大数据技术为支持,为配电设备运行产生的海量日志的及时处理提供保证。运维人员与业务人员需要分别对设备异常检测结果进行故障追因与业务求证,在对比并认证原始日志与故障样本之后,生成新的规则并将其在知识库中存储。运维人员、业务人员以及数据分析人员共同参与故障预警规则及相关知识的生成。以多方检验及求证为基础,配电设备运行状态监控与故障预警系统可以在持续的运行过程中不断将异常检测精度提高,同时,实现对各类故障预警覆盖范围的扩大。基于配电设备运行数据的日志处理及故障预警流程如图2所示。
图2 配电设备运行数据日志处理与故障预警流程Fig.2 Distribution equipment operation data log processing and fault warning process
由图2可知,配电设备产生的日志数据在模式化、指标计算、算法检测、故障确认、数据分析以及规则发现等一系列处理之后生成可用知识存储在知识库中,并在系统运行过程中对后续异常问题的检出结果产生影响,以此实现对运行状态分析效率以及故障预警准确度的提高。
为了提高配电设备消缺管理流程的规范化程度,系统以Activiti工作流为基础提供配电设备故障闭环流程管理功能,整个流程由设备故障提取、故障确认、消缺派工管理、现场消缺与信息反馈、反馈信息审核等子环节[8]共同构成。
(1)设备运维检修计划优化。根据配电设备故障预警的实际情况对运维检修计划进行优化安排,在减少不必要的检修工作、保证工作效率的同时,防患于未然,采取提前、主动的维护措施对故障的发生加以规避。例如针对存在严重故障风险的配电设备立即安排维修;针对存在异常运行状态的设备优先安排维护检修计划;针对需引起注意的设备应将其列入日常运维观察列表之中。
(2)家族性缺陷分析。在聚类与关联分析各类配电设备故障的基础之上,对设备故障缺陷所表现出来的家族性特征进行识别,制定运行维护策略及计划。举例而言,若通过家族性缺陷分析发现某厂家某一型号的特定版本或批号的配电设备出现某类故障的次数比较多,可针对其制定统一批量维护与升级的计划。
(3)备品备件管理优化。围绕厂家、型号、版本以及年限等角度对配电设备展开深入的分析,与设备运行状态监控及故障预警相结合,预测今后特定时期内所需配电设备备品备件的种类及数量,以此为基础进行备品备件采购计划的优先安排。①规避在配电设备出现故障之时由于备品备件的欠缺而延误故障处理时间这一问题的发生;②减少不必要的备品备件采购。
上述系统使用配电设备运行数据日志的实时采集,通过时序分析模块与全局异常检测模块进行故障检测,并在发现故障时基于预警通知模块,及时提醒运维管理人员,以温度监控为例,在选定监控设备后,系统界面可实时显示设备温度变化的数据日志,可见,通过异常检测,可得设备温度未出现明显变化,较为平稳,此时未见故障。
为检验上述系统的可行性,本文选用人工检测方法、文献[3]指标评价方法作为参照对象,以实地采集的配电网设备运行数据日志为测试源,其中无故障、存在故障的配电网设备日志分别为86、72个,故障主要表征为导线、绝缘纤芯等损伤。配电设备运行数据日志中的故障信息见表1。
根据表1配电设备运行数据日志中的故障信息,选用变压器漏油数据日志为实验组,遵循上述故障预警流程进行异常检测,所得结果如图3所示。可见,利用人工检测与指标评价方法进行故障预警后,变压器漏油量差异较小,而对比之下,上述研究所提出的方法因能够高效、精准的进行故障预警,极大的减少了变压器漏油量,故而,漏油量最少,验证了其应用的优势性。
图3 各方法对变压器漏油故障预警结果Fig.3 Early warning results of various methods for transformer oil leakage fault
同时,为验证上述方法故障预警的可靠性,本文以表1中的故障为例,选用检测正确率、召回率和F
表1 配电设备运行数据日志中的故障信息Tab.1 Fault information in operation data log of distribution equipment
值作为评价指标,分析其与人工检测方法、指标评价方法的差异性,所得结果如图4所示。
图4 各方法故障预警的可靠性结果Fig.4 Reliability results of fault early warning of each method
显然,从故障预警的正确率看,研究所提出的方法正确率优于其他2类方法,且正确率变幅较小,较为平稳;而且,检测召回率最高,并随着实验次数的增加大幅增加,表明研究所提方法对于配电设备运行故障的检测查全率最优,由此,也可推理得出研究方法的F值最高,验证了其在配电设备运行故障预警中具有高度可靠性,具有应用可行性。
围绕具体的业务需求,文章进行基于大数据的配电设备运行状态监控与故障预警系统设计,研究配电设备采集监控、预警分析、故障闭环管理以及辅助决策等主要应用,有利于弥补传统配电设备运行与维护管控方式中存在的不足,提高配电设备运行状态监控及故障预警效率,提供有效支撑于配电设备的可靠运行。今后,研究人员应进一步扩大配电设备大数据来源,制定更为详细与完善的监控与预警方案,与配电设备的远程运维支持相结合,进一步优化配电设备的运行、维护及管理水平。