乔向阳 舒日高 付广远 刘虎城
摘要:随着计算机和互联网技术的不断发展,社会生产生活中产生的数据量越来越大,从这些数据中挖掘有效信息成为各行各业的必备手段,数据挖掘技术也成为电力设备状态检修工作的重要技术。传统的数据分析和报表已经无法满足现代电力设备的管理需求,在电力设备状态监测系统中植入数据分析模块十分有必要,能够帮助技术人员从监测数据中获取电力设备检修所需的信息,提高电力设备状态检修的效率。本文从数据挖掘技术本身入手,分析并探讨数据挖掘技术在电力设备状态检修中的应用,希望可以为提高我国电力设备管理水平提供一些思路。
关键词:数据挖掘技术;电力设备状态检修;应用
引言:数据挖掘技术与大数据技术有一定的重叠,主要差异在于数据挖掘技术的并不能完全嵌入map-reduce算法框架。状态检修是一种新兴的电力设备检修模式,利用监视系统和诊断技术获取设备故障信息,判断设备状态,在设备发生故障前对设备进行检修,尽可能避免设备发生不可控的问题,尽可能避免电力设备停机,避免造成电力问题。电力设备状态检修大致可分为发电厂状态检修、变电站状态检修、输配电线路状态检修、输配电设备状态检修等几个部分,随着设备的不断运行,数据量不断扩大,从中挖掘有价值信息的难度也不断扩大,因此,数据挖掘技术的应用是大势所趋。
1. 数据挖掘技术概述
数据挖掘技术是一项从大量的、模糊的、无规律的数据中挖掘出实际的、有规律的、有用的信息的技术,与大数据技术相类似,却在实际算法中存在一些差异,二者并不能完全重合。数据挖掘技术已经被广泛应用于商业领域中,在电力设备状态检测中的应用还需要发展。数据挖掘技术中包括8个步骤:
1.1 数据信息收集
数据信息收集是数据挖掘的基础,只有将海量的数据收集起来,才能够进行接下来的数据分析和挖掘工作。
1.2 数据集成
在数据信息收集环节收集到的海量数据,并非都是统一的格式,想要在同一个算法中将这些信息分析处理,难度较大,至少要将不同格式、特点的数据向一个或几个方向进行集中,为后续的数据分析工作降低难度,提高效率,也为数据的有效共享奠定基础。
1.3 数据规约
数据规约工作是在集成的基础上进行的进一步处理,将数据用数据集的规约来表示,可以在保持数据完整性的同时缩小数据量,提高数据挖掘效率。
1.4 数据清理
在海量數据中有一些杂质数据,主要表现为与数据挖掘方向不一致、缺少真实性、数据错误等特点,这些数据的存在扩大了需要挖掘的数据量,还会影响数据挖掘的准确性和有效性,因此需要进行清理,对数据进行提纯。
1.5 数据变换
数据变换对于一些实数型数据是有必要的,依据概念分层、离散化都可以对数据进行转换,提高数据的可挖掘性,为数据挖掘的效率提升提供一些帮助。
1.6 数据挖掘分析
数理统计、事例推理、规则推理、模糊集、神经网络、遗传算法都属于数据挖掘分析的具体方法,能够有效进行数据的挖掘,得到有用信息。
1.7 模式评估
数据挖掘的结果根据挖掘需求、行业专家评定来评估挖掘结果的正确性。
1.8 数据挖掘结果可视化
数据挖掘技术得到的结果需要以可视化的方式呈现,供技术人员、管理人员及其他程序使用,提高数据挖掘结果的利用率。
数据挖掘技术在我国电力设备相关管理中的应用还不成熟,需要更多的研究和应用,在应用中总结经验教训,提高数据挖掘技术的应用水平,提高我国电力设备状态检测的水平。
2. 数据挖掘技术在电力设备状态检测中的应用现状
在电力设备管理系统中,我国已经开始逐步应用监测、监控设备,数据挖掘技术在电力设备状态检测工作中的应用已经成为大势所趋,国外研究成果较为成熟。在国外电力设备管理系统中,决策树是数据挖掘技术中的主流,神经网络、遗传算法等挖掘技术的应用比例较小,国内电力设备管理系统中对数据挖掘技术的应用较少,只有少数部门、岗位工作人员在使用,还处于技术应用的初级阶段。目前,我国的发电设备、变压器、输配电线路、输配电设备中对数据挖掘技术已经有了一定程度的应用,比如:发电设备汽轮机轴状态检测,以模糊聚类、粗糙集理论为主要数据挖掘技术;变电站电气设备状态检测,以决策树算法为主要数据挖掘技术;输配电线路状态检测,以粗糙集为主要数据挖掘技术。
3. 数据挖掘技术在电力设备状态检测中的进一步应用
3.1 在变压器状态检修中的应用
变压器的状态特征量是揭示变压器设备中性能状态变化、故障出现、使用寿命损耗规律的重要标志,及时并准确的对故障发生部位、原因、严重程度进行评估,借此制定设备的养护、维修方案,并付诸实践。变压器中的状态特征量主要是油中溶解气体,通过采集溶解气体的样本,技术人员能够分析出变压器的故障类型、故障原因、严重程度,其中应用到的数据挖掘技术主要是粗糙集数据挖掘技术,在对溶解气体样本数据进行模糊、离散化处理后,能够有效提高数据挖掘结果的可信性和质量。
3.2 在发电设备状态检修中的应用
发电设备中的数据挖掘技术主要借助分散控制系统实施,分散控制系统中能够存储海量的发电设备生产数据,这些具有多元性、动态性的数据需要借助挖掘技术才能够发挥出真正的作用,传统的人工处理方法不能满足数据处理的需求。发电设备状态检修中,汽轮机轴振动系数是十分重要的数据挖掘对象,是挖掘发电设备故障类型、原因、严重程度的基础,这部分挖掘研究主要依靠模糊聚类、粗糙集来进行。
结束语:近年来,状态检测理念逐渐渗透进各行各业的运维领域,成为电力、水利等领域的重要发展方向,在一定程度上推动了我国的现代化发展。状态检测理念与数据挖掘技术的结合,为技术人员及早发现设备故障征兆,及早进行设备保养和维修,提供了重要的帮助。虽然我国的数据挖掘技术和状态检测能力还处于较弱的状态,还有很大的发展空间,但我们相信,在实际应用过程中总结经验教训,能够最大程度上使我们的相关技术水平发展速度提速,为我国的电力领域发展提供助力。
参考文献:
[1]陈超金. 基于数据挖掘的电力设备状态检修技术研究综述[J]. 广东电力,2009,22(09):21-24.
[2]杨国庆,张宇. 数据挖掘技术在电力设备状态检修中的应用[J]. 上海电力学院学报,2012,28(02):176-180.