数据挖掘技术在电网安全检查管理中的应用

2017-09-13 07:30莫琦李矛李翔付龙明王立娜卢颖浩
科技创新导报 2017年19期
关键词:电网安全安全检查数据挖掘

莫琦+李矛+李翔+付龙明+王立娜+卢颖浩

摘 要:从电网安全检查标准化和动态更新安全检查标准库两个方面构建电网安全检查机制,提出了安全检查标准化的重要性及安全检查标准库的动态更新机制,采用数据挖掘技术建立了安全检查动态更新机制。做到了安全检查标准库中检查项的动态更新,间接地减少了电网的安全隐患,为电网安全稳定运行提供重要保障。

关键词:数据挖掘 安全检查 标准化 动态更新 电网安全

中图分类号:TP311 文献标识码:A 文章编号:1674-098X(2017)07(a)-0209-03

在当今的大数据时代,数据挖掘技术是这个时代快速发展的关键所在,该技术是通过大量的数据分析,从中提取有利用价值的信息的过程。电网企业在安全检查过程中,如果能够合理地运用数据挖掘技术,那么对于提高电网的管理水平、提高电网稳定性有重要意义。本文主要介绍电网安全检查标准化的重要性,以及如何利用数据挖掘技术进行有用信息挖掘,并提出了安全检查标准库的动态更新机制。

1 数据挖掘技术简介

数据挖掘(Data Mining)是一种知识发现的过程,它主要基于统计学、人工智能、机器学习等技术,高度自动化地分析数据,做出归纳性的推理,从中挖掘出潜在的模式,并对未来情况进行分析、预测,以辅助管理者、决策者评估风险、做出正确的决策。利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。

1.1 聚类分析

数据库中的记录可被划分为一系列有意义的子集,即聚类。对这些子集的识别,对用户来说有直接意义。它们常常为其它的规则抽取算法提供有用的信息。聚类增强了人们对于客观现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要包括传统的模式识别方法和数学分类学。聚类技术的要点是,在划分对象时不仅考虑对象之间的距离,还要求划分出的类具有某种内涵描述,从而避免了传统技术的某些片面性。聚类有时能直接满足用户的要求,有时是其它发现过程的“预处理”。例如,聚类所产生的类可以作为决策树生成算法的目标概念,也可以做偏差分析的基础。

1.1.1 K-Means算法

K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用误差平方和准则函数作为聚类准则函数。其算法的优点算法快速、简单;对大数据集有较高的效率并且是可伸缩性的;时间复杂度近于线性,而且适合挖掘大规模数据集。

1.1.2 Canopy算法

Canopy算法的主要思想是把聚类分为两个阶段:阶段一,通过使用一个简单、快捷的距離计算方法把数据分为可重叠的子集,称为“canopy”;阶段二,通过使用一个精准、严密的距离计算方法来计算出现在阶段一中同一个canopy的所有数据向量的距离。这种方式和之前的聚类方式不同的地方在于使用了两种距离计算方式,同时因为只计算了重叠部分的数据向量,所以达到了减少计算量的目的。

2 电网安全检查管理现状及标准化的重要性

2.1 安全检查存在的问题

随着电网建设规模的不断扩大,电网结构越来越复杂,对应的相关安全检查工作大量增加。但就目前电网公司情况来看,相关检查工作,还是按照纸质文件进行检查,其中检查标准也很模糊,主要凭借检查人员的工作经验来断定检查项目和结果,这样情况下就提高安全隐患的存在。

2.2 安全检查标准化的重要性

电力生产过程最重要的是确保安全,电网企业历来特别重视电力的安全生产,但是在实际电力生产过程中,由于作业人员安全意识不足和受到人员生理条件的限制,难免出现工作的随意和疏漏而造成人身安全身故。当实现对某一项生产的安全操作规范进行整理,让安全监督人员知道安全的内容、如何进行监督、明确监督标准;明确不同岗位安全监督的重点,让安全监督人员熟悉安全监督的依据,并在日常工作中加强安全监督工作的主要监督指标学习,这样就能大大降低外部因素对电网检查工作造成的影响,减少电网运行中的安全隐患。

3 数据挖掘技术在安全检查管理中的应用

3.1 数据挖掘技术在安全检查管理中的应用

随着社会经济的快速发展,电网建设也步入高速发展的时期,电网规模已经达到较高水平,电网结构日趋复杂。电力设备数量快速增长,电力系统中运行的设备产生的数据信息量急剧增加。在此情况下保证电网安全稳定的运行是电网动作的重中之重,而安全检查是保证电网安全运行的重要环节之一;传统的安全检查是相关工作人员根据安全检查标准库中的内容逐项对各检查项定期或者不定期进行检查或抽查,然而随着电网规模的增大传统的安全检查标准库已经跟不上电网系统运行安全生产检查项的更新速度及结构的复杂程度,难免会产生疏漏之处,或者检查项长期不更新就会造成工作效率低或者重复劳动。通过数据挖掘技术实时把安全检查结果库和安全检查标准库中的内容进行分析,实时更新安全检查标准库中的内容,保证安全检查标准库中的内容项是当下进行安全检查最重要且最全面的标准项。通过这种方法来提高检查效率、调整检查重点、以及保证检查的全面性。电网系统安全检查的全面落实是保证电网安全稳定运行的重要组成部分,随着电网规模和结构的发展,对系统运行安全生产的可靠性要求越来越高,需要在电网运行中,及时发现系统运行安全生产过程中不安全因素及是否对电网安全运行产生风险,所以利用数据挖掘技术做到安全检查标准库的动态更新是非常有必要的,检查人员要根据安全检查标准库中的内容进行详细检查,要把安全隐患消灭在萌芽之中,以免对电网造成更大的损失。endprint

3.2 运用数据挖掘技术的安全检查标准库的动态更新机制

安全检查标准库的实时更新对安全检查的进行及电网安全稳定的运行尤其重要。分析安全检查标准库和安全检查结果库,根据检查人员实时上传安全检查结果库的设备检查信息,根据聚类算法实时更新安全检查标准库中的内容。其技术实施方案如下。

(1)从安全检查结果库中提出N中特征,将多种特征合成N维向量,其中N为自然数。

(2)对N维向量进行归一化处理得到数据集合。

(3)使用Canopy算法对所述数据集合进行聚合得到第一聚类,根据第一聚类得出K值。

(4)根据K值使用K-Means算法对数据集合进行聚类知道中心点收敛或达到预设要求,得到多个类簇。

(5)根据预设向量相似度阈值确定每个类簇中的关键元素,根据关键元素提炼出导致系统运行安全隐患的关键属性,当安全检查结果库中新检查项的关键属性的数量大于预设关键属性数量阈值时,将新检查项加入到所述安全检查标准库中。

根据以上步骤就能实现安全检查标准库的动态更新机制,此机制保证了安全检查标准项的动态更新,保证了检查项的覆盖广、内容细等内容,为安全检查工作的实施更智能更全面的支持,间接的保障了电网安全稳定的运行。

3.3 安全检查标准库动态更新实施方案具体步骤

(1)从安全检查结果库与安全检查标准库中提取N种特征,完成从原始数据集合到N维向量(x1,x2,x3.....,xn)的映射。

(2)将数据归一化;样本数据集合每一个维度都具有均值和单位方差。计算每一个维度上数据的均值和标准差,首先在每一个维度上与该均值求差,然后在数据的每个维度上与该维度上数据的标准差相除。具体如下:(其中ui为xi这个维度上的均值,为xi该维度上的标准差)

(3)将新的安全检查项数据向量化得到一个结果集list后放入内存中,选择两个距离阈值:T1和T2,其中T1>T2。

(4)从结果集list中任取一个数据向量=(x1,x2,x3……,xn),用低计算成本方法快速计算与所有Canopy之间的距离(如果当前不存在Canopy,则把作为一个Canopy),如果与某个Canopy距离在T1以内,则将加入到这个Canopy。

(5)如果曾经与某个Canopy的距离在T2以内,则需要把从list中删除,此时认为与这个Canopy已经足够接近,它不可以在做其他Canopy的中心。

(6)重复步骤2、3,直到list为空结束。进而得出一个“粗”聚类,进而得到K值。

(7)遍历数据集合list,将每个数据划分到最近的中心点中;计算每个聚类的平均值,并作为新的中心点,每个点到中心点的距离公式如下:其中xi为当前数据向量第i个向量分量,ki为聚类中心点地i个分量;重复6~7,直到这k个中心点收敛或达到要求。

(8)如果对每一个类簇中的对象向量剔除其中的某几个向量分量(xj…xK…xm),计算类簇内的向量相似度,如果依然有很高的相似度,说明踢出去的向量分量不是关键元素,如果相似度明显降低,说明此向量分量为关键元素,进而提炼出导致系统运行安全隐患的关键属性,当所述安全检查结果库中新检查项的所述关键属性的数量大于预设关键属性数量阈值时,将所述新检查项加入到所述安全检查标准库中。

具体实施流程图如图1所示。

3.4 安全检查标准库动态更新方法应用

安全检查动态更新方法的实施中,我们能将新获取的检查项根据已有的信息进行数据分析,从而判定该检查项是否应该进入安全检查标准库,以及如何对检查项进行规范化处理。此方法不仅缩短了安全检查标准库的更新时间,同时自动对新的检查项判断是否加入安全检查标准库。实现了安全检查标准化、自动化、规范化,将为安全检查活动提供可靠、准确和及时的信息参考,为系统安全生产稳定运行提供科学高效的支持。

4 结语

随着电网信息化的不断发展,电网机构及规模数据量日益庞大,如何提取各安全检查数据间的关联,发现其规律,从繁杂的数据中提供对安全检查工作有用的数据,是当今电网企业发展的一个重要研究方向。随着电网数据挖掘技術不断深入,在电网企业安全检查工作中的应用越将来越广泛,对电网安全检查工作做出明智决策,对安全检查工作的检查项和检查流程,检查方式等合理化管理,保障电网安全稳定的运行,减少电网风险都起着极为重要的作用。

参考文献

[1] 卢建昌,樊围国.大数据时代下数据挖掘技术在电力企业中的应用[J].广东电力,2014,27(9):89-94.

[2] 楼巍.面向大数据的高维数据挖掘技术研究[D].上海:上海大学,2013.

[3] 宫宇,吕金壮.大数据挖掘分析在电力设备状态评估中的应用[J].南方电网技术,2014,8(6):75-77.endprint

猜你喜欢
电网安全安全检查数据挖掘
丹阳市开展汛前安全检查 筑牢汛期安全防线
“执法+审计+专家”宜兴市探索审计式安全检查新模式
安全检查表法在轿厢意外移动风险控制中的应用
基于并行计算的大数据挖掘在电网中的应用
浅析电力二次系统安全防护技术的应用
从机场的安全检查谈起……
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究