基于聚类方法的工业电气设备大数据特征识别

2020-12-04 07:51:00文,田
计算机技术与发展 2020年11期
关键词:信息熵电气设备聚类

马 文,田 园

(云南电网有限责任公司信息中心,云南 昆明 650000)

0 引 言

随着工业自动化控制技术的发展,大量的工业电气设备得到使用,过程中需要结合工业电气设备的运行工况特性进行自动化性能监测,提高工业电气设备的运行可靠性[1]。而进行自动化性能监测时需要提取运行状态下设备的运行参数大数据特征,为自动化性能监测提供有效信息,因此研究相关的特征提取方法在工业电气设备大数据分析和智能化应用方面具有重要意义[2]。

侯莉莎[3]利用聚类集成算法,在大数据组造期间,通过抽样方法抽取大数据的子集样本,并进行数冗余特征排除,结合随机子空间的miRNA识别算法,对排除冗余数据后的数据子集进行融合,最终实现大数据集合中冗余特征排除的聚类。王玥[4]提出一种基于均值密度中心估计的大数据网络中用户特征数据准确检测的方法,通过用户特征数据间的关联度进行计算,获取特征数据。根据特征数据阈值判断并筛选有效数据,利用数据不同特征的支持度与置信度对数据进行聚类,最后以总用户数据点为核心,实现用户数据中心密度集合,完成数据检测。丁春晖[5]为优化大数据分类识别效果,提出改进蛙跳的数据分类优化识别方法,同时,结合了流形半监督算法更新并筛选最新数据个体,最终实现大数据的分类及优化识别。但上述方法仅应用于网络信息或图像数据的检测上,未应用至设备中,并未有效分析出电气设备大数据的特征。

为了提升工业电气设备大数据分析和识别能力,该文提出一种基于模糊信息熵特征提取的工业电气设备大数据特征识别方法。内容包括:应用数据采集器采集并分析相关电气设备参数大数据;经计算机处理,实现大数据可视化,并重组其特征;构建特征识别的简化数学模型;实现大数据的多特征识别。最后进行仿真测试分析,得出有效性结论。

1 工业电气设备参数大数据分析

首先需采集电气设备的参数大数据,利用采样结果进行特征重组,整合获取到的分散数据,以此提高数据识别效率。具体实现流程如图1所示。

图1 方法实现流程

1.1 参数大数据采样

1.1.1 采样装置及模块分析

由于数据较多且复杂,因此对其数据采样的要求较高,该文将通过34980A数据采集器获取设备参数大数据。整个数据采集器是由三部分共同组成,分别为信号预处理部分、信号调理部分以及通信部分,如图2所示。

图2 数据采集器模块

由图2可知,信号预处理部分是实现待检测数据切换的准备阶段;信号调理部分是切换数据的周期、信号采集阶段;通信部分是实现与PC传输采集信号数据的连接环节。

利用上述装置,对工业电气设备的参数进行采集。

1.1.2 计算机处理过程

为了实现对工业电气设备大数据信息的优化提取和特征识别,需进行工业电气设备大数据信息采样。结合信息流融合调度方法,进行工业电气设备大数据的统计信息模型构建,通过期望频繁项(EFI)采样方法,进行大数据的聚类。而通常情况下聚类算法可以分为两步进行处理,一是目标识别,二是聚类处理。目标识别阶段先要对目标区域进行网络化,通过目标的轮廓或者是数据识别,获取高密度的格网概率密度函数。可以使网格化的目地在于加快目标的识别速度,以便于更加快速的定位。进行聚类处理时,在目标标识中间结果的基础上,通过DENCLUE得到概率密度函数局部值定义密度吸引子,以此确定最终的聚类结果。

此密度聚类的算法对于噪声数据有很强的抗干扰能力,另外,与其他的计算方法进行对比,该算法能够发现随意聚类,更好地叙述空间分布模式,以此提取更多的工业电气设备大数据信息聚类特征。同时对监控区域历史视频以及异常事件信息统计,对非正常与正常情况下的工业电气设备大数据信息特征分类统计,建立一个相对应的统计分析模型。其中工业电气设备大数据特征分布式调度集函数为:

D(j)=t(xj(t)+lj(t))

(1)

其中,xj(t)表示工业电气设备大数据的模糊平均集D中的平均信息熵,描述了在第j个聚类中心的样本子集,lj(t)表示模糊聚类中心中工业电气设备大数据的统计特征量,t表示采集时长。

在满足约束条件下得到工业电气设备大数据的类信息熵满足:

e(D)>xj(t)

(2)

采用模糊C均值聚类方法,进行工业电气设备大数据的融合处理,使用一个四元组结构来描述工业电气设备大数据的信息关联特征:F=(Xij,Pij,e(D),Tk1),其中,Xij为工业电气设备大数据特征信息流在Tk1时刻的信息素强度,Pij为输出优化训练的最优概率。利用谱聚类算法,得到密度的格网概率密度函数为:

(3)

(4)

采用多传感器信息采样方法进行工业电气设备大数据信息采集[6-7],得到工业电气设备参数大数据的统计分析模型为:

(5)

其中,pi为工业电气设备大数据的谱特征对齐的概率密度函数,其大小取决区域K中的概率。根据上述分析,构建了大数据采集模型,为提高特征识别效率,需根据参数特征将采集到的参数大数据进行重组。而大数据特征的重组不仅为电气设备特征识别提供可依数据,还为识别应用奠定可行的理论基础。

1.2 大数据特征重组

采用多分布的传感器阵列进行工业电气设备大数据采样,对采集的工业电气设备大数据进行特征重组[8-10],得到工业电气设备大数据信息流融合特征聚类的概率分布:

(6)

其中,δ为关联方差。结合分簇聚类融合的方法,构建工业电气设备大数据的分布式融合聚类模型,得到工业电气设备大数据信息的个体差异度函数为:

G(x)=ax-bx2+P(ω)

(7)

其中,a、b为常数,s为变量。使用有限的频谱资源融合聚类分析的方法进行工业电气设备大数据离散化调度,得到工业电气设备大数据的统计特征检测模型为:

(8)

其中,αi、yi分别表示工业电气设备大数据信息流融合的高频向量和低频向量,K(xi,x)表示相关资源的预测偏好值。结合标量序列分析方法得到工业电气设备大数据信息流的梯度向量分布模型为:

(9)

其中,m,n分别是工业电气设备大数据的嵌入式维数。建立工业电气设备大数据的负荷波动模型,得到工业电气设备大数据信息流非线性特征重组输出为:

(10)

综合上述,完成工业电气设备大数据信息流非线性特征重组。在前文的基础上,进行大数据特征识别。

2 大数据特征识别

2.1 特征识别的简化数学模型

对采集的工业电气设备大数据进行特征重组,提取元数据结构特征,通过对稳态电压平衡特征量进行统计,结合统计信息分析方法,得到模糊迭代状态方程为:

A(x)=AJ(x)a(x)+B(1-b(x))

(11)

令A={a1,a2,…,an}为终端用户分配的负载特征集,B={b1,b2,…,bm}为分布属性类别集,a(x)为负载特征集修正系数,b(x)为分布属性类别集修正系数,J(x)为检测幅值。

根据上述分析,结合傅里叶变换分解结果,计算工业电气设备大数据特征识别的简化数学模型,其可以用下述公式进行描述:

Gn=b1a1+b2a2+…+bnan

(12)

其中,an和bn都具有较强的关联性,分别表示工业电气设备大数据的偏差限制和谐波振荡值。根据上述分析,构建了工业电气设备大数据的分布式特征提取模型。

2.2 多特征识别

对采集的工业电气设备参数大数据进行特征重组,提取其元数据结构特征,采用多模状态重组的方法进行特征匹配,得到特征识别的关联规则量。其中特征识别的统计分析模型为:

(13)

其中,G表示工业电气设备大数据中的主成分,hi表示信息流属性值,βc表示原始训练集中的信噪比。

结合元数据分析的方法,进行工业电气设备大数据的信息熵检测[11],得到结构重组信息分量为:

(14)

其中,ki为负荷容量,Ecomm为重组频率,pdrop为能耗分布。任意选取一采样周期进行大数据负荷调度,提取元数据结构特征,根据元数据的结构分布进行模糊信息聚类处理,实现工业电气设备大数据的优化特征识别,输出为:

(15)

其中,a*、b*分别表示不同负荷下的大数据传输功耗。根据以上方法,提取大数据特征,结合特征分类技术,实现工业电气设备大数据特征识别。根据特征融合结果实现大数据的优化特征识别[12-14],构建工业电气设备大数据特征识别的模糊聚类分布模型,其表达式为:

(16)

其中,w表示多维大数据流的采样时间延迟;u(xj)表示大数据分布范围;ξj表示聚类系数。模糊聚类分布模型的约束条件为:

(17)

根据工业电气设备大数据的相互耦合关系,引入高维相空间重构,得到其核函数H(x),则工业电气设备大数据监测的分辨函数为:

(18)

其约束条件为:

(19)

Φ:Dfb→MR2d+1

(20)

通过映射可获取工业电气设备大数据运行过程中的有效信息,利用信息。将获取信息作为输入值,进行工业电气设备大数据的多特征识别输出,得到最终识别结果为:

(21)

其中,ck表示工业电气设备大数据的多元信息特征分布集,e表示特征识别强度。为检验该方法的有效性及可行性,需进行仿真实验。

3 仿真测试分析

通过Matlab 7测试该方法在实现工业电气设备大数据特征识别中的应用性能,给出工业电气设备的大数据分布式采样的电压参数为100 kV,对工业电气设备大数据搜索的维数为8,关联信息熵为0.35,其他仿真参数设定见表1。

表1 参数设定

根据上述参数设定,进行工业电气设备大数据特征识别,得到采集的工业电气设备大数据时域分布如图3所示。

图3 工业电气设备大数据采集时域分布

分析图3可知,工业电气设备大数据在单位时间内分布幅值大小较为稳定。利用上述过程获取的数据,建立工业电气设备大数据的多分布特征检测和属性聚类模型,采用模糊融合方法进行工业电气设备大数据的多元信息重构,根据信息熵特分布进行大数据特征识别[15-17],得到的特征识别结果如图4所示。

图4 工业电气设备大数据特征识别结果

分析图4可知,采用文中方法能有效实现工业电气设备大数据特征识别,工业电气设备大数据的特征识别准确性较高[18-20]。测试工业电气设备大数据特征识别的精度,得到的对比结果见表2。

表2 工业电气设备大数据特征识别的精度对比

分析可知,文中方法进行工业电气设备大数据采集的精度较高。这是由于文中方法在采集数据的过程中进行了数据预处理,排除了冗余数据的干扰,故而提高了特征识别的精准度[21-24]。

4 结束语

工业电气设备大数据特征识别是实现工业设备的运行工况监测的关键技术。提出了一种基于模糊信息熵特征提取的工业电气设备大数据特征识别方法。采用模糊C均值聚类方法,进行工业电气设备大数据的融合处理,建立工业电气设备大数据的负荷波动模型,采用多模状态重组的方法,进行工业电气设备大数据特征匹配,结合信息熵特分布进行大数据特征识别。分析可知,利用该方法进行工业电气设备大数据特征识别的精度较高,在工业电气设备的信息化管理和监测中具有很好的应用价值。

猜你喜欢
信息熵电气设备聚类
基于信息熵可信度的测试点选择方法研究
基于DBSACN聚类算法的XML文档聚类
电子测试(2017年15期)2017-12-18 07:19:27
基于信息熵的实验教学量化研究
电子测试(2017年12期)2017-12-18 06:35:48
一种基于信息熵的雷达动态自适应选择跟踪方法
雷达学报(2017年6期)2017-03-26 07:52:58
PLC技术在电气设备自动化控制中的应用
基于信息熵的IITFN多属性决策方法
基于改进的遗传算法的模糊聚类算法
10kV变配电站一、二次电气设备的选择
机电信息(2015年6期)2015-02-27 15:55:00
一种层次初始的聚类个数自适应的聚类方法研究
电气设备的防雷接地与保护
河南科技(2014年15期)2014-02-27 14:12:33