基于模糊软聚类的配电网负荷数据动态挖掘软件设计

2021-05-26 07:25阮玉生屈慧洁

科学与信息化 2021年13期

阮玉生屈慧洁

1. 广西博联信息通信技术有限责任公司广西南宁 530023 2. 广西教育学院数学与信息科学学院广西南宁 530023

引言

基于我国当下电力产业建设工作实施的不断完善，相关配电网负荷数据动态挖掘软件的设计研究成为配电网及有关单位的焦点关注话题，并在市场的不断建设与发展中成为高价值研究问题[1]。为了实现软件更多的功能，应在实施数据挖掘行为过程中，对行为进行条件给定，并在支撑性数据较为充足的条件下，引进多种计算算法，对挖掘行为进行实现。但由于数据挖掘行为的发生通常伴随着海量数据的干扰，因此挖掘过程中所涉及的数据量相对庞大[2]。基于此，本文引入模糊软聚类方法，开展对配电网负荷数据动态挖掘软件设计研究。

1 基于模糊软聚类的配电网负荷数据动态挖掘软件设计

1.1 基于模糊软聚类的数据动态挖掘规则制定

在对配电网环境当中负荷数据进行挖掘时，首先需要完成对本文基于模糊软聚类的配电网负荷数据动态挖掘软件的挖掘规则制定，以此完成对海量负荷数据集当中所有频繁事务的寻找。由于配电网的特殊性，在进行配电网负荷数据挖掘时，需要经历多次配电网负荷数据库。初次挖掘是对候选集进行挖掘，在这一阶段当中，可将生成的单项频繁项集作为挖掘结果[3]。后续的挖掘均是对原本复杂程度较高的挖掘对象进行进一步的优化，以此缓解本文挖掘软件的运行压力。根据上述挖掘软件的挖掘需要，制定基于模糊软聚类的数据动态挖掘规则为：

规则一：将选取的待挖掘对象样本进行分块处理，并将处理后的结果引入到集群的每个节点当中。通过模糊软聚类对每个待挖掘数据节点的支持度进行计算。再完成对软件中map程序上的相关操作执行，以此获取到配电网环境当中各个需要进行挖掘的文件中所有的数据集，并在mapper程序当中输入一个已知的数据记录，并利用combiner完成对本地相关数据集记录的兼容。

规则二：在mapper程序当中输入另外一个已知的配电网负荷数据记录信息，并将其与规则一当中的符合数据进行比对，将其中存在的相同数据统一发送到一个节点当中，开始频繁挖掘。

规则三：综合上述两点规则，完成对所有节点的分配，将不同配电网负荷数据值数据信息统一到不同数据节点当中。再结合模糊软聚类当中的默认对关键数值排序的功能，将挖掘价值更高的负荷数据进行汇总，得到最终的挖掘对象。

1.2 挖掘对象筛选

为保证本文基于模糊软聚类的配电网负荷数据动态挖掘软件的运行效率，针对挖掘价值较低的挖掘对象进行筛选，以此提高软件的应用效果。根据上述制定的挖掘规则，在配电网环境当中对负荷数据进行挖掘，根据配电网负荷数据挖掘对象的基本特征[4]。假设W为配电网负荷数据集Y当中的频繁m项挖掘对象，则W的所有m-1项的子集也可以称之为使其频繁m-1的项目集。因此，进一步分析得出，Wm为数据Y当中的频繁m项候选集，则频繁m-1挖掘对象集合Lm-1中包括的m-1项目子集的个数一定为m。根据挖掘对象的性质，本文提出进一步筛选挖掘对象的个数算法为：利用Lm-1产生的Cm之前先对Lm-1进行一次裁剪，统计与之相关的项目弧线出现次数[5]。为了实现对高挖掘价值和低挖掘价值的挖掘对象区分，用 Lm-1对其中某一要素的执行连接求得挖掘对象当中潜在的频繁项目集，即挖掘价值更高的挖掘对象。

1.3 基于筛选后的挖掘对象完成动态挖掘

在筛选出需要进行挖掘的配电网负荷数据挖掘对象后，结合编程思想，对挖掘对象中的数据进行重过滤，将挖掘对象每一类别下的特征出现概率进行计算，其计算公式为：

公式（1）中，K表示为挖掘对象中每个数据类别出现的概率；iλ表示为特征数据；m表示为配电网环境中的数据；n表示为配电网中所有特征数据个数。为避免在挖掘的过程中出现挖掘数据在重要数据集百分比中占比降低，还需要对挖掘对象权重集合进行合理分配，其分配公式为：

公式（2）中，M表示为配电网环境中每个挖掘对象权重分配数值；Q表示为挖掘对象在配电网环境当中具体出现的次数；d表示为模糊软聚类算法系数。根据上述公式实现对挖掘对象权重分配，确定最终挖掘结果的准确性，以此提高本文基于模糊软聚类的配电网负荷数据动态挖掘软件的应用价值。

2 对比实验

本文通过上述论述，完成对基于模糊软聚类的配电网负荷数据动态挖掘软件设计，为进一步验证该软件在实际应用中的优势，开展下述对比实验。首先选择电力市场当中某一配电网企业作为实验背景条件，选择该企业历史配电网负荷数据共15950组，将该组数据作为两种挖掘软件的挖掘对象，设置两种挖掘软件的运行时间分别为100ms、500ms、1000ms、2000ms和3000ms，在确保两种挖掘软件均在相同的运行环境下，完成对比实验，将得出的挖掘结果进行记录，并绘制成如表1所示的实验结果对比表。

表1 两种挖掘软件实验结果对比表

由表1中的两组数据结果可以看出，本文挖掘软件数据挖掘量明显多于传统挖掘软件数据挖掘量，在相同配电网络负荷数据集当中，挖掘出的数据量越多，则说明挖掘的利用价值越高。因此，通过对比实验证明，本文提出的基于模糊软聚类的配电网负荷数据动态挖掘软件设计在实际应用中具有更高的挖掘效率，满足配电网对海量数据的挖掘需要，充分发挥配电网数据的利用价值。

3 结束语

为了满足电力市场的发展需求，本文基于模糊软聚类技术的应用，提出一种针对配电网负荷数据的动态挖掘软件设计方法，此软件主要服务于配电站，可解决配电站在市场中的稳定运行。为了确保本文设计软件投入市场后具备一定可行性，本文提出对此软件的对比实验，并通过将本文设计的软件与传统软件进行对比的方式，验证本文提出的软件设计方法在应用中的可操作性更强，具有更加实际的社会应用价值，可满足电力市场内配电网在市场的稳定运行需求。