摘要:基于特征标签的电力计量大数据深度挖掘技术是一种先进的数据分析方法,旨在从海量电力计量数据中提取有价值的信息。这种技术结合了特征标签、大数据分析和深度挖掘等多种方法,以实现对电力计量数据的全面理解和有效利用。采用模糊C-均值聚类算法实现特征标签的生成,借助特征标签改善电力计量大数据,通过云计算平台建设特征标签下的电力计量大数据挖掘架构。研究结果表明,特征标签下的电力计量大数据深挖技术具有良好稳定性、较高的挖掘准确率,可在电网运行中广泛应用。
关键词:电力计量大数据深度挖掘特征标签
ResearchonDeepMiningTechnologyofPowerMeteringBigDataBasedonFeatureTags
WANGXinYINZhenlong*
QingdaoTopscommCommunicationCo.,Ltd.,Qingdao,ShandongProvince,266000China
Abstract:DeepMiningtechnologyofpowermeteringbigdatabasedonfeaturetagsisanadvanceddataanalysismethodaimedatextractingvaluableinformationfrommassivepowermeteringdata.Thistechnologycombinesmultiplemethodssuchasfeaturetags,bigdataanalysis,anddeepmining toachieveacomprehensiveunderstandingandeffectiveutilizationofpowermeteringdata.ItusestheFuzzyC-MeansClusteringalgorithmtogeneratefeaturetags,improvespowermeteringbigdatawithfeaturetags,andconstructsapowermeteringbigdataminingarchitectureunderfeaturetagsthroughcloudcomputingplatforms.TheresearchresultsindicatethatDeepMiningtechnologyofpowermeteringbigdataunderfeaturetagshasgoodstability,highminingaccuracy,andcanbewidelyappliedinpowergridoperation.
KeyWords:Powermetering;Bigdata;Deepmining;Featuretags
在电网运行期间,电力系统中储存了海量的数据,而数据挖掘作为一种较为普遍的数据分析和处理方式,在配电网故障辨识、火电厂运行优化等方面得到了越来越多的运用。随着电网数据的不断增长,对数据挖掘的需求也越来越高,因此,电网企业逐步将注意力集中到数据挖掘层面。本文采用模糊C-均值聚类算法生成特征标签,借助特征标签改善电力计量大数据,通过云计算平台建设特征标签下的电力计量大数据挖掘架构。
1电力计量大数据的特征标签
为深层分析电能测量大数据,必须对其进行处理,并将其置于高层服务应用和大数据平台之间,作为中间层的核心部件。采用模糊C-均值聚类算法生成一个类别的特征标记,若簇内有K个类别,则以m表达其隶属系数,其中,U为初始化的矩阵,继而得到公式:
在这个方程中,通过求解一个模糊C的平均值,得出C的迭代函数,即:
根据该算法,得到各属性的隶属系数和簇的中心,并展开收敛性判定。当目标函数的值小于预定门限时,则对簇的结果进行输出,公式为
(3)
用该方法来计算簇的迭代值,进而选取电能测量数据的运算平台,构成一个专用标记。这个运算平台可以分布运算海量数据,并进行数据库检索。构建具有3层(标记层、分析层和数据层)的大数据管理构件[1]。在此基础上,利用大数据管理构件对其进行初步的特性标记。图1为电力计量大数据的特征标签产生流程。
根据图1显示,在对电能计算进行深度挖掘过程中,需要建立多个特征标签,所以把规则引擎当作特征标签的生产机器,继而生成大量特征标签,借助标签识别中心管理和规划特征标签[2]。
所谓特征标签业务化,其实就是由使用者设定一个特定的属性标记,并给予该属性标记检视、修正等作用,并对该属性标记进行检验,其生成条件主要依照电力计量大数据内部所挖掘的数据制订,每天只需要对这些特性标记进行管理和维护就可以了。规则引擎是一种特性标记制造机,它在特性标记的设计过程中实现了图形的控制和规则的制订,并可以设置特性标记的规则,根据生成规则触发生成条件,从而制作多种特征标签。
标记辨识中心可以对特性标记的派生组合进行逻辑计算,在完成设定操作后,工作人员可以更新原始的特性标记,使之成为更有价值和更高级的特性标记。在此基础上,利用智能算法对海量数据进行属性标注,实现对海量数据的分类。在做完特性标记之后,还要判断标签价值。如果特征标签价值过低,无法挖掘电力计量数据,则必须创建价值函数,以此对特征标签价值进行判断。
2电力计量大数据的深度挖掘
生成特殊标签后,通过该特殊标签深度挖掘电力计量大数据。在对电能测量大数据进行深度挖掘的同时,利用云处理平台上的分布式信息超文本传输协议(HyperTextTransferProtocol,HTTP),构建了一个由数据预处理、云分类建模和云聚类编辑3个模块组成的大数据挖掘框架[3],图2为具体挖掘过程。
如图2所示,USB异步收发传输器与电平转换达到数据预处理目标,通过微控制单元进行数据分类,内容配置可编程,并按照CK算法的最优原理对电能测量的海量数据进行分类和整理,确定中心点,在该中心点之下的数据是有效的,并对失效的数据进行过滤,公式为
式中,u是判定对象的,m是中心点的值。
所谓云聚类编辑,就是将预处理后的数据实施聚类编辑,依照数据价值从高到低排列。针对电能测量大数据的深度挖掘需求,对其进行聚类分类,并将其转化为数据挖掘框架。云分类建模与预处理后数据相结合,将数据的分类结果传递到数据挖掘框架中,将聚类数据与分类模型进行数据融合,生成挖掘模型,将挖掘模型转移到一个挖掘点,然后再进行深层挖掘[4]。
本项目以电能测量大数据为研究对象,采用基于特征标注的方法进行电能测量大数据的深度分析。具体流程如下。首先,识别出深层挖掘的目标,并通过数据提取获得需要的深层信息,并决定其使用方法。然后,进行资料的前处理,对从基础的电能测量中抽取出的资料进行预处理,利用CK算法筛选出误差和无用的数据,利用特征标记的信息变换作用,生成误差标记,保证数据准确性。最后,实施云分类建模,采用最佳建模方式来调整、改善大数据模型,实现挖掘效率和精确度的提升[5]。
3实验验证
为了对特征标签下的电力计量大数据深挖应用效果进行验证,通过实验方式,比较该技术和蚁群算法下的大数据深挖方法、企业资源计划(EnterpriseResourcePlanning,ERP)下的大数据深挖方法。此次所用主机操作系统是Linux系统,有效配置信息,系统内存选择16GB,硬盘内存选择2TB,所用编程语言是C++语言,以Hadoop环境为开发环境[6]。
3种数据深度挖掘方法的实验结果为:实验10min时,蚁群算法、特征标签算法和ERP挖掘算法的挖掘数据量分别为10.26MB、20.25MB和5.87MB;实验30min时,蚁群算法、特征标签算法和ERP挖掘算法的挖掘数据量分别为21.37MB、60.95MB和15.48MB;实验40min时,蚁群算法、特征标签算法和ERP挖掘算法的挖掘数据量分别为29.34MB、104.37MB和26.97MB;实验60min时,蚁群算法、特征标签算法和ERP挖掘算法的挖掘数据量分别为35.37MB、122.45MB和30.45MB。
从以上结果可以看出,在挖掘时间持续延长的情况下,不同方法的数据挖掘量呈现持续增加状态,且特征标签下的电力计量大数据挖掘数据量明显比传统方法高。由于在利用特征标记对数据进行挖掘时,能够对其进行高效的分类,并对其进行加工,从而实现高信息量和低代价的数据挖掘目的[7]。
本项目采用的基于特征标记的数据挖掘算法具有良好稳定性,且信息处理结果也较为准确。这主要是因为基于特征标记大数据挖掘方法能够对数据进行处理,从而有效地解决了“信息孤岛”问题。通过对海量数据的实时采集和分析,实现对海量数据的准确和稳定的获取。表1是针各种方式的挖掘准确率的试验数据。
分析表1可以看出,特征标签下的电力计量大数据挖掘技术具有更高的准确率,且挖掘能力高于其他方法。
4结语
总而言之,特征标签的生成是电力计量大数据挖掘技术的关键步骤。通过利用模糊C-均值聚类算法等方法,可以生成能够反映数据特性和模式的特征标签,这些标签不仅有助于对电力计量数据进行有效地分类和表示,还能提高后续数据挖掘的准确性和效率。基于特征标签,可以对电力计量大数据进行深度挖掘,这包括利用云计算平台搭建的数据挖掘架构对预处理后的数据进行建模和分析[8]。在实际应用中,基于特征标签的电力计量大数据深度挖掘技术可以被广泛应用于电力系统的各个领域。例如:该技术能有效地实现电网的最优配置,从而改善电网的整体效益。同时,该方法还能对电网的负荷进行预报,为电网的规划与管理提供重要的支撑。
综上所述,基于特征标签的电力计量大数据深度挖掘技术是一种具有广泛应用前景和重要意义的数据分析方法,该技术将会在今后的电网建设中发挥越来越大的作用。
(4)
参考文献
[1]王奕萱,李翼铭,徐二强,等.基于特征标签的电力计量大数据深度挖掘研究[J].电子设计工程,2023,31(24):186-189,195.
[2]田萍.大数据深度挖掘技术下的数字资源推送平台设计应用[J].信息通信,2019(10):133-135.
[3]万金金,文屹,吕黔苏,等.基于大数据深度挖掘电网设备缺陷体外循环的模型研制与应用[J].电力大数据,2023,26(3):61-68.
[4]金欣.基于蚁群算法的非结构化大数据深度挖掘仿真[J].计算机仿真,2020,37(11):329-333.
[5]王倩.基于深度学习技术的教育大数据挖掘领域运用探究[J].数字通信世界,2023(11):112-114.
[6]左仁广,彭勇,李童,等.基于深度学习的地质找矿大数据挖掘与集成的挑战[J].地球科学,2021,46(1):350-358.
[7]吕田.面向大数据挖掘的自然资源云平台设计实现研究[J].科技资讯,2023,21(23):36-39.
[8]王文中,孔亚鑫.面向科技咨询的大数据服务平台基础架构设计与实现[J].科技资讯,2023,21(24):32-35.