摘要:常规的电力营销数据集群融合方法以数据分类为主,存在忽视数据一致性的问题,融合后的数据出现数据冗余现象。因此,文章设计了基于大数据分析的电力营销数据集群融合方法,基于大数据分析构建营销数据集群融合模型,将电力营销数据进行归一化处理,缩小数据区间分布范围,使数据集群融合更加高效。计算电力营销数据集群并行融合粒度,将集群融合营销数据重叠的问题考虑在内,实现更加理想的融合模式。对比实验证明该方法的集群融合效果更佳。
关键词:大数据分析;电力营销;营销数据;数据集群;数据融合
中图分类号:TP391" 文献标志码:A
0 引言
电力营销数据较为复杂且数据量较大,数据集群融合,能够提高数据处理效率,增强电力营销数据的可用性。针对电力营销数据集群问题,研究人员设计了多种融合方法。其中,陶迎松[1]提出了基于X-means优化聚类的电力营销数据集群融合方法,主要是利用X-means确定最佳的聚类数量,有效地处理大规模电力营销数据,从而提高融合效果。然而,该方法在复杂数据处理方面能力有限,X-means算法无法捕捉数据内在特征,影响集群融合效果。王志成等[2]提出了基于CIM和动态交通分析的电力营销数据集群融合方法,主要是利用共同信息模型整合电力营销数据结构,再通过动态交通分析技术分析电力需求,确定电力营销数据的动态变化规律,从而实现数据集群高效融合。但是,该方法对数据质量要求较高,一旦出现数据冗余问题,将会影响最终的融合效果。因此,本文结合大数据分析的优势,设计了电力营销数据集群融合方法。
1 电力营销大数据集群融合方法设计
1.1 基于大数据分析构建营销数据集群融合模型
大数据分析是针对大规模数据进行分析的过程。通过分析数据量、速度、类型、价值、真实性,能够提取出电力营销有效数据,从而提高集群融合的准确性[3]。将电力营销数据进行归一化处理,缩小数据区间分布范围,使数据集群融合更加高效。在电力营销数据集群融合过程中,数据以非线性特征为主,输入输出值对集群融合结果存在一定影响。将电力营销数据的各属性值归一化处理,转换为标准输入与输出,从而确保最终融合的准确性[4]。在数据处理过程中引入激励函数,调节数据集群的权值,公式如下:
Pi=x+y(pi-minpi)/(maxpi-minpi)(1)
其中,Pi为第i类电力营销数据集群的归一化处理结果;x为数据层输出数据;y为激励函数;pi为待输入数据;minpi、maxpi分别为融合模型中待输入数据的最小、最大值。将电力营销数据按照融合层次分类,每个层次存在多个融合节点。一个集群存在的融合节点数量表示为:
n′=n+m+aPi(2)
其中,n′为一个集群存在的融合节点数量;n为集群融合层次;m为决策层输出的融合节点数量。在数据层、特征层、决策层中的数据融合过程中,通过y能够决定集群融合效果。y连续可靠,反映输入数据与输出数据的映射关系。当n′较多时,电力营销数据类别较多,通过传递函数深入分析集群内的营销数据,避免出现数据冗余问题[5]。激励函数表示为:
y=11+e-x(3)
其中,e为底数。在(x,y)区间内,电力营销数据集群的输入、输出满足线性关系,能够达到数据准确融合的目的。大数据分析能够根据激励函数的激励,获取电力营销数据集群融合的最优权值,在非线性逼近、学习精度、计算速度等方面,均能够符合电力营销数据集群融合对大数据分析的实时性要求。在(x,y)区间内,y=1,阈值为0,构建电力营销数据集群融合模型,公式如下:
E=12∑mi=1y-∑n-1x=0wpψp(Pi)(4)
其中,E为电力营销数据集群融合模型表达式;wp为电力营销数据集群融合的最优权值;ψp为激励矩阵。在集群融合过程中,大数据分析包括5个V,分别为Volume、Velocity、Variety、Value、Veracity。根据5V特征,形成一个完整的E结构。将输入pi设定为多维数组,对应营销数据的各个属性参数。当x=1时,n′=1,此时集群融合完成,能够根据集群情况规划后续决策。当x>1时,n′>1,此时集群融合节点相对较多,融合效果不佳,重复上述步骤,直至n′=1,满足集群融合需求。
1.2 计算电力营销数据集群并行融合粒度
电力营销数据集群融合就是在一个集群内,并行融合、处理数据的过程,能够将各类数据通过合理划分、分配,形成有效的数据集,为后续决策提供保障[5-6]。本文将集群融合营销数据重叠的问题考虑在内,在n′=1条件下,对E融合粒度进行计算,实现更加理想的融合模式。融合冗余分析模式如图1所示。
一次融合的开销远远大于一次并行计算的开销。通过并行融合的方式,降低融合开销,找出融合重叠区域,从而提高集群融合效率。在集群融合时,并行融合粒度表示为:
Sij=1r∑rn=1δ(ψp(E))(5)
其中,Sij为电力营销i、j类数据并行融合粒度;r为同一类营销数据的融合次数;δ为共识函数。各个并行部分为异步执行的状态,只要降低融合次数,调整δ,就能够提高并行融合粒度,从而实现高效率的集群融合。并行融合的电力营销数据,具有远距离、低功耗、少节点、低成本的特性,通过并行融合粒度的调整,可以增强数据集群融合的高效性,真正意义上实现电力营销数据的准确融合。
2 实验
2.1 实验过程
本次实验在实验室内进行,数据集群融合环境由8个普通电脑设备连接内部交换机,搭建成电力营销数据局域网。8台设备作为8个节点,8个节点共同形成一个集群,能够满足本次实验需求。采用Linux操作系统,通过MPI实现MPICH2-1.0.4,以并行融合的方式,提高集群融合效率。通过大数据分析技术,将集群1—8的数据进行归一化处理,提高集群融合效率。本次实验数据采用UCI提供的经典电力营销数据集,分为setosa、versicolor和virginica 3个类别。在营销数据集群融合过程中,通过AUC-ROC的值判断集群融合模型的泛化能力。在上述实验条件下,本文随机选取12组电力营销数据类别,分别分析了集群融合的泛化能力、数据处理能力。
2.2 实验结果
对比方法为基于X-means的优化聚类融合方法(方法1)、基于CIM和动态交通分析的融合方法(方法2),结果如表1所示。
如表1所示,使用本文方法后,AUC-ROC值在0.95以上,并行融合粒度在240条/s以上,集群融合时间在20 s以内,融合后资源利用率在95%以上,均优于其他方法。
3 结语
本文利用大数据分析,设计了电力营销数据集群融合方法,从融合层次、融合模型、并行融合等方面,分析客户行为,为客户提供更具个性化的电力服务。通过建立大数据多维度融合模型,能够统一各个集群的电力营销数据格式,提高数据分析的准确性。利用数据可视化技术,将融合后的电力营销数据呈现出来,帮助电力企业做出更正确的决策。
参考文献
[1]陶迎松.云计算环境下基于X-means优化聚类的海量多源异构数据分类[J].北部湾大学学报,2024(2):40-46.
[2]王志成,张玉一,巴天星,等.面向CIM和动态交通分析的多源异构数据融合技术研究[J].电子设计工程,2024(8):68-72.
[3]郭丽,孙华.基于K-means和支持向量机SVM的电力数据通信网络流量分类方法[J].网络安全技术与应用,2024(4):64-66.
[4]叶旺,梁健钊,吴天磊.基于朴素贝叶斯算法的电力数据合规风险智能监督方法[J].电脑编程技巧与维护,2024(2):113-116.
[5]奚增辉,王卫斌,屈志坚,等.基于电力大数据的行业发展监测方法研究[J].自动化技术与应用,2024(1):170-173.
[6]陈艳霞,李鑫明,王志勇,等.基于LSTM-CNN-Attention模型的电力设施非周期巡视决策方法[J].计算机应用,2023(增刊2):291-297.
(编辑 沈 强编辑)
Power marketing data cluster fusion method based on big data analysis
JIANG" Tianming
(Sichuan Kelide Power Communication Technology Co., Ltd., Chengdu 610000, China)
Abstract:" The conventional method of integrating power marketing data clusters mainly focuses on data classification, neglecting the issue of data consistency, resulting in data redundancy in the fused data. Therefore, a data cluster fusion method for power marketing based on big data analysis is designed. The article builds a marketing data cluster fusion model based on big data analysis, normalizing power marketing data, narrowing the distribution range of data intervals, and making data cluster fusion more efficient. It calculates the parallel fusion granularity of power marketing data clusters, taking into account the issue of overlapping marketing data in cluster fusion, to achieve a more ideal fusion mode. Through comparative experiments, it is verified that the cluster fusion effect of this method is better.
Key words: big data analysis; power marketing; marketing data; data cluster; data fusion