电价分类数据挖掘及其在需求侧管理中的应用

2024-05-30 09:28
无线互联科技 2024年7期
关键词:电价分类器数据挖掘

戴 蕊

(国网江苏省电力有限公司扬州供电分公司,江苏 扬州 225009)

0 引言

在电力行业中,电价分类数据挖掘是一个重要的研究方向。电价分类是指将电力市场中的电价按照一定的规则划分为不同的类别或阶段,以便对不同的电价行为进行分析和管理[1-3]。本文研究了数据挖掘方法在电价分类和阈值处理中的应用和有效性,并设计价格分类流程。本文提前24 h对未来电价进行分类,提出了一种新的数据模型来形成初始特征集,提出的模型允许递归分类实现,包含最新的价格信息,反过来又提高了分类性能,实现价格分类在需求侧管理中的应用。

1 系统模型及计算

1.1 电价分类模型

本文中的电价分类流程如图1所示。该过程在输入块中选择一组价格变化的潜在特征。本文的重点是提前24 h对未来电价进行分类,提出了一个输入数据模型。该模型允许递归多步前分类,并考虑到最新的价格信息。虽然从大量数据初始集开始可以在理论上提高模型捕捉隐藏模式的能力,但在实践中,计算负担和潜在特征之间的冗余会降低模型的准确性。因此,本流程采用了特征选择器模块,通过该模块,从初始特征中选择一组精简的特征值。

图1 采用的电价分类流程

所选择的特征值以合理的计算次数、最小的冗余合理地捕捉数据中的隐藏模式。选择的特征值,即特征选择器模块的输出被馈送到分类器模块,在分类器模块中训练分类,以确定未来电力价格的“类别”。分类器在无估计确切电力价格的情况下确定未来值将在多大范围内下跌。在实践中,价格范围由用户根据其操作需求指定。

1.2 输入数据模型

考虑到电力市场价格的高度自相关性,电力系统的各个变量,如负荷、备用裕度、网络约束和发电机可用性,均可以提供有关电价的信息。然而,除了系统负载之外,其他变量的准确预测通常在实时价格之前不可用。因此,在大多数点预测文献中,系统负荷是价格预测模型的唯一外生变量。然而,支持向量机(Support Vector Machine,SVM)模型中表明,在价格分类的情况下,需求不如在点价格预测中有用[4-5]。本文将初始特征(输入)集限制为滞后价格。

(1)

(2)

因此,在K天的m小时之前的一整套历史小时价格是:

P=PK,m∪PN

(3)

对于提前1 h的预测,所有元素在预测起点都可用。

因此,P包括用于预测未来价格的所有有用的价格信息,并且直接适用于提前1 h的分类问题。然而,在多步预测中,如日前预测,PK,m包括目标日内选定小时的价格,这些价格在预测起点是未知的,因此它无法适用于24 h前的价格分类。为了进一步解释此点,假设m小时的价格取决于m-3小时的价格,此外,假设目标是预测明天所有小时的价格等级。因此,对于明天给定的一个小时,比如10:00,需要7:00的价格。在数值预测中,模型中使用7:00时的价格预测,并确定10:00时的价格预报。然而,在本申请中,关于7:00时价格的唯一可用信息是类别预测,而不是数值。

(4)

考虑3个价格类别,即低于500元/MW·h的价格,将被标记为e1,价格在500元/MW·h到700元/MW·h之间,标记为e2,价格在700元/MW·h以上的标记为e3。

2 研究分析

2.1 与一种点价格预测方法的比较

将本文模型获得的结果与基于神经网络的点位价格预测模型获得的效果进行了比较。本节的神经网络模型是一个回归模型,并生成数值价格预测。然而,目前较多使用的多层感知器(Multi-Layer Perceptron,MLP)模型是一个只生成价格类的分类器。为了进行精确的比较,在点预测方法中采用了与本文方法相同的特征选择程序,采用前馈神经网络(Feedforward Neural Network,FFNN)来获得相同测试周期的积分价格预测。完全公平调度(Completely Fair Schedule,CFS)算法最初设计用于查找一组输入特征和离散输出(即类)之间的相关性。在本节中,为了精确地进行比较,本节向FFNN提供了每个特征选择方法寻找对预测未来价格类别有用的特征。本节使用选定特征的数值,而非离散值,然后通过对预测数据取阈值来获得相应的分类精度。神经网络有包含10个神经元的隐藏层,其传递函数被选为双曲正切S形传递函数,此外,应用莱文伯格反向传播训练方法来迅速地找到解。

表1显示了基于神经网络的点预测模型的混淆矩阵,将这些结果与传统模型算法结果比较,可得本文所提模型比其单一点预测模型要准确得多。本文所提出的方法显著地降低了预测的类的误差,尤其对于较高的价格和较高经济影响的价格飙升现象,作用明显。

表1 基于神经网络的点预测方法的混淆矩阵

2.2 精度比较

将本文模型的精度与前人研究中提出的基于SVM的模型准确性进行了比较。SVM中的数值结果是2个区域市场的价格得出的,为了进行准确的比较,生成了与SVM中相同时间段的结果。对于这组模拟,在形成输入数据集时使用了20个历史日。表2给出了基于本文算法的2个市场的最佳结果。SVM的最准确结果也报告在表2中,以供参考。从该表中可以看出,对于2个地区市场,本文所提出的模型平均分别优于SVM的模型3.02个和2.73个百分点。按月计算,在12个月中的10~11个月内,本文所提出的模型在2个区域的价格方面优于SVM中的模型。本文还使用标准方差分析对表2的结果进行了假设检验,测试结果证实,使用本文所提方法获得的月平均精度明显高于SVM获得的精度。

表2 2个测试区MPCE(%)比较

与SVM法相比,本文模型实现的精度提高可归因于所提出的数据模型。SVM的模型利用了前几天的可用信息,即它只考虑将PN作为输入数据,然而,在本工作中,当天信息,即PK,m,也被添加到数据中。

当在(4)中对数据进行离散化以适应价格分类离散性质时,价格输入已被证明在提高分类准确性方面有益。与SVM的模型相比,本文研究了所提模型执行不足的月份,在这几个月里,都有几天的每日价格极不稳定,高波动性使当前信息对所提模型的价值降低,从而导致更高的误差。对于这2个市场,CFS特征选择方法与贝叶斯(By)分类器相结合产生了最准确的结果,这与表2中报告的结果一致。

3 结语

不同的电力市场价格的每日、每周和季节性波动会有所不同。然而,隐藏在不同价格时间序列中的内在一般模式被认为是相似的,主要是因为价格是由类似的电力需求模式驱动的。实验数值结果表明,本文提出的算法提高了分类准确性。基于模式识别的分类流程的性能明显优于基于函数逼近的方法,研究结果亦适用于需求管理的个案研究。电价分类数据挖掘在需求侧管理中具有重要的应用价值。通过对电价行为进行分类、预测和关联分析,人们可以更好地管理电力市场。

猜你喜欢
电价分类器数据挖掘
探讨人工智能与数据挖掘发展趋势
德国:电价上涨的背后逻辑
探索电价改革
BP-GA光照分类器在车道线识别中的应用
基于并行计算的大数据挖掘在电网中的应用
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
可再生能源电价附加的收支平衡分析
争议光伏标杆上网电价
一种基于Hadoop的大数据挖掘云服务及应用