聚类分析在超短期电力负荷中的应用

2013-08-05 09:39刘晓悦姚乐乐
关键词:均值蚂蚁聚类

刘晓悦,姚乐乐

(河北联合大学电气工程学院,河北唐山063009)

0 引言

目前的电力系统负荷按照监测周期的长度,大体上可以分为超短期、短期、中期和长期四种[1]。在一天中各个时间段特定时刻监测到的负荷值称为超短期电力负荷,其数据间隔一般为15 min,对数据值进行分析及预测可以为电力系统的安全监视和预防性控制提供重要依据。

当前国内外学者对超短期负荷的研究主要集中在负荷值的预测上,提出了传统预测方法和现代预测方法[2]。尽管预测方法日趋成熟,但是并没有对负荷的预测值或实际值做进一步数据处理,电力系统需要人为的观察负荷值或负荷曲线(预测或实际),然后做出调度决策,容易造成一定的误差,并且带来一定的不便。

本文将超短期电力负荷值进行归类,并对归类结果预测。由于传统的模糊C均值(FCM)聚类具有对初始条件敏感、容易陷入局部最优解等缺点,采用蚁群聚类得到最优的类别数,作为FCM聚类的初始条件。通过聚类将负荷数据软性划分归类,可以减少人为失误。然后对聚类结果用LM神经网络进行预测。最后通过仿真实验验证该方法的合理性、有效性。

1 聚类分析

聚类分析是一种常用的多元统计分析方法,也是非监督模式识别的一个重要分支。在聚类过程中没有任何关于分类的先验知识,仅靠事物间的相似性作为类属划分的准则,因此属于无监督分类的范畴。聚类分析把一个没有标记的样本集按某种准则划分成若干类,根据相似程度将相似的样本尽可能归为一类,而不相似的样本尽量划分到不同的类中[3-4]。

1.1 蚁群聚类

蚁群算法是一种最新发展的模拟昆虫王国中蚂蚁群体觅食行为的仿生优化算法。该算法采用了正反馈机制,具有较强的鲁棒性、优良的分布式计算机制、易于与其他方法结合等优点,在解决许多复杂优化问题方面已经展现出其优异的性能和巨大的发展潜力,蚁群聚类就是在蚁群算法的基础上对样本数据进行分类[5-6]。蚁群聚类算法的具体步骤如下:

第一步,初始化数据,设n是样本数据的个数,m是数据属性的个数,蚂蚁数量与样本数据个数相同,ceil(sqrt(n))是网格的大小。

第二步,随机分配所有蚂蚁的位置(x,y),随机分配蚂蚁的类别ant_kind,并计算所有蚂蚁之间的相似

度:

第三步,进入循环,蚂蚁的状态分为两种:激活和睡眠。计算每次蚂蚁的激活概率p。

f(i)是第i蚂蚁的适应度函数,

其中

β∈R+,称为激活阈值,并作自适应调整,其增量依据下面公式调整:

k为常数,favg(t)表示第t代蚂蚁的平均适应度。

设rand是[0,1]间的随机数,当p>rand时,蚂蚁激活,随机移动到其他位置;当p<rand时,蚂蚁为睡眠状态,它的类别更改为它的邻域蚂蚁中与它的相似度最高的蚂蚁的类别。

第四步,当循环结束后,可以得到蚂蚁的分类数c。

通过蚁群聚类之后,将其得到的类别数作为已经成熟了的模糊C均值聚类的初始化条件,克服模糊C均值聚类初始化时人为确定类别数而引起的误差,使其结果更加精确,有效的弥补了模糊C均值聚类对初始条件敏感、易陷入局部最优点等缺点。

1.2 模糊C均值(FCM)聚类

模糊C均值(FCM)聚类是用隶属度确定每个数据点属于某个聚类的程度的一种聚类算法。1973年,Bezdek提出了该算法,作为早期硬C均值聚类(HCM)方法的一种改进。FCM算法是一种基于划分的聚类算法,它的思想就是使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小。模糊C均值算法是普通C均值算法(HCM)的改进,普通C均值算法对于数据的划分是硬性的,而FCM则是一种柔性的模糊划分。

模糊C均值聚类算法把n个样本向量xi(i=1,2,…,n)分为C个模糊组,并求出每组的聚类中心,使得非相似性指标的价值函数达到最小。FCM与HCM的主要区别在于FCM用模糊划分,运用每个给定数据点在[0,1]间的值代表隶属度,来确定其属于各个组的程度。与模糊划分相对应,隶属矩阵U中每个元素的取值均在[0,1]间。此外,加上归一化的规定,一个数据集的隶属度的和总等于1,即:…,n

那么,模糊C均值聚类算法的价值函数(或目标函数)的一般化形式为:

uij∈[0,1];ci为聚类中心。

也可以构造如下新的目标函数:

其中λj(j=1,2,…,n)是n个约束式的拉格朗日乘子;dij=‖ci-xj‖为第i个聚类中心与第j个数据点间的欧几里德距离;m∈[1,∞)为加权指数,加权指数m的选择对聚类的模糊程度有着重要的调节作用。

FCM算法的具体步骤如下:

第一步,初始化聚类中心ci。定义一个c×n的二维隶属矩阵U。如果第j个数据点xj属于组i,则U中的元素uij=1;否则,该元素取0。

第二步,计算uij及价值函数,构造如下的目标函数:

λj(j=1,2,…,n)是约束等式的拉格朗日乘子。对所有输入参量求导,得:

进而得出uij,计算目标函数,若计算结果小于某个确定的值,或它相对上次价值函数值的改变量小于某个阈值时,算法停止。并由9式计算U矩阵。

第三步,用计算出的新的U矩阵,返回求价值函数,直至满足阈值要求。

FCM算法需要两个参数:一个是聚类数目C,另一个是参数m。一般来讲C要远远小于聚类样本的总个数,同时要保证C>1。对于m,它是一个控制算法的柔性的参数,如果m过大,则聚类效果会很差,而如果m过小则算法会接近HCM聚类算法。

算法的输出是C个聚类中心点向量和一个C×N的模糊划分矩阵,聚类中心表示的是每个类的平均特征,可以认为是这个类的代表点。模糊划分矩阵表示的是每个样本点属于每个类的隶属度。根据这个划分矩阵按照模糊集合中的最大隶属原则就能够为每个样本归类。

2 LM神经网络

神经网络具有高度的自学习、自组织和自适应能力,能通过学习和训练获取网络的权值和结构。多层前向神经网络具有理论上可逼近任意非线性连续映射的能力,因而非常适合于非线性系统的建模及控制,是目前使用较多的一种神经网络模型。

BP神经网络采用误差反向传播算法,主要应用到梯度下降法,使误差函数减小,直到取得极小值。但是梯度下降法线性收敛,速度很慢,所以在BP神经网络的基础上采用LM算法。LM全称是levenberg-marquardt,其将梯度下降法与高斯—牛顿法相结合。由于LM算法采用近似二阶导数,所以LM算法比梯度下降法具有较快的收敛速度[7]。下面对LM算法作简要阐述。

设误差指标函数为:

其中Yi为期望的网络输出向量为实际的网络输出向量;P为样本数目;w为网络权值和阈值所组成的向量;ei(w)为误差。

设wk表示第k次迭代的权值和阈值所组成的向量,新的权值和阈值所组成的向量wk+1为wk+1=wk+Δw。权值增量Δw计算公式如下:

其中I为单位矩阵;μ为用户定义的学习率;J(w)为Jacobian矩阵,即:

LM算法的计算步骤描述如下[8]:

(1)给出训练误差允许值ε,常数μ0和β(0<β<1),并且初始化权值和阈值向量,令k=0,μ=μ0;

(2)计算网络输出及误差指标函数E(wk);

(3)计算Jacobian矩阵J(wk);

(4)计算Δw;

(5)若E(wk)<ε,转到(7);

(6)以wk+1=wk+Δw为权值和阈值向量,计算误差指标函数E(wk+1),若E(wk+1)<E(wk),则令k=k+1 ,μ=μβ ,转到(2),否则 μ=μ/β ,转到(4);

(7)算法结束。

3 实例仿真

本文以唐山地区的一个局部电力系统为例,通过对一段时期内相似日(非负荷因素如经济、气象等相似)的历史负荷数据训练,对某一日的负荷数据值进行聚类分析,并对聚类结果预测仿真。其实际数据如表1所示。

表1 某日实际负荷数据(单位:kW)

将上述聚类分析算法应用到表1所示的实际负荷数据,仿真结果如图2、图3、表2和表3所示。其中图

2是蚁群聚类的初始分布图,图3是蚁群聚类的最终分布。

从图3可以看出,表1的实际负荷数据分为3类,对其应用FCM算法,可以得到具体的聚类结果。表2是聚类中心,表3是聚类隶属度。

表2 聚类中心

表3 聚类隶属度

本文采用三层神经网络,具体结构如下:

第一层:输入层的结点个数为4,每个结点分别对应表1不同时间段中的0 min、15 min、30 min和45 min的数值。

第二层:隐含层的结点个数为12,通过聚类处理后,得出样本数据有3个类别,所以每个输入变量都有3个子集。

第三层:输出层的结点个数为3,即表3各时间段聚类隶属度的预测值。

对该神经网络采用LM算法进行训练学习,误差曲线图如图4所示,聚类隶属度预测值如表4所示。

图4 误差曲线图

表4 聚类隶属度预测值

通过图4与表4可以验证:本文所采用的三层神经网络通过LM算法训练学习,收敛速度较快,对表3

聚类隶属度的预测精度较高,具有一定的合理性、有效性。

4 结论

本文主要针对超短期电力负荷进行归类,并对归类结果预测。应用本文提出的算法,对一段时期内的相似日训练、学习,可以有效地分析将来某一相似日内的超短期负荷变化情况。虽然该算法较为复杂,但是通过对历史数据做聚类分析及预测,可以为未来相似日内电力系统负荷调度提供决策依据,具有一定的实用性。

[1] 朱向阳.电力系统短期负荷预测及其应用系统[D].南京:东南大学,2004.

[2] 崔和瑞,宋秀莉,葛曼倩.基于数据挖掘的FNN短期电力负荷预测方法研究[J].电力系统保护与控制,2009,37(22):54-57.

[3] 刘增良.模糊技术与神经网络技术选编[M].北京:北京航空航天大学出版社,1999.

[4] 李柏年.加权模糊C-均值聚类[J].模糊系统与数学,2007,(01):23-26.

[5] Gupta M M.On the principles of Fuzzy Neural Networks.Fuzzy Sets and Systems,2001.61:1-18.

[6] V.Ramos,F.Muge,P.Pina.Self-Organized Data and Image Retrieval asa Consequence of Inter-Dynamic Synergistic Relationships in Artificial Ant Colonies.In J.Ruiz-del-Solar,A.Abraham,M.koppen,(Eds)Hybrid Intelligent Systems,Frontiers of Artificial Intelligence and Applications,Santiago,Chile,Dec.2002(87)1-4.

[7] 杨益君,古春生,朱广萍,蒋红芬,陈丹.LM神经网络在环境质量评估中的应用[J].江南大学学报,2010,9(2):213-216.

[8] 赵弘,周瑞祥,林廷圻.基于Levenberg-Marquardt算法的神经网络监督控制[J].西安交通大学学报,2002,36(5):523-527.

猜你喜欢
均值蚂蚁聚类
基于K-means聚类的车-地无线通信场强研究
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
我们会“隐身”让蚂蚁来保护自己
蚂蚁
基于高斯混合聚类的阵列干涉SAR三维成像
关于均值有界变差函数的重要不等式
一种层次初始的聚类个数自适应的聚类方法研究
蚂蚁找吃的等
关于广义Dedekind和与Kloosterman和的混合均值