郑建柏
(国网福建省电力公司厦门供电公司,福建 厦门 361000)
基于朴素贝叶斯和支持向量机的短期负荷预测
郑建柏
(国网福建省电力公司厦门供电公司,福建 厦门 361000)
朴素贝叶斯是一种简单而高效的分类算法,可与支持向量机结合组成一种新的组合模型,以便供电企业在电力供应不足时对重点大用户的负荷进行预测。结果表明:组合模型的有序用电短期负荷预测结果准确率较高。
朴素贝叶斯;支持向量机;有序用电;负荷预测
在迎峰度夏期间,供电企业经常面临局部地区电力供应不足,短期内用户的负荷情况是制定有序用电方案的重要依据。为了让有序用电方案科学合理,在供电紧张时尽可能减少对用户正常用电影响,需要尽可能准确地取得用户负荷预测数据。
用户负荷预测就是在充分考虑用户的生产情况、自然条件与社会条件的情况下,研究或利用一套系统的处理过去和未来负荷的数据方法,在满足一定精度的要求下,确定未来特定时刻的负荷值。负荷预测经历了从依赖调度员的经验到自动化、智能化转变的过程;近年来人工智能技术被引入负荷预测领域,与传统负荷预测方法相比,虽然提高了预测准确率,但由于负荷预测的复杂性,预测结果往往无法满足实际生产需要。
贝叶斯分类是一种基于统计方法的分类模型,对于解决复杂系统不确定因素引起的故障分类问题具有很大优势,被认为是目前不确定知识表达和推理领域最有效的理论模型之一,其中朴素贝叶斯分类器以简单的结构和良好的性能受到人们的关注。基于概率统计的贝叶斯分类方法对样本数量要求较高,而在实际应用中常常难以获得大量样本,因此会严重影响其分类性能,较难满足实际分类需要。
支持向量机(简称SVM)是一种以统计学理论为基础,针对有限样本的一种通用学习方法,能有效解决小样本、高维数、非线性等问题,并克服人工神经网络存在局部最优等缺点,大大提高了学习方法的泛函能力。鉴于SVM能在训练样本很少的情况下很好地达到分类推广的目的,国内外学者已开始在负荷预测领域进行SVM方法的应用研究。
根据有序用电工作对负荷预测的需要,提出用支持向量机来改进贝叶斯分类器的算法,建立一种基于朴素贝叶斯和支持向量机的变压器故障诊断模型,并用厦门供电公司重点用户的负荷数据进行验证分析,结果表明新模型取得了令人满意的效果。
贝叶斯分类是一种典型的基于统计方法的分类模型,它通过对训练集的学习而归纳出分类器,并以此对没有分类的数据进行分类。
朴素贝叶斯分类器是基于贝叶斯公式的分类器,当训练集D的所有实例都完整时,通过对实例出现频率的统计,求出给定类变量C条件下各个属性变量Xi的条件概率。理论上,条件变量满足条件独立下它是最优的。
由贝叶斯公式可知:
通过训练集D获得P(C),P(X1|C),…,P(Xn|C)的值,对给定的属性值X1,…,Xn,使最大)的C值便是X1,…,Xn所属的类。
类变量取第k个值Ck的先验概率为:
其中:NCk为类变量取Ck的样本数;N为样本总数。
用似然概率作为各属性节点的条件概率估计值,其计算公式为:
支持向量机是Vapnik等根据统计学习理论中的结构风险最小化原则提出的,最初是用来解决模式识别问题。支持向量机用于模式识别的基本思想是构造一个超平面作为决策平面,使2类模式之间的间距最大。对于线性可分的训练样本:(xi,yi),xi∈Rn,yi∈{+1,-1},i=1,…,n,可构造最优分类超平面使得这2类样本完全分开(见图1)。
最优分类方程为:x·w+b=0。
为此需求解下列二次规划问题:
使分类间隔最大就是对推广能力的控制,这是SVM的核心思想之一。求解最优分类面问题实际上就是利用Lagrange优化方法将其转化为对偶问题,即:
图1 SVM线最优分类面
最终得到决策函数是:
对非线性可分的情况,还可采用核函数的方法,即通过核函数映射使之转化为在高维特征空间中构造线性分类超平面的问题。输入空间的样本做非线性变换,不同的支持向量代入支持向量机的决策函数,最终支持向量机的非线性分类决策函数表示为:
朴素贝叶斯分类器结构简单,实现多分类的性能较好,在多个领域得到广泛的应用。但在有序用电的负荷预测时,难以大量获取同类样本,样本的缺乏给朴素贝叶斯分类造成了很大的影响。支持向量机已被证明在小样本情况下表现突出,并成功应用于多个分类领域。因此考虑引进支持向量机来改进朴素贝叶斯模型,解决某些类别因样本较少而误判的可能。建立一种基于朴素贝叶斯和支持向量机的组合模型,该模型可应用于有序用电时的负荷预测中。
朴素贝叶斯(NB)和支持向量机(SVM)相结合的基本原理是:若类别ci,cj的样本较少,就将这2类合并成1类cij,作为朴素贝叶斯分类器的1个输出类,这样对于小样本情况下朴素贝叶斯分类器分类效果比较差的问题能够有效解决。若某条信息通过朴素贝叶斯分类器计算的分类结果为cij,就将该信息输入支持向量机,并将类别ci,cj对应的样本作为支持向量机的训练样本,最后可以得到该信息的确切分类,实验原理如图2所示。
图2 基于朴素贝叶斯和支持向量机组合模型
在有序用电中,大用户的负荷情况对整体负荷影响最大,因此需重点关注大用户的负荷走势,尤其是每天负荷高峰期(11:00和14:00)的负荷极值是否超过允许最大负荷。
选取厦门供电公司用重点大用户电负荷最高的前50户,对其在2012—2014年3年间夏季负荷最高月每天96点负荷数据和气象数据进行整理,保留有效数据共1 280条,将这些数据作为训练样本。在组合模型中经参数优化,得到参数修正后的组合预测模型。
在2015年的有序用电期间,将厦门供电公司负荷最高的50户用电数据、气象数据输入组合预测模型,重点预测明日负荷与今日负荷的对比情况,分为“高、低、平”3类进行分类预测。预测准确率达到98 %,而且预测速度在10 s以内。实验结果表明:利用朴素贝叶斯和支持向量机的组合模型进行有序用电短期负荷预测,这种方法是可行的、实用的。
本文针对有序用电工作中对短期负荷预测的需求,在对常用的朴素贝叶斯分类算法进行研究之后,提出用支持向量机分类器进行改进,解决了其在小样本情况下分类效果不好的问题。通过运用组合模型对用户用电负荷进行诊断,收到了令人满意的诊断效果,表明了该方法的有效性和实用性。
1 朱永利,吴立增,李雪玉.贝叶斯分类器与粗糙集相结合的变压器综合故障诊断[J].电机工程学报,2005,25(10):159-165.
2 王 多,王维洲,靳 丹,等.基于贝叶斯网络的连锁故障概率模型[J].电力安全技术,2011,13(7):36-38.
2016-07-14。
郑建柏(1981-),男,计量管理高级师,主要从事电力营销计量管理工作,email:wellzheng@126.com。