基于核密度估计的概率分布函数拟合方法

2016-08-29 05:20宋元峰万凌云刘涌张盈杨群英马成红马浩然国网陕西省电力公司陕西西安7008国网重庆市电力公司电力科学研究院重庆上海博英信息科技有限公司上海000国网重庆市电力公司重庆000国家电投西安太阳能电力有限公司陕西西安80000
电网与清洁能源 2016年6期
关键词:密度估计概率密度函数概率分布

宋元峰,万凌云,刘涌,张盈,杨群英,马成红,马浩然(.国网陕西省电力公司,陕西西安 7008;.国网重庆市电力公司电力科学研究院,重庆 0;.上海博英信息科技有限公司,上海 000;.国网重庆市电力公司,重庆 000;.国家电投西安太阳能电力有限公司,陕西西安 80000)

基于核密度估计的概率分布函数拟合方法

宋元峰1,万凌云2,刘涌3,张盈2,杨群英4,马成红3,马浩然5
(1.国网陕西省电力公司,陕西西安710048;2.国网重庆市电力公司电力科学研究院,重庆401123;3.上海博英信息科技有限公司,上海200240;4.国网重庆市电力公司,重庆400014;5.国家电投西安太阳能电力有限公司,陕西西安810000)

基于核密度估计的非参数估计方法,开发了支路利用率程序。基于概率潮流计算结果给出了线路潮流的概率密度函数和累积概率分布,并应用其进行电网线路利用率的分析,最终得出电网中各线路的利用率及其对应可能发生的概率。

概率潮流;概率密度函数;核密度估计;电网线路利用率

在传统电力系统分析中,负荷的波动、电网运行方式的变化和发电机的停运等因素造成了电力系统一定程度上的不确定性。随着电力工业的发展,以太阳能和风能等为代表的新能源接入电网,给电网带来了明显的间歇性和随机性;微网、分布式电源和电动汽车等配电网新概念的发展,大大增强了电源、负荷与电网之间的互动性,其直接导致了电力系统不确定性的显著增加。因此,用于电力系统分析的概率潮流算法的研究日益重要。

概率潮流(probabilistic load flow,PLF)是分析考虑不确定因素的稳态潮流的有效工具之一,其考虑负荷波动、线路和发电机故障对潮流的影响,获得节点电压和支路潮流的统计矩或者概率分布函数[1],为电力系统运行和规划等提供了更有效的参考信息,是传统潮流分析方法的有效补充。PLF方法为科学考虑电力系统各种不确定性因素提供了有效手段,也为进一步分析线路的利用率提供了可能。

基于模拟法的概率潮流计算得到线路潮流的样本数据,需要对样本数据进行分析,获得线路潮流功率的概率密度函数和累积概率分布函数,以评估线路利用率[2]。虽然概率潮流的输入变量服从特定的参数分布,例如正态分布、二项式分布等,但是由于潮流方程的非线性特点,所以概率潮流的输出变量(节点电压和线路潮流)的概率分布复杂,常常呈现出多峰特性,无法用简单的参数分布来拟合。因此,若简单采用正态分布函数来描述线路潮流的概率分布,其误差往往较大。一种更加合理的方式是采用非参数估计获得线路潮流的概率分布函数,而核密度估计是典型的非参数估计方法[3]。

本文研究了基于核密度估计的非参数估计方法,开发了支路利用率程序,基于概率潮流计算结果给出了线路潮流的概率密度函数和累积概率分布,并最终分析了电网线路的利用率。

1 蒙特卡罗模拟法

假设x为n维的输入随机变量,输出变量z和输入变量x的关系为:

蒙特卡罗模拟通过对输入随机变量x进行采样,获得输入变量x的样本x{1},x{2},…,x{N},并将样本x{i}代入式(1),以获得输出随机变量的样本z{i}:

获得样本x{1},x{2},…,x{N}的采样方式有很多种,常用的有简单随机采样(simple random sampling,SRS)和拉丁超立方采样(latin hypercube sampling,LHS)[4]。在SRS中,样本从随机变量的取值空间任意选取;而LHS则由采样和排序2个步骤构成,其具体算法如下。

1)采样。假设随机变量xk(k=1,2,…,n)的累积概率分布函数为Fk(xk)。将Fk的取值空间平均分为N个区间,从每个区间中任意选取一个数作为Fk的采样值,则xk的采样值为xki=F-1k((i-rand)/N)。将每个随机变量的采样值排成一行,形成n×N阶的采样矩阵X,LHS采样示意图如图1所示。

图1LHS采样示意图Fig.1 LHS sampling schematic diagram

2)排列。在输入随机变量独立时,输入随机变量采样值之间的相关性对计算结果有一定影响,排序能够降低采样值之间的相关性。有很多种排序方法,如Cholesky分解、Columnwise-pairwise算法、Single-switch优化方法等[4-5]。其中,基于Cholesky分解的排列方法为:假设L为n×N的顺序矩阵,其每一行对应于采样矩阵X的1,2,…,N排列。L的线性相关矩阵为n×n维的ρL,根据定义gL为对阵正定矩阵,因此可以将ρL进行Cholesky分解:

式中:D为下三角矩阵。

n×N维矩阵G可以由下式计算得到:

与矩阵L不同,矩阵G的元素不一定是正整数。根据G生成矩阵G′,使得G′的每一行为1,2,…,N的排列,且其排列顺序对应于G中每一行元素的排列。按照G′每一行元素的排列,更新采样矩阵X每一行元素的排列。

基于蒙特卡罗模拟法的概率潮流计算方法如下:

1)读取潮流计算数据,读取输入变量信息,确定概率潮流计算参数。

2)基于蒙特卡罗采样技术获得输入变量样本矩阵。

3)采用样本矩阵进行潮流计算,并保存输出变量信息。

4)分析节点电压幅值相角和线路潮流的概率分布与统计数字。

2 基于核密度估计的概率分布函数拟合方法

核密度估计(kernel density estimation,KDE)也被称为Parzen窗估计[6],是20世纪五六十年代提出并发展起来的一种密度估计方法,它是一种有效的非参数估计方法[7]。假设x{1},x{2},…,x{N}为随机变量x的样本,变量x的概率密度函数为f(x),则f的核密度估计可以表示为:

式中:h为带宽;N为样本规模;K(·)为核函数,并满足如下条件:

当N→∞,h→∞且Nh→∞时,fˆ依概率收敛于f。核函数的形状和值域控制着用来估计f在点x的值所用数据点的个数和利用的程度,常用的核函数包括均匀核、三角核和高斯核等。本文选择高斯核函数,其表达式为:

根据核密度估计理论,相比于核函数,带宽h对拟合结果的影响更大。在不同带宽h下,核密度估计结果差别较大。当带宽h较小时,核密度估计曲线fˆ较为曲折,光滑性很差,呈现出原概率密度函数f所没有的多峰特性;当带宽h较大时,核密度估计曲线fˆ较为平滑,但会掩盖较多细节。因此,选择合适的带宽h是非常重要和必要的。通常有两类带宽选择方法:交叉验证法(cross-validation method,CV)和插入法(plug-in method,PI)[8]。

2.1交叉验证法

核密度估计值fˆ和理论概率密度函数f的区别可表示为:

式中:第一项可由样本数据计算得到;第二项可表示为估计值fˆ的期望;第三项与带宽h无关,可被省略。所以式(8)可被简化为:

交叉验证法的主要任务是精确估计式(9)中的第二项。

2.2插入法

核密度估计值fˆ和理论概率密度函数f的差别的期望为:

式中,

定义渐近均方误差(asymptotic integral mean squared error,AMISE)为:

则渐近的最优带宽为:

在式(13)中,只有R(f″)是未知的,所以插入法的主要任务是合理估计R(f″)的值。

针对R(f″)的估计,Silverman提出了一个经验方法:假定f为正态概率密度函数N(0,σ2),则R(f″)= (3π-0.5σ-5)/8,此时若选择高斯核函数[9],则可以得到最优带宽h=1.06σn-1/5。当数据接近正态分布时,该方法是一个良好的选择。然而,当真实分布为非对称或者是多峰时,该方法可能导致过度平滑。因此,有学者提出采用如下带宽选择方式以较好拟合单峰或者双峰的概率函数:

式中:σ为样本的标准差;R为样本的四分位距。

3 概率分布函数拟合流程图

结合第2节,本方法采用核密度估计拟合输出变量概率分布函数,核函数K选择为高斯核函数,带宽h由式(14)计算得到,采用式(5)得到节点电压幅值和相角、线路潮流有功和无功的概率分布函数,其流程图如图2所示。

图2 计算数据的概率分布函数拟合流程图Fig.2 Data flow chart of the probability distribution function of fitting calculation

4 支路利用率程序模块

支路利用率程序对概率潮流计算模块的结果进行统计分析,主要包括:

1)数据读取程序

输入:概率潮流计算结果。

输出:节点电压幅值和相角、线路潮流有功和无功的样本矩阵。

实现功能:读入节点电压幅值和相角、线路潮流有功和无功的样本矩阵。

2)概率分布函数估计程序

输入:某线路潮流数据或者变压器功率数据。

输出:数据所对应的概率密度函数和概率分布函数。

实现功能:采用核密度估计得到给定样本的概率分布。

3)设备利用率分析程序

输入:线路或者变压器利用率区间,线路或者变压器额定容量,线路潮流或者变压器功率概率分布。

输出:给定利用率区间的分布概率。

实现功能:分析线路或者变压器在给定利用率区间的分布概率,程序流程图如图3所示。

图3 支路利用率程序流程图Fig.3 Branch utilization program flow chart

5 结论

本文主要研究了概率潮流算法,考虑负荷波动、线路和发电机故障对潮流的影响,获得节点电压和支路潮流的统计矩或者概率分布函数。研究了基于核密度估计的非参数估计方法,开发了支路利用率程序,基于概率潮流计算结果给出了线路潮流的概率密度函数和累积概率分布,并应用其进行电网线路利用率的分析,最终得出电网中各线路的利用率及其对应可能发生的概率。

[1]蔡德福.计及相关性的概率潮流计算方法及应用研究[D].武汉:华中科技大学,2014.

[2]梁浩.基于概率潮流的输电线路利用率计算方法及其应用[D].天津:天津大学,2013.

[3]尹素菊.线性模型的参数估计理论与方法[D].北京:北京工业大学,2005.

[4]蔡德福,石东源,陈金富.基于多项式正态变换和拉丁超立方采样的概率潮流计算方法[J].中国电机工程学报,2013(13):23-25. CAI Defu,SHI Dongyuan,CHEN Jinfu.Probabilistic load flow calculation method based on polynomial normal transformation and latin hypercube sampling[J].Proceedings of the Csee,2013(13):23-25(in Chinese).

[5]李存华,孙志挥,陈耿,等.核密度估计及其在聚类算法构造中的应用[J].计算机研究与发展,2004(10):16-20. LI Cunhua,SUN Zhihui,CHEN Geng,et al.Kernel density estimation and its application to clustering algorthm comstruction[J].Journal of Computer Research and Development,2004(10):16-20(in Chinese).

[6]刘敬伟,胡爽,康进,等.倒向随机微分方程中非参数估计的核函数选择[J].统计与信息论坛,2011,26(11):5-8. LIU Jingwei,HU Shuang,KANG Jin,et al.Kernel function selection of nonparametric estimation of backward stochastic differential equation[J].Statistics&Information Forum,2011,26(11):5-8(in Chinese).

[7]李泽中,白勇.核密度估计在分类问题中带宽参数的优化研究[J].计算机科学,2009,36(6):17-20. LI Zezhong,BAI Yong.Study on the optimization of the bandwidth of the kernel function kernel discrimination[J]. Computer Science,2009,36(6):17-20(in Chinese).

[8]赵莹.支持向量机中高斯核函数的研究[D].上海:华东师范大学,2007.

(编辑董小兵)

Coarse-to-Fine Detection for Nests on Pylon

SONG Yuanfeng1,WAN Lingyun2,LIU Yong3,ZHANG Ying2,YANG Qunying4,MA Chenghong3,MA Haoran5(1.State Grid Shaanxi Electric Power Company,Xi'an 710048,Shaanxi,China;2.State Grid Chongqing Electric Power Research Institute,Chongqing 401123,China;3.Shanghai Proinvent Information Technology Co.,Ltd.,Shanghai 200240,China;4.State Grid Chongqing Electric Power Company,Chongqing 400014,China;5.SPIC Xi'an Solar Power Co.,Ltd.,Xi'an 810000,Shaanxi,China)

In this paper,nonparametric estimation method based on kernel density estimation,developing the branch utilization program,The probability density function and the cumulative probability distribution of the power flow are presented based on the probabilistic power flow calculation results,and in the end analyzed the power grid line utilization.

probabilistic power flow;probability density function;kernel density estimation;power grid line utilization

1674-3814(2016)06-0085-04

TM711

A

2016-01-02。

宋元峰(1968—),男,硕士,高级工程师,主要从事电力系统及其自动化方面的研究工作。

猜你喜欢
密度估计概率密度函数概率分布
面向鱼眼图像的人群密度估计
幂分布的有效估计*
基于MATLAB 的核密度估计研究
一种基于改进Unet的虾苗密度估计方法
离散型概率分布的ORB图像特征点误匹配剔除算法
NSD样本最近邻密度估计的强相合性
已知f(x)如何求F(x)
基于变构模型的概率密度函数的教学探索
关于概率分布函数定义的辨析
基于概率分布的PPP项目风险承担支出测算