魏红燕,魏含玉
(周口师范学院 数学与统计学院,河南 周口 466001)
基于密度峰值聚类的用户类型划分
魏红燕,魏含玉
(周口师范学院 数学与统计学院,河南 周口 466001)
提出了一种快速查找密度峰值的聚类方法,在电力市场的实际运营中,根据用户消费情况获得私有信息,实现用户类型的合理划分,有效反映了不同类型可控负荷对价格响应的差异性,从而为零售电价设计提供理论依据.
密度峰值;聚类分析;用户类型;划分
在电力市场的实际运营中,用户从自身利益出发,根据给定的补偿电价改变用电方式,在某一个时段负荷功率增加或者减少.由于不同类型的用户对电价的响应程度不同,且改变用电方式所产生的成本具有差异性.因此,为了实现对不同类型用户需求响应的差别定价,需要对用户类型进行合理的划分[1-2].
可控负荷增、减功率边际成本、需求弹性系数属于用户私有信息.负荷服务机构通过用户参与市场交易或者问卷调查时上报的可控负荷增、减功率上限量、价格、需求弹性系数等信息,获得用户私有信息,并通过聚类算法[3],实现用户类型的合理划分.以便负荷服务机构利用经济措施(电价)诱导用户增加或减少负荷功率,参与日前或者小时前市场交易,以促进用户主动改变用电方式,实现有效的需求侧管理和系统削峰填谷.
用户要向LSE上报削减功率的弹性系数、边际成本、用户的特征参数.理论上每一个用户的参数都不一致,但是要向LSE上报所有用户的参数是不现实的,零售商在收集所辖用户的信息之后进行整理.通过对样本进行聚类并获得聚类中心,得到的聚类中心值近似等价于用户的参数,于是用户的用电行为参数用聚类中心的值近似[4-5].
本文在聚类分析的基础上,利用Alex Rodriguze和Alessandro Laio提出的快速查找密度峰值的聚类方法[6].该方法假设数据样本中各个类簇的中心由一些局部密度比较低的点围绕,且这些点距离其他高密度点的距离都比较大.通过搜索合适的局部密度较大的点(即高密度点)作为类簇中心,再将类簇的标签从高密度点向低密度点依次传播来实现数据样本的聚类划分.由于该聚类算法具有计算速度快,无需迭代等特点,适用于各种类型、不同形状的样本点集聚类.该方法可以自动找出聚类数,并且对参数选择及样本分布具有鲁棒性,因而适用于数目庞大、概率分布不确定的用户上报信息,以实现用户类型的聚类划分.用户聚类划分的具体步骤如下:
(1)将用户上报的信息分为增功率信息样本集合Y+和减功率信息样本集合Y-.每个样本点由3个聚类特征,即功率调整上限量、价格、需求弹性系数组成,具体表达为:
(3)计算样本集合中除局部密度最大点之外的其他所有样本点的γ值,选取合适的聚类中心阈值γ′,大于γ′值的样本点被选为样本的一个聚类中心.γ′值的大小反映了样本集合的分类程度,γ′值越大则分类越多,可根据聚类的有效性检验和实际运营情况来确定.聚类中心形成的具体表达为:
由此可得到样本集合Y+,Y-的聚类中心样本点,记作
最优聚类数分别为K+,K-.
(4)在确定聚类中心后,其他非聚类中心样本点根据局部密度从高到低的顺序,确定各自属于哪种类别,即每个非聚类中心样本点归类到局部密度大于该样本点且距离最近的聚类中心所属的类别,最终得到用户分类图.
本文选取2016年12月19∶25分,PJM市场637个用户减功率报价数据,构成637组用户信息样本.基于密度峰值聚类方法,获得聚类决策图和样本分类图[7],如图1所示.从图1中可看出,637组样本数据形成5个聚类中心,即用户划分为5种类型.同一颜色的样本点表示相同类别,得到样本分类图,横坐标X维度表征不同类型样本点之间的欧氏距离,纵坐标Y维度表征同一类型样本点之间的欧氏距离,即同类型样本的紧密程度.
图1 聚类决策图与样本分类图
各用户类型所包括的样本数、聚类中心如表1所示.从表1中可以看出,第3类和第4类的样本点数量占比较高,表明用户参与市场交易的减功率边际成本大多数集中在中间段,成本较高和较低的用户比例相对较小,这与实际情况相符合.类别1到类别5反映了从居民、商业到工业用户电力生产消费的特点,居民用户的减功率边际成本较高,对价格响应的弹性系数较小,功率调整的上限也较小;而工业和商业用户由于具有较小的减功率边际成本,需求弹性较大,参与市场交易时的减功率调整上限也较大.
表1 各子类样本数及先验概率
本文针对需求侧地域分散、数量庞大的可控负荷,通过用户上报的数据获得用户私有信息,并通过聚类算法,实现用户类型的合理划分[8].以便负荷服务机构利用经济措施(电价)诱导用户增加或减少负荷功率,参与日前或者小时前市场交易,以促进用户主动改变用电方式,实现有效的需求侧管理和系统削峰填谷.
[1]王璨,冯勤超.基于价值评价的电力用户分类研究[J].价值工程,2009(05):64-67.
[2]李智勇,吴晶莹,吴为麟,等.基于自组织映射神经网络的电力用户负荷曲线聚类[J].电力系统自动化,2008(15):66-70+78.
[3]王骏,王士同,邓赵红.聚类分析研究中的若干问题[J].控制与决策,2012(03):321-328.
[4]黄岚,李玉,王贵参,等.基于点距离和密度峰值聚类的社区发现方法[J].吉林大学学报,2016(06):2042-2051.
[5]盛华,张桂珠.一种融合K-means和快速密度峰值搜索算法的聚类方法[J].计算机应用与软件,2016(10):260-264.
[6]Rodriguez A,Laio A,Clustering by fast search and find of density peaks[J].Science,2014,344(6):1492.
[7]何晓群.多元统计分析[M].北京:中国人民大学出版社,2015.
[8]乔慧婷.基于密度聚类的峰谷时段划分方法研究[D].华北电力大学(北京),2011.
[责任编辑:王 军]
Classificationofusertypesbasedondensitypeakclustering
WEI Hongyan,WEI Hanyu
(School of Mathematics and Statistics,Zhoukou Normal University,Zhoukou 466001,China)
In the paper,we propose a clustering method to find the peak of density quickly.In the actual operation of electricity market,we obtain the private information according to the user’s consumption situation,to realize the reasonable division of user type,and effectively reflect the difference of the different controllable load to price response,thus to provide a theoretical basis for retail price design.
peak of density;cluster analysis;user type;divided
2017-04-05
河南省高等学校重点科研项目(16A110026)
魏红燕(1986—),女,河南周口人,周口师范学院讲师,硕士,主要从事应用统计的研究.
F724.6
A
1672-3600(2017)12-0011-03