魏鹤婵
摘 要: 海量用电数据中隐含着客户的用电规律特征,对这些数据进行分析能够了解客户的差异化、个性化服务需求。基于国内外研究现象,对客户用电规律关键技术进行了系统研究,研究方法包括聚类算法、日期匹配算法、曲线相似性度量算法等。提出详细的电能计量系统构建方案,分析主网的用电规律和用电特征。结合用电模式分析了海量客户的用电规律,建立历史日削峰填谷匹配关系,并以某电力公司2017-2018年的客户用电数据为例,验证了用电分析模型的有效性,能够为未来的电力需求侧响应政策的制定提供数据支撑。
关键词: 用电特征; 聚类算法; 用电规律; 电能计量系统
中图分类号: TP311; TM933 文献标志码: A
Abstract: Massive electricity consumption data imply the characteristics of customers electricity consumption law. The analysis of these data can understand differentiated and personalized needs of customers. The key technologies of customers electricity consumption law are systematically studied, including clustering algorithm, date matching algorithm, curve similarity measurement algorithm, etc. A detailed construction scheme of energy measurement system is proposed, and the main network is studied. Based on the electricity consumption law and characteristics, combined with the electricity consumption pattern, the electricity consumption law of mass customers is analyzed, and the matching relationship between peak-shaving and valley-filling is established. The validity of the electricity consumption analysis model is validated by taking the massive electricity consumption data of a power company from 2017 to 2018 as an example, which can provide data support for the formulation of future power demand-side response policy.
Key words: power consumption feature; clustering algorithm; electricity usage law; energy metering system
0 引言
近年來,客户用电规律及用电量呈现出多元化的特征,未来电网必须能够提供更加优质、清洁、可靠、安全的电力供应[1]。同时,随着营配一体化协同工作机制的建立,用电客户的用电数据能够与客户缴费、客户档案等关联起来,对这些用电数据进行深度挖掘能够帮助电网了解客户的个性化、差异化服务需求。如何通过提取天气参数、客户信息、用电负荷等相关数据,建立电力主网的负荷特征与客户群体的负荷特征的模式匹配关系,对提高整个配电系统的工作效率和管理水平有着重要的意义[2-4]。国内外学者对客户用电规律进行了深入研究,林承就等[5]对居民智能用电情况进行了数据统计,通过模糊综合评价法对居民智能用电的态度进行量化评分,分析了居民用电情况和影响因素;刘利成等[6]探讨了典型用电客户的用电规律,结合大量的行业经验,构建了月度用电量计算公式,验证了该电量计算方法的有效性,但系统运行的时间耗费长不能满足快速的用电需求响应。Ibrahim D等[7]基于并行K-MEANS聚类算法,建立了谷电系数、负荷率、峰时耗电率等时间序列特征,将居民客户被分成商业客户、老人家庭、上班族+老人、上班族、空置房等5类客户,但聚类方法的计算复杂度较高。本文对客户用电规律关键技术进行了系统研究,包括聚类算法、日期匹配算法、曲线相似性度量算法等,并对提出了详细的电能计量系统构建方案,研究了主网的用电规律和用电特征,结合用电模式分析了海量客户的用电规律,建立历史日削峰填谷匹配关系,并以某电力公司2017-2018年的海量客户用电数据为例,验证了用电分析模型的有效性,对提高电网需求侧能效管理水平具有建设性意义。
1 用电规律模型的构建
1.1 用电规律分类
客户用电规律分析是对历史数据的处理过程,本文对海量数据进行聚类分析,用电规律分析需要对以下算法进行研究,聚类算法、最优聚类评价算法、日期匹配算法、曲线相似性度量算法。其中,聚类分析是将海量数据集划分为若干个子集,并使集合内的数据具有较高的相似度。EM聚类算法作为一种迭代算法,用于含有隐变量的概率参数模型的极大后验概率估计,EM算法主要分为E步骤和M步骤,通过两步骤逐步改进模型的参数,最后终止于一个极大点。K-MEANS算法是将数据对象划分为k个聚类,具体过程为:从数据对象中任意选取k个对象作为初始的聚类中心;分别计算每个对象到聚类中心的距离,并将其分配到最近距离的聚类;分配完成后,重新计算k个聚类的中心点,对两次聚类中心进行比较,输出聚类结果。
1.2 用电规律诊断
2 电能计量系统的设计与实现
电能计量系统分为用电规律分析模型、主网负荷聚类分析、主网负荷数据管理、用电客户负荷查询、客户群用电规律分析等模块,功能模块[12]如图1所示。
其中,用电规律分析引擎通过用电规律分析模型的算法实现[13]。
2.1 用电规律分析引擎
用电行为分析引擎是以算法包的形式实现,对用户规律分析之前,需要对数据进行预处理,包括新旧测量点处理、负值处理、缺失值处理、“0”值处理、异常值检测处理等[14]。使用EM聚类对主网负荷数据进行聚类,将历史负荷曲线分成多个群体,从而获得在不同时期主网负荷的不同特征,主网聚类分析算法流程,如图2所示。
基于主网聚类的聚类结果,使用Map-Reduce环境下的K-Means聚类算法,对不同主网下的客户群进行聚类分析,得到负荷聚类结果和负荷聚类特征[15]。客户群聚类分析流程,如图3所示。
基于客户群聚类分析,对主网特征及客户群聚类特征进行削峰填谷模式匹配,通过匹配结果将客户群与主网之间关系分类,如图4所示。
将历史数据划分为3个日期数据集合,分别为:工作日、周末以及节假日。待测日为工作日或周末时,分别在工作日和历史周末集合中寻找历史相似日。待测日为节假日时,直接用历史同一节假日群体进行用电规律的分析。日期匹配分析算法流程,如图5所示。
2.2 主网负荷的聚类分析
主网负荷的聚类分析对聚类结果、聚类分布、聚类结果特征,能够直观的展示负荷分类以及日期构成等,流程图如图6所示。
2.3 客户群用电规律分析
客户群用电规律分析实现了用户用电规律分析和用电规律预测。结合主网负荷聚类、客户负荷聚类、削峰填谷模式匹配执行结果,直观的展示对比情况;用户用电规律预判支撑查询匹配结果,功能流程图,如图7所示。
2.4 主网负荷数据管理
主网负荷数据管理和用电客户负荷查询以表格和图形形式展示日主网负荷情况,以及主网、客户群、用电客户三者之间的对比关系,用于查询主网负荷数据和用电客户负荷数据,页面流程图[16],如图8所示。
3 仿真实验分析
为验证系统的设计思路、操作流程及模块功及是否满足各单位功能需求,以某电力公司2017-2018年的海量客户典型月用电数据为例,对电能计量系统客户用电规律进行验证。
3.1 主网聚类结果
利用EM聚类算法对2017年某电力公司典型月主网负荷曲线进行聚类分析,网负荷聚类特征曲线,如图9所示。
可以看出,每一类的负荷特征曲线形态较为相似,低谷型负荷主要出现在节假日和春季,高峰型负荷主要出现在冬季和夏季。第一类主网负荷曲线夜间负荷较低,昼夜差距明显,白天从6:00负荷不断增大,并在11:00达到峰值,19:00后负荷开始下降,分布主要集中在夏冬季节。其中,节假日和春季在第一类中无分布;夏季、秋季、冬季中第一类分布分别占比58.11%、51.70%、6.52%,第二类主网负荷曲线为普通型,整体趋势与第一类类似,昼夜差距也较为明显,但白天基本平稳,四季分布均匀,分别占比15.07%,39.82%,41.34%,33.18%;第三类主网负荷曲线为低谷型,在中午有明显谷值,春秋季和节假日分布较多,夏冬季也有少许分布。其中,节假日占比82.16%,夏季、秋季、冬季中第一类分布分别占比83.93%,1.08%、51.13%、14.31%。綜上,第一类主网负荷曲线主要为夏、冬季节;第二类主网负荷曲线四季分布较为均匀;第三类主网负荷曲线主要为春秋季节;节假日主要集中在第三类。
3.2 客户群体分析结果
通过对用户用电曲线数据的聚类分析,可得到电力客户负荷特征。利用客户负荷曲线作为并行K-MEANS聚类算法的输入,得到第一类主网负荷下的客户负荷曲线,如图10所示。
通过模式匹配建立第一类主网负荷特征曲线和电力客户负荷曲线的对应关系,求取皮尔森相关系数及负荷曲线的最大负荷值,结合电力客户负荷曲线最大负荷值确定削峰填谷对象。客户负荷特征曲线,可以看出,第一类主网负荷特征曲线与四类电力客户负荷曲线的皮尔森相关系数分别为0.989 7,0.993 3,0.999 7,0.630 3,最大负荷分别为7.022 0 kW、1.216 9 kW、0.433 7 kW和0.095 1 kW。第一类的最大负荷值最大,因此确定第一类主网日负荷特征曲线下的削峰填谷对象为第一类用户。
针对第二类主网日负荷特征曲线,利用测量点负荷曲线进行自动化聚类,可以得到第二类日负荷下客户负荷曲线,如图11所示。
通过模式匹配等技术建立第二类主网负荷特征曲线与电力客户负荷曲线的对应关系,第二类主网负荷特征曲线与三类电力客户负荷曲线的皮尔森相关系数分别为0.996 2,0.995 3,0.858 8,电力客户的最大负荷为分别为2.371 2 kW,0.412 4 kW,0.056 6 kW。由于第一类和第二类客户负荷曲线皮尔森相关系数差距较小,且第一类的最大负荷值较大,因此,确定第二类主网电力客户削峰填谷对象为第一类用户。
针对第三类主网日负荷特征曲线,利用测量点负荷曲线进行自动化聚类,可以得到第三类日负荷下客户负荷曲线,如图12所示。
通过模式匹配等技术建立第三类主网负荷特征曲线与电力客户负荷曲线的对应关系,可以看出,第三类主网负荷特征曲线与五类电力客户负荷曲线的皮尔森相关系数分别为0.986 2,0.745 4,0.995 6,-0.605 8,0.991 4电力客户的最大负荷为分别为5.294 6 kW,4.637 0 kW,0.799 5 kW,0.321 4 kW,0.095 8 kW。由于第四类客户负荷曲线与第三类主网负荷曲线的相关系数为负值,因此该类客户优先作为鼓励用电的客户类型。而为第一类、第三类和第五类客户负荷曲线的相关系数差距较小,且均接近1,但第一类的最大负荷值较大,确定第三类主网电力客户削峰填谷对象为第一类用户。