李 宗, 刘晓静, 谢 涛, 邢胜男, 安 玲
(1.国网安徽省电力有限公司, 合肥 230000; 2.国网安徽省电力有限公司 阜阳供电公司, 安徽 阜阳 236000; 3.北京经世万方信息技术有限公司, 北京 100022)
近年,智能电表设施普及促成用户端数据维度的不断丰富,深度挖掘用户端电力数据隐含的信息,有助于电网公司了解用户差异化需求,从而为用户提供个性化服务。同时,用户用电行为特征的掌握对于电网公司需求侧管理、电力生产调度服务、用电服务引导增值服务等工作也至关重要。
在此背景下,如何处理电力用户端大数据,挖掘用户用电行为的有效信息成为相关领域学者关注的课题。现有研究成果中,张素香等[1]提出采用云计算平台和并行 k-means 聚类算法,并结合熵权法计算各类特征权重,将居民用户分类进而分析居民用电行为,但并未结合实际情景证明文中提出算法的鲁棒性。傅军栋等[2]首次基于ReliefF算法建立以峰时耗电率等 5 种特征为指标的数据模型,利用负荷特征权重证明峰时耗电率是影响居民用电日负荷曲线相似度的最关键特征,但文中所提数据特征数量较少缺乏全面性。徐良军等[3]利用K均值聚类算法与模糊C均值聚类算法两种方法对用户的总负荷线进行分类,分析用户用电行为,并进一步分析了两种分析方法的不同,为供电公司进一步了解用户负荷曲线提供参考依据,然而,单纯使用原始负荷数据进行聚类对分析结果的准确性会造成一定的影响。
参考已有研究文献,并结合研究样本的实际情况,本文从台区居民负荷数据入手,同时为降低原始负荷数据中所包含的杂乱信息对分析结果的影响,提取9类负荷特性指标,采用K-means算法对指标集进行聚类分析,以此来识别居民用电行为特征,并基于分析结果提出针对性建议,以期辅助电网公司完善相关业务工作。
K-means算法是一种常用的根据距离进行聚类的算法。本文以居民负荷特征指标为输入数据进行聚类分析,由于数据长度较短且趋势较为相似在聚类方法的选择方面具有较多参数的复杂的聚类方法并不适用于本文所作研究,因为此类算法参数具有很强的不确定性容易对聚类结果准确性造成影响。相较之下以距离作为聚类依据的K-means聚类算法更具优势,聚类流程如图1所示。
图1 聚类流程
本文以安徽省阜阳市供电公司采集的96点居民用电负荷数据为基础,分析以台区为单位的居民用电行为特征。
根据居民用电量规模分别在市区及阜阳市其他区县选取共约50个台区,50个台区中城镇与农村台区按2∶1分配。
抽样台区分布如表1所示。
表1 抽样台区选取
根据阜阳市居民抽样台区全年96点负荷数据,区分采暖降温季与基础负荷季节、工作日与节假日(表2),分别计算其典型日(典型日取当日负荷率最接近当月日均负荷率的日期),选取典型日负荷曲线作为研究对象。
在阜阳市居民用电负荷数据的调研中发现,个别抽样台区(多位于农村地区)负荷曲线存在剧烈波动的特性,因此,在负荷特征指标集中增加了负荷环比增速标准差,实验显示,增加该项指标能够在一定程度上区分出日负荷波动剧烈的台区,能够有效支持台区的细化聚类。综合其他负荷特征指标共9项负荷特征,如表3所示。
表2 聚类分析时间段划分
表3 负荷特征指标集
根据2.2构建的负荷特征指标集,基于Kmeans聚类分析方法对抽样台区负荷特征进行聚类分析。
2.3.1 基础负荷季节工作日负荷特征分析
本文根据标准差曲线来确定k的取值为7,聚类结果如表4所示。
表4 聚类中心
从表4中可以看出,第Ⅰ类特征的样本最多,占样本总数的30%,第Ⅵ类数据只有一组,占比最少,其他几类数据占比相对持平。选取其中最具代表性的几类绘制均值负荷曲线如图2-图6所示,横坐标为一天中的24个时点,纵坐标为负荷数值(下同)。
图2 基础负荷季节工作日第I类所含样本的聚类均值曲线
图3 基础负荷季节工作日第Ⅱ类所含样本的聚类均值曲线
图4 基础负荷季节工作日第Ⅳ类所含样本的聚类均值曲线
图5 基础负荷季节工作日第Ⅴ类所含样本的聚类均值曲线
图6 基础负荷季节工作日第Ⅵ类所含样本的聚类均值曲线
据负荷曲线特征判断第Ⅰ、Ⅱ类负荷数值较小为农村地区居民负荷,第Ⅴ类负荷均为城市居民负荷,第Ⅳ类负荷特征曲线的最大负荷数值远大于第Ⅱ类负荷和第Ⅴ类负荷,可以判定为商业用户,且符合商业用电特征, 而调研台区地址信息也佐证了统计层面的判断结论。进而总结工作日不同类型台区用电特征如下:
1)居民用电量小且稳定可调度空间也相对较小。工作日用电高峰多发生在晚7点到9点。
2)农村地区居民负荷显著小于城市居民负荷。
3)商业用户负荷明显大于居民负荷,最大负荷发生时点晚于居民负荷一个小时左右。
2.3.2 基础负荷季节节假日负荷特征分析
本文根据标准差曲线来确定k值的取值为6,聚类结果如表5所示。
从表5中可以看出,第Ⅰ类样本数量最多,占样本总数的32%,第3类数据只有一组占比最少,其他几类数据占比相对持平,选取其中最具代表性的几类均值负荷曲线如图7-图11所示。
根据负荷曲线特征判断第Ⅴ类负荷为农村地区居民负荷,第Ⅰ、Ⅳ类为城市居民负荷,第Ⅱ类和第Ⅵ类负荷特征曲线波动相似且数值相近并大于第Ⅴ类负荷,可以判定为商业用户,且符合商业用电特征,而调研台区地址信息也佐证了统计层面的判断结论。进而总结节假日不同类型台区用电特征如下:
1)节假日居民用电规律与工作日不同,居民夜间活动更加频繁,最大负荷发生时点后移,出现在夜间8点前后,且持续时间较长,可将其作为负荷调度的一个因素给予考虑。
表5 聚类中心
图7 基础负荷季节工作日第I类所含样本的聚类均值曲线
图8 基础负荷季节节假日第Ⅱ类所含样本的聚类均值曲线
图9 基础负荷季节节假日第Ⅳ类所含样本的聚类均值曲线
图10 基础负荷季节节假日第Ⅴ类所含样本的聚类均值曲线
图11 基础负荷季节节假日第Ⅵ类所含样本的聚类均值曲线
2)商业负荷在节假日用电量有所增加但总体趋势与工作日没有过大差异这由其自身的服务行业特性决定。
2.3.3 采暖季节工作日负荷特征分析
本文根据标准差曲线来确定k值的取值为7,聚类结果表6所示。
表6 聚类中心
从表6中可以看出,第Ⅰ类样本数量最多,占样本总数的30%,第Ⅲ类次之。第Ⅳ类数据只有一组占比最少,第Ⅱ类次之。其他几类数据占比相对持平。选取其中最具代表性的几类曲线如图8-图15所示。
根据负荷曲线特征判断第Ⅰ类负荷为农村地区居民负荷,第Ⅵ类为城市居民负荷,第Ⅱ类、第Ⅳ类负荷特征曲线波动相似且数值相近并大于第Ⅰ类、第Ⅵ类负荷,而且最大负荷发生时点相差在1~2小时以内,且符合商业用电特征,可以判定为商业用户,而调研台区地址信息也佐证了统计层面的判断结论。进而总结工作日不同类型台区用电特征如下:
在采暖季节,受采暖需求影响居民用电负荷明显增加,日用电高峰来临时间在晚上9点到12点前后。同时普通住宅与商品住宅之间在用电方面差异较大。
图12 采暖季节工作日第Ⅰ类所含样本的聚类均值曲线
图13 采暖季节工作日第Ⅱ类所含样本的聚类均值曲线
图14 采暖季节工作日第Ⅳ类所含样本的聚类均值曲线
图15 采暖季节工作日第Ⅵ类所含样本的聚类均值曲线
2.3.4 采暖季节节假日负荷特征分析
本文根据标准差曲线来确定k值的取值为5,聚类结果如表7所示。
从表7中可以看出,第Ⅰ类样本量最多,占样本总数的36%,第Ⅴ类次之。第Ⅲ类数据只有一组占比最少。其他几类数据占比相对持平。选取其中最具代表性的几类曲线如图16-图20所示。
根据负荷曲线特征判断第Ⅰ类负荷为农村地区居民负荷,第Ⅴ类负荷为农村地区居民负荷,第Ⅱ类中城市与农村均有。第Ⅲ类和第Ⅳ类负荷特征曲线波动相似且数值相近并大于第Ⅱ类、第Ⅴ类负荷,符合商业用电特征,可以判定为商业用户,并且第Ⅲ类台区所在范围的商品住宅规模较大。而调研台区地址信息也佐证了统计层面的判断结论。进而总结节假日不同类型台区用电特征如下:
表7 聚类中心
图16 采暖季节节假日第I类所含样本的聚类均值曲线
图17 采暖季节节假日第Ⅱ类所含样本的聚类均值曲线
1)普通民用负荷方面用电量在采暖季节明显增加,最大负荷发生时点范围扩大为晚上6点到11点,且日峰谷差相对于工作日有所上涨,主要是由于节假日多数居民在家中休息,对家中采暖负荷需求有所变化。在节假日,商业负荷与居民负荷一样出现巨幅增长。
图18 采暖季节节假日第Ⅲ类所含样本的聚类均值曲线
图19 采暖季节节假日第Ⅳ类所含样本的聚类均值曲线
图20 采暖季节节假日第Ⅴ类所含样本的聚类均值曲线
2)采暖季节节假日最大负荷上限值达到36.67 kw,与采暖季节工作日最大负荷相比,节假日最大负荷大幅上涨。另外,采暖季节工作日与节假日负荷特征最大的差异在于日峰谷差,说明在节假日居民对于采暖负荷需求增大。
2.3.5 降温季节工作日负荷特征分析
本文根据标准差曲线来确定k值的取值为7,聚类结果如表8所示。
表8 聚类中心
从表8中可以看出,第Ⅱ类样本量最多,共有18个样本量,占样本总数的36%,第Ⅲ类次之。第Ⅶ类数据只有一组占比最少。其他几类数据占比相对持平。选取其中最具代表性的几类曲线如图21-图24所示。
图21 降温季节工作日第II类所含样本的聚类均值曲线
图22 降温季节工作日第Ⅲ类所含样本的聚类均值曲线
图23 降温季节工作日第Ⅳ类所含样本的聚类均值曲线
图24 降温季节工作日第Ⅶ类所含样本的聚类均值曲线
根据负荷曲线特征判断第Ⅲ类负荷为农村居民负荷,第Ⅳ类为城市居民负荷。第2类和第Ⅶ类最大负荷数值相近并大于第Ⅲ、Ⅳ类负荷,初步判定这几个类别台区所在范围商品房较多,第Ⅶ类负荷所代表的是台区所在范围内的商品房的规模相对比第Ⅰ类大一些。而通过调研信息也佐证了统计层面的判断结论。进而总结工作日不同类型台区用电特征如下:
1)降温季节因温度变化,居民用电负荷有所增加。主要是由于该季节台区内的一些商业用户为保持室内温度恒定需要通过空调进行温度调控,所以负荷相对基础负荷季节有所上涨。
2)由于所选时段是工作日用电高峰来临时间在晚6点到11点,持续时间较长。商品房所属的商业负荷与普通居民负荷一样出现巨幅增长。
2.3.6 降温季节节假日负荷特征分析
本文根据标准差曲线来确定k值的取值为7,聚类结果如表9所示。
从表9可以看出,第Ⅰ类样本最多,共有14组占样本总数的28%,第Ⅲ类次之。第Ⅵ类数据只有一组占比最少。其他几类数据占比相对持平。选取其中最具代表性的几类曲线如图25-图28所示。
表9 聚类中心
图25 降温季节节假日第Ⅰ类所含样本的聚类均值曲线
图26 降温季节节假日第Ⅱ类所含样本的聚类均值曲线
图27 降温季节节假日第Ⅲ类所含样本的聚类均值曲线
图28 降温季节节假日第Ⅶ类所含样本的聚类均值曲线
根据负荷曲线特征判断第Ⅰ类负荷为农村地区居民负荷,第Ⅶ类为城市居民负荷。第Ⅱ类、第Ⅲ类曲线波动相似且数值相近并远大于第Ⅰ类、第Ⅶ类负荷,判定为商业负荷。而调研台区地址信息也佐证了统计层面的判断结论。进而总结节假日不同类型台区用电特征如下:
1)与基础负荷季节节假日相比,此时间段的最大负荷数值偏高。
2)降温季节节假日最大负荷发生时点较工作日最大负荷发生时点推迟1.5~2小时。
本文利用Kmeans算法建立了用户行为分析模型,并对多种负荷特征指标聚类结果进行分析,基本掌握了不同季节居民用电行为特征。根据季节性的居民用电行为特征,本文提出以下几点建议。
基于Kmeans的居民用电行为聚类分析结果,可以看出基础负荷季节、采暖季节、降温季节三个典型季节居民用电特征存在明显的差异性,工作日和节假日居民用电行为也存在不同。所以应以此作为依据加强需求侧管理。
1)电网应及时将居民用电信息通过智能设备终端、手机APP等方式反馈给用户,通过数据共享让用户充分了解自身用电行为,并以节省电费为目的及时优化用电行为,减少电能消耗。
2)根据居民用电行为特征与大型工厂进行协调,避开用电高峰期避免过载现象的发生,通过加强需求侧管理减小电厂压力。
根据居民用电行为聚类分析结果,电网可以基本掌握台区内居民在不同季节的用电趋势,包括日最大负荷、最大负荷发生时点等基本信息。以此作为背景,根据台区内居民用电情况不断调整电网的调度模式是电网公司的主要任务。
1)聚类结果显示现有分时优惠电价政策效果并不明显,电网应根据居民用电行为特征信息对优惠政策进行细化,鼓励台区内用户积极的配合电网调度。例如,明确居民负荷用电高峰,利用储能设备实现“消峰填谷”。
2)根据不同季节、工作日、节假日居民用电行为存在的差异性制定合理的调度模式以服务台区安全运行和经济运行。