王卫公,江晶晶,朱佳盈
(国网上海市电力公司市北供电公司,上海 200072)
目前,国内外不同研究单位和相关企业围绕综合能源服务的理论研究和实践工作进行了研究。《国内外综合能源服务发展现状及商业模式研究》文献对国内外综合能源服务情况进行了较为详细的研究与介绍,指出两类发展路径,总结电力企业进行综合能源服务的几种主要商业模式;《电网企业转型升级之世界观和方法论探讨——打造综合能源整体解决方案及服务平台企业》文献探讨在经济新常态和新一轮电力体制改革的背景下,电网企业转型升级的世界观(转型方向和战略)和方法论(实现路径、技术支撑——大数据、云计算、物联网等)[1-2]。英国HDPS 项目关注大量可再生能源与电力网间的协同,HDEF项目关注智能电网框架下集中式能源系统和分布式能源系统的协同等;日本NEDO 于2010年4月发起成立的JSCA,主要致力于智能社区技术的研究与示范,实现与交通、供水、信息和医疗系统的一体化集成[3]。
阎洁等人提出基于风速云模型相似日的电力能源业务潜力预测方法[4],通过模糊性特征构建能源业务潜力预测模型,设置以日为单位的风速相似度量化指标,获得时段风速历史数据序列,对电力能源业务潜力进行有效预测,能够提高预测精度,但是无法获得电力能源业务潜力值。朱抗等人提出一种基于极限学习机的电力能源业务潜力预测方法[5],针对风能的间歇性与随机性特点,引入极限学习机方法,对电力能源业务潜力进行预测,通过开源风速数据分析风速的非线性特性,此方法能够有效提升电力能源业务潜力预测时间,但是此方法的业务潜力预测结果准确性不佳。
为此,基于国内外综合能源业务相关理论,本文从新的角度对综合能源业务进行研究,助力电力公司综合能源服务业务拓展。本文设计一种基于时序分析的综合能源业务潜力预测模型。得出的预测结果可应用于新能源接入电网的管理、综合能源服务潜力项目挖掘、业务推荐等实际工作,也可用于国网上海市电力公司市北供电公司范围内新能源接入、综合能源服务业务发展、提升经济效益。
综合能源业务横向打通冷、热、电、气等多种能源供应,整合了区域内煤炭、石油、天然气、电能、热能等多种能源,使得能源供应质量和效率更高。国网公司于2017年正式提出将综合能源服务作为第二主业进行市场拓展,三年产值达到500 亿。在此背景下,为了对服务区域的新能源接入客户的综合能源服务潜力与需求有一个较为清晰的把握,为实施新能源接入客户的综合能源服务业务拓展提供支撑,设计综合能源业务潜力预测模型。
本文综合能源业务潜力预测模型设计主要依据时序分析来进行。时间数列由于彼此之间存在着统计上的依赖关系,因此可以通过历史值来预测未来值。基于基于时序分析的综合能源业务潜力预测模型设计主要分为四部分:第一部分数据预处理,收集历史资料,加以整理,编成时间序列;第二部分对时间序列进行稳定性检验;第三部分对时间序列进行分解,把时间序列用函数的形式表达出来;第四部分将预测时期数代入到函数表达式中,实现预测[6]。
要想对综合能源业务潜力进行预测,需要以庞大的历史数据作为支撑,因此在构建模型之前,首要做的的就是收集历史资料,加以整理,编成时间序列。下面进行具体分析。
综合能源业务潜力是指国家电网公司能够提供满足用户对综合能源需求的能力。而综合能源业务潜力相关数据主要由电力企业产值数据、用户需求数据、气象数据、资金投入数据以及当地经济发展水平数据等组成。这些数据并不是“完美”的,在利用之前需要对其处理,包括异常值剔除、缺失值补足、数据标准化和时间序列编写[7]。
(1) 异常值剔除
异常值也被称为离群值,是一个群体中不符合统计规律的个别值,也就是与大多数值差异较大的值。这些值可能属于来自不同的总体,或属于意外的、偶然的测量错误。对于异常值剔除,面临的关键问题就是异常值判断,判断出来后直接剔除即可[8]。异常值判别一般依据三个准则,具体如下表1所示。
表1 异常值判别准则
(2) 缺失值补足
采集到的综合能源业务潜力相关数据中除了异常值外,还有可能存在缺失值,即某一个值由于某种原因丢失,数据完整性遭到破坏,后续时间序列就有可能断裂,所以需要对缺失值补足。缺失值补足方法主要有5种,如下表2所示。
表2 缺失值补足方法
(3) 数据标准化
获取到的综合能源业务潜力相关数据是具有不同的量纲,无法进行统计分析和比较,因此需要将这些数据进行标准化处理,统一量纲。数据标准化处理公式如下:
离差标准化:
Z-score标准化:
log函数转换:
其中,xmax为样本数据的最大值,xmin为样本数据的最小值;a 为所有样本数据的均值,b为所有样本数据的标准差。
(4) 时间序列编写
时间序列编写是指将数据按照某一规则编写成具有时间特征的数列。编写方式主要有绝对数时间序列、相对数时间序列、平均数时间序列等三种。
绝对数时间序列:由一系列同类的总量指标数据按时间先后顺序排列而形成的序列。
相对数时间序列:由一系列同类的相对数按时间先后顺序排列而成的序列。
平均数时间序列:由一系类同类的平均数按时间先后顺序排列而成的序列。
组成时间序列中的有的变量并不是固定的,经常发生变化,因此具有不平稳性。不平稳的时间序列的预测不具有效力。因此对序列进行平稳性检验,保证所需要使用的序列是平稳的,是进行准确预测的前提和基础。时间序列平稳性检验方法有时序图检验、自相关图检验两种。
(1) 时序图检验
时序图检验就是将得到编写好的时间序列绘制在一个平面二维坐标图中,其中横轴为时间,纵轴为对应的变量数据值,然后观察时序图中的曲线是否围绕一个常数值波动,而且波动范围有界的特点。若具有这样的特点就是平稳时间序列;若时序曲线明显带有趋势性或周期性特点,证明该时间序列是非平稳时间序列,如图1所示。
图1 时序图示意图
(2) 自相关图检验
平稳时间序列的典型特征之一就是短期相关性。该特点是延迟期数与自相关系数之间呈现负相关关系。通过观察时间序列是否具有短期相关性,就可以轻易判断是否为平稳时间序列。
将时间序列分解成4 个因素,具体包括趋势变动A、季节变动B、周期变动C和不规则变动D,由此得到时间序列的函数的表达式,如下:
其中,t为时间。
分解预测模型表达式如下:
以上四个因素的具体计算方法如下:
(1) 季节指数B计算
季节指数B的计算较为简单,基本原理是现将其余三种因素去除掉,然后通过季平均法计算季节指数B即可。具体过程如下:
步骤1:基于各年历史数据为基础,计算四个季度的移动平均值,然后组成序列TC。
步骤2:再利用各年相对应的季度数据除以TC,得到序列SI;
步骤3:重新排列SI,通过季平均法求出同季平均数,再对其加以修正,得到各季节指数S1,S2,S3,S4的值。
(2) 长期趋势A计算
将求取长期趋势A问题转化为求回归直线方程T=kt+b的问题,其中t为时期数。作出散点图,使得直线方程到各点(1,Y1)、(2,Y2)、…、[4(i-1)+j]、…、Y4(i-1)+j、…、(4n-1,Y4n-1)、(4n,Y4n)的距离和最小,从而得到回归方程T=kt+b的解析式。
(3) 周期变动C计算
周期变动C计算计算公式如下:
由于不规则变动D对于预测结果影响很小,不影响预测结果的准确性,因此在本文构建的时间序列综合能源业务潜力分解预测模型不考虑该值,降低计算复杂性。
时间序列综合能源业务潜力分解预测模型表达式如下:
其中,C4(i-1)+j根据它的历史周期变化情况估计得到。
将综合能源业务潜力测试输入带入到公式(7)中,即可得出想要的预测值。
为检验本文构建的基于时序分析的综合能源业务潜力预测模型的可用性,本章节进行仿真实验分析。仿真实验环境如下:软件环境:操作系统Windows XP,仿真平台Matlab 6.1;硬件环境:Intel PentiumM,256RAM。其中,样本数据取自上海市电力供电公司的系统。
按照正文章节2.1 对样本数据进行缺失填补和异常值去除,然后进行标准化处理,如表3所示。
表3 处理后的样本数据(部分)
基于处理后的样本数据,利用sigmaplot软件获得不同方法下预测差值曲线,如图2所示。
分析图2可知,不同方法下综合能源业务潜力预测存在差值。当数据量为15GB时,风速云模型相似日预测方法的综合能源业务潜力预测差值为1.6854,极限学习机预测方法的综合能源业务潜力预测差值为-0.362,时序分析的预测方法的综合能源业务潜力预测差值为0.010,本文方法的差值明显低于其他方法,说明本文方法具有较高的预测精准度。
从样本数据中截取部分数据作为测试数据,输入到时间序列综合能源业务潜力分解预测模型当中(公式7),得到某一时间段内的潜力预测值,然后与实际给出的模拟样本值进行对比,得到的结果如表4所示。
表4 综合能源业务潜力预测结果
从表4中可以看出,本模型预测结果与模拟样本中给出的结果都很接近,误差都很小,由此证明本模型能够有效预测出综合能源业务潜力,达到了本文研究的目的。
综上所述,本文基于综合能源服务业务实际拓展需要,结合时间序列,对综合能源业务潜力进行预测。研究过程和成果将与实际工作相结合,助力公司综合能源服务业务拓展。研究成果可应用于新能源接入电网的管理、综合能源服务潜力项目挖掘、业务推荐等实际工作。
然而,虽然本文中时间序列分解预测法预测结果较精确,但它却不能提供各变动因素对预测结果的影响程度的信息,因此研究具有局限性,因此下一步将这一方面研究作为重点,进行进一步分析。