煤改电用户补贴电量的影响因素及模型分析

2022-02-21 23:58张艳左雅李香平吕盼荆世博
微型电脑应用 2022年1期
关键词:用电量源热泵线性

张艳, 左雅, 李香平, 吕盼, 荆世博

(1.国网新疆电力有限公司,新疆,乌鲁木齐 830001;2.国网新疆电力有限公司 经济技术研究院,新疆,乌鲁木齐 830001)

0 引言

能源短缺与环境问题促使了煤改电项目的实施,自从2003年北京地区实施煤改电工程以来,截止到2015年已经有38.45万户用户完成采暖改造,2016年463个村庄完成了“煤改清洁能源”的计划。2017年实现了7区平原村“无煤化”。煤改电项目的实施使人们的生活环境得到了大幅度的改善,但从传统的以煤炭取暖到以电力取暖使煤改电的用电费用成为了人们担心的焦点。为了更好推进煤改电项目的实施,政府给予煤改电用户一定量的电量补贴[1]。虽然政府给予煤改电用户补贴,但在煤改电补贴金额的多少上依然缺少参考依据[2-5]。

采暖季煤改电用户用电量受多重因素影响,用户的家庭情况、用户的住房采暖面积、采暖季室外温度和室外湿度、采暖设备的型号类型、采暖设备的数量和用户的行为习惯等都是需要考虑的因素。本文运用逐步线性回归模型和定性定量的数据分析,根据煤改电用户的原始数据,通过专家判断和煤改电用户调查研究结果,综合考虑煤改电用户用电量的各方面因素,准确分析出采暖季煤改电用户用电量的影响因素,为政府提供有价值的参考依据。

1 回归原理

1.1 回归简介

根据某市“煤改电”智能服务平台,可以得到大量的煤改电用户信息。煤改电用户的用电量作为模型训练数据集中的每个样本的输出项,煤改电用户补贴电量的影响因素可以从机器学习中的监督学习去分析。又因为煤改电用户的用电量属于连续型变量,所以属于监督学习中的回归[6]问题。某市“煤改电”智能服务平台5分钟采集一次数据,采用逐步线性回归的模型对煤改电的用电量进行分析,因为逐步线性回归可以帮助人们理解现有的模型并对该模型做出准确的改进。在构建逐步线性回归模型的时候,可以运行该模型算法找出重要的特征,也可以及时停止对不重要特征的收集,减少数据分析时的内存消耗,提高效率。

逐步线性回归是在线性回归[7-8](Linear Regression)基础上,加入逐步设置。线性回归是利用线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。回归模型用于连续型变量的预测分析,通常当只有一个解析变量的时候,线性回归称为简单线性回归。当有多个解析变量的时候称为多元线性回归。

1.2 逐步线性回归

在SPSS预测工具中,线性回归分为逐步线性回归、进入线性回归、删除线性回归、向前线性回归和向后线性回归,最常用的是进入和逐步2种线性回归方式[9-10]。进入线性回归方式将所有变量引入模型中,做强制线性回归。逐步线性回归是将变量逐个引入模型,每引入一个解释变量后都要进行F检验,并对已经选入的解释变量逐个进行t检验,当后面解释的变量对原来解释的变量不起作用时,将其删除。通过这个反复的过程,选出模型中最优的变量,通过逐步线性回归的方式对用户补贴电量的影响因素进行线性回归分析。

2 指标变量选取和模型建立

2.1 线性回归模型的构建

用户的家庭情况、用户的住房采暖面积、采暖季室外温度和室外湿度、采暖设备的型号类型、采暖设备的数量、用户的行为习惯是研究煤改电用户的用电量影响因素需要考虑的7个因素。通过研究煤改电相关的参考文献和分析某市“煤改电”智能服务平台采集的数据,将7个因素进行分组,这样可以降低无关因素的影响。首先对煤改电用户数据进行数据收集和数据清洗,然后通过对煤改电用电量的影响因素的综合考虑,采用逐步线性回归和定性定量2种分析手段进行分析。

根据上述分析,建立如下指标变量作为基础的分析框架。Y为因变量,表示煤改电用户用电量,Xi(i=1,2)为自变量。

(1)X1表示室外的日平均温度。

(2)X2表示室外的日平均湿度。

采用逐步多元线性回归的分析方法,煤改电用户的用电量和采暖季室外温度、室外湿度因素之间存在的函数关系:Y=f(X1,X2)+随机干扰项。

建立模型如式(1)。

Y=β0+β1X1+β2X2+ε

(1)

式中,β0为常数项,βi是Xi(i=1,2)对应的偏回归系数,ε为误差值。

2.2 性能评估标准

在不同类别分析模型中,可以通过多种测评方式来评价预测值和真实值之间的差距,本文采用R-Squared作为评价指标。

R-Squared评价指标如式(2)—式(4)。

(2)

(3)

(4)

f(x)代表回归模型x的预测值,SSres代表回归值与真实值之间的平方差异(回归差异),SStot代表测试数据真实值的方差(内部差异),R2叫做决定系数,用来衡量方程拟合度,一般来说R2越大拟合度越好。

R-Squared既考量了回归值与真实值的差异,同时也兼顾了问题真实值的变动。它用来衡量模型回归结果的波动可被真实值验证的百分比,也暗示了模型在数值回归方面的能力。

2.3 线性回归模型的处理过程和结果分析

Step1:采取某市某用户于2018年1月2日—1月25日共24天用电量作为数据源进行数据分析,用户信息数据如表1所示。

表1 用户信息数据

Step2:将整理好的数据的Excel导入SPSS中,对数据做线性回归逐步处理。

Step3:将回归分析结果导出,结果如表2所示。

表2 模型汇总

表2模型汇总表中,R2大于0.8说明方程对样本点的拟合效果很好,R2在0.5—0.8之间拟合度可以接受。本次拟合的R2为0.596,在0.5—0.8之间,拟合度可以接受。

为明确样本数据是否完全适合于线性回归模型,本文采用方差分析来进行检验,结果如表3所示。

表3中,F检验代表的是对进行线性回归的所有自变量的回归系数的一个总体检验,主要通过比较两组数据的方差S2。如果sig<0.05,说明至少有一个自变量能够有效预测因变量。本次sig为0.000,小于0.05,说明用电量至少与室外平均温度或室外平均湿度任何一个有关。

表3 ANOVA

使用SPSS预测工具进行常量、平均温度各组样本的多元相关回归分析后,得出回归方程系数相关性分析表,结果如表4所示。

表4 系数

表4中,首先对各个符号进行说明,字符B也就是beta,代表回归系数。非标准化系数主要拟合方程,标准化系数主要用来分析因子的重要性。t值就是对回归系数的t检验的结果,绝对值越大,sig就越小。从经济学的角度,sig<0.05时一般被认为是系数检验显著[13]。本次线性回归的sig为0,小于0.05,说明平均室外温度的系数检验显著。

根据表4系数,拟合方程可以表示为式(5),

Y=-2.102X1+45.224

(5)

在SPSS多元线性逐步回归中,回归系数不显著的变量将被排除,结果如表5所示。

表5 已排除的变量

表5中,平均湿度是已排除变量,说明该变量对回归模型没有显著影响,在构建多元线性回归方程式时不将其考虑进去。逐步线性回归的思想是将多个变量逐个引入模型,以确保每次引入新的变量之前回归方程中只包含主动变量。这是一个反复的过程,直到既没有显著的解释变量选入回归方程,也没有不显著的解释变量从回归方程中剔除为止,以保证最后所得到的解释变量集为最优。

3 定性定量分析

3.1 设备类型因素

Step1:根据某市“煤改电”智能服务平台采集的数据,在定量的前提下,选取2018年1月份不同采暖设备的30个样本,不同设备用电量如表6所示。

表6 不用设备的用电量

Step2:生成设备类型因素折线图,如图1所示。

图1 设备类型因素

空气源热泵取暖所消耗的用户用电量高于蓄热式电暖器和地源热泵设备的取暖所消耗的电量,蓄热式电暖器取暖和地源热泵设备取暖所消耗的用电量都相对较低。

3.2 用户住房面积因素

Step1:首先对数据做简单整理,采用控制变量的方法采集数据,选取样本的规则是选取相同用户有两处住宅的20天用电量数据,选取每户样本的每处住宅人数相同,将其数据整理成如表7所示。

表7 采暖面积对用电量的影响

Step2:生成采暖面积因素折线图,如图2所示。

图2 采暖面积因素

在排除用户的行为习惯等影响因素的条件下,采用孙某臣和张某江两户的用电量数据,他们都拥有两处住宅且住宅面积都不相同。孙某臣两处住宅在3月14日的用电量存在交叉点,张某江两处住宅的用电量除3月14日外存在多处交叉点。由此可以看出,在其他因素相同的条件下,用户的采暖面积对用户的用电量没有影响。

4 总结

(1)采暖季室外湿度对煤改电用户的电量影响很小可以忽略不计,采暖季的室外温度对煤改电用户的电量影响很大,根据公式Y=-2.102X1+45.224可以看出采暖季用户的用电量与室外温度成负相关,随着室外温度的降低,煤改电用户的用电量越大。

(2)煤改电用户用电量受采暖设备的类型影响较大,其中空气源热泵日用电量是蓄热式电暖器和地源热泵2种设备的日用电量的2倍,耗能较多。煤改电用户用电量受用户采暖面积影响较小。

(3)采暖的设备类型对用户的用电量影响很大。一方面政府可以根据分发到不同用户的不同设备类型给与不同的补贴费用;另一方面从节能减排的角度,政府可以大力推广蓄热式电暖器和地源热泵等一些节能的取暖设备。

猜你喜欢
用电量源热泵线性
01 国家能源局:3月份全社会用电量同比增长3.5%
暖通空调设计中地源热泵实践
二阶整线性递归数列的性质及应用
空气源热泵用于天然气加热的经济环保性
空气源热泵供暖期耗电量计算
国家能源局:3月份全社会用电量同比下降4.2%
非齐次线性微分方程的常数变易法
空气源热泵机组设计与维护方法