基于多神经网络组合的建筑能耗预测研究

2022-06-14 09:49窦嘉铭马鸿雁
计算机仿真 2022年5期
关键词:权重能耗神经网络

窦嘉铭,马鸿雁*,2,3

(1. 北京建筑大学电气与信息工程学院,北京100044;2. 智慧城市国家级虚拟仿真实验教学中心,北京 100044;3. 建筑大数据智能处理方法研究北京市重点实验室,北京 100044)

1 引言

2019年发布的《2018年中国建筑能耗研究报告》[1]指出,2000年~2016年我国建筑能耗占全国能源消费总量的17%~21%。随着经济快速发展,建筑能耗也呈现一种增长的趋势。通过采集建筑数据,建立建筑物能耗预测模型,进行节能改造逐渐成为当今社会发展的研究热点。

目前,通过对已有建筑物结构进行建模的方法和数据驱动的方法是国内外建筑物能耗预测的两种主流方法。依据建筑物结构进行建模是一种“白箱”的建模方法,优点是不需要收集能耗数据,并且易于解读,但该方法往往会因为实际建筑与模拟建筑在参数设计上存在一定差异,因此得到的结果往往会有较大误差[2]。而数据驱动的方法以其速度快,精度高的优点而备受推崇。人工神经网络(ANN)具有很强的非线性、并行处理能力和鲁棒性,并且不需要建立复杂的数学模型,属于建筑能耗预测中十分常用的一种数据驱动模型。文献[3]统计了在建筑能耗预测领域各类学习算法使用的概率,分别为:回归(26%)、ANN(41%)、SVR(12%)和其它类型(21%),并得出结论,ANN是这四类算法中应用最广泛的。

通过阅读文献[4]-[7],发现国内预测模型的研究主要有以下缺点:①大多数文献使用大量的样本数据才能获得较好的结果,如果只有少量数据,预测精度难以提高。②模型预测结果总体上不够准确。③预测模型影响因素众多,尤其是天气因素,导致输入样本维度较高,使得神经网络收敛速度慢,易陷入局部最优。

此外,国内组合预测模型的研究与国外还有国内组合预测模型的研究与国外还有较大差距,且主要局限在经济领域。在能源电力领域,尤其是在建筑能耗预测模型的构建上,组合预测方法的研究文章较少。

对此,本文一方面使用遗传算法优化BP神经网络,防止其陷入局部最优,另一方面,使用灰色关联度分析法和人体舒适度指数处理天气因素。分别利用等权重法和优势矩阵法,来组合GA-BPNN、RBFN、GRNN三种单一神经网络模型,构建组合预测模型,进一步缩小预测误差。最后,使用某图书馆的实际能耗数据进行验证。

2 三种基本神经网络

2.1 BP神经网络

BP神经网络是一种前馈网络,由输入层、输出层和一个或多个隐含层组合而成,其典型结构如图1所示。每层都有大量的神经元,前一层的神经元都与后一层的神经元加权连接。BP神经网络的训练算法,采用的是误差反向传播的形式,其学习规则为梯度下降法。训练网络的过程就是神经元之间权值调整的过程,每一层神经元的权值和阈值都根据误差反向传播而不断进行调整,直到期望输出与实际输出的均方差(MSE)最小。

图1 BP神经网络的典型结构

BP神经网络在运行中存在局部最优的情况,因此,使用遗传算法优化网络中权值和阈值的选取过程,使网络达到更好的性能。

2.2 RBF神经网络

RBF网络是一种前向的神经网络,结构与BP神经网络类似,它分为输入层,隐藏层和输出层。输入层节点个数等于输入数据类型的个数。隐藏层使用径向对称函数作为隐藏层中的激活函数,将输入向量空间转化成隐含层空间,可以将非线性问题变为线性问题。输出层的节点个数与输出数据的维数一致。

2.3 广义回归神经网络

广义回归神经网络(GRNN)是普通径向基神经网络的一种变形。包括四层,分别是输入层、模式层、求和层和输出层。模式层比较特殊,它的数量是样本的数量。求和层的数量等于输出样本的维度加1。广义回归神经网络的典型结构如图2所示。

图2 广义回归网络的典型结构

3 输入变量的处理

3.1 灰色关联分析

本文选取的天气数据为2018年1月8日~2018年4月7日共90组的数据,其中包括最高温度、最低温度、平均温度、相对湿度、日照时间和风速。被关联的数据是某图书馆在该段时间内的建筑总能耗实测数据。

图3为所选日期内温度和能耗的变化图,上图为温度,下图为建筑能耗。由图3可知,随着时间的推移,温度(最高温度、最低温度、平均温度)局部稍有动荡,但总体不断增长。冬季最低温度较低,建筑内开启暖气、空调制热以保证室内温度;夏季最高温度较高,建筑内部开启空调制冷以降低室内温度,提高人的舒适性。然而,仅仅依靠图3中并不能直观的展示出某一天气因素与建筑物能耗是否有很强的关联性。因此,使用灰色关联度分析法分析六类天气因素对建筑能耗的影响。灰色关联度分析的具体步骤如下:

1)建立原始数据矩阵

xi=(xi(1),xi(2),…,xi(k),…)

(1)

其中,xi(k)表示第i个天气因素在第k天的数据,x0(k)表示第k天的建筑能耗数据。

2)初值化

(2)

3)计算灰色关联度系数ξ0i和灰色关联度γ0i

ξ0i(k)=

图3 所选日期内温度和建筑能耗的变化

灰色关联度γ0i为

(4)

通过上述方法,可以得到这六类天气因素相对于建筑能耗的灰色关联度,如表1所示:

表1 天气因素与建筑能耗之间的灰色关联度

分析表1可得:

1)平均温度与建筑能耗的关联程度最大,日照时间最小。具体排序为:平均温度>最低温度>最高温度>相对湿度>风速>日照时间。

2)在本文所选的日期节点下,最高温度相对于最低温度和平均温度来说,与建筑能耗的关联较低。可以推断,所选数据从季节上属于冬季和春季,此时北京温度较低。冬季的最高温度在一定程度上不能反映冬季寒冷的真实情况。

3)平均温度与建筑能耗的关联度最高,说明温度的平均值作为温度这一研究目标的概括性指标,本身相对于最值指标,更能反映数据变化的趋势。最高温度和最低温度的变化虽然在某种程度上也能反映建筑能耗的趋势,但最值本身来讲存在一定的随机性。

六类天气因素的灰色关联度值均大于0.6,说明此六类天气因素与建筑能耗均有一定的关联,因此均选为模型输入的考虑对象。

3.2 人体舒适度指数

如果单纯的使用天气因素作为神经网络的输入参数也是存在一定的问题:一方面,由于天气因素数量较多,可能使得神经网络输入维度过高,导致其易于陷入局部最优。另一方面,天气因素只能反映有一部分建筑能耗所包含的信息,如果简单的减少天气因素的种类,很可能使得预测精度下降。已有多篇文献证实了人体舒适度在预测模型构建中的应用[9]-[11]。

人体舒适度指数,是对人在环境中的舒适情况进行评价的一种指数。主要通过温度、相对湿度、风速等方面的数据来评价人体的舒适程度。北京地区所对应的人体舒适度指标公式如下[12]:

(5)

式中DIBJ为北京地区人体舒适度指数;t为日平均温度,单位为℃;R为相对湿度,单位为%;V为风速,单位为m/s.

因此,选择人体舒适度指数代替部分天气因素,作为神经网络的输入。再选择一些与预测日同类型的历史数据,弥补一些丢失的信息,以达到在小样本数据下的最好预测效果。

4 组合预测模型

4.1 组合预测模型介绍

目前,建筑能耗预测中,组合模型较为罕见。组合模型是相对于单一模型而言的。由于建筑能耗或电力负荷往往具有非稳定性、随机性和时变性等特点,使得单一模型的预测精度难以把控。且每种单一模型只包含一定量的样本信息,很难全方位地反映变量的变化规律。但单一模型也有其优点,具体表现为计算速度快、可靠性高、涉及的知识少、易于实现等等。

文献[13]曾证明了两种及两种以上的无偏单项预测模型可以组合出优于每个单项模型的结果,进而有效地提升预测准确度。使用多种预测技术的模型,正是将单个模型看作代表不同信息的片段,通过信息的集成来分散单个模型特有的不确定性,并减少总体的不确定性,从而有效的提高预测精度[14]。通过不同的方法对多种预测模型进行组合,利用来自不同预测模型多种角度的信息,可以更加的全面反映系统的变化规律,减少预测结果的随机性。

4.2 组合预测方法

4.2.1 等权重法

等权重法不需要考虑每种预测结果的准确程度,直接赋予每种结果相同的权重。这种方法的优点是计算简单、容易实现,不需要考虑每种预测方法之间的准确程度和关联程度;缺点是,简单的赋予权重难以体现出各种方法的特点,忽略了不同预测方法之间的差别。等权重法在数学上表现为计算各个单一预测方法的算数平均值

(6)

其中,Xi表示第i种预测方法得到的预测结果,X表示组合预测结果。

4.2.2 优势矩阵法

1975年Bunn最早提出优势矩阵法的思想。1987年,Gupta和Wilton经过论证等权重法的缺陷(如出现负权重),提出了一种新的权重确定方法,即优势矩阵法[16]。优势矩阵法是根据每种单一方法在每个样本的预测准确程度来分配权重。以三个单一模型进行组合为例,假设A、B、C是三个单一模型,NA表示在整个样本集里模型A比模型B、模型C预测结果精确的次数,同理,NB表示在整个样本集里模型B比模型A、模型C预测结果精确的次数,NC表示在整个样本集里模型C比模型A、模型B预测结果精确的次数。那么其权重分配公式如下

(7)

则组合预测模型的最终预测结果就是

(8)

其中Xi表示第i种预测方法得到的预测结果,wi表示第i种预测方法的权重,X表示3种方法组合之后的最终预测结果。其实现流程如图4:

图4 优势矩阵法流程图

5 算例分析

使用GA-BP神经网络、RBF神经网络、广义回归神经网络和本文提出的两种组合模型,将90组数据作为模型的训练数据进行训练,预测未来10天的建筑能耗。将预测结果与实测数据进行对比分析。通过比较误差的大小来展现本文所提算法相对于单一算法在建筑物耗预测方面的优越性。

5.1 输入输出变量选取

根据BP神经网络和RBF神经网络、广义回归网络的输入输出要求,选择输入变量和输出变量。输入变量的类型选择如下:日最高温度、日最低温度、日热舒适度、日星期类型、前一周同一类型日热舒适度、前一周同一类型日建筑负荷能耗、前一天建筑负荷能耗、前两天建筑负荷能耗。输出变量的类型为预测日建筑负荷能耗。

5.2 数据归一化与反归一化

为了避免神经网络在预测时因为输入、输出数据的量级差别过大,导致神经网络的误差较大,对数据进行归一化的处理。为了保证模型具有一定的外推性,使预测数据和训练数据在经过数据预处理后的值在0.2~0.8之间,并且经过预测得到的数据还需要进行反归一化处理。归一化的公式如下

(9)

其中,xn表示原始数据,xmin和xmax表示该数据的最小值和最大值,Xn表示归一化后的数据。

5.3 模型参数设置

对BP神经网络参数设置如下:神经网络函数采用newff函数,BP神经网络最大循环次数(epochs)设置为50,训练目标最小误差(goal)为0.00001,网络的学习速率(lr)设置为0.1;隐含层和输入层之间采用tansig函数,隐含层和输出层之间采用purelin函数;训练函数使用trainbr,即采用Bayes规范化法训练函数。构建三层结构的BP神经网络,输入层节点数为 8,输出层节点数为 1。由于神经网络隐含层节点个数的确定并没有统一的方法,但其在实际问题中对预测精度有很大影响。因此采用试凑法确定隐含层节点个数,通过反复比较在不同隐含层节点数下的误差,确定最佳隐含层节点数为13。

遗传算法参数如下:迭代次数10,种群数量10,交叉概率0.4,变异概率0.2。

RBF神经网络参数设置如下:RBF神经网络采用newrb函数,指定的训练均方误差(goal)为0.015,径向基函数扩散速度(spread)为0.35。

广义回归神经网络参数设置如下:采用newgrnn函数,扩散速度(spread)为0.35。

5.4 仿真结果与实测数据对比分析

本文主要使用的评价指标是:

1)平均误差MAE(一次损失函数)[14]

(10)

2)平均百分比误差MAPE

(11)

3)均方误差MSE(二次损失函数)[14]

(12)

4)平均运行时间T

表2所示为六种不同模型的预测情况。可以看出,不同预测方法在预测同一天的建筑能耗时,结果是不同的。如表现欠佳的传统BP神经网络模型,在某种特定的时间或场合预测非常精确[14](如序号1,BP神经网络的预测结果误差最小)。

表3是不同预测模型的评价指标,表4为不同模型中单一模型的权重分配。可以看出:

1)单一模型:广义回归神经网络的预测结果明显比BP神经网络、RBF神经网络好。其MAPE为3.90%,T为0.6s,均好于BP(MAPE为6.64%,T为1.8s)、RBF(MAPE为4.67%,T为0.9s)。GA-BP模型比BP模型虽然在时间上有所延长,但预测精度也有所提高。这符合他人的研究结果[16]。

2)单一模型与组合模型:等权重法和优势矩阵法MAE分别为115.01和134.00,MSE分别为21159和27586。除优势权重法的MSE不如广义回归神经网络外,两种组合模型(等权重法、优势矩阵法)的预测结果都要好于三种单一模型。从运算时间来看,单一模型的时间更短,这是因为组合模型比单一模型有更多的运算量。但在某些情况下,为了得到更小的预测误差,额外的运算时间也是可以接受的。

3)两种组合模型:从时间来看,二者基本一致。从误差来看,组合模型通过组合三种神经网络模型,达到了误差降低的效果。可以看出,在本例中使用等权重法的组合模型误差要比优势矩阵法低。究其原因,是因为三者贡献不一致造成的。在优势矩阵法下,GA-BPNN、RBFNN、GRNN三者权值分别为0.6333、0.2000、0.1667,而等权重法分别为0.3333、0.3333、0.3333(见表4)。说明GA-BPNN的结果主导了优势矩阵法模型的结果,而GA-BPNN模型受遗传算法的影响,容易出现早熟的现象。如表2中序号1的数据,GA-BPNN模型的预测结果相对于测量值有较大偏差,导致了组合模型也产生较大偏差,影响最终的预测结果。此外,Gupta和Wilton[15]的研究结果也表明,对于大样本的数据,优势矩阵法的精确性超过了等权重法。本文研究的是小样本数据的预测模型,因此两种组合模型的精度是可以接受的。

表2 六种建筑能耗预测模型预测结果对比

表3 不同预测模型评价

表4 不同模型权重分配

6 结论

本文介绍了组合预测方法在构建建筑能耗预测模型方面的应用。首先通过灰色关联度分析和人体舒适度指数处理天气因素。将处理后的天气因素,连同历史数据作为三种神经网络模型的输入变量,采用两种不同的组合方法对三种模型的预测结果进行优化。结果表明,组合预测方法在一定程度上克服了传统单一神经网络陷入局部最优的不足,提高了预测的精确度和可靠性。

此外,本文还存在一些不足和改进方法:

1)组合模型存在易受某一单一模型的不良数据影响而导致误差增大的问题,有两种方法解决:一是可以通过增加模型的数量来抵消某一模型不良数据;二是可以通过变权重的方法对不同模型的预测结果进行变权重赋值来解决。

2)能否通过多种预测模型和多种权重方法的双重组合来取得更好的效果也值得研究。

猜你喜欢
权重能耗神经网络
基于神经网络的船舶电力系统故障诊断方法
严寒区太阳能资源分区与集装箱房供暖期能耗
公共建筑年能耗强度影响因素交互作用
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
基于人工智能LSTM循环神经网络的学习成绩预测
MIV-PSO-BP神经网络用户热负荷预测
权重常思“浮名轻”
水下飞起滑翔机
日本先进的“零能耗住宅”
为党督政勤履职 代民行权重担当