闫宇祺
建筑耗能是我国总耗能中占比最大的一部分,对其进行规律验证与预测具有非常重要的意义。提出了一种基于门控循环单元(Gated Recurrent Unit, GRU)神经网络预测建筑耗能的方法,充分挖掘数据中的深层特征关系。将采集到的原始数据输入到输入层,对数据进行预处理。利用DGRU层对特征信息进行提取,进而实现序列分析。通过序列信息和回归层获得预测结果。为验证方法的有效性,采用BGD2(Building Data Genome 2)数据集进行仿真验证,结果证明此方法可以很好地预测建筑耗能。
在全球资源紧缺和环境日益恶化的情况下,节约能源对于各个国家显得非常重要,尤其是我国。我国是全球最大的能源消耗国,其中建筑耗能在我国占据了能源消耗的首位。同时,随着我国的不断发展,能源短缺的问题也慢慢凸显出来,这成为了制约我国经济发展的重要因素。根据清华大学发布的《中国建筑节能发展研究报告2020》统计显示,随着我国居民的生活水平逐渐提升,国民对建筑用能也会变得多样化。这导致了建筑耗能在总耗能中的比重逐年上涨。为了降低不必要的能耗,进而达到节约能源的目的。对占比最大的建筑耗能进行监测并预测,进而实施合理的决策和措施是一种提高能源效率的重要途径。
建筑耗能预测是从历史耗能数据中推断出未来的耗能情况。根据现有文献对这种研究方进行统计分析,建筑耗能预测方法主要三种方法:物理模型方法、数据驱动方法以及混合模型方法。物理模型也叫白箱模型,是利用物理形式的方程对建筑能量的变化进行描述,进而实现建筑耗能的表征。数据驱动的方法是利用监测到的历史数据,并使用时间序列进行统计分析或者通过机器学习的方法进而达到建筑能耗预测的目的,这种方法也被称为是黑箱模型。混合模型的方法是结合了数据驱动方法和物理模型方法的优点进而产生的预测方法。因此,也被称为是灰箱模型。以上三种方法中,由于数据驱动的方法不受一些专业知识的限制受到了研究者的青睐。例如,周芮锦等人利用自回归移动平均(ARMA)时序模型对上海某办公建筑进行逐月能耗预测,但是这种方法只能对稳定数据进行预测,导致这种方法的预测误差较大。Neto等人分析了ANN模型,这种模型都显示了很高的预测精度,但是,这种方法存在一种缺陷,那就是不易收敛,易陷入局部最优。Zhao和Magoulès利用相关系数和回归梯度的方法减少了SVM训练的变量,但这种方法也同时降低了预测精度。目前,LSTM和GRU受到了研究学者的青睐,并被广泛地应用,尤其是在文本生成、语音合成和语音识别。GRU是LSTM的特殊变体,相比于LSTM来说,它的张量运算更少,因此,运算速度更快。除此之外,GRU有更加灵活的隐藏单元数量以及工作方式,在预测的场景中表现与LSTM不相上下。因此,对比以上研究方法,本文提出一种基于GRU神经网络预测建筑耗能的方法。
在前人的研究中,GRU模型被广泛证明可以学习输入数据的深层特征并获得很好的预测效果。本文将GRU模型作为深层网络结构的基础构建块,采用多层堆叠GRU网络(DGRU),深层网络架构具有强大的表示能力,可以在不同的时间尺度上学习原始数据中的隐藏特征和高级表示。本文提出的预测网络架构如图1所示。首先,将原始的耗能信息输入到网络的输入层,对数据进行格式定义;然后,连接输入层与DGRU层,旨在对原始耗能信息进行序列建模分析;最后,将分析出的特征输入到全连接层,并通过回归层提供耗能的预测结果,即预测网络的输出。
图1 网络预测模型
为了验证本文所提方法对于耗能预测的有效性,本文使用真实耗能数据进行预测实验。实验数据来自BGD2数据集,该数据集包括1636栋建筑的众多时序数据和气象数据,数据范围为两年(2016年和2017年)。这些数据是从北美和欧洲的19个地点采集。本文采用BGD2数据集中的空气温度数据进行方法验证,BGD2数据集中2016年空气温度数据如图2所示,数据集包含了366天*24小时的空气温度。为充分利用该数据来验证本文提出方法的可靠性。本文将数据的90%作为提出方法的训练数据,将剩下的10%数据作为网络的测试数据。
图2 BGD2空气温度数据集
绝对平均误差(MAE)和均方根误差(RMSE)被常常用作方法预测结果的评价指标。因此,本文利用MAE和RMSE作为预测方法的评估指标。在预测结果中,如果一个模型获得预测结果的MAE和RMSE值越小,则表示该模型的预测精度越预测高。
在训练期间,本文采用最小批量4的优化器Adam,通过更新网络权重和降低损失函数的偏差。在本文所提出的预测方法中,DGRU的隐藏层数和隐藏单元个数是两个重要的参数。因此,本文利用每天温度的有效值作为监测数据,对在不同隐藏层层数和不同隐藏层单元个数下的有效值进行预测并计算实际值与预测值的RMSE值,进而通过RMSE值大小寻找出最优的两个参数。但在这之前需要确定网络参数,本文确定的网络参数如表1所示。
表1 网络参数
为验证不同隐藏层数和不同单元数对预测结果的影响,本文分别使用单层GRU网络、二层至五层DGRU网络进行对比试验以选择最适合的网络层数。本文对每组实验重复十次,取他们的平均值作为这组预测效果,将不同组的预测出效果进行对比,实验结果如图3(a)所示。从图中可以看出,当DGRU的隐藏层层数为4时,网络预测结果获得了最低的RMSE值2.2992,因此,本文选择4层DGRU作为预测网络。确定隐藏层层数后,我们重复相同的实验步骤以确定隐藏层的单元个数,不同隐藏单元的实验结果如图3(b)所示,隐藏层的单元数为100时,预测结果获得了最好的预测结果。因此,本文提出的网络模型中隐藏层数为4,隐藏层的单元数为100。
图3 BGD2空气温度数据集
根据实验部分第二节中的网路配置对数据集进行了多组实验。实验选用除测试集外的实验数据作为训练集,利用本文提出方法的预测结果如图4所示。从图中可以看出,真实值和预测值的升降基本趋势相同,只有在每个小时空气温度相差较大处,预测值与真实值有较小差距,但在其他观测点处都去得了较好的预测结果。以上分析表明本文所提出的模型可以较准确地预测输入与输出之间的非线性关系并获得良好的预测性能。
图4 本文提出方法的预测值与观测值
为了证明本文提出方法的优越性,本文在同样的实验条件下,利用LSTM和BiLSTM预测方法对实验数据进行预测,如图5和图6所示。对比图4和图5的预测结果可以看出,LSTM预测方法的预测效果仅比本文提出的预测方法效果差一点。但是,在实验过程中,与本文提出的方法相比,LSTM预测方法却花费了较长的网络训练时间,且收敛速度慢。因此,本文提出的预测方法优于LSTM预测方法。
图5 LSTM方法的预测值与观测值
图6 BiLSTM方法的预测值与观测值
对比图4和图6的预测结果可以看出,图4的预测的效果在预测效果上远远优于图6的预测效果,且在实验过程中,BiLSTM预测方法的训练时间远长于其他两种预测方法的训练时间。综上所述,本文提出的基于改进门控循环单元的建筑耗能预测方法在运算性能上和预测精度上都优于另外两种预测方法。
为了进一步说明本文提出方法的优越性,表2给出了三种预测方法的评估指标RMSE值。为确保RMSE值的有效性,实验中三种方法的预测点数相同,预测数据相同。
表2 不同方法的RMSE值
本文为解决建筑能耗预测问题,提出一种基于改进GRU的建筑耗能预测方法,该方法将GRU作为网络结构的基础构建块,采用多层堆叠方式,进而使网络架构具有强大的表示能力,可以在不同的时间尺度上挖掘原始数据中的隐藏特征。为验证方法的有效性,本文采用BGD2数据集数据,进行了建筑耗能的预测。实验结果证明,GRU预测网络具有较好的准确性和泛化性能,能够进行建筑耗能的准确预测。