唐晓灵,刘嘉敏
(西安建筑科技大学管理学院,陕西西安 710055)
我国碳达峰碳中和工作进入了关键期,2021年4月,习近平总书记在领导人气候峰会上讲到:“支持有条件的地方和重点行业、重点企业率先达峰”[1]。而建筑作为能源消耗和二氧化碳排放的三大领域之一,其所产生的二氧化碳排放在我国碳排放总量的占比中达到了35%~50%[2]。可见,建筑碳排放的有效控制是实现“双碳”目标的重要组成部分,对建筑领域碳排放峰值进行预测是推动生态目标实现的有效路径。
对建筑碳排放的测算范围,学界已有文献并无统一的研究边界。大体上可以分为微观和宏观两大类。其中微观研究以建筑产品全寿命周期碳排放测算为主要内容,考虑了建筑产品从无到有再到无的全过程碳排放[3],胡姗等[4]对我国建筑领域碳排放的核算及王幼松等[5]对某办公楼碳排放的核算均得出建材生产和建筑运行两阶段的碳排放量最大;冯博等[6]、刘菁等[7]基于宏观视角的研究则主要以建筑业或包含生产、建造、运行及拆除等全产业链的碳排放为测算对象。在微观和宏观两个不同视角的研究中,运行阶段的碳排放的占比都在50%左右,因此袁闪闪等[8]、鞠颖等[9]、刘菁等[10]众多学者的研究都围绕建筑领域运行阶段的碳排放展开。
对碳排放预测,学界也已有相当多的方法。渠慎宁等[11]、Wang等[12]、Wu 等[13]和刘菁等[10]分别采用STIRPAT模型、灰色预测模型、LEAP模型和系统动力学模型对碳排放量进行了预测,而后随人工智能的不断发展,越来越多的学者将机器学习方法运用到了能源和碳排放量的预测领域中,Sun等[14]采用LSSVM(最小二乘支持向量机)对工业和居民的CO2排放量进行了预测,Agbulut[15]则用3种机器学习方法:ANN、SVM、DL对土耳其交通领域的能耗和CO2进行了预测,研究结果均表明机器学习在碳排放预测领域表现出了更好的准确性和有效性。在近期的研究中,Huang等[16]使用长短期记忆模型(LSTM)对中国碳排放量进行了预测,胡剑波等[17]基于LSTM模型和ARIMA-BP模型对我国碳排放强度进行了预测,通过模型精度的检验说明了深度学习网络可应用于碳排放量的预测且其预测效果更好。为解决参数无法确定的问题,一些优化算法被应用,段福梅[18]采用粒子群优化算法(PSO)对BP神经网络进行优化,王珂珂等[19]采用鲸鱼优化算法(WOA)优化极限学习机(ELM)中的网络输入权值和隐含层阈值,孙静怡[20]则采用的是布谷鸟搜索算法(GCS),结果表明通过优化算法优化的网络模型在模拟和预测的精度上都有了很大的提升。
综上,本文首先通过对建筑领域碳排放的测算进行较为全面的分析,确定本研究建筑领域碳排放的测算范围,并依据现有数据可得性及质量要求,确定基本测算方法。其次,通过多种优化算法的比对,选用粒子群算法(PSO)优化后的长短期记忆网络对我国建筑领域运行碳排放进行预测。最后,结合情景分析法设置碳排放影响因素的变化量,预测基准、低碳及高碳3种情景下2020—2050年之间我国建筑领域运行阶段的碳排放量。
建筑行业具有能耗大、碳排放量多、投资收益高的特点,具有巨大的碳减排潜力[21]。对建筑全生命周期碳排放的研究中,运行使用阶段的碳排放量最大,达到60%~80%[10],并且该阶段的碳排放量和建筑能耗的关系密切,因此本文将建筑领域运行阶段产生的CO2作为研究对象,文中提及的建筑碳排放也指建筑领域运行阶段的碳排放量。然而建筑碳排放的核算是一大重难点问题,当前国内外认可度较高的3种核算方法为:排放因子法、质量平衡法和实测法3种[22]。对建筑领域运行阶段的研究大都是立足于国家宏观层面的碳排放总量的趋势分析,而排放因子法具有数据易于获得、实用性和适用性高的优点,广泛地应用于碳排放量核算的宏观研究领域中,因此本文选用该方法进行计算,其核算原理为“碳排放量=活动数据×排放因子”。本文针对城镇住宅建筑、城镇公共建筑、农村住宅建筑等不同碳排放源,由国家统计数据获取其能源消耗的活动水平数据,根据相关碳排放因子,将不同活动的能源消耗数据与其所对应的碳排放因子进行相乘并累加即得到建筑碳排放的估算值。具体计算公式如下:
式中CE为建筑碳排放总量,Ei为第i种能源的消耗量,EFi为第i种能源的碳排放因子。
本文以1990—2019年的碳排放历史数据为研究基准,分类能源消耗量由《中国能源统计年鉴》中摘录所得,根据能源平衡表中的各分项按部门进行取舍。将生活消费,分城镇和乡村分项作为住宅建筑能源消耗数据;将批发、零售业和住宿餐饮业分项、其他分项作为公共建筑能源消耗数据,选取原煤、洗精煤、汽油、柴油等12种能源进行统计核算,并按照相关系数对交通能耗进行扣除折算。核算时所用的不同能源碳排放因子由IPCC(联合国政府间气候变化专门委员会)及国家发展和改革委员会公布的相关系数确定。我国1990—2019年的建筑碳排放量的核算结果如表1、图1所示。
表1 1990—2019年我国的建筑碳排放量
表1(续)
图1 我国建筑碳排放量及人均建筑碳排放量
结果显示1990—2019年间我国建筑碳排放总量整体上呈现上升趋势,从1990年的44 659.09 万吨增长至2019年的204 994.54 万吨,年均增长率达5.21%;同样地,整体上我国人均建筑碳排放量也呈现出了逐年上涨趋势。碳排放总量和人均排放量的逐年增加,说明建筑领域具有极高的低碳减排潜力,是我国实现“双碳”目标的重要抓手。因此对建筑碳排放进行核算和峰值预测对建筑领域的碳减排工作和我国“双碳”目标的实现具有重要意义。
长短期记忆网络 (long short term memory networks,LSTM)是Hochreiter等[23]提出的对循环神经网络(RNN)的变体,其具有记忆长短期信息的能力。该模型克服了机器学习中梯度消失和梯度爆炸的问题,对于时间序列数据有良好的处理能力。LSTM的单元结构如图2所示。
图2 LSTM网络的循环单元结构
LSTM模型中,每个神经元中都含有3个基本的单元门,这3个门单元是一种机制,通过乘法操作来确定每个单独的存储单元的状态。根据功能不同,门单元分为输入门it、输出门Ot和遗忘门ft,LSTM网络预测的具体过程如下:
首先计算遗忘门,遗忘门能控制上一个时刻的内部状态需要遗忘多少信息,且通过该门读取ht-1和Xt,ht-1表示上一时刻隐含层的输出,Xt表示当前细胞的输入。当完成后输出的结果被读取后,会得到一个0~1的数值作为输出结果,并以此对每个在细胞状态的Ct-1进行赋值。0表示关闭状态,任何信息不得通过,1表示开放状态,信息全数保留。遗忘门算法如式2
式(2)中,ft为遗忘门的输出值、σ是Sigmoid函数、Wf为遗忘门的权重矩阵、bf为遗忘门的偏置项。
其次是计算输入门,它控制着当前时刻有多少信息需要储存。其包含两部分的内容,首先Sigmoid层会决定哪些信息需要更新;随后tanh层会生成一个新的候选值向量,即备选的用来更新的内容。这两部分结合就能对cell的状态进行更新。输入门算法如式3、式4
输入门会不断刷新细胞状态,将Ct-1更新为Ct,旧状态Ct-1与ft相乘表示需要丢弃的信息,将其与相加就能得到新的候选值,如下:
最后计算输出门,其能基于过滤后的细胞状态进行输出。首先会根据Sigmoid函数确定输出的初始值,其次利用tanh函数计算细胞状态中即将输出的值,最后把这两个结果相乘得到最终的输出值。输出门算法如下:
式(7)tanh为双曲正切激活函数。
粒子群优化算法(particle swarm optimization,PSO)最早是由Kennedy等[24]提出的,是一种用于全局搜索最优值的改进算法。该算法起源于对鸟种群觅食行为中迁徙和聚集的模拟,如果一群鸟在随机觅食,而该区域只有一种食物,那么最高效的觅食策略是在离当前猎物最近的鸟周围搜索。PSO算法以该模型为基础[25],被广泛用于解决各种优化问题。在对优化问题求解时,问题的潜在解对应于搜索空间中某一只鸟的具体位置,通常将这些“鸟”称为粒子(particle)或主体(agent)。每个粒子在空间中不断飞行,拥有自己的速度和位置,在搜寻最佳位置的过程中,首先会随机产生一组解,而空间中的粒子会记忆、追随当前的最优粒子,随即重复上述过程不断迭代,在解空间中搜寻。然而每次迭代的过程并不是完全随机的,PSO具有强大的学习功能,会以上一次找到的较好解为依据,去寻找下一个更优解。
假设在多维搜索空间中,群体中有m个粒子,在第t次迭代中,第i个粒子的位置和速度分别为Xi,t和Vi,t,粒子通过监督两个极值来更新自己:第一个是粒子本身所找到的最好解,叫做个体极值点(用pbest表示),另一个就是目前群体所找到的最优解,称为全局极值点(用gbest表示)。粒子速度与位置更新方程为:
式(8)(9)中:w是惯性系数,取值通常在0.1到0.9之间;C1与C2是学习因子,调节向全局最好粒子和个体最好粒子方向飞行的最大步长,通常令C1=C2=2;rand是[0,1]之间的随机数,λ为速度系数,为=1。
虽然LSTM模型在时间序列数据的处理上具有显著优势,但其参数往往难以确定,不同参数的选取对预测结果存在很大的影响。由于PSO算法具有良好的全局寻优能力和收敛速度,于是引入粒子群算法来对LSTM网络进行优化,改进了LSTM模型初始连接权重和参数获取不够准确的问题,增强了参数选择的客观性,能对碳排放数据做出更加精准的预测。据此本文提出了一种组合模型PSO-LSTM对建筑碳排放量进行预测,思路如下:
(1)首先对建筑碳排放的影响因素进行分析,并利用Pearson相关性分析考察各个影响因素与建筑碳排放的相关性,随即得到碳排放预测模型的输入层数据。
(2)针对LSTM网络参数难以确定的缺陷,提出用PSO算法优化的LSTM网络,对LSTM网络的参数进行寻优,提高模型预测的可靠性和精确度。
(3)采用相关的误差指标及1990—2019年共计30年的数据,并划定训练集和测试集对PSOLSTM模型进行精度检验,同时和传统LSTM模型进行对比。
(4)将影响因素设定低碳、基准和高碳3种情景,根据训练好的模型作为预测的输入数据,对我国未来建筑碳排放量进行外推预测,考察不同情景下的达峰时间,并由此给出相应的建议。
具体预测的流程如图3所示。
图3 PSO-LSTM模型预测流程
由于本文研究的对象是建筑领域的碳排放而非总量碳排放,在各类影响因素中人口、经济和空间这3类会呈现出更强的相关性[26]。因此选取这3类影响因素,共计6个影响因素,即人口总量和城镇化率[22],地区生产总值(GDP)、技术水平和产业结构[10],城镇建筑面积[27]。对应建筑能耗,建筑碳排放指的是建筑中用于采暖、照明、制冷等工具产生的CO2排放,而这些行为的执行者都是人,人口的增加必然会带来各种能源需求总量的增加,从而带来CO2排放量的增加;同样地,城镇化会使得大量人口向城镇聚集,城镇地区有着更丰富的能源需求,因而也会产生更多的CO2排放;产业结构和技术水平从侧面反映了我国的经济水平,这两个因素和我国GDP水平会影响我国城镇居民的能源消费习惯,而能源消费的多少决定了CO2的排放量;此外,建成区面积是能反映建筑规模的指标,其在一定程度上决定了因建筑运行产生的CO2总量。因此选取这6个因素作为影响建筑运行碳排放的影响因素。
对上述6个影响因素的水平进行测度时,用年末常住人口衡量人口总量;用人口城镇化率作为城镇化率;为规避价格的影响,GDP的衡量采用1990年的不变价考虑各个年份的实际GDP;研究与试验发展经费(R&D)是我国科技经费的重要来源,因此采用其投入强度衡量技术水平;产业结构的衡量采用第三产业的增加值占GDP考虑;建筑面积则采用建成区面积衡量。上述的详细数据主要来源于各年的《中国统计年鉴》,各变量描述性统计结果如表2所示。
表2 变量描述性统计
在将这些因素作为输入参数输入粒子群算法改进的LSTM模型时,对各因素进行了相关性分析。利用了Pearson相关性分析,计算出了相关性系数,分析结果如表3所示。结果表明这6个因素的Pearson相关度都很好,除了人口总量,均大于0.9,且在P<0.01的水平下显著。可见,这6个因素与建筑碳排放有着极高的相关度,因此将这个6个因素作为模型的输入层。
表3 影响因素相关性分析
选取我国1990—2014年共25年的建筑运行碳排放数据作为训练样本,2015—2019年共5年的数据作为测试样本。算法实验在 Matlab R2021环境下进行,通过1990年到2014年的25组数据拟合来预测2015年到2019年的建筑碳排放量。由第4小节可知,影响因素与碳排放量之间存在显著的相关性关系,因此模型将选取的6个主要建筑碳排放影响因素作为PSO-LSTM模型的输入参数。为避免输入数据数量级差别较大而产生较大误差,实验中的所有时间序列数据均需要进行归一化处理,按照式(10)进行:为归一化后的值;X为原始值;Xmax和Xmin分别代表各个影响因素序列原始数据的最大值和最小值。
在回归预测领域,BP神经网络已经在实践中得到了多次使用,但作为单一的神经网络,由于缺少反馈结构其并没有考虑历史数据样本的记忆信息;而RNN网络在此基础上进行改进,突破了传统神经网络对忽略时间信息的问题,但依然存在梯度膨胀、梯度爆炸及梯度消失导致的训练困难的问题;LSTM模型又在此基础上进行了改进。因此,在模型的精度的比较中将BP神经网络和LSTM模型作为对照组。PSO-LSTM模型中采用PSO算法对隐含层节点、训练次数和学习率寻优。
将4种算法分别依次运行50次,对所得的预测结果求均值,分别得到训练集1990—2014年和测试集2015—2019年的建筑碳排放量,预测结果如图4所示。
图4 样本历史数据预测结果
为对模型预测效果作出直观评价,本文选取了4种误差指标:MAE(平均绝对误差)、RMSE(均方根误差)、MAPE(平均绝对百分比误差)以及确定系数R2。研究对象的数量等级会对MAE和RMSE的绝对数值产生影响,而MAPE作为百分比误差规避了这种差异。Pao等[28]根据MAPE的大小把预测效果分为:高精度预测(MAPE<10%)、良好预测(10%≤MAPE<20%)、合理预测(20%≤MAPE<50%)和不准确预测(MAPE≥50%)4类。误差指标的计算方法如下:
式(11)至式(14)中:Xi是建筑碳排放量的真实值,是所得的预测值,是碳排放实际值的平均值,n为样本集的个数。MAE、RMSE、MAPE均是越小越好的指标,R2越接近1证明模型拟合效果越好。各模型误差结果如表4及图5所示。
表4 误差指标计算结果
表4(续)
图5 不同模型各误差指标计算结果
通过对3种模型对历史数据的预测效果和模型误差指标的对比,可以看出经过粒子群算法优化后的LSTM模型的预测能力优于BP神经网络和原始的LSTM模型,其对于历史数据呈现出了更好的拟合预测效果;同样地,从误差指标分析,PSO-LSTM各项指标都更优。PSO-LSTM模型的R2为0.932 8,而MAPE仅为3.96%,均是3种模型中最佳的,可见其精确度更高。这也说明粒子群算法可以提升LSTM的预测效果,改进后的LSTM模型能够更好地捕捉数据变化的长期趋势,进而能够进行更加精准的预测,因此以下选用PSO-LSTM模型对建筑碳排放的峰值进行预测。
3.3.1 建筑碳排放影响因素模拟
将以上确定的人口总量、城镇化率等6个影响因素作为研究对象,参考大量的公报及政策文件设定高、中、低3种排放情况,分别对应碳排放高碳模式、基准模式及低碳模式。情景分析的预测年限为2020—2050年,合计31年,由于预测年限较长,为保证预测结果的合理性与科学性,各个影响因素将分别设置3个预测频段:
(1)人口。从1990—2020年间的历史数据来看,我国人口增速呈现大幅放缓趋势,即便是在2016年开放二孩政策实施以来,五年间的年均增速也只有0.28%,而我国每年的出生人口从2017年至今连续四年下降。2021年5月31日,我国三孩生育政策开始实施,该政策将会在一定程度上对我国人口的增长起到一定的刺激。但参考“全面二孩”政策带来的生育势能经验,推测3年~5年内该政策带来的生育势能释放完毕。根据中国人口与发展研究中心预测,中国人口数量在2027年将达到峰值14.17亿人,此后将进入持续的负增长状态,2035年降至14.03 亿人、2050 年降至 13.21 亿人。
(2)GDP。2020年受到新冠肺炎疫情的严重冲击,我国GDP增速降至2.3%,同比增速下降4%。而2021年以来,经济逐步恢复,市场相关机构对我国的GDP增速的预测均在8%左右。我国“十四五”规划和二〇三五年远景目标建议中也明确提出了2035年实现经济总量或人均收入翻一番的目标。据此,方琦等[29]对我国GDP增速做出了2022年增速回落6%,2023—2035年匀速下降的预测。而根据清华大学国情研究院课题组的预测,我国GDP在2031—2035年间的增速为2.84%~5.59%,在2036—2050年间的增速为3.2%~3.95%[30]。
(3)城镇化率。2020年我国人口城镇化率达到63.89%,而世界上发达国家城镇化率均超过80%,并趋于稳定。“十四五”期间我国城镇化率预计年均提高1.03%,较“十三五”时期有所下降。根据中国社科院人口与劳动经济研究所发布的《人口与劳动绿皮书》,我国城镇化发展的增速将在“十四五”期间出现开始放缓的拐点,在2035年后呈现相对稳定的态势,而峰值将大概率出现在75%~80%。
(4)第三产业增加值。根据发达国家经验,当进入发达服务经济社会时,第三产业增加值比重将超过70%[31],胡鞍钢等[32]预测其比重在2035年时将达到65.6%左右,到2050年将进一步上升至70.5%左右。
(5)技术水平。从总量来看,1990年我国的R&D经费投入仅75.49 亿元,而2020年则跃升至24 383.67 亿元,2013年后我国R&D经费投入水平一直位于世界第二;从投入强度上看,1990年仅为0.4%,2002年首次突破1%,2014年首次突破2%,到2018年提升至2.14%,超过欧盟15国的平均水平。根据我国创新驱动第二步的战略目标,2030年我国要跻身创新型国家前列,相应的R&D经费投入强度要达到2.8%。
(6)建筑面积。1990—2020年间我国城市建成区面积每年持续增长, 2011年前,年均增长率为5.99%,2012年开始增长速度有所放缓,年均增长率降至3.07%。随着我国城市化的推进,我国城市规模会进一步扩张,进而使得建成区面积增加。
综上所述,各参数情景设置结果如表5所示。
表5 2021—2025年各参数情景设定
3.3.2 多情景预测结果
在PSO-L STM模型的拟合结果和有效性检验结果良好的前提下对未来31年,即2020年到2050年的数据进行预测,考察这段时间内建筑碳排放量情况、峰值及达峰的年份。依据以上情景预测设定,利用训练好的PSO-LSTM网络分情景逐年对我国建筑碳排放量进行预测,分别得到低碳、基准和高碳3种情景下我国2020—2050年的建筑碳排放量,如图6所示。值得说明的是,采用训练好的PSO-LSTM进行外推预测时,将上一时刻得到的预测结果在网络中进行了更新作为了输入层数据,使得预测的误差产生累计,因而会造成模型精度的下降。
图6 2020—2050年我国建筑碳排放预测结果
预测结果显示,我国未来建筑碳排放量总体呈现出右部平缓的倒“U”型趋势。不同情景下我国建筑碳排放峰值不同,且达峰的时间也有所区别。高碳情境下建筑碳排放将以更高的速度增加且峰值最大为 253 379.468 8 万 t,并且在 2033 年才能达到峰值;基准情景是更加符合社会现实的发展状态,该情境下我国建筑碳排放将在2032年达到239 738.109 4 万 t的峰值,仅建筑领域自身来说,并不能实现“ 双碳”战略中2030年前达峰的目标;而在低碳情境下我国建筑碳排放将在2029年达到峰值,为 226 774.562 5 万 t。分别对比 3 种情景,显然低碳情景是建筑领域实现碳达峰目标的路径,从峰值结果看低碳情景分别比基准和高碳情景的峰值减少了 12 963.546 9 万 t、26 604.906 3 万 t,而从达峰时间则从基准情景的2032年和高碳情景的2033年提前到了2029年,在2030年前达到了峰值且在后续的年份中表现出了较为明显的碳排放的减少趋势。
结合以上关于影响因素的相关性分析可知道本文选取的主要影响因素都会促进建筑碳排放量的增加,但预测建筑碳排放量却出现了峰值,分析其原因是研究期内(1990—2019年)相关因素的规模效应占据主导地位,如城镇化的急速发展带来的城镇扩张使得人口大量在城镇聚集,建筑运行阶段能源消耗总量大;而技术进步前期各方需要投入大量的能源,使得CO2的排放增大。然而随着社会发展水平质量的提高,质量效应开始逐渐显现:城镇化发展到较高水平时,其通过人力资本积累使得城镇居民能源消费习惯发生转变,而技术水平的提高则会催生出一系列绿色节能的低碳建筑,这两种情况都会使得建筑在运行阶段产生的碳排放量降低。结合预测结果不难发现,建筑领域想要在2030年前实现碳达峰的目标,还需采取相应的低碳措施,促进碳减排工作的开展,应在经济社会保持稳定增长的趋势下,通过推动城镇化的高质量发展以及通过技术水平的提高实现建筑领域的清洁生产和节能减排,使得建筑碳排放的尽早达峰,实现社会发展与环境保护的双赢。
(1)主要结论。针对我国建筑碳排放达峰问题,本文根据文本分析将建筑碳排放的影响因素分为人口、经济和空间3类,选定了6个主要影响因素,通过PSO-LSTM网络模型进行预测,得到了如下研究结论:1)1990—2019年我国建筑碳排放总量呈现逐步上升的趋势,从1990年的44 659.09 万t增长至2019年的204 994.54 万t,年均增长率达5.21%。2)在于BP神经网络和LSTM网络的对比中,PSOLSTM模型的预测表现出了更优的预测能力,精度更高,更适用于碳排放这类时间序列数据的预测。3)通过训练好的PSO-LSTM模型对低碳、基准和高碳3种情景的建筑碳排放进行预测,得到3种情况的峰值分别为 226 774.562 5 万 t、239 738.109 4 万 t和 253 379.468 8 万 t;而达峰时间分别为 2029 年、2032年和2033年。
(2)对策建议。基于以上研究结论,为尽早实现我国建筑领域碳排放的达峰,推动影响因素从规模效应到质量效应的转变,提出以下对策建议:第一,重点推进城镇化的高质量发展。城镇化的急速发展是影响建筑碳排放的主要因素,在经济社会保持稳定增长的趋势下,一方面要提高城镇居民建筑内能源消耗的低碳意识,另一方面要完善相关激励政策制度,加强建筑领域低碳高质量发展的推广和应用。第二,重点发展建筑领域的绿色低碳技术与产品。发挥技术进步在建筑领域的能效,如提高建筑产品的节能标准、推广超低能耗建筑的落地实施、积极推动清洁生产技术在建筑领域的实施。通过上述等方面的举措,发挥重点因素的质量效应作用,从而实现建筑领域碳排放的尽早达峰及其碳减排工作的顺利开展。