张梦成 刘兆辉 谭洪卫 *
1同济大学机械与能源工程学院
2同济大学绿色建筑及新能源研究中心
3联合国环境规划署- 同济大学环境与可持续发展学院
在校园各项能耗消费中,空调能耗占比迅速增大。据全国高校统计数据显示, 校区平均空调耗电量已达到总耗电量的29.3% [1] 。 校园空调负荷随着建筑用途的不同呈现不同的需求规律, 具有通过错峰管理降低整体能耗的潜力。空调负荷在开学前后阶跃式的增长[2]会给电网带来极大压力, 开展负荷错峰可以保持整体负荷需求的稳定, 降低用电量的波动。
为挖掘错峰潜力, 必须充分整理校园空调负荷需求规律。本篇通过最近最远指标来改进模糊C均值算法 (Fuzzy C-means), 自动确定最佳的聚类数来开展聚类。整理校园空调负荷聚类特征, 结合其他数据挖掘方法研究校园建筑负荷时序规律及空间分布特征, 从而为优化校园空调系统管理和开展节能减排工作提供方法和借鉴。
数据挖掘的首要任务是对数据进行预处理, 以提高数据的准确性、 一致性、 适用性、 权威性, 从而真实反映校园空调负荷需求规律。数据预处理包括数据集成, 数据清洗, 数据变换和数据简化, 在一般的数据挖掘工作中, 数据的预处理会占到80%左右的工作量 [3] 。
各栋建筑物空调负荷需求无法实际测量, 对于校园建筑, 在末端 (如风机盘管) 可控时, 可以认为空调系统供冷满足各楼的实际需要, 因此用空调系统向各楼的实际负荷供应量来代替需求量:
式中:Qi表示各楼空调系统冷量,kW;ts、tr分别表示各楼空调系统供回水温度,℃ ;Li表示各楼空调系统冷冻水流量,m3/ h。
采集的数据受到实际采集条件的制约, 存在诸多错误, 异常和空白数据, 这些数据需要在清洗之后才能使用,在清洗的过程中需要根据负荷物理意义, 尽量多的保留样本, 以便开展分析。
1) 针对错误数据如乱码等, 根据负荷的连续性,通过相邻两时刻的平均值来代替。
2) 针对异常数据即个别过大或过小的数据, 利用负荷的周期性, 将其与同一时刻的其他负荷值平均来加以修正。
3) 针对大段的空白数据, 利用同一星期天数同一时间段的负荷平均值来代替。
采集得到的输入参数中,某 些负荷属性可能与其它数据属性相关性较低,无 法体现整体负荷需求特征,需要舍去以免对分析结果产生干扰。本次建模过程采用相关性分析的方法加以判定。
利用聚类可以归纳各个时刻的负荷需求,从 而得到几类典型特征样本,从 数据层面获得真实的负荷规律。而 FCM[4]算 法是一种基于目标函数的模糊聚类算法,相 较于其他聚类方法运算时间少,克 服了非此即彼的缺点,缺 点是需要预设聚类数目,本 篇通过最近最远得分指标( NFS)进 行改进。
FCM聚类准函数由隶属函数定义:
式中: (xi -m j)是xi到mj之间的欧式距离;c为预定的类别数;mj(j=1,2,…,c)是每一个聚类的中心;uj(xi)是第i个样本关于第j类的隶属度;b是模糊加权幂指数;M是X的模糊C划分矩阵,V是X的聚类中心集合。
FCM 聚类算法的结果就是要获得使得准则函数达到最小的M和V。隶属度和为1:
在式 (3) 条件下求式 (2) 的极小值, 令J(M,V)对mj和uj(x i)偏导数为0, 可得极小值的必要条件为:
FCM算法可以按照以下迭代步骤完成:
①设定聚类数目c和参数b,算法终止阈值ε, 迭代次数t=1, 允许最大迭代数为tmax。
②初始化各个聚类中心mi(随机设定聚类中心,多次运算以避免局部最小值)。
③用当前聚类中心根据式 (5) 计算隶属度函数。
④用当前隶属函数按式 (4) 更新各类聚类中心。
⑤选取合适的矩阵范数, 如果 ||V(i+1)-vi||≤ε或t≥tmax, 停止运算; 否则,t=t+1, 返回步骤③。
代入训练样本进行聚类运算, 当算法收敛时即可以得到各个聚类中心和各个样本的隶属度, 根据隶属度归类各个训练样本。
聚类数目C的确定关系到聚类效果和后续的分析。最佳聚类数C值可以通过最近最远得分指标 [5] 加以确定。NFS指标是基于最近邻一致性和最远邻相异性的原则, 每个样本拥有两个影响评分的因子, 即最近得分因子ns(i)和最远得分因子fs(i):
样本得分s(i)为最近最远得分的均值, 即s(i)=[ns(i)+fs(i)]/2, 平均各个类样本的得分, 得到各类的得分,再平均类得分, 得到类别数为K下的聚类结果的最近最远得分nfs(K):
K即为类别数。聚类结果的得分越高,表示聚类的近邻一致性和远邻相异性越好, 即聚类效果越佳。
在C均值算法的目标函数中, 引入最近最远得分指标, 则可以避免了重复计算聚类结果, 大幅度减少计算量。该算法的思想步骤如下:
图1 改进FCM算法流程图
①设置最大聚类数Cmax和最小聚类数Cmin, 阈值ε, 并 设k=Cmin- 1,最 佳聚类数为C。
②随机初始化隶属度矩阵U(0),t= 0,k增加1。
③更新隶属度矩阵U(t)和聚类中心V(t),t增加1;
④||V(i+1)-vi||>ε, 返 回③。
⑤计算nfs(k),记 下此时聚类数目k,并 设nfsmin=nfs(k)(Cmin) 如果nfs(k)<nfs(k)min, 则nfsmin=nfs(k),C=k。
⑥如果k>Cmax,即C即为最终聚类数目,否 则,返回②。
通过引入最近最远得分改进后的算法可以较好的解决聚类问题,算 法流程图如图1。
案例为江苏省某绿色校园, 该校为建设绿色建筑与节能示范区, 便于统一管理和降低能耗, 在校园内主要用能建筑内实施采用地源热泵可再生能源空调系统。系统供能总建筑面积14.47万m2, 向涵盖行政、 食堂、 教学、 科研、 图书馆、 宿舍在内的9栋建筑供应冷热水。各类建筑使用时间表如表1所示。
表1 各类建筑用能时间表
该系统由4台热泵主机组成,末端负荷侧水循环系统为两管制闭式二次泵水循环系统, 一级泵4台, 二级泵14台。 空调系统设有独立的含分项计量装置在内的自动化监控系统, 和智能电表, 气象观测仪等共同组成校园能源监管平台。本次采集数据包括特定楼的逐时电耗数据, 各类楼输入的冷冻水流量和供回水温度数据。
将采集得到的数据进行预处理,得到连续的2017/8/1-2017/9/25 时间段涵盖六类建筑的共计16128组逐五分钟负荷数据样本,进行归一化处理。将六类建筑负荷样本进行相关性分析, 结果如表2:
表2 各类建筑负荷相关性表
其中,Q x,Q t,Q s,Qj,Q k,Qg分别表示行政楼、图书馆、 食堂、 教育技术中心、 科研楼、 宿舍的历史负荷数据。由表2可见, 科研楼与其他楼的相关性极低, 观察数据和实地调研可知, 由于科研楼在夏季几乎没有使用, 故将其排除。为保证聚类样本时刻的统一性, 需要将采集得到的数据整理成逐时样本。同时, 为体现该时刻不同楼的负荷变化范围, 最大程度挖掘数据的价值, 取每幢楼每小时的负荷平均值、 最大值、 最小值作为该楼该时刻的负荷属性,即每组样本共有 15 个属性, 整理得到样本数1345组。
使用改进后的 FCM 聚类算法对训练样本进行聚类, 从 FCM 算法的物理解释角度出发[6], 参数b取为2,ε取为0.0001,tmax取为100。参照2.3设定C为2至15运行算法得到最优聚类C为 3,其中nfs得分变化趋势如图2:
图2 nfs得分随聚类数的变化趋势
从峰值调控出发, 取各类建筑的逐时最大负荷进行描述统计, 得到各类负荷需求特征如表3。
表3 聚类结果的负荷分布
由表可知,0类宿舍负荷需求较高,其 他类建筑负荷需求较低,总 负荷需求最高,占 样本总数的16.6%。1类各类建筑都有较低负荷需求,总 负荷需求最低,占 比60.7%。2 类建筑行政、图 书馆教学等负荷需求较高,兼有部分食堂和宿舍负荷需求,占 比23.4%。统 计所有负荷样本的峰值比上各楼负荷峰值之和为0.52,即通过错峰使设计峰值负荷降低了 48.0%,因而可以选用输出冷量较小的设备从而降低能耗,节 省费用。
从电量监测模块得到机房总电耗 (机组和冷冻、 冷水泵组电耗)整理成逐时样本。将逐时电耗与逐时总负荷进行回归分析, 结果如图3:
图3 负荷与能耗趋势图
可见负荷 (供冷量) 与冷热源能耗基本呈现线性关系, 负荷与机房能耗比值为5.36。
为观察能耗时序规律的聚类划分情况, 以空调系统冷热源总能耗为 Y 轴, 分别以时序列, 小时周期和星期周期为X轴, 按照聚类结果进行划分, 结果如图 4所示。
图4 (a) 中九月开学后能耗剧增, 结合图4 (c) 中各聚类在一周各天内均有分布, 表明影响能耗时间分布的主要因素是假期和教学周的划分, 对于校园建筑, 并不存在严格的工作日和休息日区分。开学后,以办公教学负荷为主的2类能耗倍增,由于假期行政楼只有部分区域在使用, 而开学后全部投入使用, 同时图书馆等其他建筑也正常运行。以宿舍休息负荷为主的 0类在假期没有需求, 开学后随着学生返校达到高峰, 由于部分学生给末端设备设定温度过高, 导致此时系统总能耗达到假期能耗的2倍。
图4 (b) 中机组在日常运行时, 分别在中午和午夜时刻达到能耗峰值, 在聚类上分别对应于2类和 1类,表明宿舍用冷和办公教学用冷是能耗的主要来源。在日常运行中, 校园建筑通过错开使用时间, 保持负荷错峰来维持能耗的基本稳定, 避免了用能突变对电网造成压力[7]。
图4 聚类结果
此外, 由图 4 可得 1 类有两类能耗特征, 大部分时间段能耗较低或为0,集中于八九月份的非工作时间; 部分时间段能耗较高, 主要集中在九月过渡时间段和午休时间段。根据能耗特征结合表3中1类负荷需求总体较低的特点,可知1类主要对应的是机组关机和较低负荷率下的运行模式, 其中机组能耗较高时的负荷与能耗回归曲线如图5所示, 此时, 负荷与机房能耗比例相比于平均水平降到了3.51,即开学后存在部分时间段, 地源热泵系统在较低的负荷率下运行且系统能效下降 [8] 。根据实地问询和分析可知, 由于在过渡时间段, 人流在办公类建筑和宿舍间移动时未做到及时关闭空调末端设备, 造成机组关机后二次泵组仍在运行,冷量供应逐渐减少但是泵组能耗仍较高, 此外, 地源热泵系统开机存在延迟, 在负荷剧增时, 地埋管瞬间换热能力有限, 也会造成供冷量下降而能耗仍然较高的情况。在午休时刻,人流集中在食堂而其他建筑空调末端仍在运行 [9] , 造成系统能效比较低, 从而使该时刻被归于1类。
图5 1类部分九月份样本负荷与能耗回归
由图4 (b) 可知以办公教学为主的 2类, 以宿舍休息为主的0类和负荷较低的1类在多个时间段上均有交叉分布, 这表明校园错峰管理并不完善, 需要结合同一时间段建筑负荷空间分布情况进行具体分析。提取典型教学周能耗及典型类建筑的负荷, 其小时增长变化聚类情况如图6所示。
由图6 (a) 可知办公时间类的能耗比较稳定, 休息时间类能耗在休息日略有下降。在两类时段的过渡期存在隶属于1类的整体负荷需求较低的样本。由于行政楼、 教育中心、 图书馆相关性较高, 故用行政楼负荷变化情况代替第2聚类。 观察变化曲线可知, 行政楼在中午 (午休 / 用餐) 时间段存在较大负荷需求, 由于食堂一般在工作日中午才运行, 导致存在食堂负荷的样本均被归于办公时间类。宿舍除晚上睡眠外还存在中午午休需求,故宿舍在中午 11:00-14:00也存在负荷,但由于并不是所有学生均有午休需求, 所以一周内大部分存在宿舍负荷的样本也被归于办公时间类。
理论上三类负荷需求与各类建筑使用时间密切关联, 彼此区分。 但其中, 周一行政楼 12:00-13:00由于负荷需求较低, 被归于休息时间类。 周二中午11点, 在办公时间类建筑最大负荷均较高的情况下, 由于关机造成均值负荷较低, 如图7所示, 因而被归于 1类。据了解, 该周周四晚上 7:00 行政楼举行活动, 导致行政楼负荷需求剧增, 使得该时间段也被归于办公时间类。周六和周日中午 10:00-11:00 由于处于机组运行状态过渡时间段,负荷与能耗比例从 2.46 增加到5.14, 所以仍然被归于1类。因此, 应当加强各类建筑管理, 主动引导负荷错峰。
图6 典型教学周能耗及负荷聚类结果
图7 周二中午办公教学楼建筑负荷均值
1) 本文利用最近最远指标改进 FCM 算法, 可以自动确定最佳聚类数, 减少运算次数。聚类结果显示,负荷被聚为办公时间类, 休息时间类和过渡时间段三类, 聚类数目与时间表联系密切, 物理意义清晰, 各聚类样本负荷特征明显,有开展负荷错峰管理的潜力。由于负荷 (供冷量) 与能耗关联性较强, 聚类结果对于分析校园能耗特征和来源有较高的价值, 也为充分利用监测平台数据提供了方法和借鉴。
2) 能耗聚类时序规律显示校园能耗主要受到开学季的影响, 不存在明显的工作日和休息日划分, 同时由于机组的延迟效应和维持无人房间空调开启状态等不好的用冷习惯, 导致处于工作和休息时段之间部分样本能效比较低。在今后的节能管理中,应当加强对校内人员节能减排的宣传工作。同时,校园在运行地源热泵系统时可以考虑利用机组的延迟效应, 在各类建筑使用时段末端提前关机, 利用冷冻水的余冷为建筑继续供冷。在宿舍的使用时段前提前开机,避免突然过高的冷负荷需求对供冷安全造成威胁。
3)能耗在时间序列上存在各聚类时间段交叉的现象, 针对异常的时间段, 可以进行负荷空间分布特征的分析来得到异常值出现的来源。某典型教学周分析结果显示, 同一时间段办公教学用建筑和宿舍休息用建筑负荷需求基本错开, 在过渡时间段存在两者交叉,总负荷需求较小的情况。由于中午人流转移到宿舍和食堂, 同时行政楼等末端设备仍处于开启阶段, 因而该段时间仍被聚类为办公时间类。食堂在周末没有进行供冷, 此外, 宿舍在周末的使用率较低。校园在日常运行时存在负荷错峰现象, 但需要进一步加强引导从而降低能耗并使其保持稳定, 以提高设备使用效率和保持电网稳定。
参考文献
[1] 张春杰.基于 Apriori算法的校园空调的节能研究[D].杭州: 杭州电子科技大学,2014.
[2] 赵亚楠.地源热泵在校园建筑中的适用性分析[D].济南:山东建筑大学,2013.
[3] 刘明吉,王秀峰,黄亚楼.数据挖掘中的数据预处理[J].计算机科学,2000,27(4):54-57.
[4] Bezdek J C.A physical interpretation of FuzzyISODATA[J].Readings in Fuzzy Sets for Intelligent Systems,2007,6(5):387-389.
[5] 冯柳伟,常冬霞,邓勇,等.最近最远得分的聚类性能评价指标[J].智能系统学报,2017,12(1):67-74.
[6] 李国勇,杨丽娟.神经·模糊·预测控制及其 MATLAB实现(第3版)[M].北京:电子工业出版社,2013
[7] 李跃文.冰蓄冷技术在昆明某商业建筑中的应用[J]. 建筑热能通风空调,2013,32(6):94-95.
[8] 于齐东.部分负荷率对热泵系统能耗的影响分析[J].流体机械,2012,40(1):76-80.
[9] 王亮,卢军, 罗轶麟.校园综合建筑空调系统能耗[J].暖通空调,2013,(12):154-159.