潘世英, 丁 鑫, 崔 玥, 吕昊正, 王 童, 马乐志
(1.济南热力集团有限公司, 山东 济南 250014; 2.山东睿冠电能热力有限公司,山东 济南 250101; 3.山东鲁恒节能服务有限公司, 山东 济南 250001)
影响建筑物室内温度的因素有地理位置、供热面积、墙体绝热性能、用户用热习惯、窗墙比、室外温度及太阳辐射量等,这使得求解变得复杂[1]。本文将济南市供热用户作为研究对象,将供热介质流量、供水温度、回水温度、室外温度作为输入参数,利用SPSS MODELER软件建立基于MLP神经网络的室内温度预测模型。室内温度预测模型可实现在一定室外温度和热网运行参数下,预测用户室内温度,为满足用户用热需求、调整热源负荷提供一个有效的分析工具。
① MLP神经网络
MLP多层感知器是一种在单层感知器基础上增加隐藏层而形成的一种多层前馈网络,一般由输入层、隐藏层和输出层构成,每一层全连接到下一层,除了输入层,每个层都是一个带有非线性激活函数的神经元,多层感知器是一种通用的可拟合复杂函数的近似方法[2]。
选定供热介质流量x1、供水温度x2、回水温度x3、室外温度x4作为MLP神经网络的输入参数,室内温度y作为输出参数。MLP神经网络的结构见图1,为提高预测精度,本文将隐含层设定为两层。
图1 MLP神经网络的结构
② SPSS Modeler软件
SPSS Modeler是一款以可视化数据为用户界面的数据挖掘软件,拥有丰富的数据挖掘算法,可提供数据挖掘相关的数据源、数据预处理(包括数据审核、数据抽取、数据转换)、建模、模型评估、模型部署等功能,将需要操作的各个环节表示成若干个节点,数据通过图形化的方式在各个节点流动形成数据流,可以和其他数据库软件比较好地兼容、连接[3]。
① 数据预处理
济南热力集团有限公司已经采集逾3×108组数据,每一组数据均包含供热介质流量、供水温度、回水温度、室外温度。除室外温度来源于中国天气网外,其他数据均来自远程抄表系统、室内温度采集系统。本文选取含有室内温度的40 000组数据(室内温度由室内温度采集系统获得),按照1∶1比例随机分配,分别作为建模数据集和验证分析数据集,进行预测模型建模和室内温度预测效果后评价。
从数据源读取建模数据(随机选取20 000组数据),将供热介质流量、供水温度、回水温度、室外温度设置为输入参数,将室内温度设置为输出参数。然后对数据进行预处理,主要进行缺失值、离群值和极值处理,数据预处理中的参数设置见图2。由预处理结果可知,符合要求的数据为19 358 组。
图2 数据预处理中的参数设置
② 预测模型参数选择
建模数据集分区界面见图3。将建模数据集随机按5∶3∶2分为训练集、测试集、验证集。训练集用于训练预测模型,测试集用于测试已训练好的预测模型的泛化能力,验证集用于验证由不同数量组件组成的预测模型精度。
笔者采用便于提高预测结果准确性的增强方式(boosting)构建预测模型,预测模型构建的目标选项见图4。预测模型可由多个组件构成,笔者选取了由1~10个组件构成的预测模型,对训练完成的10个预测模型分别进行精度验证。
图3 建模数据集分区界面
图4 预测模型构建的目标选项
在预测模型构建的基本选项中(见图5),将神经网络模型设为MLP,两个隐藏层,每个隐藏层的神经元数均为66。在预测模型构建的终止规则中,将每个组件的最大训练时间设定为25 min。
③ 模型预测结果验证
经过训练,并通过模型泛化能力测试后,我们对分别由1~10个组件组成的预测模型进行精度验证。在进行精度验证时,我们采用平均绝对误差作为考核指标。平均绝对误差越小说明预测模型的精度越高,反之精度越低。由精度验证结果可知,当预测模型由10个组件构成时,预测模型的精度最高。因此,我们采用由10个组件构成的预测模型对室内温度进行预测。
图5 预测模型构建的基本选项
笔者从验证分析数据集的20 000组数据中随机抽取了19组,进行预测效果验证。预测效果验证结果显示,预测室内温度与实测室内温度的平均相对误差为-2.27%,基本符合要求。
将济南市供热用户作为研究对象,将供热介质流量、供水温度、回水温度、室外温度作为输入参数,利用SPSS MODELER软件建立基于MLP神经网络的室内温度预测模型,对预测模型的构建及预测效果后评价结果进行分析。预测效果验证结果显示,预测室内温度与实测室内温度的平均相对误差为-2.27%,基本符合要求。