基于DE-BP神经网络的室内热舒适评价方法①

2020-06-20 07:32翁虎,何勇,梁健

计算机系统应用 2020年6期

翁虎,何勇,梁健

(贵州大学计算机科学与技术学院,贵阳 550025)

引言

现代生活中,人们的工作和生活时间大多数都在室内度过,舒适的室内环境成为了目前人们的迫切需求.通过智能家居来调控室内家具设备,使其改变室内环境属性,进而使室内到达舒适,是目前智能家居一个重要应用和研究方向.室内环境的热舒适度由多个客观和主观因素共同影响,目前评价室内热舒适主要采用丹麦工业大学教授Fanger PO 于1970年提出的PMV-PPD 指标[1],其中预测平均投票值(Predicted Mean Vote,PMV)指对热环境舒适感的高低,预测不满意百分数(Predicted Percentage of Dissatisfied,PPD)指对热环境不满意的预测的百分比人数.热舒适度一般指PMV 公式计算出的热感觉指标,其越接近0 表示环境越接近热中性的舒适区.表1所示为PMV 指标的热感觉分布.

表1 热感觉与PMV 值对应表

近年来,不少学者使用机器学习算法来研究PMV公式,如使基于鸟群算法优化[2]和粒子群优化[3]的BP 神经网络算法实现对PMV 预测,以及基于先验知识和模糊自适应算法构建的PMV 控制模型[4].多数研究集中在对PMV 的拟合回归,本研究从智能家居角度出发,考虑到实际场景中,在模块化和组件化的智能家居中获取的数据并不一定能满足标准PMV 的计算要求,例如存在风速和平均辐射温度不宜获取的情况,导致PMV 计算存在误差甚至错误.

1 算法模型

针对智能家居场景中所面临的问题,本论文研究提出在在裁剪掉部分参量的情况下,引入一些容易获取的气候特征与环境参数,使用差分进化算法优化后的BP 神经网络构建对PMV 的拟合模型,实现在一定误差范围内对PMV 的有效计算,其算法模型如图1.

图1 DE-BP 算法模型图

1.1 PMV 公式

本文研究所拟合的PMV 计算公式如式(1)所示,式(2)～式(5)为式(1)中部分参数的计算公式,表2为公式中参数的含义解释.PMV 计算过程较为繁杂,是一个多元非线性函数,分析后可知PMV 计算实际需要的参数有以下7 个:基础代谢率M、额外活动机械功W、平均辐射温度、空气温度ta、服装热阻Icl、相对风速va和相对湿度hr.

对于上述需要获取的客观参数中,在智能家居领域内空气温度和相对湿度容易采集,有很多常用温度湿度传感器能做到;服装热阻和新陈代谢率若无法准确获取,则一般使用正常成年人的指标和经验值计算;人体活动所做的功采集较为困难,一般研究中都以静坐为参考分析;平均辐射温度代表房屋本及其装饰物给人体带来的温度辐射作用,平均辐射温度的测量较为复杂和困难,但研究表明[5],在多数情况下可用空气温度代替平均辐射温度,其误差可忽略不计;风速的测量较为困难,准确检测室内人体附近的空气流速需要昂贵复杂的设备,在智能家居中不经济.风速和平均辐射温度的测量困难与不准确性,在一定程度上导致了热舒适度测量的客观不确定性[6].因此论文提出的规避不易测量的参量来拟合PMV 公式的计算具有一定实际意义.

表2 PMV 公式参数解释

1.2 数据准备

本研究使用的数据集是ASHRAE 全球热舒适数据库[7],这是由加州大学伯克利分校收集全球上百篇论文的实际实验数据整理出的数据集.对于数据集中的样本首先要进行数据清洗,根据常识和具体情况清洗样本中不正常的数据,如存在违反常识的数据:56 m/s的室内风速.其次,数据集是由许多世界各地的学者实际测量的,其结果可能存在误差,因此需要使用标准公式重新计算样本的PMV 值,使用其中误差较小的样本.论文模型使用的数据特征不仅包含了PMV 公式中的空气温度、相对湿度、衣服热阻和新城代谢率等连续特征外,还包含了气候类型、房间类型、月平均气温和季节等离散特征.对样本中的离散特征进行独热编码(one-hoting encoding),将4 个离散特征编码成了25 列的01 矩阵,这样的转换使其能参与神经网络的运算,与其他4 个连续特征组成了29 维的输入.为了更好的进行神经网训练,因此对连续特征进行归一化处理,归一化公式如下所示:

1.3 BP 神经网络

BP 神经网络是采用误差反向传播的神经网络,一般由输入层,隐藏层和输出层3 部分构成,每层由多个神经元感知器组成.每层之间通过激活函数来激活其神经元是否参与运算和计算权值,一般层与层之间通过全连接来进行信息传递.图2是论文的神经网络拓扑结构示意图.

图2所示神经网络模型结构中,wi表示第i层总的权值矩阵,加上下标j定位到单个神经元.bi,j是神经元节点的阈值,x表示神经网络的输入.设f为激活函数,则任意一个神经元的输出ai,j可表示为:

图2 神经网络拓扑结构图

特别地,第一层的输入是模型参量x和权值w1的积.网络还需要输入PMV 的实际值pmv,用来和预测值PMV_P计算得到误差,然后将误差反向传播到所有节点,以计算节点各个参数的梯度.设模型的损失函数为L(x,θ):

其中,φ(xi,θ)表示神经网络,其中的参数θ是训练中优化更新的权值和阈值.梯度指函数L(x,θ)对θ的偏导,记为 ∇θ,设神经网络的学习率为η,则误差反向传播更新的参数θt+1可以表示为:

BELLA将40焦耳的能量（相当于相机闪光能量的好几倍）装入仅仅持续40飞秒的红外脉冲中，这个时间比蜜蜂拍一下翅膀还要快1万亿倍。对于这种激光脉冲如果击中一个人的话会发生什么情况，BELLA主管维姆·利曼斯（Wim Leemans）不愿意进行任何猜测，但是可以肯定地说，他会受到严重伤害，甚至会死亡。

1.4 差分进化算法

差分进化算法是在其他进化算法的基础上提出的群体启发式搜索算法[8],由于其简单性和有效性被广泛应用.DE 算法步骤和其他进化算法类似,但部分操作有所差异.其优化BP 神经的主要步骤如下:

(1)初始化种群:将神经网络的初始化后的权值和阈值以浮点数形式编码一个D维矩阵的个体,初始化N 个个体形成种群.根据式(8),将1/L(x,θ)作为适应度函数f,因为误差越小说明个体越好,适应度也应越大.

(2)变异:变异操作通过差分策略来实现.常见的差分策略是随机选取种群中两个不同的个体xr2和xr3,将其向量差用变异因子F缩放后与待变异个体xr1合成待变异个体.j代表个体的某个基因,t表示某一代种群.

(3)交叉:根据交叉概率CR,从种群中随机选择一个非待变异个体与待变异个体和进行交叉,得到待选择个体.

(4)选择:计算个体的适应度,根据适应度大小来决定选择变异交叉后的个体还是保留原来的个体.

种群进化迭代t代后选择其中最大适应度最大的个体作为DE 算法的最优解,解码后得到权值和阈值矩阵,将其赋值给神经网络.

2 模型搭建与训练

2.1 模型搭建与优化

本文研究搭建的模型是在PMV 公式忽略风速和平均辐射温度,引入气候类型,房间类型,平均月气温和季节等离散特征构建对于PMV 公式的拟合,实现在新条件下对室内热舒适的评估.传统的BP 神经网络训练存在收敛慢和下降难,易陷入局部最优的情况,本研究采取随机梯度下降(Stochastic Gradient Descent,SGD)算法,并在其之上加入优化方法优化BP 神经网络训练过程,实现训练的加速收敛和更优结果.

(1)模型使用动量法优化SGD 算法,动量法是当每次训练的梯度方向与上一次梯度方向相同时会加速下降[9],在一定程度上可以避免陷入局部最优,能更快地收敛到较优结果.设动量参数为α,根据式(9)可以把SGD 算法的优化过程表示如下:

Vdθ表示一阶动量,模型训练设定α的为0.9,意味着梯度的下降速度是原来的10 倍.

(2)神经网络存在过拟合的问题,考虑到具体训练过程,本研究在模型训练中加入L2 正则化,对训练施加惩罚,过程可以表示为在L(x,θ)的每次计算中增加误差,设λ为正则化系数,‖w‖2为参数向量的L2 范式,公式表示为:

正则化目的在于对于训练参数的衰减,降低对于训练样本的过度依赖,提高泛化性能.

(3)对于每层的输出结果进行批量标准化.正常的数据通过一层隐藏层后会变成新的分布,为了实现有效的特征学习,保证每一层的输入是相同分布,因此使用仿射变换后的标准化[10]操作处理每层的输出数据,即给标准化函数增加仿射参数β和γ,设μ表示样本均值,δ表示样本方差,增加一个极小数ε防止分母为零,则形成一个动态变化的数据标准化层:

在隐藏层中间加入上述的标准化层,能有效加快网络的收敛速度.

2.2 模型训练

差分进化算法的迭代设定了种群大小50 个,最多进化200 代,变异因子0.8,交叉概率0.5.BP 神经网络隐藏层少了难以对过多维度的的数据特征进行学习训练,因此增大到了4 个隐藏层.学习率通过经验法得出,过小会导致收敛速度慢,而过大会导致下降的幅度太大,跳过全局最优值[11];隐藏层神经元个数根据经验公式和模型实际训练进行了调整,设定为200 到300 个之间训练效果好,神经元太多会降低收敛速度,太少学习效果弱.具体参数设定如表3所示.

表3 神经网络参数设定

图3为神经网络训练过程中误差下降图,可以看出在200 次的训练中,论文设计模型在训练中迅速且平稳地收敛到一个较低值.

3 结论与分析

为验证模型引入离散变量对PMV 拟合上的有效性,将训练好的模型与没有加入离散变量的模型和原PMV 模型作对比,主要对比的参数是均方误差和R2回归决定系数.原PMV 模型的条件中风速采用经验值0.1 m/s,平均辐射温度用空气温度代替.测试样本共8927 条,测试主要比较均方误差和R2决定系数以及最大绝对误差.均方误差越低表示模型测试平均误差越小,R2越接近1 表面模型回归效果越好,最大绝对误差代表了模型拟合的误差范围.表4为实验结果对比.

图3 神经网络损失下降图

表4 模型测试结果对比表

从上述的结果分析可以看出,论文提出弱化输入参数,并引入一些离散特征参数后的模型比无离散变量的BP 神经网络模型和原来的PMV 模型具有更好的回归效果和误差表现.通过比较离散变量的是否引入可以发现其对模型的数据拟合存在一定的影响,证明论文引入的环境和气候参量具有有效性.

研究使用神经网络构建的模型可适用于多种条件下的PMV 检测,对于增强和扩展智能家居系统感知部分的能力具有一定可行性.本文研究从数值上忽略了风速和平均辐射温度的影响,并未否定实际中这两者对室内热舒适的影响.模型的测试数据也存在着绝对误差较大的样例,其中不排除数据集样本的真实误差.

4 总结与展望

本文实验的结果表明,在放弃风速和平均辐射温度,并引入一些离散特征的情况下,我们搭建的模型对于PMV 具有良好的拟合效果和泛化性能,对PMV 的计算可以起到替代作用,也表明了房间类型和季节等的离散因素对室内热舒适具有一定影响.在可以预见的未来里,使用神经网络去研究室内热舒适的评价,可以更深层次地分析环境因素与热舒适直接的关联程度,更精确的建立热舒适评价模型.