王飞飞 武新乾 卢跃静
(河南科技大学数学与统计学院,河南 洛阳 471023)
目前,伴随着我国经济和城市化的快速发展与人们生活水平的不断提高,建筑业已成为我国国民经济的重要支柱产业[1]。为了顺应当前社会的发展需求,需充分重视绿色建筑。因此,为进行绿色建筑的持续性探索,进行关于建筑因素对环境温度统计关系的研究是有必要的。
本文旨在对建筑中对环境温度因素的影响及其关系进行研究,基于聚类分析、正态性检验,分别建立建筑高度、绿化率与环境温度的一元回归模型。这对于房地产合理开发布局、建筑设计行业科学设计具有一定的借鉴意义和实际应用价值,有利于提高环境质量,从而更好地推进绿色建筑发展。
本文依据河南科技大学建筑学院团队所实地测量的数据进行分析。在聚类分析之前,对所搜集到的建筑高度、密度、绿化率数据进行如下标准化处理,即
(1)
其中yi为xi标准化的值。
由于各因素数据量较大,故考虑将其分类归并,且对典型代表进行更为详细和深入的分析。因此,本文基于K-means聚类方法对三个因素,即建筑高度、密度、绿化率分别聚类。
基于K-means聚类法的中心思想[1],本文采用“手肘法”,通过误差平方和SSE选取K值。这里,
(2)
其中K为聚类数量,p为聚类样品,mk为k个聚类的中心点。
利用Python软件,分别绘制各因素肘部图,如图1、图2、图3。
图1 高度肘部图
图2 密度肘部图
图3 绿化率肘部图
由图1、图2、图3可知,随着K的增加,纵轴呈下降趋势且最终趋于稳定。拐点肘部处的位置所对应的K值,不妨认为是相对最佳的类聚数量值。故对于高度,确定最佳K值为5;对于密度,确定最佳K值为3;对于绿化率,确定最佳K值为4。
利用R软件,求得建筑高度、密度、绿化率的单因素聚类结果,绘制单因素聚类结果图,如图4、图5、图6。
图4 高度单因素聚类分析结果
图5 密度单因素聚类分析结果
图6 绿化率单因素聚类分析结果
利用SAS软件,对因素聚类后对应的因变量数据进行K-S正态性检验(显著性水平为0.05),检验结果如表1。
表1 因变量K-S正态性检验结果
由表1的正态性检验结果可知,第四类高度所对应温度、第三类绿化率所对应温度的K-S正态性检验P值均大于等于显著性水平0.05,故接受原假设,认为其服从正态分布,符合建立一元回归模型的条件。而其他类所对应因变量的K-S正态性检验P值均小于等于显著性水平0.05,故拒绝原假设,认为其不服从正态分布。
综上,分别选取符合建立回归模型条件的第四类高度、第三类绿化率作为自变量,所对应的温度作为因变量,进行回归分析。
令x1表示建筑高度(第四类),x2表示建筑绿化率(第三类),y1表示第四类建筑高度对应的环境温度,y2表示第三类建筑绿化率所对应的环境温度,分别建立建筑高度、绿化率与环境温度的一元回归模型[2]。
以第四类建筑高度为自变量,所对应的环境温度为因变量,利用SPSS软件,对环境温度和建筑高度进行线性、对数、二次、幂、指数等曲线拟合[3]。拟合结果如表2,拟合曲线如图7。
表2 建筑高度与环境温度拟合结果
图7 建筑高度与环境温度拟合曲线
由表2及图7可知,对数曲线拟合效果最为理想。利用SPSS软件,求得其参数估计值,如表3。
表3 建筑高度与环境温度回归系数汇总表
建立的一元非线性回归方程[4]为
y1=2.977lnx1+25.939
(3)
由表2、表3可知,该模型拟合度好,且模型显著。拟合图如图8。
图8 建筑高度与环境温度拟合图
以第三类建筑绿化率为自变量,所对应的环境温度为因变量,利用SPSS软件,对环境温度和建筑绿化率进行线性、对数、二次、三次、幂、指数等曲线拟合。拟合结果如表4,拟合曲线如图9。
由表4及图9可知,三次曲线拟合效果相对较理想。利用SPSS软件,求得其参数估计值,如表5。
图9 建筑绿化率与环境温度拟合曲线
建立的一元非线性回归方程为
(4)
拟合图如图10。
图10 建筑绿化率与环境温度拟合图
由表4、表5可知,所尝试建立的建筑绿化率与环境温度的一元回归模型拟合度不佳,且模型不显著。故本文仅保留有效、拟合度好、模型显著的建筑高度与环境温度的一元非线性回归模型。
表4 建筑绿化率与环境温度拟合结果
表5 建筑绿化率与环境温度回归系数汇总表
由上文可知,建筑高度对环境温度的影响显著,且所建立的一元非线性回归模型是合理的。而建筑密度和建筑绿化率对环境温度的影响呈现的显著性较弱。此研究结果在一定程度上反映建筑高度对环境温度具有极为重要的影响,且建筑高度与环境温度大致呈对数函数关系。在建筑高度达到20m之前,环境温度增长较快;建筑高度在20m以上时,环境温度增长较慢。此研究可用于建筑设计过程的规律分析[5],对于房地产合理开发布局、建筑设计行业科学设计等具有一定的借鉴意义和实际应用价值,以便有效减弱热岛效应,提高环境质量,从而更好地推进绿色建筑发展。