马笑笑+文海珍+邱辰禹
【摘 要】气温对我们日常的生产生活有着举足轻重的作用,同时也对城市规划有着重要的影响。尤其近些年全球气候变暖,造成了经济方面的损失,对人类生活造成了影响。我们需要了解如何应对温室效应,这就使得对气温的研究更加重要。我国地域广阔,气温复杂多变。对主要城市进行气温研究以此来观测全国气温情况是十分必要的。本文的研究对象是全国29个主要城市全年各月份的气温。首先对29个城市进行聚类分析,分析聚类结果;再采用主成分分析,得到两个主成分代替之前的十二个自变量实现降维,并按主成分得分對各城市进行分析;最后进行判别分析,得出判别函数。
【关键词】气温;聚类分析;主成分分析;判别分析;R
一、引言
近些年温室效应出现,各地气温较以往普遍升高。研究气温的特征,可以对农业生产、人类出行与城市规划等起着指导性的作用。同时对主要城市的气温研究,可以映射出全国各地区的气温情况,从而为应对气候变暖提供有利信息。
二、模型建立
(一)符号说明
x1到x12分别表示1-12月份的气温。
(二)动态聚类分析(k均值法)
其基本步骤是:
(1)选择k个样品作为初始凝聚点,或者将所有样品分为k个初始类,然后将这k个类的重心(均值)作为初始凝聚点;
(2)对所有的样品逐个归类,将每个样品归入凝聚点离它最近的那个类(通常采用欧式距离),该类的凝聚点更新为这一类目前的均值,直至所有样品都归了类;
(3)重复步骤(2),直至所有的样品都不能再分配为止。
聚类结果如下,将29个城市分为六组:
第Ⅰ组:北京、石家庄、济南、郑州、西安(泾河)
第Ⅱ组:上海、南京、杭州、合肥、武汉、长沙、成都(温江)。
第Ⅲ组:太原、呼和浩特、沈阳、长春、哈尔滨、拉萨、兰州(皋兰)、西宁、银川。
第Ⅳ组:贵阳、昆明。
第Ⅴ组:广州、南宁、海口。
第Ⅵ组:福州、南昌、重庆。
(三)主成分分析
在R中用主成分分析法求得各主成分的累积贡献率,得到碎石图。
从碎石图中可以看出,第二个主成分开始出现拐点,意味着从第三个特征值开始特征值的变化开始明显变小;且由累积贡献率可知,前两个主成分的累积贡献率已达到97%。因此只取前两个主成分。
(1)载荷分析
得到的方程模型为:
y1=-0.293x1-0.294x2-0.293x3-0.306x4-0.302x5-0.284x6-0.235x7-0.251x8-
0.301x9-0.308x10-0.290x11-0.297x12 (2.3.1)
y2=-0.274x1-0.278x2-0.253x3+0.299x6+0.544x7+0.482x8+0.152x9-0.273
x11-0.238x12 (2.3.2)
第一个主成分在所有原始变量上都有近似相等的负载荷,因此可取第一主成分为综合气温成分。第一主成分较大时,表明各变量(即各月份)相对其他地区普遍气温低;反之,较高;
第二个主成分在一、二、三月和十一月、十二月有近似相等的负载荷,在六月到八月有近似相等的正载荷(在九月上的载荷较小,可忽略),且正负载荷绝对值也近似相等,因此可取第二主成分为全年气温变化成分。第二主成分较大时,倾向于此城市全年气温变化幅度较大,即六月到八月气温较高,而一到三月以及十一、十二月气温较低。
(2)主成分得分
根据各个城市所对应的主成分,发现纬度较高,气温偏低的城市第一主成分得分较高,如呼和浩特等;纬度较低,气温偏高的城市第一主成分得分较低,如海口等。且从南到北各城市的第一主成分得分有逐渐增加的趋势。
全年温差大的城市第二主成分得分较高,如北京、哈尔滨等;温差小的城市第二主成分得分较低,如四季如春的昆明,全年气温普遍偏高的海口等。
(四)判别分析(Fisher判别)
判别函数建立:
以下假设各组的协方差矩阵相同。利用R得到第一个判别函数的贡献率为0.7972,第二个判别函数的贡献率为0.1346,前两个判别函数的累积贡献率已达到0.9以上,故取前两个判别函数。
第一判别函数:
z1=0.0190x1+0.0428x2+0.0225x3+0.0295x5+0.1309x6+0.2335x7+0.0315x8
+0.1264x9+0.1233x10+0.0312x11+0.0196x12 (2.4.1)
第二判别函数:
z2=0.0441x1+0.0333x2+0.0304x3+0.0651x4+0.0137x5-0.0777x6-0.2051x7
-0.0749x8-0.0598x9+0.0383x10+0.0427x11+0.0358x12 (2.4.2)
从第一判别函数中可以看出,x4在决定某一城市应归属的组别中作用很小,可忽略;x6,x7,x9,x10在决定某一城市应归属的组别中起着较大的决定作用。
在第二判别函数中,x6,x7,x8,x9的系数为负;x7的系数的绝对值最大,即判别应归属的组别时,七月份的气温所起作用最大。
三、小结
通过以上分析,我们对全国主要城市的气温有了一个概括的认识,气温是生产生活中重要的一部分,对其特征进行研究是十分必要的,一方面可以通过研究采取措施避免一些经济损失以及为城市规划提供指导建议,另一方面也对人们生活工作提供指导,如可根据不同城市的气温特征选择自己喜欢的城市旅游或居住。
参考文献:
[1]何晓群.多元统计分析[M].北京:中国人民大学出版社,2004
[2]高惠璇.应用多元统计分析[M].北京:北京大学出版社,2005
[3]方开泰.实用多元统计分析[M].上海:华东师范大学出版社,1989