魏光辉
(新疆塔里木河流域管理局,新疆 库尔勒 841000)
基于主成分与聚类分析的水面蒸发影响因素分类
——以新疆塔中地区为例
魏光辉
(新疆塔里木河流域管理局,新疆 库尔勒841000)
摘要:以新疆塔中气象站2013年逐日气象观测资料为例,采用主成分与聚类分析方法对研究区冰期与非冰期水面蒸发影响因素进行分类与机理阐述.结果表明主成分与聚类分析的水面蒸发影响因素分类结果完全一致,据此认为在不同冰期情况下,温度都是影响水面蒸发的主要因素.
关键词:水面蒸发;水资源配置;主成分分析;聚类分析;塔里木盆地
0引言
陆面蒸散是陆面水量平衡计算的一个重要参数,也是地球水分消耗的主要方式[1].其与地表植被性态、土壤环境及微气象条件等因素密切相关,时空差异性较大.此外,陆面蒸散也是干旱、沙尘暴等气象灾害的诱因之一[2,3],其对区域水资源合理配置[4]、农业灌溉制度制定等也有重要影响[5,6].
目前,国内外学者已对蒸散问题进行了大量研究,并取得了一些卓有成效的工作[7-9].其研究方法主要是根据彭曼法、蒸发皿法、蒸渗计法及卫星遥感等来估算蒸散量.在大尺度、长时间系列情况下一般采用彭曼法来计算[10].当然,也有根据蒸发皿实测数据分析蒸散量的时空变化及其对气候的响应[11].
塔里木盆地位于我国的新疆南疆地区,世界第二大流动沙漠塔克拉玛干沙漠坐落于盆地中心.这里气候干燥、降水稀少,是我国的极端干旱区,当地人类活动主要集中在盆地边缘的零星绿洲内,而地处塔里木盆地腹地的塔中地区,迄今为止有关水面蒸发与气象要素的关系研究鲜见报道.鉴于此,本文利用目前世界唯一深入流动沙漠腹地200 km以上的新疆塔中气象站冰期与非结冰期日水面蒸发气象数据,利用主成分与聚类分析方法,分析各气象要素对水面蒸发的影响,并从机理上对其进行阐述,得到了一些有价值的研究成果.
1资料与方法
1.1研究区概况
塔中地区位于塔克拉玛干沙漠腹地,具有高温干燥、降水稀少、植被稀少、沙源丰富的特点.多年平均气温13.6 ℃,极端最高气温为46.0 ℃,极端最低气温为-25.0 ℃.多年平均降水量25.9 mm,主要集中于春、夏季,约占全年降水量90%左右.年均蒸发量为3 812.3 mm(Φ20小型蒸发皿观测数据),风沙活动频繁,风能资源丰富.
1.2数据资料
本文资料数据来自于中国气象数据共享服务网.选取新疆塔中气象站(39°00′N,83°40′E,海拔高度1 099.3 m)2013年1月至12月的日均气温、日均地表温度、日均水汽压、日均大气压、日均相对湿度、日平均风速、日照时数以及日蒸发量(Φ20小型蒸发皿)等共计12个气象要素,进行研究分析.
1.3主成分分析
主成分分析[12](Principal Component Analysis,简称PCA)为多元统计方法,其利用降维思想,可将多指标数据转化为综合指标数据,并最大限度保留原始数据所蕴含的信息,其原理如下:
(1)假设有n个样本,p项指标,则构建评价矩阵X=(xij)n×p.
(2)为消除评价矩阵的量纲差异性,对数据进行归一化处理:
(1)
(3)计算评价指标间的相关系数R=(rij)n×n,求解特征值λi(i=1,2,…,p),并按大小顺序排序,之后计算特征值λi的对应特征向量ei(i=1,2,…,p),且‖ei‖=1.
1.4聚类分析
聚类分析(ClusterAnalysis,简称CA)属于多变量统计分析方法,它能够将某批次样本数据按照自身性质,根据某一评价标准进行自动分类.层次聚类分析法(HierarchicalClusterAnalysisMethods)属于聚类分析的改进方法,其基本思想是:先将样本总体看成一类,之后规定各样本间的距离和类与类间的距离.初始状态下,各样本自成一类,类间距离与样本距离一致,选择距离最小的一对合并成一个新类,计算新类和其他类的距离,之后反复如此,直至所有样本合为一类[13].
2模型计算与分析
(1)非冰期(4月至10月).选取日均气温(x1,℃)、日最高气温(x2,℃)、日最低气温(x3,℃)、日均地表温度(x4,℃)、日均水汽压(x5,hPa)、日均大气压(x6,hPa)、日均相对湿度(x7,%)、日总云量(x8,成)、日低云量(x9,成)、日均风速(x10,m/s)与日照时数(x11,h)这11类气象因素为分析对象,模型样本数为214组.
(2)冰期(1月、3月、11月及12月).选取日均气温(x1,℃)、日最高气温(x2,℃)、日最低气温(x3,℃)、日均地表温度(x4,℃)、日均水汽压(x5,hPa)、日均大气压(x6,hPa)、日均相对湿度(x7,%)、日总云量(x8,成)、日低云量(x9,成)、日均风速(x10,m/s)与日照时数(x11,h)这11类气象因素为分析对象,模型样本数为151组.
上述各气象因素的日统计值由于篇幅所限,未在此列出.
2.1非冰期水面蒸发分析
(1)主成分分析
根据式(1)对评价样本进行归一化处理,计算得到气象因素的相关系数矩阵(见表1).
由表1的相关系数计算结果可知,除日总云量(x8)、日低云量(x9)与日照时数(x11)这3因素外,其他气象因素与水面蒸发的相关系数均达到了极显著水平.
主成分特征值及累计贡献率(见表2),由表2确定主成分个数为4.
根据确定的主成分个数,采用方差极大正交法得到主成分荷载(见表3).
表1 相关系数矩阵(非冰期)
注: 左下角为相关系数,右上角为显著性;相关系数临界值,a=0.05时,r=0.134 2;a=0.01时,r=0.175 7;表中字母y代表蒸发量.
表2 特征值及累计贡献率(非冰期)
表3 主成分荷载值(非冰期)
由表3可知,第一主成分主要是温度与大气压的综合指标,它包含了日均气温、日最高气温、日最低气温、日均地表温度与日均大气压这五个因素,解释了总变量46.8%的信息;第二主成分主要是云量的综合指标,它解释了总变量21.5%的信息;第三主成分主要是空气湿度指标,它包含了日均水汽压与日均相对湿度这两个因素,解释了总变量11.8%的信息;第四主成分为风速、日照的综合指标,它解释了总变量10%的信息.上述4个主成分包含原始数据指标信息的90.1%(累计贡献率).
对各指标进行KMO检验,其值为0.727 7,Bartlett球形检验的相伴概率远小于显著性水平0.01,故样本适合因子分析.
(2)聚类分析
将选取的11个气象因素数据组成聚类分析的样本矩阵,采用类平均法进行聚类分析.本文采用SPSS13统计软件实现聚类分析,并得到聚类分析谱系图.结果(见图1)(图1中,纵轴中的阿拉伯数字1代表日均气温,2代表日最高气温,3代表日最低气温,4代表日均地表温度,5代表日均水汽压,6代表日均大气压,7代表日均相对湿度,8代表日总云量,9代表日低云量,10代表日均风速,11代表日照时数;横轴表示类之间的平均距离,无量纲).
图1 水面蒸发气象因素聚类(非冰期)
从图1可知,取类间距离d=1.22时,水面蒸发因素可分为两类,但此时有的类间距离太大,所以取d=0.81,分为四类比较合适,即日均气温、日最高气温、日最低气温、日均地表温度与日均大气压这五个气象因素为一类,日均水汽压与日均相对湿度为一类,日总云量与日低云量这两个气象因素为一类,日均风速与日照时数这两个气象因素为一类.
聚类分析将影响水面蒸发的11个气象因素分为4类,这与主成分分析计算结果完全一致.
2.2冰期水面蒸发计算
(1)主成分分析
同理,计算得到各气象因素的相关系数矩阵(见表4).
表4 相关系数矩阵(冰期)
注:左下角为相关系数 ,右上角为显著性 ;相关系数临界值,a=0.05时 ,r=0.160;a=0.01时 ,r=0.209;表中字母 y代表蒸发量因素.
由表4的相关系数计算结果可知,除日低云量(x9)与日照时数(x11)这2因素外,其他气象因素与水面蒸发的相关系数均达到了极显著水平.
主成分特征值及累计贡献率(见表5),由表5最终确定主成分个数为5.
根据确定的主成分个数,采用方差极大正交法求得主成分荷载(见表6).
表5 特征值及累计贡献率(冰期)
表6 主成分荷载(冰期)
由表6可知,第一主成分主要是温度、水汽压与风速的综合指标,它包含了日均气温、日最高气温、日最低气温、日均地表温度、日均水汽压与日均风速这6个因素,解释了总变量52.6%的信息;第二主成分主要是大气压与湿度的综合指标,它解释了总变量17.1%的信息;第三主成分主要是太阳辐射指标,它包含了日照时数这个因素,解释了总变量9.5%的信息;第四主成分主要是总云量指标,它解释了总变量6.8%的信息;第五主成分主要是低云量的描述指标,它解释了总变量5.4%的信息.这5个主成分共计包含原始数据指标信息的91.4%(累计贡献率).
对各指标进行KMO检验,其值为0.775 9,Bartlett球形检验的相伴概率远小于显著性水平0.01,故适合进行因子分析.
(2)聚类分析
同理,采用类平均法进行冰期水面蒸发聚类分析,结果(见图2).图2中各指标含义同图1.
图2 影响水面蒸发的气象因素聚类(冰期)
从图2可以看出,取类间距离d=4.55时,水面蒸发因素可分为两类,但此时有的类间距离太大,所以取d=3.0,分为五类比较合适,即日均气温、日最高气温、日最低气温、日均地表温度、日均水汽压与日均风速这6个气象因素为一类,日均大气压与日均相对湿度这两个气象因素为一类,日总云量与日低云量这2个气象因素各为一类,日照时数为一类.
聚类分析结果将影响水面蒸发的11种气象要素分为5大类,这同样与主成分分析结果一致,充分说明了主成分分析的正确性,也实现了方法的检验.
2.3水面蒸发影响因素机理分析
由以上分析可知:在非冰期,水面蒸发主要受温度因素(包括日均气温、日最高气温、日最低气温、日均地表温度4项指标,下同)、大气压与云量(总云量与日低云量)这3因素的影响;在冰期,主要受温度因素、日均水汽压与日均风速这三因素的影响.两种情况下,温度因素都是影响水面蒸发的主要因素,这与文献[14]的研究一致.
由于温度决定着水体表面的水汽扩散速度;云量的多少直接影响着水体接收太阳辐射的大小及大气温度的高低,云量大则水面蒸发弱;水体表面的水汽压越大,则水汽扩散交换速率就会越小,蒸发则弱;风速大,水体表面干湿空气交换就会越快,水面蒸发就会越大[15].
3结论
本文以新疆塔中气象站观测数据为例,将主成分与聚类分析应用于冰期与非冰期水面蒸发影响因素分类研究中,主要取得了以下结论:
(1)主成分分析中:非冰期所提取的4个主成分包含原有11个气象数据的90.1%信息,满足分析精度要求;冰期提取的5个主成分包含原有11个气象指标的91.4%信息,同样满足分析精度要求.
(2)在聚类分析中:非冰期各气象要素对水面蒸发的影响可以归并为4类:日均气温、日最高气温、日最低气温、日均地表温度与日均大气压这五个气象因素为一类,日均水汽压与日均相对湿度这两个气象因素为一类,日总云量与日低云量这两个气象因素为一类,日均风速与日照时数这两个气象因素为一类;冰期各气象要素对水面蒸发的影响可以归并为5类,即日均气温、日最高气温、日最低气温、日均地表温度、日均水汽压与日均风速这六个气象因素为一类,日均大气压与日均相对湿度这两个气象因素为一类,日总云量为一类,日低云量为一类,日照时数为一类.
(3)不同冰期情况下,温度因素都是影响水面蒸发的主要因素.
参考文献:
[1]闫桂霞,李登华.1961—2006年我国水面蒸发时空变化特征分析[J].水电能源科学,2015(10):1-5.
[2]唐凯,姜海波,何新林.干旱区水面蒸发特性及消减技术研究[J].水资源与水工程学报,2014(6):68-71.
[3]赵晓松,李梅,王仕刚.鄱阳湖夏季水面蒸发与蒸发皿蒸发的比较[J].湖泊科学,2015(2):343-351.
[4]仇宝云,王斐.水面蒸发对南水北调江苏段调水效率的影响[J].排灌机械工程学报,2011(3):219-223.
[5]葛建坤,李佳,罗金耀.基于水面蒸发法的日光温室膜下滴灌番茄需水量计算模型[J].灌溉排水学报,2015(8):53-56.
[6]UZOKWEPAULINE,李新强,高阳.不同灌水方式下基于水面蒸发量的夏玉米灌溉试验研究[J].灌溉排水学报,2013(3):59-62.
[7]童新,刘廷玺,杨大文.半干旱沙地-草甸区水面蒸发模拟及其影响因子辨识[J].干旱区地理,2015(1):10-17.
[8]柯珂,金晓媚,高萌萌.以改进SEBS模型估算苏木吉林南湖的水面蒸发[J].中国沙漠,2015(1):233-239.
[9]魏光辉,陈亮亮,董新光.基于熵值与关联分析法的塔里木河下游区域水面蒸发影响因子敏感性研究[J].沙漠与绿洲气象,2014,8(1):66-69.
[10]王振英.天山西部地区水面蒸发量计算模型研究[J].南水北调与水利科技,2013(6):30-34,38.
[11]魏素洁,余维.水面蒸发及其影响因子的原位对比观测实验分析[J].人民长江,2013(1):10-13,41.
[12]陈亮亮,魏光辉.新疆玛纳斯灌区水面蒸发量主成分分析[J].沙漠与绿洲气象2009,3(3):49-51.
[13]张尧庭,方开泰.多元统计分析引论[M].北京:科学出版社,2003.
[14]魏光辉,王勇,申莲.库尉地区气象要素对水面蒸发量影响程度的灰关联分析[J].沙漠与绿洲气象,2007,1(3):18-20.
[15]孙凤贤,刘昌宇,夏新林.太阳辐照对静止水面稳态蒸发的影响[J].计算物理,2014(6):699-705.
Classification of Influential Factors on Water Surface Evaporation Based on PCA and HCA Methods—Taking Tazhong as an Example
WEI Guang-hui
(Xinjiang Tarim River Basin Management Bureau, Korla 841000, China)
Abstract:Water surface evaporation is an important factor in the water balance calculation, which also has an important influence on regional water resources allocation and development of crop irrigation system. The paper takes daily meteorological data of Tazhong Meteorological Station in 2013 as an example, the principal component analysis and cluster analysis method are used to classify the influencing factors of glacial and non-glacial period, and from the mechanism of classification index carries on the elaboration. The results showed that: the temperature was the main factors affected water surface evaporation during the different periods. The main factors were the same as the effect factors of water surface evaporation in the cluster analysis and principal component analysis. The results provide a reference for the mechanism of water evaporation in arid desert area.
Key words:water surface evaporation; water resources allocation; principal component regression; cluster analysis; Tarim basin
收稿日期:2016-01-25
基金项目:国家自然科学基金资助项目(51369030);新疆水文学及水资源重点学科资助(XJSWSZYZDXK20101202).
作者简介:魏光辉(1981-),男,新疆石河子人,高级工程师,博士,主要从事干旱区水资源利用研究.
中图分类号:TV211
文献标志码:A
文章编号:1008-536X(2016)04-0042-06