何 力,黄 薇,刘 丹
(长江科学院水资源研究所,武汉 430010)
基于聚类分析方法的节水型社会分区研究
何 力,黄 薇,刘 丹
(长江科学院水资源研究所,武汉 430010)
南水北调东、中线一期工程受水区39个城市的经济社会发展水平、水资源禀赋、用水效率、节水型社会建设现状等条件各不相同,其节水型社会建设模式也有一定差异。以受水区城市2005年统计资料为依据,引入聚类分析方法研究受水区城市节水型社会建设分区。分区结果作为受水区节水型社会管理模式研究典型城市及节水型社会建设试点的选择依据。
南水北调;节水型社会;聚类分析
南水北调东、中线一期工程受水区为黄淮海地区京、津、冀、鲁、豫、苏等省市的39座地级及其以上城市、245座县级城市(区、县城)和17个工业园区。受水区横跨半湿润半干旱过渡带,水资源匮乏,时空分布极不均匀;土地面积广大,耕地资源丰富,光热条件适宜,长期以来一直是我国重要的农产品生产基地;人口密集、生产发达,用水需求增长较快。根据统计资料,2005年受水区内总人口23 588万人,全年GDP为44 755亿元,占全国的24.5%,三次产业比重为10.1∶51.9∶38.0。现状耕地面积1 615.53 ×104hm2,当年粮食产量10 297万t,占全国粮食产量的21.3%[1]。人口增加和经济发展驱动水资源需求量不断增加,长期以来生产、生活、生态用水之间竞争激烈,为了保证城市和工业用水,大量挤占农业、生态用水,大部分城市依靠超采地下水来维持供水,基本上形成了“有河皆干、有水皆污”的局面,地下水漏斗不断扩大,区内地表、地下水环境遭到极大破坏,受水区城市开展节水型社会建设势在必行。
受水区涉及的39个地级市,横跨半干旱半湿润过渡带,各地区水资源条件和问题不尽相同,经济发展水平和产业类型各异,节水型城市建设的目的、目标和任务既有共性又有个性。我国在“十五”期间开展的节水型社会建设试点,重点放在西北干旱农业区、南方水资源相对丰沛地区和沿海地区,与本次受水区在水资源条件、产业类型、用水水平等方面存在较大差别,已有的经验不能完全适用于整个受水区,因此需要针对实际需求以及受水区城市的经济社会发展、水资源利用和节水型社会建设的特点,对节水型城市建设进行分区,并选择典型城市开展节水型社会管理模式研究,进行节水型社会建设试点。
2.1 分区方法选择
对研究对象进行分区,使其归属于相应的范畴,是科学研究的一种基本方法。在样本容量较小、评价指标不多的情况下,人们往往利用经验直接对研究对象进行分区。但是对样本容量较大、评价指标较多的系统进行分区时这种方法就难以满足要求。因此,人们利用多元统计分析的方法研究这类分区问题,聚类分析和判别分析是多元统计分析中对样本进行分区研究的基本方法,两种方法最大的区别在于,即分区前是否已明确研究对像的分类[2]。本文在分区前不能确定研究对象的具体分类数和分类的判别标准,因此选用聚类分析法。
聚类分析法诞生于上世纪40年代,是多元统计方法的一个新分支,正处于快速发展阶段,理论上不断完善,应用日益广泛,该方法最早由方开泰等引入我国。系统聚类是聚类分析最基本的方法,在此基础上先后形成了动态聚类法、最优分割法、模糊聚类法、图论聚类法、智能聚类法等新的聚类方法[2-5]。聚类分析方法最早被应用于地质学中对矿产进行分类[6],后来在生物学、社会、经济等各个领域也得到了广泛的应用[7-11]。前人采用聚类分析进行分区研究时,样本容量相对较小,分区指标比较单一,指标多以定量描述为主。本文将聚类分析方法引入样本容量大、分区指标复杂、以定量描述为主辅以定性描述的水资源生态经济复合系统中,研究节水型社会建设的分区。
在综合分析各种聚类分析方法及节水型社会分区特点后,本文采用系统聚类方法中的离差平方和法(Ward’s Method)研究分区问题。
2.2 理论依据
离差平方和法的思想来源于方差分析,分类结果应当使同类样本的离差平方和较小,类与类之间的离差平方和较大。为了根据指标变量对样本进行分类,就要研究样本之间的关系。可以将每个样本看成m维空间中点与点的关系,这种关系可以用距离表示。共有n个样本,每个样本测量m个指标,如果将样本x1,x2,…xn看成m维空间的n个点,从几何角度看可以定义为这些点之间的距离。开始时各样本自成一类(这时有n类),计算各样本之间的距离,按离差平方和大小,将距离最近的2个样本合并成一类;计算新类与其余各类距离,再将距离最近的两类合并,这时如果类的个数仍大于1,则继续重复上述步骤,直到所有样品归为一类,停止计算,完成分区。离差方法和法聚类分析基本计算过程如下:
聚类时先将n个样品各自看成一类,然后逐步合并,每次进行一次合并、减少一类;每减少一类都会使S增大,每一步聚类都选择使S增加最小的两类进行合并。
(3)重复上述过程直到将所有城市合并成一类,再根据需要的分区数调整归并形成最终的分区方案。
3.1 分区指标
节水型社会建设受经济社会发展水平、水资源禀赋、用水效率、节水型社会建设情况等因素影响,反映这些因素的指标很多,若全部参与分区计算不仅难以取得合理的分区目的,而且数据之间的独立性也难以保证。本文参照水利部2005年颁发的《节水型社会建设评价指标体系(试行)》、《开展节水型社会建设试点工作指导意见》及建设部等部委颁发的《节水型城市目标导则》,按照代表性能够反映城市的缺水类型和缺水程度,能够反映城市节水型社会建设的基本情况、数据完整性等原则,筛选出人口、人均GDP、节水型社会建设情况等11个指标,分区指标如表1所示。以受水区城市2005年统计数据为依据进行分区研究,数据来源于各城市的水资源公报、国民经济和社会发展统计公报及统计年鉴等统计资料。
表1 分区指标Table 1Districting indicators
3.2 分区结果
把分区指标及对应的数据输入SPSS软件,按照离差平方和聚类法操作软件,经过39次聚类输出聚类分析树状图如图1。聚类计算过程比较冗长,这里不再累述。在树状图中,聚类的全过程均以直观的方式表现出来,把类间的最大距离算作相对距离为25,其余距离均换算成与之相比的相对距离,合并则通过线条连接的方式来表示。典型城市不宜选择太多,因此按照图1,共将受水区城市分为3大类。
3.3 结果分析
聚类分析法根据城市的11个指标综合确定城市分类,因此会出现某些同类城市间个别指标值的差异较大,而某些不同类城市间个别指标值的相似性较好的情况。本文根据各类城市的总体特征,按节水型社会建设条件可把各类城市特点概括为:工业型经济发达、节水型社会建设基础好的重点城市;有一定工业基础、经济欠发达、节水型社会建设基础一般的大城市;农业主导型经济欠发达、节水型社会建设基础较差的中等城市。各类城市分布图如图2所示,具体特征为:
(1)第一类城市是工业型经济发达、节水型社会建设基础好的重点城市,包括北京、天津、淄博等9个城市。经济发达、总量大,2005年人均GDP均超过25 000元;除天津外有效灌溉面积小于26.67×104hm2,农业增加值所占比重均小于10%,大部分城市农业用水比例在50%左右;人口众多,除威海、东营外人口均超过或接近500万人;水资源禀赋较差,人均水资源量在300 m3以下,大部分城市总供水量超过可供水量;总体看地下水供水比例小于第二类城市;用水效率最高,万元GDP用水量均低于100 m3,远远低于全国平均水平;节水型社会建设基础最好。
(2)第二类城市有一定工业基础、经济欠发达、节水型社会建设基础一般的大城市,包括聊城、德州、周口等13个地级市,其中石家庄为省会城市。经济欠发达、总量较大,2005年人均GDP均低于20 000元;农业在经济社社会中所占比例超过10%,有效灌溉面积均超过33.33×104hm2是我国重要的粮食产区,除个别城市外,农业用水比例均超过70%;所辖人口众多,大部分城市人口超过600万,城市化水平较低;除南阳外均位于黄淮海平原,属于半湿润气候区,水资源匮乏,过境水量较少,人均水资源量小于300 m3,水资源开发利用率小于第一类城市;地下水供水所占比重最高、基本靠超采地下水维持经济社会发展;万元GDP用水量在100~200 m3之间,现状节水型社会建设基础一般。
(3)第三类城市农业主导型经济欠发达、节水型社会建设基础较差的中等城市,包括扬州、淮安、滨州等17个城市,均为地级市。此类城市亦属于欠发达地区,经济总量小于前两类城市,2005年除扬州市外均在20 000元以下;大多数城市农业在国民经济的比重超过15%,工业基础薄弱,耕地面积小于第二类城市,农业用水比例小于第二类城市,高于第一类城市;城市所辖人口小于前两类城市,大部分城市所辖人口少于500万,城市化水平低;水资源禀赋好于前两类城市,大部分城市有较为丰富的过境水量,以地表水供水为主,水资源供需矛盾总体上小于前两类城市;大部分城市万元GDP用水量高于200 m3,有的甚至超过500 m3,现状节水型社会建设基础最差。
图1 节水型城市分区树状图Fig.1 W ater-saving Cities districting tree
图2 节水型社会分区图Fig.2 W ater-saving society districting map
离差平方和法聚类分析,从经济发展水平、水资源禀赋、用水效率、节水型社会社会建设现状等方面把不同类型的城市区分开,分区方案中各类城市之间具有较好的差异性,每一类城市的内部又具有很好的相似性,符合聚类分析的标准,达到了节水型城市建设分区目的。分区是受水区节水型社会建设管理模式研究的基础工作,在上述分析的基础上建议选择代表性最好的天津、邯郸、淮安作为每类城市的典型城市。通过研究典型城市的节水型社会建设管理模式,形成每个典型城市的具体管理模式和每类城市的基本管理模式,在典型城市试点的基础上不断完善节水型社会管理模式和机制、积累经验,为在南水北调受水区全面开展节水型社会建设提供技术支撑。
[1] 王 浩,秦大庸.黄淮海流域水资源合理配置[M].北京:科学出版社,2003.(WANG Hao,QIN Da-yong.The Water Resources Allocation of the Huang-Huai River Basin[M].Beijing:Science Press,2003.(in Chinese))
[2] 向东进,李宏伟,刘小雅.实用多元统计分析[M].武汉:中国地质大学出版社,2005.(XIANG Dong-jin,LI Hong-wei,LIU Xiao-ya.Practical Multivariate Statistical Analysis[M].Wuhan:China University of Geosciences Press,2005.(in Chinese))
[3] 何晓群.多元统计分析[M].北京:中国人民大学出版社,2004.(HE Xiao-qun.Multivariate Statistical Analysis[M].Beijing:China Renmin University Press,2004.(in Chinese))
[4] AL-Sultan K S,Selim S Z.A simulated annealing algorithm for the clustering problem[J].Pattern Recognition,1991,24(10):1003-1008.
[5] Bezdek JC.Clustering validity with fuzzy sets[J].Mathematical Biology,1974,(1):57-71.
[6] 方开泰,潘恩沛.聚类分析[M].北京:地质出版社,1982.(FANG Kai-tai,PAN En-bei.Clustering[M].Beijing:Geological Publishing House,1982.(in Chinese))
[7] 岳晓宁,徐宝树,王竞波.基于聚类分析的DNA序列分类研究[J].沈阳大学学报,2008,20(6):104-106.(YUE Xiao-ning,XU Bao-shu,WANG Jing-bo.On DNA sequence classification based on fuzzy clustering[J].Journal of Shenyang University,2008,20(6):104-106.(in Chinese))
[8] 刘世建,荣廷昭,杨俊品,等.四川地方玉米种质的SSR聚类分析[J].作物学报,2004,30(3):221-226.(LIU Shi-jian,RONG Ting-zhao,YANG Jun-pin,et al.Cluster analysis of localmaize germplasm in Sichuan based on SSRs[J].Acta Agronomica Sinica,2004,30(3):221-226.(in Chinese))
[9] 朱华芳,罗玉兰,胡永红,等.萱草属部分种和园艺品种的SSR多态性分析[J].上海交通大学学报(农业科学版),2009,27(2):143-148.(ZHU Hua-fang,LUO Yu-lan,HU Yong-hong,et al.Analysis of a section of hemerocallis species and varieties by SSR-PCR[J].Journal of Shanghai Jiaotong University(Agricultural Science),2009,27(2):143-148.(in Chinese))
[10]罗琴.广西14个城市城镇居民消费结构的聚类分析[J].现代商业化,2008,(35):235-236.(LUO Qin.The 14 cities'consumption structure of urban residents in Guangxi by Cluster Analysis[J].Market Modernization,2008,(35):235-236.(in Chinese))
[11]李亚杰.中国教育国际竞争力分析[J].北京邮电大学学报(社会科学版),2008,10(2):61-65.(LIYa-jie.Analysis of international competitive strength of China’s education[J].Journal of Beijing University of Posts and Telecommunications(Social Sciences Edition),2008,10(2):61-65.(in Chinese) )
(编辑:曾小汉)
Study on W ater-saving Society Districting Based on Cluster Analysis M ethod
HE Li,HUANGWei,LIU Dan
(Yangtze River Scientific Research Institue,Wuhan 430010,China)
The Middle Route Project and Eastern Route Project of South-to-North Water Transfer Project(phaseⅠ)will supply water for 39 cities,and their economic and social development levels,natural endowments ofwater resource,water use efficiencies,water-saving society statues are all different,and their water-savingmodes of social construction have certain differences.This paper chose the cluster analysismethod,a branch ofmultivariate statisticalmethods,to study the citieswater-saving society building district,on the basis of statistical data in 2005.The city districting resultmay be used for selecting typical cities to research water-savingmanagementmode and accumulate experience so as to popularize to whole water-use region.
South-to-North water diversion;water-saving society;cluster analyis
TV21
A
1001-5485(2010)04-0020-04
2009-05-11;
2009-07-17
国家“十一五”科技支撑计划重大项目:东、中线一期工程沿线区域生态影响评估技术研究(2006BAB04A15);水利部江湖治理与防洪重点实验室开放基金资助项目(R2007-04)
何 力(1982-),男,陕西安康人,硕士研究生,主要从事水文水资源方面的研究,(电话)027-82926433(电子信箱)heli_18@163.com。