基于主成分分析和模糊聚类方法的主体功能分区

2014-07-05 16:25:02王晓张利陈亚恒
关键词:区划功能区分区

王晓,张利,陈亚恒

河北农业大学国土资源学院,河北保定071000

基于主成分分析和模糊聚类方法的主体功能分区

王晓,张利,陈亚恒

河北农业大学国土资源学院,河北保定071000

主体功能区划是协调我国当前经济快速发展与资源保护问题的有效途径之一,有助于形成我国区域均衡有序发展的空间格局。论文以冀东山地丘陵区典型县域卢龙县为研究对象,从生态环境重要性、社会经济承载力、土地利用承载力3个方面建立指标体系。运用主成分分析与模糊聚类相结合的方法进行主体功能分区。优化开发区为卢龙镇、石门镇,面积为20122.26 hm2;重点开发区为刘田各庄镇,面积为11094.93 hm2;限制开发区为下寨乡、双望镇、木井乡、蛤泊乡、潘庄镇、印庄乡,面积为40006.11 hm2;禁止开发区为刘家营乡、燕河营镇、陈官屯乡,面积为24359.25 hm2,分区结果科学、合理,符合实际情况。主成分分析与c-均值聚类相结合拓宽了划分主体功能区的方法,对落实主体功能区划具有重要价值和创新意义。

主成分分析和模糊聚类;分区指标;主体功能分区

目前至2020年,是我国全面建设小康社会的关键时期,也是城镇化加快发展时期,区域工业、能源、交通、水利等用地需求大幅度增加,大量农村人口将从农村转移到城镇,城镇居住、基础设施、公共服务等建设用地和生态用地需求也将大幅度增加,这必将引起空间结构急剧变动[1]。国家“十一五”规划纲要明确提出,各地要根据资源环境承载能力、现有开发密度和发展潜力,将国土空间划分为优化开发、重点开发、限制开发和禁止开发4类主体功能区,以促进形成经济发展与人口资源环境相协调的空间均衡格局。

目前学术界对于主体功能区的研究主要集中在理论创新、区域政策调整、指标体系研究、生态补偿机制、主体功能规划与各级规划衔接等方面[2-5]。而对于主体功能区划分的理论研究正处于探索阶段,国际、国内也没有现成的理论和方法体系。一些学者建立了由资源环境、开发密度和发展潜力等多种指标组成的主体功能区划指标体系,自下而上采用综合分析法、主要因素法、叠置法、熵权法、生态位划分法、三维矩阵法、主成分分析法及聚类分析法并结合RS、GIS等综合集成的方法,相继开展了省域、市域、县域尺度下主体功能区划研究[6-10]。事实上各主体功能区之间的范围界线没有明显的划分,更多的是一种模糊关系,传统的定量方法不能对其进行精确地分类。聚类法目前在划分综合分区中应用较为广泛。但对于硬聚类法(HCM),其聚类对象是被严格区分出来,一个对象只能划分到一个类中,原来数据所蕴含的信息损失较多[11]。模糊聚类则是用柔性特征的分类方法将分类对象与聚类中心建立隶属度关系,故其中又以模糊c-均值聚类法(FCM)应用最广,而将FCM运用到主体功能分区中,目前国内研究较少。

县域主体功能分区,不仅有助于全国、省域主体功能分区的深入及落实,还可以宏观指导县域城乡、农业、国土、人口等资源配置,为各部门制定差别化相应政策.本文在前人研究的基础上采取主成分分析与模糊c-均值聚类相结合的方法,以冀东山地丘陵区典型县域卢龙县为研究对象,划分不同的主体功能区,采取不同的区域发展政策,以求促进卢龙县人口、经济、资源与环境和谐发展。

1 研究区概况与数据来源

1.1研究区概况

卢龙县位于东经118°45′54"~119°08′06",北纬39°43′00"~40°08′42"之间,地处河北省东部秦皇岛市,东连抚宁县,北揽长城与青龙满族自治县交界,西与迁安市、滦县隔青龙河、滦河相望,南抵京山铁路与昌黎县接壤,是沟通东北与华北交通联系的咽喉要道。

地势北高南低,北部多低山,中部多丘陵,南部有部分平原、洼地。地貌分为低山、丘陵、平原洼地3种类型。低山区占地面积100.2 km2,占总面积的10.4%。丘陵区主要分布于县境中部和低山区中下游坡面上,面积688.4 km2,占总面积的71.7%平原洼地,主要分布在县境南部,面积172.4 km2,占总面积的17.9%。土质肥沃,地下沙源较丰富,水资源条件较好,为县内主要粮食产区。随着河北省经济重心向沿海、京津地区的产业转移,以唐秦承为中心的“冀东经济区”将成为环渤海地区新的经济增长极,势必会使该区的空间格局发生巨大变化。

1.2数据来源

本研究土地数据来源于卢龙县2010年完成的第二次土地调查1:50000农村土地利用现状调查成果。社会经济数据来源于权威部门的统计资料。坡度、植被、地质等自然资源数据运用遥感处理软件ENVI4.7对TM影像数据解译得出,卢龙县解译精度约为85%。

2 主成分分析与模糊聚类相结合的分区方法

2.1主成分分析的基本原理

为满足指标体系完备性和针对性,选取指标较多。而指标之间具有一定的相关性,为保证使用精度与范围,运用主成分分析(Principal Components Analysis,PCA)法将原有多个变化量化为少数几个综合指标。

1)建立初始矩阵X,并进行标准化处理。假设分类对象有n个,每个对象有p个分类变量,得到初始矩阵X:

由于变量指标的量纲和指标值的数量级不一致,并会对分析结果产生影响,采用(2)对pnX×进行标准化处理,并得到矩阵*X,

式中xij为第i样本第j个指标的原始数据值;j为第j个指标的平均值:第j个指标的标准差。

2)建立相关系数矩阵。有了标准化矩阵*

X后,可以运相关系数法计算相关系数矩阵R:

式中rij(i,j =1,2,…p)为矩阵X*中与的相关系数,通过下式计算:

3)计算相关系数矩阵R的特征值和特征向量。

相关系数矩阵的非负特征值λi(i=1,2,…,p),令=0,使λi从大到小顺序排列,得到λ1≥λ1≥,…,≥λp≥0,得到特征向量μi(i=1,2,…,p):

4)计算主成分贡献率及累计贡献率

第k个主成分ky的方差贡献率为:

主成分myyy…,,21的累计贡献率为:α

i值越大,其对应的主成分iy结合pxxx,,,21…信息的能力越强,将主成分按着特征值从大到小排序,一般截取前m个主成分,其中pm<,使得累计方差贡献率大于85%[12]。这样用截取的m个主成分代替原p个变量进行分析。

5)计算出主成分分值。

由下式结算得出:

将每个样本各指标标准化值代入上式,求出各主成分得分。之后利用模糊C-均值算法依据各样主成分分值进行主体功能分区。

2.2模糊c-均值聚类法(FCM)原理及计算步骤

2.2.1 FCM计算原理模糊聚类分析法,是根据样本间的亲疏关系,按其亲属程度,客观地划分类型,得到一个能反映个体亲属关系的系统。模糊c-均值聚类是常用的一种无监督的动态聚类算法[13]。其基本思想是先选择若干样本作为聚类中心,再按某种聚类准则(例如最小距离准则等)使其余样本向各中心聚类,从而得到初始分类;然后判断初始分类是否合理,若不合理就修改分类,如此反复迭代,直到获得合理的分类。它不要求用于聚类的变量具有相似的方差或遵从高斯分布,可以较好的解决具有连续性变异的自然现象[14]。

式中:Q为大于等于1的实数指数,iv为第i类的聚类中心。

为求得最合理的聚类中心,常用的目标函数为:

2.2.2 FCM计算步骤

1)选定C(2≤C ≤n),初始模糊分类矩阵H(o),迭代次数L(初始值为0),允许误差E (>0)和指数)1(≥QQ。在确定)(oH时,i∀,k∀应满足如下约束条件:

3)修改)(L

R

4)比较H(L+1)与H(L)大小,当时,则迭代停止;否则取1+=LL,重新开始计算。

2.3分区原则

2.3.1 体现区域发展战略和规划要求与区域“十一五”总体规划纲要和远景目标相配合,符合其空间战略布局的思路和要求,将主体功能区划的初步分区结果进行相应调整,以符合总体规划。

2.3.2 明确主导功能在特定空间内,社会、经济、生态等要素的一种或几种起着主导作用,在分区过程中确定在整体功能中起主导作用的要素,确定特定单元的优势功能[16]。以求达到地域优势互补,协调区域共同发展。

2.3.3 保持行政区划相对完整在县域范围内,为便于主体功能分区的规划与管理,尽量保持主体功能区界线尽量与一定级别的行政界线吻合。这有利于实施对各级政府的责任目标管理,增加可操作性。

2.3.4 高度综合性依据系统论中的结构功能原理,一定的系统结构决定其功能,结构的合理性、有序性保证了功能的完整性。主体功能区划必须从经济、社会、生态耦合作用的角度,考虑单元及其组合结构的完整性,使主体功能区是完整的功能体。

2.4分区步骤

1)构建分区指标体系。收集基础资料,综合考虑选取符合卢龙县实际情况,按照科学性、可比性、易得性和精简性原则,在生态环境重要性、社会经济支撑力和土地利用承载力3个方面选取14个评价因子,建立指标体系。

2)运用主成分分析法简化因子。所选14个评价因子,因为每个因子都在不同程度上反映了分区的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠,运用主成分分析法对因子进行简化。

3)运用模糊c-均值聚类法确定分区。利用MATLAB自带的RAND函数随机确定分类矩阵H,选定最大迭代次数为100,允许误差为10-5,根据主成分分值,利用MATLAB编制FCM程序,多次迭代,求得最小J(H,V),根据最大隶属度所在分区作为分类依据。

3 结果与分析

3.1评价因子选取与体系构建

主体功能区划分的本质是用一套科学的指标体系来综合评价特定空间的社会、经济、生态价值,评价不同区域的主导功能差异。根据卢龙县自然地理背景和社会发展特点,以乡镇为单元,保持行政界线完整性,从生态环境重要性、社会经济承载力、土地利用承载力3个方面筛选14个评价因子,在人口、经济、资源、环境等各方面协调发展思想的主导下,构建指标体系。

生态环境主要为主体功能区划分的刚性限制因素,考虑区域的自然环境特征及资料的可取性选取坡度、生物多样性、水资源涵养、地质灾害、土地利用方式等五个因素。

社会经济为划分主体功能区中需要把握的重要经济属性,对于判断各样本现有发展情况影响显著。选取人口密度、人均GDP、交通便捷度、财政收入增产率四个因素。

土地利用为国土空间布局优化的重要方面,从中选取人均居民点面积、城镇工矿用地比例、单位建设用地GDP、耕地综合生产力优势指数、可利用土地资源量五个因素。

表1 主体功能区划指标及编号Table 1 Index and numbers of major function oriented zoning

3.2主成分分析法确定主成分

以SPSS11.5为工作平台,对选取的14个因子进行主成分分析,得出相关系数矩阵,计算各个主成分的特征值及贡献率。由下表可知第一主成分贡献率为47.917%,第二主成分贡献率为23.172%,第三主成分贡献率为12.449%。这三个主成分累计贡献率已达83.538%,确定主成分y1、y2、y3。

特征向量即是各因子在主成分上的载荷矩阵,通过载荷矩阵和样本标准化数值,可以得出主成分得分,由3个主成分来代表所选因子,之后通过模糊c-均值聚类来进行主体功能分区。

表2 特征值及贡献率Table2 Eigenva lues and contribution ratio

表3 主成分载荷矩阵Table 3 Principal component loading matrix

3.3模糊c-均值聚类方法进行主体功能分区

相比传统模糊聚类算法,FCM算法将各样本按一定的模糊隶属度归属到某一聚类中心。结合主成分分析法的分析结果,运用MATLAB平台首先确定分类矩阵H,初步确定分区数为4,经26次迭代后,得到目标函数),(VHJ的最小值,以此确定各样本的的隶属度矩阵,隶属度最大值所在矩阵作为分区依据,得到分区结果。

表4 各样本的分类隶属度矩阵Table 4 Matrix of sub jection degree on samples

图1 模糊隶属度空间预测分布图Fig.1 Predictive maps showing partial memberships of individual fuzzy classes

3.4主体功能分区结果

3.4.1 优化开发区该区域主要包括主要包括西南部的卢龙镇、石门镇。隶属度分别为0.325和0.412。该区域面积20122.26 hm2,占全县总面积的21.5%。该地区人口密度大,产业聚集度高,单位工业产值处于较高的水平,土地开发强度高,现有开发密度高,因其自身的区位优势、科技潜力和以往较高经济水平的积累,使得其区域发展水平较高。该地区应限制占地多、耗能高的工业用地,支持高新技术、循环经济和现代服务业的发展。并严格保护耕地,保留开敞的绿色空间,保护好各项生态用地,促进区域生态环境改善。

3.4.2 重点开发区该区域主要包括刘田各庄镇。隶属度为0.416,面积为11094.93 hm2,占全县总面积的11.61%。该地区资源环境承载力较高,现有开发密度较低,未来发展前景良好。未来发展应优先保障承接优化开发区产业转移的用地需求,积极引导产业集群发展和集中布局。鼓励存量建设用地深度开发,统筹安排基础设施建设用地,推动和加快基础设施建设。严格保护生态用地,切实发挥耕地特别是基本农田在优化城镇、产业用地结构中的生态支撑作用。

3.4.3 限制开发区该区域主要包括中部的下寨乡、双望镇、木井乡、蛤泊乡、潘庄镇、印庄乡。隶属度高于其他乡镇,面积为40006.11 hm2,占全县总面积的41.86%。资源环境约束中等,现有开发强度较低,未来发展潜力中等。在未来开发过程中,应坚持保护优先、适度开发、点状发展的原则,严格控制开发强度,逐步减少城镇用地和农村居民点用地空间,严格限制增加建设用地,引导与主体功能定位相悖的产业向区外有序转移。

3.4.4 禁止建设区该区域主要包括北部的刘家营乡、燕河营镇、陈官屯乡。隶属度分别为0.638、0.418和0.706,面积为24359.25 hm2,占全县总面积的25.49%。主要为坡度大于25°的山地区。具有较为强大的生态功能,在维护区域环境中发挥重要的作用。未来应实行实行强制性保护,严禁任何不符合主体功能定位的各类土地利用活动,确保生态功能的稳定发挥。

图2 卢龙县主体功能区划结果Fig.2 Major function oriented zoning in Lulong County

4 结论与讨论

1)将主成分分析与模糊聚类相结合的方法应用到主体功能分区中,从生态环境重要性、社会经济承载力、土地利用承载力三个方面构建了综合评价指标体系。评价结果全面、细致准确地划分了主体功分区。利用模糊聚类进行分区,避免了信息的丢失,符合分区的模糊特征。拓宽了划分主体功能区的方法,为落实主体功能区划,协调区域发展,存进资源节约和环境友好,统筹城乡区域发展的效率与公平关系都具有重要价值和创新意义。

2)卢龙县主体功能区划分结果与各区生态环境、社会经济情况及土地资源状况相一致,与客观实际相符合。表明分区方法科学、合理,符合实际情况。主体功能分区作为明显的区位指向性分区,更加注重从总体空间上协调经济发展与生态环境矛盾,有别于以往的各类分区。

3)主体功能区划是战略性、基础性、约束性分区,是其他区域规划在空间开发和布局的基本依据。同时主体功能区划要以其他区域规划为支撑,应做好与其他区域规划的衔接工作。

[1]刘彦随.区域土地利用优化配置[M].北京:学苑出版社,1999

[2]樊杰.我国主体功能区划的科学基础[J].地理学报,2007,62(4):339-350

[3]张学波,武友德.省域主体功能区区划的理论与方法[J].资源开发与市场,2009,25(12):1092-1096

[4]牛叔文,李永华,马利邦,等.甘肃省主体功能区划中生态系统重要性评价[J].中国人口·资源与环境,2009,19(3):119-124

[5]黄亚云,周寅康,金晓斌.基于主体功能区规划理念的土地利用总体规划控制性指标分解初探[C]//2008年中国土地学会学术年会论文集.北京:中国大地出版社,2008:40–44

[6]张晓瑞,宗跃光.区域主体功能区规划模型、方法和应用研究-以京津地区为例[J].地理科学,2010,30(5):728-734

[7]王利,张卓,王丹,等.辽宁省主体功能区划分方法研究[J].地域研究与开发,2010,29(6):8-11

[8]傅鼎,宋世杰.基于相对承载力的青岛市主体功能区区划[J].中国人口·资源与环境,2011,21(4):148-152

[9]蒙莉娜,郑新奇,赵璐,等.基于生态位适宜度模型的土地利用功能分区[J].农业工程学报,2011,27(3):282-287

[10]范树平,程久苗,项思可.基于三维魔方的芜湖市市域主体功能区划研究[J].亚热带资源与环境学报,2011,6(2):66-74

[11]Mingqin liu,Ashok Samal.A fuzzy clutering approach to delineate agroecozones[J].Ecological Modelling,2002,149:215-228

[12]于秀林,任雪松.多元统计分析[M].北京:中国统计出版社,1999

[13]刘宜平,沈毅,刘志言.一种FCM聚类算法的改进与优化[J].系统工程与电子技术,2000,22(4):1-3

[14]Yang M S,Liu H H.Fuzzy clustering procedures for conical fuzzy data[J].Fuzzy Sets and Systems,1999,106:189-200

[15]王新洲,史文中,王树良.模糊空间信息处理[M].武汉:武汉大学出版社,2003

[16]朱传耿,仇方道,马晓冬,等.地域主体功能区划理论与方法的初步研究[J].地理科学,2007,27(2):136-141

Major Function Oriented Zoning Based on Principal Components Analysis and Method of Fuzzy-C-means

WANG Xiao,ZHANG Li,CHEN Ya-heng
College of Land and Resources,Agricultural University of Hebei,Baoding 071000,China

Major function oriented zoning(MFOZ)is one of the effective ways to coordinate current rapid economic development and resources and environmental protection,and is the guideline for optimizing the spatial pattern of regional development.Taking Lulong County in Jidong mountainous and hilly region as an example,this paper buit index system from importance of eco-environment,support of social economy and Land use strength.This paper classified MFOZ using the method of principal components analysis and fuzzy clustering means.Optimization development zone is Lulong,Shimen, which has the area of 20122 ha;important development zone is Litiangezhuang,which has an area of 11094.93 ha;lmit development zone is Xazai,Shuangwang,Mujing,Habo,Panzhuang,Yinzhuang,which has an area of 40006.11 ha; development-prohibited zone is Liujiaying,Yanheying,Chenguantun,which has the area of 24359.25 ha.Evaluation results show that the method is scientific,proper and accords with the actual conditions.The method of principal components analysis and fuzzy clustering means broadened the method of classifying MFOZ,which has important value and innovation significance for the implement of MFOZ.

Principal components analysis and fuzzy clustering means;zoning indicators;major function oriented zoning

F301.23

A

1000-2324(2014)04-0568-08

2012-10-25

2012-12-03

河北省高等学校科学技术研究优秀青年基金项目(Y2012015);河北省自然科学基金项目(D2010000795)

王晓(1987-),男,山东省肥城市人,硕士研究生.从事土地信息与管理研究.E-mail:wxguotu@163.com

猜你喜欢
区划功能区分区
上海实施“分区封控”
环球时报(2022-03-29)2022-03-29 17:14:11
林芝市雷电风险区划
烧结混合机各功能区的研究与优化
山东冶金(2019年3期)2019-07-10 00:53:54
基于“三线一单”的环境功能区划实证研究
四川环境(2019年6期)2019-03-04 09:48:54
川渝传统民居区划的环境蕴意
浪莎 分区而治
衡水市不同功能区土壤营养元素的比较
现代园艺(2017年23期)2018-01-18 06:57:44
水功能区纳污能力计算及污染物总量控制
基于SAGA聚类分析的无功电压控制分区
电测与仪表(2015年8期)2015-04-09 11:50:16
基于多种群遗传改进FCM的无功/电压控制分区
电测与仪表(2015年7期)2015-04-09 11:40:16