基于SVM的城乡发展一体化水平评价
——陕西延安的研究

2016-05-07 06:40郝向举
关键词:测度指标体系城乡

王 渊,郝向举,崔 弘

(1.西安工程大学 管理学院, 陕西 西安 710048;2.西北大学 经济管理学院,陕西 西安 710069;3.西安工业大学 学生处,陕西 西安 710048)

【经济研究】

基于SVM的城乡发展一体化水平评价
——陕西延安的研究

王 渊1,2,郝向举1,崔 弘3

(1.西安工程大学 管理学院, 陕西 西安 710048;2.西北大学 经济管理学院,陕西 西安 710069;3.西安工业大学 学生处,陕西 西安 710048)

基于支持向量机(SVM)构建评价模型测度城乡发展一体化水平,并对陕西延安地区进行实证研究,一方面检验模型的有效性,另一方面为延安地区县域城乡发展一体化提供决策依据。为了解决构建指标体系过程中主观性强的问题,研究将评价指标看作空间维度,被评价样本映射为高维空间中的点集,在构造学习样本的基础上,应用网格搜索法和K-交叉验证训练样本确定最优核函数与参数,并应用该模型测度了延安地区12个县的城乡发展一体化水平。结果表明,基于SVM的评价模型相对于传统的指标体系评价模型具有更高的科学性。K-Means聚类分析表明,12个县的城乡发展一体化水平应该划分为四个阶段:黄陵和吴起处于高度一体化阶段,志丹处于中度一体化阶段,洛川和安塞处于初步一体化阶段,其余的七个县均处于城乡互动起步阶段。

城乡发展一体化;支持向量机;聚类分析

一、引言与问题的提出

加快推进城乡发展一体化是党的十八大提出的战略任务,也是落实“四个全面”战略布局的必然要求。推进城乡发展一体化要坚持从国情出发,认清城乡发展不平衡、不协调和二元结构的现实[1]。作为省委、省政府支持的率先实现统筹城乡发展的地区,认识和解读城乡发展一体化的阶段性和差异性是推进统筹城乡发展的前提和基础,也是新时期“上山建城”战略目标能否顺利实现的关键。

城乡发展一体化的阶段性和差异性客观存在,构建科学的评价模型并对特定样本进行横向比较具有重要意义。但是,通过对已有研究的梳理和分析发现,在内容上,建立指标体系是构建评价模型的基础,主观差异导致了指标体系的多样性;方法上,构建指标体系的降维过程很难规避信息损失和指标间的多重共线对评价结果造成的影响。如果不对指标进行降维和分类,而是将每一个指标看做空间的一个维度,则每个被评价样本就对应高维空间的一个点,进而利用支持向量机(SVM)的非线性处理能力在高维空间中对样本点分类,结果用来评价样本的城乡发展一体化水平,既实现了多个样本之间的横向比较,又减少了构建指标体系过程中引入的主观误差。

本文的主要内容包括:根据城乡发展一体化的内涵与影响因素,运用频率分析法与专家咨询法选取反映城乡发展一体化的指标,进而构建基于多属性SVM的城乡发展一体化水平评价模型,寻找指标到评价结果间的映射关系;通过机器学习的方法求解模型的核函数以及参数;应用模型实证研究延安地区城乡发展一体化水平存在的阶段性和差异性,进而提出下一步的发展建议。

二、城乡发展一体化水平评价研究评述

城乡一体化的思想源于马克思、恩格斯,由“城乡融合”演化而来,但表述方式却源于我国学者,体现了我国学者对马克思、恩格斯城乡关系论述的理解和感悟[2]。十八大报告中明确了城乡一体化的内涵是城乡发展一体化,即不是城市向乡村靠拢的低水平一体化,而是在发展中缩小城乡差距的高水平一体化。城乡发展一体化内容广泛,很难用一个指标体系或者几个维度的指标全面测度[3],但学者们还是从不同的角度进行了尝试。1997年,杨荣南设计了包括经济、人口、空间、生活、生态环境5个方面融合度的指标体系,并采用数学平均法计算城乡一体化水平得分[4]。从内容上讲,他的研究仅仅做了一些探索,没有检验指标体系的效度;从方法上讲,数学平均法没有考虑指标间的多重共线问题。不过他的研究提供了两个重要的研究方向:

第一,测度内容。测度内容就是指标体系的维度设计,即一级指标。文献中的维度设计有三种方式:第一种按城乡发展一体化的内涵划分,如经济、生活、基础设施等。大部分学者都是以这种方式设计一级指标[5-9];第二种按政府行为划分,可以分为投入性指标和产出性指标[10,11]。第三种按指标与结果的关系划分,可以分为显示性指标、传导性指标和分析性指标[12,13]。

第二,测度方法。现有研究都是基于指标体系测度城乡发展一体化水平,即首先形成指标体系,然后确定指标权重,采用加权平均的方法计算城乡发展一体化水平。指标体系的形成有理论导向和数据导向两种方式,前者基于理论推理指标体系的二级、三级指标,具有很强的理论逻辑;后者按照承载信息的侧重有选择地进入指标体系,数理逻辑较强。权重的确定分为三类。第一类是主观赋值法,如德尔菲法,采用主观评分给各项指标打分,充分利用专家们的经验做出综合评判,但是存在过度估计和估计不足的问题[14-16]。第二类是客观赋值法,根据指标对总体的贡献来确定权重,如主成分分析、因子分析[5,10,17,18]。第三类是主客观结合赋值法,如层次分析法、模糊综合评判等[2,19-22]。

现有研究存在三点共性:第一,内容上采用不同划分方法的目的都是为了确定合理的指标体系,这是科学评价的基础;第二,方法上客观赋值法和主客观结合赋值法应用广泛,操作性较强;第三,结果上以指数得分作为评价结果并作为分析差异性和阶段性的依据,区域间的发展差异可能因此被模糊甚至被消除。

综上所述,尽管学者们从不同角度构建指标体系,测度了全国和部分地市的城乡发展一体化水平,然而,始终缺乏一个能被广泛认可的指标体系和测度方法。

三、基于SVM的城乡发展一体化水平测度模型的提出

本研究将评价指标视为城乡发展一体化水平的属性,将城乡发展一体化水平评价转化为多属性评价问题,模型的效用偏好值即代表了城乡发展一体化水平。应用多属性决策的支持向量机方法提出基于SVM的城乡发展一体化测度模型,决策问题可以表示为:

DR:[x1(u),x2(u),…,xn(u)]

其中DR为决策原则,X={x1,x2,…,xn}是研究对象构成的集合,Y={y1,y2,…,ym}是属性集,aij是研究对象xi在yj下的属性值(i=1,2,…,n;j=1,2,…,m),矩阵A=(aij)n×m表示研究对象X关于属性Y的决策矩阵,为避免属性之间量纲不同对评价结果造成的影响,对矩阵A进行无量纲化和正向化处理,得到规范化矩阵R=(rij)n×m。

所提出的城乡发展一体化水平测度模型利用SVM强大的非线性处理能力和良好的学习能力描述决策者偏好,通过对决策样本的学习,建立基于SVM的决策模型,也就是要设计一个高维空间映射关系ui=F(rij),描述属性向量(ri1,ri2,…,rim)与效用值ui之间的非线性映射关系,反映决策者偏好。

基于SVM的城乡发展一体化水平的测度分为学习阶段和执行阶段。学习阶段主要用于获取决策者的偏好行为并建立决策模型,大致可将其分为构造学习样本、模型训练和测试。学习样本主要通过效用函数拟合将属性值效用化以便获取决策者偏好信息,通过训练和测试学习样本选取SVM的核函数以及参数对比寻优建立最优决策模型,记忆决策者偏好信息。执行阶段则是将效用化的属性真实值输入已建立的决策模型获得映射回归值,即城乡发展一体化水平评价值。

四、延安城乡发展一体化的实证研究

(一)城乡发展一体化的属性

已有研究主要采用理论分析法、频率分析法和专家咨询法等选取评价指标,本文在查阅已有研究的基础上,选取尽可能多的指标作为测度城乡发展一体化水平的属性,共19个,如表1所示。

表1 城乡发展一体化水平评价属性

(二)数据来源和处理

数据来源有两个:第一,统计资料,包括《陕西省统计年鉴2013》《陕西省区域统计年鉴2013》《延安统计年鉴2013》《陕西省县域经济监测排行榜2013》;第二,延安地区实地调查的数据。

由表1可以看出各属性之间具有不同的量纲和属性方向,为避免对评价结果产生影响,需要对属性进行趋同化和无量纲化处理。采用标准化方法处理数据得到规范化矩阵R=(rij)19×12。

(三)构造学习样本

(四)训练与测试

随机抽取18个样本作为测试样本,其余210个作为训练样本。采用MATLAB下的libsvm工具箱,通过网格搜索法得到最优核函数为径向基核函数,经过10折交叉检验得到最优参数:c=1,gamma=0.6,epsion=1.0×10-6。此模型对测试样本进行预测得到测试样本均方差MSE=0.0009,平方相关系数SCC=0.988,说明模型具有很好的预测能力。

(五)执行阶段

利用训练好的SVM回归模型将规范化矩阵R作为SVM的输入,得到计算结果如表2所示。

表2 延安地区各县城乡发展一体化水平排名

由上表可知,延安地区城乡发展一体化水平中,黄陵和吴起的指数最高,分别是1.09、0.919;志丹次之,城乡发展一体化指数为0.744;发展水平最差的是黄龙和延长,水平指数分别是-0.196、-0.178;居中的各县城乡发展一体化水平差距不大。为进一步考察各县城乡发展一体化阶段性,对各县水平指数进行K-Means聚类分析。通过聚类分析,将延安12县的城乡发展一体化水平划分为四个阶段,高度一体化阶段以1.0045为聚类中心,包括黄陵、吴起;中度一体化阶段以0.7438为聚类中心,仅包括志丹一县;初步一体化阶段以0.3029为聚类中心,包括洛川和安塞两县;其余的七个县处于城乡互动起步阶段。可见延安县域城乡发展一体化水平差异很大,两极分化现象比较严重。

五、结论及政策建议

本研究将城乡发展一体化水平测度转化为多属性评价问题,映射样本到高维空间中,利用SVM在高维空间中进行分类并计算效用值,研究得到了两点结论:第一,提出了基于SVM的城乡发展一体化水平评价模型及测度方法;第二,利用提出的模型实证研究了延安地区12个县的城乡发展一体化水平,一方面检验了模型的有效性,另一方面定量描述了延安地区12个县城乡发展一体化的阶段性和差异性。

实证研究的结果表明,延安城乡发展一体化水平不均衡,存在两极分化现象。12个县的城乡发展一体化水平可以划分为四个阶段,对每个阶段适用的差异化发展建议如下:

第一,高度一体化阶段要坚持工业化带动城乡发展一体化,通过引入高水平的项目改善产业结构,促进转型升级,同时加快发展社会公共服务。黄陵和吴起两县处于高度一体化阶段,依托资源优势发展工业带动了本地的城乡发展一体化,城乡差距在经济社会快速发展中不断缩小。例如,城乡人均GDP和城乡人均收入都有了较大提高,而且差距越来越小。聚类结果表明,这两个县城乡发展一体化水平相近,结构相似,表现为工业化水平较高,经济总量较大,城乡差距小。但是,社会公共服务方面有所欠缺。黄陵县的农村社会保障覆盖率和安全饮用水普及率处于中等偏下水平,吴起县的公路交通网密度排名倒数第二,这是两县在城乡发展一体化进程中的短板,也成为制约两县城乡发展一体化的主要因素。

第二,中度一体化阶段要加快发展工业,增加信息化投入,促进两化融合,利用信息化提升产业优势,缩小城乡信息鸿沟,带动城乡发展一体化。志丹的资源优势和区位优势使得其工业和现代农业都具有较高水平,工业和农业的平衡发展带动了城乡发展一体化,但是,该县的问题是信息化水平较低,而且已经成为制约发展的主要障碍,也是其跨入高度发展一体化的主要瓶颈。在延安地区12个县中,志丹的信息化水平排名11位,较低的信息化水平制约了产业结构升级,影响了产业链无缝衔接,同时也是加大城乡信息鸿沟的主要原因。政府通过信息化基础设施的投入,改善信息化环境,同时引导企业增加信息化投入,为两化融合奠定基础,是促进城乡发展一体化的重要抓手。

第三,初步发展一体化阶段要改变现代农业产业化水平较低,产业结构单一的状况。聚类的结果显示,农业规模较大,产业结构单一是洛川和安塞的特点,优越的农业生产条件和明显的区位优势是两县的优势所在,不足之处在于工业发展的产业结构单一,现代农业产业化推进较慢。洛川的特点是农业比重较大,表现是非农产业从业人员比重、乡村人员非农就业比都是12个县中最低的,而安塞尽管农业生产条件较好,但是农业机械化水平在12县中排名倒数第一。因此,两县优越的农业产生条件是一把“双刃剑”,利用比较优势发展农业是两个县的合理选择,特色农业取得了较好的经济效益,但是却削弱了推进农业产业化的动力。安塞和洛川依托资源优势和区位优势发展工业也取得了一定成果,但是产业结构比较单一,造成了两极分化。工业农业分别发展的结果虽然拉动了城乡发展,但是城乡差距很难缩小,反而有越来越大之势。因此,这两个县的发展应该走工农业齐头并进之路,在传统农业基础上大力推进现代农业产业化,通过集约化的农业生产促进农业人口收入不断增加,逐步缩小和城镇人口的差距。同时,利用其区位优势,通过引进高水平项目改善增量,实现产业结构转型升级。

第四,对处于城乡互动起步阶段的七个县而言,需要在对比差距的基础上,找到制约城乡发展一体化的短板,以此为突破口,实行差异化的发展策略,提升城乡发展一体化水平。七个县中,子长最为特殊,是典型的低水平一体化,经济、社会等各个方面指标都低于12个县的平均水平,需要全面赶超。其他各县均有某些方面远低于平均水平,包括:甘泉城镇化水平和交通网密度较低;宜川教育投入和非农产业增加值较低;延川人均固定资产投资和农业机械化水平低于平均水平;富县乡村从业人员非农占比和非农产业人员比成为发展短板;延长信息化水平较低;黄龙非农产业增加值和安全饮用水不达中等水平。各个县应该以改善这些方面的状况为工作重点,推进城乡发展一体化,尽快进入初步城乡发展一体化阶段。

[1] 健全城乡发展一体化体制机制 让广大农民共享改革发展成果[N].人民日报,2015-05-02(1).

[2] 王渊,白永秀,王宇.城乡经济社会一体化内涵与外延的再认识[J].福建论坛,2013,(1).

[3] 周江燕,白永秀.中国城乡发展一体化水平的时序变化与地区差异分析[J].中国工业经济,2014,(2).

[4] 杨荣南.城乡一体化及其评价指标体系初探[J].城市研究,1997,(2).

[5] 李志杰.我国城乡一体化评价体系设计及实证分析——基于时间序列数据和截面数据的综合考察[J].经济与管理研究,2009,(2).

[6] 刘伟,张士运.北京城乡经济社会一体化进程评价定量化研究[J].生态经济,2009,(8).

[7] 刘伟,张士运,孙久文.我国四个直辖市城乡一体化进程比较与评价[J].北京社会科学,2010,(1).

[8] 李运祥,陈国生.城乡一体化评估体系的主要指标——以湖南省为例[J].求索,2010,(2).

[9] 完世伟.城乡一体化评价指标体系的构建及应用——以河南省为例[J].经济经纬,2008,(1).

[10] 苏春江.河南省城乡一体化评价指标体系研究[J].农业经济问题,2009,(3).

[11] 罗雅丽,张常新.城乡一体化发展评价指标体系构建与阶段划分——以大西安为例[J].江西农业学报,2007,(7).

[12] 付兆刚.统筹城乡的评价指标体系与实证分析[J].哈尔滨商业大学学报(社会科版),2009,(1).

[13] 李勤,张元红,张军,等.城乡统筹发展评价体系:研究综述和构想[J].中国农村观察,2009,(5).

[14] 中国社会科学院农村发展研究所城乡统筹研究课题组.统筹城乡发展评价及其政策建议[J].重庆社会科学,2009,(11).

[15] 邓玲,王彬彬.统筹城乡发展评价指标体系研究——基于成都市温江区的实证应用[J].西南民族大学学报:人文社科版,2008,(4).

[16] 王力,汪海霞.新疆石河子垦区城乡一体化进程评价及分析[J].石河子大学学报:哲学社会科学版,2006,(6).

[17] 杨振宁.城乡统筹发展与城镇化关系的实证研究——基于安徽的数据[J].农业经济问题,2008,(3).

[18] 王阳,岳正华.城乡统筹协调发展的实证研究:2000—2008——以四川省为例[J].农村经济,2010,(3).

[19] 张庆文,叶丹,韩洁,等.城乡一体化综合评价与聚类分析——以北京市为例[J].农村经济,2010,(3).

[20] 王洪跃,张雄.湖北省城乡一体化评价研究[J].现代农业科技,2010,(5).

[21] 朱金鹤,崔登峰.新疆城乡一体化进程的影响因素与评价研究[J].干旱区资源与环境,2012,(2).

[22] 任平,周介铭,张果.成都市区域城乡一体化进程评价研究[J].四川师范大学学报:自然科学版,2006,(6).

An evaluation model was proposed to measure rural-urban integration based on support vector machine (SVM) and then empirical study with data of Yan′an. There are two contributions of this research. Firstly, empirical study indicated the evaluation model is effective and is less subjective than evaluating by index system. Secondly, the evaluation results can support authorities′ decision. We take the index as spatial dimensions and the samples can be seen as set of points in high dimensional space. The optimal kernel function and parameters are determined by the grid search method and K-cross validation training samples, and then the 12 countries of Yan′an were evaluated by the SVM evaluation model. Results indicated that rural-urban integration of Yan′an has serious polarization: Huangling and Wuqi are in the high integration phase; Zhidan is in the moderate integration phase; Luochuan and Ansai are in the preliminary integration phase; the rest seven counties are in initial stage of rural-urban interaction.

integation of rural and urban areas; support vector machine; clustering analysis; development phase

2015-10-11

陕西省软科学计划项目(2014KRM51);西安市社科规划基金(15J114);教育部人文社科青年基金(11YJC630217);陕西省哲学社会科学重点研究基地建设项目(14JZ018);西安工程大学研究生创新基金(CX2014041)

王渊,男,江苏镇江人,西北大学博士后,西安工程大学副教授,从事经济决策研究。

F127 文献标识码:A DOI:10.16152/j.cnki.xdxbsk.2016-02-022

卫 玲]

Integration Evaluation of Rural-Urban Development based on Support Vector Machine Method:Empirical Study of Yan′an

WANG Yuan1,2, HAO Xiang-ju1, CUI Hong3

(1.ManagementSchool,Xi′anPolytechnicUniversity,Xi′an710048,China; 2.SchoolofEconomic&Management,NorthwestUniversity,Xi′an710069,China; 3.Students′AffairsDivision,Xi′anTechnologicalUniversity,Xi′an710048,China)

猜你喜欢
测度指标体系城乡
三个数字集生成的自相似测度的乘积谱
R1上莫朗测度关于几何平均误差的最优Vornoi分划
非等熵Chaplygin气体测度值解存在性
Cookie-Cutter集上的Gibbs测度
城乡涌动创业潮
层次分析法在生态系统健康评价指标体系中的应用
供给侧改革指标体系初探
城乡一体化要两个下乡
缩小急救城乡差距应入“法”
城乡一体化走出的新路