彭国荣
(湖北民族学院 教育学院,湖北 恩施 445000)
基于相关分析-变异系数的地市现代农业评价指标筛选模型及实证
彭国荣
(湖北民族学院 教育学院,湖北 恩施 445000)
地市现代农业评价是发展绿色农业,实现农业可持续发展的必要环节,建立合理的指标体系是评价地市现代化农业的关键.通过相关分析剔除反映信息重复的指标,利用变异系数筛选对地市现代农业评价影响最大的指标,构建了由农业投入程度、农业产出水平、农业经济结构、农业可持续发展水平等6个准则层,包含单位面积农机总动力、农业劳动生产率等31个指标在内的地市现代农业评价指标体系.通过相关分析,计算了同一标准层内两两指标之间的相关系数,找出了反映信息冗余的,即相关系数较大的指标集.在反映信息冗余的指标集中,利用变异系数计算各指标的信息含量,挑选出同一类别中最大信息含量的指标,剔除其它指标.既保证了对地市现代农业评价影响最大的指标都在筛选后保留下来,还弥补了现有指标体系存在多个指标反映同一信息、信息冗余的不足.
地市现代农业评价;指标筛选;指标体系;相关分析;变异系数
发展现代农业是提高土地生产率、资源产出率、劳动生产率和产品商品率,实现农业经济效益、社会效益和生态效益统一的必然选择;而对各地市现代农业发展水平进行测评,是落后地区寻找“差距”、先进地区挖掘自身“短板”的重要途径.现代农业评价的关键是建立合理的指标体系.根据现代农业的内涵构建地市现代农业评价指标体系,筛选出对现代农业影响最大的代表性指标,同时剔除反映信息冗余的指标.
1)现代农业指标评价体系的研究现状.一是权威机构的评价指标体系.代表性的有:Kruseman等[1]构建的农业生态系统定量评价指标体系.世界银行建立的农业可持续发展指标体系[2].柯炳生[3]构建的我国现代农业评价指标体系与标准.徐星明等[4]建立的我国现代农业进程评价指标体系.中华人民共和国国务院建立的“十二五”现代农业发展评价指标体系[5].上述指标体系虽然都是现代农业发展的评价,且具有很强的典型性,但都聚焦于宏观层面的国家为单位,不适合于微观层面地市现代农业发展的比较与评价.二是典型文献建立的评价指标体系.齐城等[6]构建的由物质装备、经济效益等6个准则层,有效灌溉率、劳均农业增加值等26个指标构成的中国现代农业评价指标体系.徐贻军等[7]构建的由农业投入水平、农业产业化水平等8个准则层,农产品综合商品率、财政支农力度等28个指标构成的湖南现代农业评价指标体系.沈琦等[8]利用单位耕地总动力、农业劳动力受教育水平等12个指标评价我国现代农业发展状况.这类指标体系存在的主要问题:一是对区域现代农业评价指标体系的研究多以宏观层面的国家或省为单位,不适合于地市现代农业发展微观层面的评价.二是现有的现代农业评价指标体系出现信息冗余的现象,存在多个指标反映同一信息.
2)现代农业发展评价指标的研究现状.一是专家经验的主观筛选方法.齐城等[6]运用层次分析AHP法和德尔菲法建立中国现代农业评价指标体系.甫永民等[9]运用层次分析法筛选出适合黑龙江垦区现代农业发展的评价指标体系.专家主观筛选法仅依赖于指标意义和个人经验,主观随意性较强,存在严重的弊端.
二是基于定量方法的客观筛选方法.张荣等[10]利用三角白化权函数的灰色评估方法,建立河南现代农业评价指标体系.乌东峰等[11]运用灰色理论构建现代多功能现代农业发展评价模型.周亚莉等[12]应用改进型熵权法从粮食安全水平、产业化经营水平、现代化生产水平、可持续发展水平和绩效水平5个方面,建立了陕西省现代农业发展评价指标体系.客观筛选法过分依赖指标数据,而忽略了指标的实际含义.
本文基于现代农业内涵和数据可获得初筛指标为基础,使用相关分析剔除反映信息重复的指标,使用变异系数选择对地市现代农业评价影响较大的指标,构建了地市现代农业评价指标筛选模型.并以陕西省西安、宝鸡等10地市现代农业评价数据为样本,进行了实证分析.
1.1 建立指标体系的基础
根据相关文献[6-18],结合国内外权威机构经典观点的高频指标[1-5],建立反应现代农业内涵的地市现代农业评价海选指标集.
为保证指标体系的实际应用,在指标筛选前,可根据数据的可观测性标准,剔除无法获得数据的指标.
1.2 指标筛选的原则
1)变异系数筛选对地市现代农业评价影响较大的指标.指标的信息含量反映了指标历年数据差异对地市现代农业评价的鉴别能力,指标数据的差异性越大,表明该指标对地市现代农业评价的鉴别能力越强;反之,鉴别能力越弱.为确保筛选出的指标对地市现代农业评价影响最大,通过变异系数筛选出各类中辨别能力最强的指标.
2)相关系数剔除反映信息冗余的指标.指标体系包含的冗余指标越多,评价结果反映的信息越混乱.经过相关性分析,剔除同一准则层中相关系数大的指标,避免指标信息反应重复.
1.3 信息含量最大的指标筛选原理
通过相关分析计算同一准则层内两两指标间的相关系数,找出反映信息冗余的指标集,即相关系数较大的指标.经过变异系数计算每一个反映信息冗余的指标的信息含量,挑选出同一类中信息含量最大的指标,剔除其余指标.既保证了筛选后保留的指标对地市现代农业评价影响最大,也避免了指标体系反映信息重复.最终构建了由农业投入水平、农业产出水平、农业经济结构、农业可持续发展水平、农村社会经济水平、农业支持保障水平6个准则层,包括了单位面积农机总动力、农村居民恩格尔系数等31个指标在内的地市现代农业评价指标体系.地市现代农业评价指标体系构建原理,如图1所示.
2.1 构建海选指标体系
梳理相关文献[6-18],结合现代农业发展内涵和国内外权威机构经典观点的高频指标[1-5],挑选出包含单位面积农机总动力等55个指标在内的、包括农业投入程度、农业产出水平、农业经济结构、农业可持续发展水平、农村社会经济发展水平、农业支持保障水平等6个准则层的指标体系的海选,如表1第1、2、5列所示.
图1 现代农业评价指标筛选原理Fig.1 The indicator screening principle of modern agriculture evaluation
表1 地市现代农业评价海选指标集
续表1
(1)准则层(2)指标层(3)参考文献(4)筛选结果(5)指标层(6)参考文献(7)筛选结果X4农业可持续发展水平X4,1森林覆盖率[3][6-8][12-15]X4,2旱涝保收率[4][7][10]X4,3区域平均降雨量[18]X4,4水土流失率[7][11]保留不可观测删除X4,5单位面积农药施用量[1][6-7][13]X4,6农业成灾率[11][14]X4,7三废治理率[17]--不可观测删除- X5农村社会经济发展水平X5,1农村居民恩格尔系数[3-4][7-8][13-15]X5,2农村居民人均纯收入[1][3-4][7-8][10][12][15]X5,3人均GDP[1-3][8][10][14]X5,4农村居民人均纯收入增长百分比[8][17]X5,5村卫生室个数[10]X5,6每一乡村人口占有耕地[7][12]X5,7乡村批发业网点数[7]X5,8空气日报优良率[7]保留X5,9零售业网点数[7]X5,10城乡居民收入比[1][3-5][7-8][10][12]X5,11千人拥有乡村医生和卫生员数[10][13]X5,12电话普及率[7][13]X5,13餐饮业网点数[7]X5,14人均居住面积[12][13]X5,15农村社会保障服务网络覆盖率[3]--保留变异系数删除不可观测删除- X6农业支持保障水平X6,1财政支农力度[1][7][13]X6,2农业从业人员人均耕地面积[4]X6,3农业投资占当年第一产业增加值的比重[6-7]X6,4农村投递线路长度[6-7]保留X6,5公路里程[6]X6,6农户入社率[7]X6,7农业信息化水平[3][6-7]X6,8农民补贴[7]变异系数删除不可观测删除
为了确保初次筛后的指标体系可以量化,根据数据可观测性原则删除无法获得数据的指标,剔除的指标在表1第4、7列用“不可观测删除”标注.
2.2 建立指标筛选模型
2.2.1标准化指标数据
1)标准化指标数据的目的.因为不同的指标单位和量纲不同,原始数据无法进行直接的评价和比较.为消除不同指标单位和量化差异对现代农业评价的影响,常采用数据标准化方法将原始数据转化为区间[0,1]之间的数[19].
2)标准化正向指标.正向指标数值越大是反映地市现代农业发展越好的指标,如“X1,1单位面积农机总动力”.
假设:Pik表示第k个地区第i指标的标准化值;Vik表示第k个地区第i指标原始数据,n表示地区数.根据正向指标标准化公式[19]:
(1)
式(1)反映了现代农业评价指标原始数值距离最大值越近,标准化后的值越大.
3)标准化负向指标.负向指标指数值越小是反映地市现代农业发展越好的指标,如“X5,1农村居民恩格尔系数”.标准化负向指标公式[19]:
(2)
式(2)反映现代农业评价指标原始数值距离最小值越近,标准化后的值越大.
4)标准化适中值指标.适中指标指数值越靠近某一特定值,表明地市现代农业发展越好的指标.本文仅有两个适中指标:“X1,4单位面积化肥施用量”、“X4,3区域平均降雨量”;其中,“X1,4单位面积化肥施用量”的适中值为180 kg/hm2[14];指标“X4,3区域平均降雨量”的适中值为500 mm/a[20].
假设:Vi0表示第i个指标的理想值,根据适中指标的标准化公式[21]:
(3)
式(3)反映现代农业评价指标原始数值距离适中值越近,标准化后的值就越大.
2.2.2 相关分析剔除冗余指标 为了消除评价指标对评价结果信息重复的影响,计算同一准则层下两两指标间的相关系数,删除相关系数比较大的评价指标,精简评价指标体系.
(4)
相关分析删除指标的标准:相关系数的绝对值越大表明两个指标之间的相关程度越大.本文选取相关系数临界值M=0.8[22-23],两个指标的相关系数的绝对值若大于0.8,表明两个指标反映的信息重复,可删除其中任何一个指标.
2.2.3 变异系数筛选信息含量最大指标 指标的变异系数反映该指标在地市现代农业评价中的鉴别能力.即变异系数越大,则该指标的分布变异性越大、信息含量越大,该指标的信息辨别能力就越强,应保留;反之,则越弱,应剔除.
为了确保所筛选出的指标对地市现代农业评价影响最大,在反应信息冗余的指标集中,利用变异系数筛选出同一类中鉴别能力最强的指标.
(5)
2.3 指标体系合理性的判定
采用文献[24]提出的“主成分-信息熵”方法,分别测算海选指标体系的信息含量IH、筛选后构建指标体系的信息含量IS.若筛选后指标体系的信息含量IS与海选指标体系的信息含量IH之比IS/IH≥90%,即筛选后指标体系保留了原海选指标体系90%以上的信息,表明所建指标体系构建合理[24].
3.1 样本选取与数据来源
以陕西省西安、铜川、安康等10地市现代农业发展评价指标数据为实证研究对象,构建了地市现代农业发展评价指标体系.指标数据来源于2013年陕西省统计年鉴[18],如表2第5~14列所示.
表2 地市现代农业发展评价指标原始数据及标准化结果
续表2
3.2 指标筛选模型的应用
3.2.1 标准化指标数据 标准化正向指标:以西安市正向指标X1,1单位面积农机总动力为例.将表2第1行第5列的数据6.033、第1行第5~14列指标数据最大值7.504、第1行第5~14列指标数据最小值2.862代入式(1),得:
同理,把表2中其余正向指标数值代入式(1),得其对应的标准化值,列入表2第15到24列相应行.利用式(2)可将表2中所有负向指标数据标准化,利用式(3)可将表2中两个适中指标数据标准化,结果列入表2对应位置.
3.2.2 基于相关分析-变异系数的指标筛选
1)求解同一准则层两两指标间的相关系数.表2第15~24列指标数据分准则层逐次代入式(4),找出相关系数绝对值大于0.8的指标集,结果如表3第3、4列所示.
表3 相关系数大于0.8的指标集
由表3可知,相关系数绝对值大于0.8的指标集合共有9个.下一步需要在每个指标集中,计算各个指标的信息含量,保留信息含量最大的一个指标,删除其余指标.
2)求全部指标的变异系数.以X1,1单位面积农机总动力为例,解释变异系数求解信息含量的过程.将表2第1行第15~24列数据及均值0.485代入式(5),得X1,1单位面积农机总动力的变异系数v1=0.644,列入表4第1行4列.
同理,可得其它指标的变异系数,分别列入表4第4列对应位置.
表4 变异系数指标筛选
3)在高度相关的指标集中,挑选出信息含量最大的一个指标、删除其余指标.由表3知,指标“X1,6农膜使用水平”和“X1,10农用机械总动力”相关系数为0.860,相关系数绝对值大于0.8,两指标高度相关、反映信息重复.再由表4第4列知,指标“X1,6农膜使用水平”的信息含量1.075高于指标“X1,10农用机械总动力”的信息含量0.385.根据上文1.3信息含量最大的指标筛选原理,剔除指标“X1,10农用机械总动力”.
同理,可以删除“X1,9单位面积劳动力数量”、“X1,11粮食播种面积”等9个反映信息重复且信息含量较低的指标.删除的指标已在表1和表4中用“变异系数删除”标注.
4)地市现代农业评价指标体系.综上,通过相关分析-变异系数的指标筛选,如表4第5列所示,建立了31个指标在内的,包括农业投入程度、农业产出水准、农业经济结构、农业可持续发展水平、农村社会经济发展水平、农业支持保障水平6个准则层的地市现代农业发展评价体系.
3.2.3 地市现代农业评价指标体系合理性的判定 采用“主成分-信息熵”方法[24],利用表2第15~24列数据,可得40个海选指标的信息含量IH=0.357;利用表2第15~24列中31个筛选后保留的指标数据,可得筛选后指标体系的信息含量IS=0.331;则IS/IH=0.331/0.357=92.72%.表明筛选后保留的指标保留了原海选指标体系92.72%的原始信息.
根据第2.3节指标体系合理性判定标准知,本文构建的指标体系合理,可以实践使用.
4.1 主要工作
本文通过变异系数计算指标的信息含量,挑选出同一类中最大信息量的指标,确保了了筛选出的指标对地市现代农业发展评价影响最显著.最终构建了由农业投入水平、农业产出水平、农业经济结构、农业可持续发展水平、农村社会经济发展水平、农业支持保障水平6个准则层,包括单位面积农机总动力、农业生产劳动率等31个指标在内的地市现代农业评价指标体系.实证研究表明:筛选后保留的31个指标保留了原海选指标体系92.72%的原始信息.
4.2 主要创新与特色
本文经过相关分析法,求解了同一准则层内两两指标之间的相关系数,找出反应信息冗余的,即相关系数较大的指标集.在反映信息冗余的指标集中,通过变异系数计算各指标的信息含量,挑选出同一类中信息含量最大的指标,剔除其它指标.既保证了对地市现代农业评价影响最大的指标都在筛选后保留下来,还弥补了现有指标体系存在多个指标反映同一信息、信息冗余的不足.
[1] Kruseman.Analytical framework for disentangling the concept of sustainable land use [J].Agricultural Systems,1996,50:191-207.
[2] WORLB BANK.Indicators of sustainable development of agriculture in the world in 2012[EB/OL].(2012-03-16)[2015-04-25].http://data.worldbank.org/country/china.
[3] 柯炳生.对推进我国基本实现农业现代化的几点认识[J].中国农村经济,2000(9):4-8.
[4] 徐星明,杨万江.我国农业现代化进程评价[J].农业现代化研究,2000(9):276-282.
[5] 国务院.国务院关于印发全国现代农业发展规划(2011-2015年)的通知[EB/OL].(2012-02-13)[2015-04-25].http://www.gov.cn/zwgk/2012-02/13/content_2062487.htm.
[6] 齐城.中国现代农业评价指标体系设置及应用研究[J].农业经济问题,2009(3):13-20.
[7] 徐贻军,任木荣.湖南现代农业发展水平评价[J].经济地理,2009(7):1166-1171.
[8] 沈琦,胡资骏.我国农业现代化指标体系改进的新思路[J].统计与决策,2012(15):25-27.
[9] 甫永民,姜法竹.基于层次分析法的黑龙江垦区现代农业发展模式分析[J].农业技术经济,2012(9):111-116.
[10] 张荣,刘斌,张慧,等.区域农业现代化进程测度体系研究及实证分析[J].河南农业大学学报,2002(1):96-100.
[11] 乌东峰,张世兵,滕湘君.基于灰色理论的现代多功能农业评价研究:以湖南省湘潭市为例[J].农业技术经济,2009(6):105-112.
[12] 周亚莉,袁晓玲.现代农业发展水平评价及其金融支持:以陕西省为例[J].西安交通大学学报(社会科学版),2010(1):19-26.
[13] 孟素英.北方地区可持续农业评价指标体系建立与验证[D].石家庄:河北科技大学,2014.
[14] 武瑞娟.河北省农业现代化指标体系构建及评价研究[D].保定:河北农业大学,2006.
[15] 李宝玉,李刚,高春雨.环渤海现代农业指标评价体系的构建与发展水平评价[J].中国农学通报,2012,28(11):133-139.
[16] 林英华,李红.基于因子分析法的聊城市农业现代化水平评价研究[J].中国农学通报,2010,26(22):403-406
[17] 贾士靖,刘银仓,王慧军.基于指标体系的河北省农业循环经济发展评价[J].中国生态农业学报,2008,16(5):1230-1233.
[18] 陕西省统计局,国家统计局陕西调查队.陕西统计年鉴2013[M].北京:中国统计出版社,2013.
[19] 石宝峰,迟国泰.基于信息含量最大的绿色产业评价指标筛选模型及应用[J].系统工程理论与实践,2014,34(7):1800-1810.
[20] 陕西省发展和改革委员会.陕西省“十三五”现代农业发展研究[R].陕西省发展和改革委员会,2014-12-07.
[21] 周知,迟国泰,章穗.基于次约束的区县科学发展评价及其实证[J].系统工程学报,2014,29(2):258-268.
[22] 迟国泰,曹婷婷,张昆.基于相关-主成分分析的人的全面发展评价指标体系构建[J].系统工程理论与实践,2012,32(1):111-119.
[23] 陈洪海,迟国泰.基于信息显著性差异的绿色产业评价指标筛选模型及实证[J].运筹与管理,2014,23(6):193 -204.
[24] 迟国泰,李战江.基于主成分-熵的评价指标体系信息贡献模型[J].科研管理,2014,35(12):137-144.
责任编辑:时 凌
The City Modern Agriculture Evaluation Indicator Screening Model and Its Empirical Study Based on Correlation Analysis and Coefficient of Variation
PENG Guorong
(College of Education,Hubei University for Nationalities,Enshi 445000,China)
Evaluation of prefecture-level modern agriculture is a necessary step to develop the green agriculture and realize the sustainable development of agriculture,and establishing a reasonable index system is the key to evaluating prefecture-level modern agriculture. In this paper,indicators reflecting the same information are eliminated by the correlation analysis,and indicators with the biggest impact on the evaluation of prefecture-level modern agriculture are screened by the coefficient of variation. And then,the index system for prefecture-level modern agriculture evaluation has been established,which involves indicators such as ′Total power of agricultural machinery per unit area′,and′Agricultural labor productivity′.The characteristics and innovation of this paper are as follows.Firstly,it calculates correlation coefficients between two indicators in the same criterion layer by using Person correlation analysis,and then these indicators possessing the bigger correlation coefficient can be obtained.It means these indicators reflecting repeated information have been obtained.Secondly,in the redundant information indicators′set,calculating the indicators′information content by utilizing coefficient of variation,this paper selects the maximum information content indicator,and removes the rest of indicators.It ensures the selected indicators have the biggest impact on the prefecture-level modern agriculture evaluation as well as make up the deficiency that a number of indicators reflect the same information in the existing index system.
prefecture-level modern agriculture evaluation; indicator screening;index system;correlation analysis;coefficient of variation
2017-03-01.
湖北省教育厅人文社会科学研究项目(16Y111);湖北民族学院院内青年科研项目(MY2017Q020).
彭国荣(1983-),女,硕士,讲师,主要从事应用数学的研究.
1008-8423(2017)03-0297-08
10.13501/j.cnki.42-1569/n.2017.09.012
N945.16 S11+7
A