基于因子分析和聚类分析的广西农垦农场综合发展水平评价

2020-12-21 03:49徐坤冯娟黎高陆玉琴
安徽农业科学 2020年22期
关键词:聚类分析因子分析评价

徐坤 冯娟 黎高 陆玉琴

摘要 以广西农垦24个农场为样本,选取第一产业生产总值、第二产业生产总值、第三产业生产总值、地区生产总值等16项指标,利用广西农垦统计年报相关数据,构建综合发展水平评价体系,先采用因子分析的方法,对各农场的综合发展水平进行排序,在此基础上采用系统聚类法Ward 法,通过因子综合得分对各地区进行聚类,分成4类。并针对不同的类型对各类别做简要分析,根据社会发展形势、国家政策和地区特点提出建议。

关键词 因子分析;聚类分析;综合发展水平;评价

中图分类号 F061.3文献标识码 A文章编号 0517-6611(2020)22-0246-05

doi:10.3969/j.issn.0517-6611.2020.22.065

Evaluation of the Comprehensive Development Level of Guangxi Agricultural Reclamation Farms Based on Factor Analysis and Cluster Analysis—Taking 24 Farms of Guangxi Agricultural Reclamation as Examples

XU Kun,FENG Juan,LI Gao et al

(South Subtropic Agricultural Scientific Research Institute of Guangxi, Longzhou, Guangxi 532415)

Abstract 24 farms of Guangxi agricultural reclamation were taken as samples, 16 indicators such as total output value of the primary industry, total output value of secondary industry, total output value of tertiary industry, regional gross value of production were selected, using relevant data of Guangxi farming reclamation statistical annual report, an evaluation system for comprehensive development was established. Factor analysis was used to rank the comprehensive development level of each farm, on this basis, through the factor comprehensive score, the systematic cluster analysis (Ward method) was used to cluster each region, which was divided into four categories. It made a brief analysis of each category according to different types and also put forward suggestions according to social development situation, national policies and regional characteristics.

Key words Factor analysis;Cluster analysis;Comprehensive development level;Evaluation

作者简介 徐坤(1988—),女,广西陆川人,经济师,从事农业经济管理、财务审计研究。*通信作者,经济师,从事农业经济管理、财务审计研究。

收稿日期 2020-04-08

社会发展水平的高低是衡量一个地区综合实力、文明程度和现代化的重要标志[1]。为综合反映广西农垦农场经济社会的发展水平,笔者以广西农垦24个农场为例,选取第一产业生产总值、第二产业生产总值、第三产业生产总值、地区生产总值等16 项指标,对各农场的社会发展水平通过因子分析、聚类分析法给出地区排名和聚类。

1 指标选取、数据来源与研究方法

1.1 评价指标体系构建

地区综合发展水平评价指标体系,是度量一个地区综合发展程度的工具。为了使评价结果全面、准确、客观地反映现实,在选取评价指标时,需遵循系统性、典型性、独立性、有效性、可比性、可操作性、导向性以及动态性8条原则。影响综合发展水平的因素有很多,為了科学合理地进行评价,在遵循上述原则的基础上,选取16项指标构建地区综合发展水平的评价指标体系:第一产业生产总值(A1)、第二产业生产总值(A2)、第三产业生产总值(A3)、地区生产总值(A4)、劳动者报酬(A5)、人口总数(A6)、从业人员总数(A7)、工业社会从业人员人数总数(A8)、全社会人口纯收入(A9)、经营总收入(A10)、农林牧渔业总产值(A11)、交通运输业全年营业总收(A12)入、批发和零售业全年销售总额(A13)、住宿和餐饮业全年营业收入(A14)、居民服务业全年营业收入(A15)、招商引资到位资金(A16)。

1.2 数据来源

该研究数据主要来源于《2017年广西农垦统计年报资料汇编》。

1.3 研究方法

1.3.1

因子分析法。一般认为因子分析是从Charles Spearman 1904年发表的文章《对智力测验得分进行统计分析》开始的,它是一种对高维数据进行降维处理的方法,通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。这几个抽象的变量被称作“公因子”,能反映原来众多变量的主要信息。原始的变量是可观测的现在变量,而公因子一般是不可观测的潜在变量。因子分析还可以对初始因子载荷矩阵进行旋转,使因子和原始变量之间的关系进行重新分配,提取的主因子具有实际意义,用公共因子反映变量之间的相关关系,并对其做出比较简单的解释,揭示指标间的内部规律从而使结果更加客观、合理。

1.3.2 聚类分析法。聚类分析又称集群分析,是按“物以类聚”原则研究事物分类的一种多元统计分析方法。根据样本的多指标、多个观察数据,定量地确定样品、指标之间存在的相似性或亲疏关系,据此联结这些样品或指标归成大小类群。采用系统聚类法不需要给定分类的标准,也不需要给出所有数据分成几类,而是比较客观地从数据自身出发进行分类[2-9]。

2 结果与分析

2.1 因子分析

2.1.1 原始数据的无量纲化处理。为了消除指标之间量纲不一致和数量级差异大等现象,首先需要对评价指标的原始数据进行无量纲化处理[10-11],公式如下:

Yij=Xij-jSj(1)

式中,Yij为标准化值;Xij表示第i个样本第j个评价指标的原始测定值;j表示第j个评价指标的平均值;Sj表示第j个评价指标的标准差(SD值)。结果如表1所示。

2.1.2

因子分析的适宜性检验。应用IBM SPSS Statistics 19软件对无量纲标准化处理后的24个农场的16个评价指标数据进行指标分析,即KMO检验和Bartlett球度检验[10-13]。检验结果显示,KMO值为0.705,根据统计学家Kaiser给出的KMO度量标准可知,原始变量适合进行因子分析。Bartlett球度检验得出的相伴概率为0.000,小于显著性水平0.05,因此拒绝Bartlett球度检验的零假设,认为变量间存在较强的相关性,适合做因子分析。

2.1.3

公因子的选择。应用IBM SPSS Statistics 19软件对标准化后的数据进行因子分析,各主因子的特征值、累计贡献率如表2所示。从表2可以看出,前3个因子变量的特征值均大于1,并且经过最大方差旋转后它们的方差贡献率分别为50.047%、24.515%、12.029%,累计方差贡献率已达到86.591%,即这3个公因子已经反映了全部16项评价指标的绝大部分信息,因此可以选取这3个因子作为广西农垦农场综合发展水平的综合评价指标。

為了更加突出主要公因子的作用,将因子进行方差最大正交旋转,得到旋转后的公因子载荷矩阵如表3所示。

通过各因子旋转后的载荷矩阵可以看出,具有较高载荷的因子变量分布在若干关键评价指标上,说明它们之间有着明确的结构关系。公因子所包含的指标因子载荷若为正,表明该因子对公因子产生正向影响;因子载荷若为负,表明该因子对公因子产生负向影响。对比图1、表4可直观地解释各性状指标对3个公因子的贡献。第一公因子F1主要由A2(第二产业生产总值)、A3(第三产业生产总值)、A4(地区生产总值)、A10(经营总收入)、A13(批发和零售业全年销售总额)、A14(住宿和餐饮业全年营业收入)6个因子综合作用的指标,主要反映加工制造业和服务业方面的发展情况;第二公因子F2主要由A1(第一产业生产总值)、A11(农林牧渔业总产值)2个因子综合作用的指标,主要反映农、林、牧、渔业方面的发展情况;第三公因子F3主要由A16(招商引资到位资金)1个因子作用的指标,主要反映招商引资方面的情况。

2.1.4

公因子得分及综合发展水平的量化评价。旋转后各公因子得分系数如表4所示,24个农场各公因子的得分根据公式(2)进行计算;24个农场的综合评价得分,根据3个公因子旋转后的方差贡献率及对应的公因子得分计算,见公式(3)。结果如表5 所示。

F=Yn1×Zn1+Yn2×Zn2+…+Yn16×Zn16(2)

Fz=42.052×F1+23.907×F2+15.887×F381.846(3)

式中,F为公因子得分;Fz为综合评价得分;Yn1,…,Yn16为第n个样本的16个评价指标标准化后的值;Zn1,…,Zn16为旋转后16个评价指标因子得分系数。

从上述综合因子F的得分情况可以看出,各农场综合发展水平存在差异。从分类情况可以看出新兴农场的综合发展水平较高,分类属于良好等级。

从单个公共因子得分来看,新兴农场、明阳农场、九曲湾农场、金光农场4 个农场第一公因子(F1)得分较高,表明这4个农场在加工制造业和服务业发展方面均处于前列。而华山农场、沙塘农场、良丰农场、那梭农场则得分较低,这些农场在发展农业生产的同时,还应该注意农副食品的加工及相关配套服务产业的发展;北部湾总场、金光农场、良圻农场、昌菱农场、红河农场、东风农场6个农场第二公因子(F2)得分较高,表明这6个农场在农、林、牧、渔业等农业生产方面处于领先地位,而九曲湾农场、大明山农场则得分较低,这些农场还应该注意农业生产的发展;九曲湾农场、北部湾总场、良圻农场3个农场第三公因子(F3)得分较高,表明这3个农场在招商引资方面处于领先地位,而源头农场、明阳农场则得分较低,这些农场还应加大招商引资的力度。

2.2 基于聚类分析的各农场综合发展水平评价

在上述因子分析的基础上,利用因子分析产生的新变量(因子综合得分F值)进行聚类分析,即采用以区间平方Euclidean 距离为度量标准,利用Ward法对24个农场进行聚类。据此,24个农场可分为4类,如图2所示,各类群评价指标的平均值见表6。

从表6可以看出,第Ⅰ类群,即新兴农场,除第一产业生产总值、农林牧渔业总产值、交通运输业全年营业总收入以及招商引资到位资金4个指标外,其他指标均领先于其他3个类群,综合发展水平领先优势明显,第Ⅱ类群刚好在第一产业生产总值、农林牧渔业总产值、交通运输业全年营业总收入以及招商引资到位资金4个指标领先于其他3个类群,第 Ⅲ 类群、第 Ⅳ 类群则无明显领先优势,但第Ⅲ类群各评价指标的平均值要明显高于第Ⅳ类群。表明聚类分析对各个农场的综合发展水平进行了较为准确的分类,分类结果与现实相符,而因子分析综合得分结果和聚类分析的结果也能够基本保持一致,说明因子分析和聚类分析的结果能互相印证,分析结论可信。

3 结论与建议

该研究通过因子分析和聚类分析发现,综合发展水平较高的农场不多,绝大多数农场的综合发展水平偏低。现就如何提高农场的发展水平提出几点建议。

(1)因地制宜,发挥自身优势,实现经济发展3个经济带齐头并进。综合发展水平较好的农场要利用原有的发展优势反哺发展劣势和短板,各农场之间还可以进行优势互补,实现共同发展。

(2)产业优化,结构升级,尤其是第Ⅲ、Ⅳ类地区想要改变自身发展滞后的现状,就要优化自己的产业比例,加强第三产业发展力度,向发展较好的农场学习,走可持续发展道路。在以经济发展为主要任务的同时,还应顾及生态环境的建设。党的十八大以来,生态建设这一政策导向将影响我国未来5~10 年的经济建设主题,也可以以此为契机鼓励发展水平不高的农场发展扩大生态产业。

(3)廣西农垦集团要在集团层面加大招商引资的力度,大力扶持发展相对落后的农场,充分挖掘其自身地理、人文、环境等有利因素以实现全面发展。

参考文献

[1] 陶文达.发展经济学[M].北京:中国财政经济出版社,1988.

[2] 王学民.应用多元统计分析[M].2版.上海:上海财经大学出版社,2004.

[3] 余建英,何旭宏.数据统计分析与SPSS应用[M].北京:人民邮电出版社,2003.

[4] 何晓群.多元统计分析[M].北京:中国人民大学出版社,2004.

[5] 杜强,贾丽艳.SPSS统计分析从入门到精通[M].北京:人民邮电出版社,2009.

[6] 薛毅,陈立萍.统计建模与R软件[M].北京:清华大学出版社,2007.

[7] 李静萍.多元统计分析——原理与基于SPSS的应用[M].2版.北京:中国人民大学出版社,2015.

[8] 李静萍,谢邦昌.多元统计分析方法与应用[M].北京:中国人民大学出版社,2008.

[9] 袁志发,周静芋.多元统计分析[M].北京:科学出版社,2002.

[10] 刘昊天.基于因子分析和聚类分析的全国各地区综合发展分析[J].萍乡学院学报,2018,35(3):17-21.

[11] 杜相,张韵,杨丹.基于因子聚类分析的地区综合发展水平评价研究[J].无锡商业职业技术学院学报,2014,14(5):46-51.

[12] 罗秀秀.基于因子分析和聚类分析的全国各地区社会发展水平研究[J].齐齐哈尔工程学院学报,2015,9(4):25-32.

[13] 周冲.基于因子分析法的皖北地区农民增收分析[J].湖南人文科技学院学报,2018,35(4):67-71.

猜你喜欢
聚类分析因子分析评价
中药治疗室性早搏系统评价再评价
基于Moodle的学习评价
保加利亚转轨20年评价
多维度巧设听课评价表 促进听评课的务实有效