闫芳序 王剑辉 蔡云鹏
基金项目:辽宁省科学技术计划项目工业攻关及产业化指导计划(2019010094-JH8/101);辽宁省教育厅科学研究经费项目(LFW202004);沈阳师范大学创新团队支持计划(054/92000306002)
第一作者简介:闫芳序(2000-),女,硕士研究生。研究方向为人工智能。
*通信作者:蔡云鹏(1972-),男,博士,副教授。研究方向为工业大数据。
DOI:10.20028/j.zhnydk.2024.03.014
摘 要:在乡村振兴战略下,分析农村贫困的影响因素对减贫工作具有重大的指导意义和参考价值。该文基于因子分析法,引用辽宁省某国家级贫困县脱敏后的真实数据,首先将每种影响贫困的因素分为属性和经济性影响因素两大类,将预处理后的数据进行KMO与Bartlett检验以确定数据对因子分析的适应性。提取特征值大于1的公因子共计12个,建立三级指标体系。而后分别计算3类权重值,按程度将影响因素分为4个等级,比较得出农村贫困影响因素等级。通过比较分析,发现家庭结构、房屋面积、文化水平和是否接通生活用电用水等因素对家庭贫困的影响最大,其中,生产、经营、工资、种植、务工和养老保险金等是影响农民增收的重要因素。
关键词:乡村振兴;农村贫困;影响因素;因子分析;权重计算
中图分类号:F812.8 文献标志码:A 文章编号:2096-9902(2024)03-0053-06
Abstract: Under the strategy of rural revitalization, the analysis of the influencing factors of rural poverty is of great guiding significance and reference value for poverty reduction. Based on the factor analysis method, this paper quotes the real data after desensitization of a national poverty county in Liaoning Province. Firstly, each factor affecting poverty is divided into two categories: attribute and economic factors. The preprocessed data are tested by KMO and Bartlett to determine the adaptability of the data to factor analysis. A total of 12 common factors with eigenvalues greater than 1 are extracted, and a three-level index system is established. Then three kinds of weight values are calculated respectively, and the influencing factors are divided into four grades according to the degree, and the influencing factors of rural poverty are compared. Through comparative analysis, it is found that family structure, housing area, education level, access to electricity and water have the greatest impact on family poverty, among which, production, management, wages, planting, employment, old-age insurance and other factors are important factors affecting farmers' income.
Keywords: rural revitalization; rural poverty; influencing factors; factor analysis; weight calculation
黨的二十大提出要全面推进乡村振兴。这标志着我国的农村建设、农村发展、农村扶贫开发工作进入了一个新的时期。要坚持以发展为中心,把“三农”问题彻底解决好,取得脱贫攻坚胜利,实现共同富裕,以更快的速度迈向中国特色社会主义现代化的进程。乡村振兴是我国今后乡村建设发展的主要方向,需要从目前的发展中找到新的问题和新的发展方向,实现脱贫和发展的有机结合和乡村的可持续发展[1]。改革开放后,国家实施了一系列精准扶贫政策,成效显著。中国已实现了7.7亿人的脱贫,农村居民人均可支配收入从2013年的6 079元提高到了2020年的12 588元,平均每年增加11.6%[2];即使在与突发的新冠感染疫情进行抗争的情况下,中国也比联合国提出的2030年可持续发展议程的减贫目标提早了10年,为世界减贫工作贡献了卓越的力量[3]。2021年的脱贫胜利,既是我们的终点,也是我们的新起点。脱贫工作应根据新问题、新情况,进行科学、合理、有效的扶贫研究,从而达到脱贫的战略目的。贫困程度深,致贫原因复杂,困难重重,必须运用科学的统计手段,寻找问题的症结,避免人力、物力、财力的浪费;科学规划,巩固和扩大脱贫成效,坚持以持续的方式追求更好的生活,确保从集中力量支撑脱贫攻坚到全面振兴。
1 研究方法
1.1 因子分析法
因子分析法是一個逐步降低维度的过程,来自英国的心理学家C.E.斯皮尔曼最早提出因子分析法的思想,他根据各科分数的关系,推论出存在潜移默化的共同因素对学生的学习产生了影响,使得在某些学科中表现更好的同学往往在其他学科中表现更好。
因子分析的实质是根据各个研究变量之间的内在相关性,通过分类归并手段提取多个变量中的潜在共性因子。且各因子互不相关,即它们所综合的信息并无交集。而后用这些隐式的综合因子来表达多个变量所传达的信息。具体可分“信息浓缩—权重计算—得分比较”3个步骤,首先将多个信息项浓缩为几个关键性指标,利用方差解释率值计算各指标的权重,构建因子权重体系,而后根据成分和权重计算因子得分,常用于比较综合竞争力,从而得出结论[4]。其具体数学模型如下
设Xi(i=1,2,…,p)个变量,如果表示为
Xi=μi+ai1F1+…+aimFm+εi,(m≤p)。 (1)
式中:
X=[X1,X2,…,Xp]T,μ=[μ1,μ2,…,μp]T,ε=[ε1,ε2,…,εp]T ,(2)
称F1,F2,…,Fp为公共因子,它们的系数称为载荷因子。εi为特殊因子,是不能被前m个公共因子包含的部分,并且需满足
E(F)=0,E(ε)=0,Cov(F)=Im, (4)
D(ε)=Cov(ε)=diag(σ,σ,…,σ),Cov(F,ε)=0。(5)
1.2 权重计算
在二级指标基于一级指标上的权重(Ai)中,n为公因子个数(n=12),Ci为第i个成分的方差贡献率,即第i个成分对农村贫困的影响程度。其计算公式如下
Ai=。 (6)
在因子分析的过程中,对各自变量前的系数aij进行具体的归一处理。从而可以获取三级指标基于二级指标上的权重值(Aij)。其中n为主成分个数(n=12),m为第j个公共因子上承载的三级指标数,为第i个成分所涵盖的第j个三级指标的因子得分系数。其计算公式如下
Aij=aij/|aij|(i=1,2,…,n)。 (7)
由上述算式可得Ai,Aij,由此可导出三级指标基于一级指标上的权重值(wi),计算公式如下
wi=AiAij。 (8)
1.3 数据处理
1.3.1 数据来源
中国是世界上最大的发展中国家,从古代起就以农业为主体,乡村贫困严重地制约着国家的兴盛。农村贫困问题的影响因素很多,而且大部分都是相互联系的,主要是经济、环境、社会因素的综合作用。本文数据源来自辽宁省某国家级贫困县,数据提取自某县脱贫攻坚大数据平台。主要涵盖2017—2020年的已脱离贫困数据近22万余条,将属性影响因素与经济性影响因素相结合,采用 Python技术进行数据挖掘与分析,最后得出相应结论。
1.3.2 指标选取
由于影响农村贫困的因素复杂繁多,本文在划分过程中将众多影响因素根据属性与经济性2类范畴分类。其中属性影响因素包括年龄、家庭人口、住房面积、是否不愁吃、是否不愁穿、是否危房、是否辍学学生、是否在校生、是否通生活用电、是否通生活用水、是否独生子和文化水平。本文属性影响因素中,含有“是否”的因素均为指标型变量,采用编码的形式进行计算:取1为“是”;0为“否”。特别地,将文化程度分为9类,分别用数字 1~7表示,依次是1为“文盲或半文盲”、2为“小学”、3为“初中”、4为“中专”、5为“高中”、6为“大专”和7为“本科及以上”。
经济性影响因素包括收入类因素(家庭年纯收入、工资性收入合计、生产经营性收入合计、种植业收入合计、养殖业收入合计、林果业收入合计、其他收入合计、财产性收入合计和转移性收入合计)和支出类影响因素(生产经营性支出、其他生产经营性支出、生活性支出合计)。
1.3.3 数据归一化
指标型变量在编码之后与数字型变量(如家庭年纯收入、家庭人口数、年龄等)数值相差巨大,不可以直接进行计算分析,因此需要进行数据标准化处理,利用标准化后的数据进行数据分析。本文利用z-score算法,通过对样本的平均值、标准偏差进行归一化,并将不同的数据转换成z-score的统一度量。由于本文数据量较大,故只展示部分影响因素的前10条归一化结果,见表1。
2 实验验证与分析
2.1 数据检验
进行因子分析的前提是对数据相关性进行检验,通常情况下采用KMO和Bartlett's球状检验2种方法,确保检测值落在一定的区间内,从而判别数据是否适用于因子分析[5]。当KMO值越接近于1的时候,各变量间的关联度随KMO值增大而升高,KMO值越接近于0,各变量之间的关联度也越低,越不适宜进行因子分析,球形度检验则恰恰相反。本文基于Python中的factor_analyzer包,进行数据相关性检验。检验结果为KMO=0.553,显著性为0,因此适用于因子分析。且特征值大于1的因子有14个,且每个因子都对变量存在一定贡献,由Python程序计算可得方差累计贡献率为61.5%,说明存留了大量关于原始数据的信息。针对单个因子分析,因子1的特征值为2.813,保留了8.5%的原始信息,显然高于其他成分,对于农村贫困影响相对较大。其他因子的分析可依次类推。根据碎石图也可以直接观测出因子特征值的分布情况,如图1所示,由于因子13—14的波动较小,所以本文取前12个因子作进一步分析。
2.2 因子旋转
在建立因子分析模型时,因子建模有3点意义:第一,发现公因子;第二,划分组别并插入相应的公因子;第三,明確分析公因子的独立意义,以便更为科学地解决处理实际问题。可以采用对因子进行旋转的方法,即基于因子的载荷矩阵之上进行一定的矩阵变换,使结构更为简单化[3]。本文利用最大方差法对载荷矩阵进行旋转,而后对12个主要因子进一步旋转,更好地反应变量与公因子之间的既得关联,得到的载荷矩阵见表2。
2.3 因子权重计算
由表2中矩阵可以对影响因素进行分类,构建三级指标体系,并根据三重指标权重的计算公式整理得到各级指标权重[6-7],见表3。
2.4 影响因素分析
为比较各影响指标的重要程度,本文将各指标按照权重大小升序排列,将影响程度Ti分为:“轻微重要”“一般重要”“比较重要”“非常重要”4项。其中Ti具体的取值范围如下
Ti=轻微重要Ni∈[0,1)一般重要Ni∈[1,2)比较重要Ni∈[2,3)非常重要Ni∈[3,+∞)
式中:Ni=80×|wj|,可由以上影响因素得出贫困影响因素的等级,见表4。
综上可知,对农村贫困的影响非常重要的因素共7项,它们分别是生产经营类收入、工资类收入、独生子女家庭、住房面积、家庭人口数、种植业收入及生活类支出;对农村贫困的影响比较重要的因素共4项,它们分别是生产经营类支出、是否通生活用水、是否双女户及养老保险;对农村贫困的影响一般重要的因素共3项,它们分别是文化水平、其他收入、是否通生活用电;对农村贫困的影响轻微重要的因素是年龄。
针对属性影响因素,“独生子女家庭”“住房面积”“家庭人口数”均属“非常重要”的影响等级,这表明农村家庭的结构组成至关重要,会对经济产生重要的影响;“是否双女户”“是否通生活用水”属于“比较重要”的影响等级,“是否双女户”反映了农村家庭的劳动力情况,一般女子的劳动力较男子低,分担家务、农活的能力较差;若为双女户家庭,会影响耕种进度及劳动情况。且根据统计数据显示,农村贫困地区缺乏生活用水的概率高达37.5%,严重影响日常生活及农作物灌溉。水是生命之源,有没有通上自来水,这一问题对居民的生活和发展产生了很大的影响,所以要着重于管道的铺设和投资,保障居民的饮水安全。
“文化水平”属于一般类影响因素,接受教育的程度在很大程度上决定了其所从事工作技术含量的高低,进而会影响收入。因此,要不断地、全方位地加强教育扶贫,要大力推进农业实用技术培训,提高农村劳动力的受教育率。同时,要有效地缓解因上学而带来的家庭经济负担,保证所有学龄儿童都能进入学校,为更多的农村年轻人提供更好的教育环境,增强他们自身发展的能力,防止贫困的世代传承。政府应该重视农村地区的教育,提高农村义务教育的普及率,提高农民的文化素质,进而增强农民的就业竞争力,增加农民的就业率和劳务收入。最后,“年龄”对贫困的影响程度较低。
针对经济类影响因素,“生产经营类收入”“工资类收入”“种植业收入”“生活类支出”均属“非常重要”的影响等级,因为农村地区的主要经济来源为耕种、生产经营及日常工作所得工资。“生产经营类支出”“养老保险”属于“比较重要”的影响等级,养老保险是我国目前最重要的养老保障制度,其主要服务对象是老年人,与老年人的年龄有着密切的联系,因而每年一直都受到人们的广泛重视。“其他收入”属于“一般重要”的影响因素,除了以上几种主要的经济来源之外,农民家庭还可以获得其他的收入,例如耕地补贴、大豆补贴、防护林巡逻队员补贴等。
3 结论
水是生命的源泉,目前乡镇还没有全部开通自来水,这个问题已经严重影响到了居民的生存和发展,因此,我们应该把重点放在铺设水管上,并提供适当的资金,以尽快解决这个问题。此外,教育水平在诸多属性影响因子中具有普遍意义;在这些因素中,有无退学、有无住校学生等影响教育的因素也有,但是由于这些因素在一般情况下都是相同的,所以并没有在因子分析中单独反映,而被教育程度的影响因素所代替[8]。
经济影响主要有生产、工资、种植和生活等,还有低保金、五险金、退休金等各类转移性收入。养老保险的档次和缴费年限关系到人们的生活水平,是当今社会的一个热点问题。因此,要结合村民年龄、家庭人口等特点,制定扶贫政策,既要兼顾生产经营、种植业的收入,又要关注其个体经济产业等方面的问题,比如可以针对贫困户个体经济企业减免税收,并给予他们一定的补助,以此来调动贫困户创新创业、主动脱贫的积极性。农业、林业和渔业是其主要经济来源。在着重提高经济的同时,也要重视生态环境问题。水资源、森林、耕地等资源依然是制约贫困的主要制约因素,农业基础设施的发展依然十分薄弱,农业信息化建设在扶贫工作中起着举足轻重的作用,但当前信息化建设在我国农村扶贫中的作用尚未完全发挥,因此必须大力推进农业机械化、信息化、现代化[9]。
影响农村贫困的因素并非仅限于这一点,还有一些社会的主观因素,比如老年人的养老问题,即孩子会不会把他们当成自己的一颗“摇钱树”,只顾着“啃老”,却忽略了他们的身心健康状况,无法给予他们应有的关怀。另外,在决定贫穷的因素中,内在的因素比外在的因素要多。扶贫的关键是要激发贫困群众的内在动力,要根除“等别人靠别人”的观念。首先,要制定合理的扶贫政策,为提高农民的脱贫提供有效的激励。其次,要注意引导贫困者的抱负。最后,通过组织学习、示范、宣传等方式,促进贫困人口的勤劳致富。针对扶贫对象的健康问题要充分调动贫困人口的自主经营意识,增强他们的个体素质,真正实现“授人以渔”。同时,要防止盲目跟风,缺乏合理的规划安排,脱离实际。
本文基于因子分析方法,针对辽宁省国家级重点贫困县的实际情况,采用Python数据挖掘处理技术,对贫困信息进行脱敏处理、数据清洗、数据标准化等数据预处理过程,得到正规统一的数据进行下一步分析。为进一步判断数据是否适合因子分析的方法,本文采用KMO法与巴特利特检验法,根据法则标准对比判断数据是否吻合要求。选取适当的公因子评估其影响比重,进而获取因子得分,得到影响农村贫困因素的主要因子,并围绕致贫原因给出了相应的分析与意见。
参考文献:
[1] 赵永刚.乡村振兴战略下农村贫困治理路径研究[J].智慧农业导刊,2023,3(19):82-85.
[2] 我国7.7亿农村贫困人口摆脱贫困:兑现庄严承诺 创造人间奇迹[EB/OL].https://m.gmw.cn/baijia/2021-04/07/1302215352.html.
[3] 徐晓阳.我国农村贫困人口稳定脱贫的影响因素与对策[J].乡村科技,2021,12(5):6-7.
[4] 韩林芝,邓强.我国农村贫困主要影响因子的灰色关联分析[J].中国人口·资源与环境,2009,19(4):88-94.
[5] 李昕,韦巍,陈旭.基于SPSS程序的贫困村农民收入状况分析——以靖西市某贫困村为例[J].现代农业科技,2016(21):269-270.
[6] 郭兴华.基于因子分析法的A市农村地区扶贫绩效评估实证分析[J].技术经济与管理研究,2020(12):124-128.
[7] 何蓉.多维视角下民族地区农户致贫因素分析——基于黔东南苗族侗族自治州黄平县的调查[J].理论观察,2013(11):80-82.
[8] 李彦军,刘梦帆.我国农村家庭贫困影响因素及区域差异[J].中南民族大学学报(人文社会科学版),2021,41(2):139-149.
[9] ORSHANSKY M. Counting the poor: another look at the poverty profile. 1965.[J]. Social Security Bulletin,1988,51(10):25-51.