赵富昌,周强
(青海师范大学地理科学学院,青海 西宁 810008)
退耕还林工程是迄今全世界范围内涉及面最广和个人参与程度最高的生态项目之一,也是生态产品私人供给的有效尝试[1,2]。1999年,退耕还林工程启动试点工作,于2002年全面启动退耕还林工程,至今已有18a,取得了巨大的生态效益和社会效益。为了巩固前期成果,于2014年又全面开展新一轮退耕还林(2014~2020年)。新一轮工程明确提出“农民自愿,政府引导”的原则,充分体现工程针对农民的意愿性。农户作为退耕还林工程的基础决策单元和微观参与主体,其积极参与的态度是退耕还林工程持续运行与有序实施的根本前提,也是工程区生态产品与经济产品协同供给的重要路径[3~5]。在新一轮的工程实施中,如何将农户的参与期望及影响因子加入工程的设计和实施中,对退耕还林工程的可持续性具有重要意义[6]。
退耕还林工程中因其涉及的内容、地域、参与人员的广泛性和复杂性, 使得农户对工程的认知和参与的意愿至关重要。因此,国内学者进行了一系列研究,唐旭、朱灵伟等[7,8]以参与意愿为因变量, 以工程项目政策、农户自身条件和区位影响等3类因子指标为自变量, 构建了造林营林和林下种养两类项目农户参与意愿的Logistic模型, 并设计了主成分回归的求解方法,得出影响农户参与造林营林项目意愿的正向作用因子为户主文化程度、家庭劳力规模,农户拥有的耕地面积、现金收入、家庭村委会成员数量,负向作用因子是户主年龄和产品产生周期长短。张朝辉等[9,10]先后分别应用Order Probit模型和TAM模型探讨了新背景下农户退耕响应意愿的影响因素和农户退耕参与意愿的生成逻辑,其研究结果表明农户对新一轮退耕还林工程的有用性感知、易行性感知、风险感知将影响其退耕响应态度,进而影响其退耕响应意愿。获取国家退耕补助、退耕地林业经营收入与非农就业收入等经济理性变量以及维持农田生产安全等生态理性变量是影响农户退耕参与意愿的显著要素。陈中泰等[11]通过对西部地区云南、甘肃两省的调研数据的分析,将模糊聚类分析和描述统计、方差检验等统计方法相结合,对329名农户的退耕还林工程的参与意愿进行实证分析,得出户主年龄、文化程度、是否党员以及林地面积这4个因素对林农参加退耕还林工程的意愿有显著影响。国内外学者从理论和方法上对农户参与退耕还林的意愿和工程效益等方面做了大量的硏究,为研究者提供了理论和方法上的指导和支持。河湟谷地地处青藏高原东北缘,是典型的农牧过渡带,是青藏高原和黄土高原、东部季风区与青藏高寒区的交界区,其独特的地理环境和多样的山地地貌形成了气候具有空间上的复杂性、时间上的易变性、响应上的敏感性和状态上的脆弱性等特点,成为最易受气候变化影响的生态脆弱地带,从而对河湟谷地农户参与退耕还林意愿的研究具有重要意义。因此,文章尝试应用谱聚类分类和随机森林确权,就农户对于退耕还林生态工程的参与意愿进行分类和贡献分析,为政府提高退耕还林生态工程的执行效率提供参考性意见。
河湟谷地位于青藏高原东北缘,地理位置介于100°40′~103°20′E,35°10′~37°18′N。海拔1658~5210m,是青藏高原海拔相对较低的区域,面积36 000km2。区域范围包括青海省境内的黄河及其支流湟水河谷地区,行政单元包括西宁、门源、互助等14个市县(图1)。属于典型的干旱、半干旱大陆性气候。据2017年统计数据,河湟谷地集聚了青海省约60%的耕地(青海省统计局,2018)。农户习惯上根据海拔、气候、土壤、植被、地貌和农业条件的不同将河湟谷地流域划分为:河谷地区(川水区)、浅山梁峁地区(浅山区)、脑山湿凉地区(脑山区)、石山林区[12],其中川水区海拔1658~2200m,浅山区海拔2200~2800m,脑山区海拔2800~3200m。由于石山林区海拔大多在3200~5210m之间,山体陡峭,岩石裸露,地势起伏相对平缓,气候温凉湿润,植被良好,为石山森林草场区,是宜林宜牧之地,几乎不存在耕地。该地区是一个半农半牧的生态脆弱带,是东部农耕区和西部草原牧区的纽带,是防止沙漠化的重要生态屏障。在河湟谷地中,由于大面积的陡坡开荒耕地和过度放牧使得该区域植被退化、水土流失、土壤侵蚀等问题日益突出。
2019年8~9月对研究区进行了实地调研。为了提升调研结果的解释力和代表性,在综合考虑研究区经济社会发展水平、区位因素等基础上,将调研区域随机、均匀地分布在河谷地区(川水区)、浅山梁峁地区(浅山区)、脑山湿凉地区(脑山区)。在43个调查样本村中,随机抽取退耕还林农户进行问卷调查。本次调查总共发放214份问卷,经问卷筛选与数据整理,剔除无效问卷后,有效问卷总计210份,有效率达98%;海拔数据来源于地理空间数据云网站SRTM数据集。
农户参与意愿是综合考虑多种因素的结果。影响因素具体分为以下几方面:
(1)农户个体特征。因性别原因个体机能存在差异,所以在农业劳动分工上存在不同。受能力和精力限制,年龄较大的农户凭借丰富的农业生产经验和“恋地”情感从事农业生产活动的可能性较大。文化程度反映了农户信息接受的能力,思想保守程度越高使其出于生态目标维护退耕成果的意愿越弱。
(2)农户家庭特征。该因素决定家庭收支渠道和水平,家庭人口数量越多,剩余劳动力也就越多,通过向工副业转移增加收入的可能性也越大,使得农户的生计资本禀赋更好,生计活动更加多样化,抗风险能力更强,对自然环境的依赖性也更小。人均家庭年收入低,导致退耕补贴在家庭年收入中占比较大,家庭对耕地和退耕补贴的依赖较大。
(3)农户耕地特征。该因素主要决定农户务农收入的高低。耕地面积和农作物种类直接影响到农户农业收入,耕地面积越大,农户规模化、机械化农作的可能性就越高。
以农户退耕参与意愿为因变量,并基于参考文献的研究成果,结合农户访谈与问卷调查情况,拟纳入分析框架的影响因素包括:农户个体特征(性别、年龄、文化程度和从事农业工作年限),农户家庭特征(家庭人口、劳动力人数、务农人数和人均家庭年收入),农户耕地特征(耕地面积、退耕地占比、农作物种类丰富度和农业收入占比) (表1)。
表1 变量解释及赋值说明
1.4.1谱聚类
谱聚类算法是聚类分析中的一种新型聚类算法,相较于传统的聚类算法,它建立在谱图理论基础之上[13]。其基本思想是首先利用高斯核函数计算数据之间的欧式距离,构建相似度矩阵,将聚类问题转换为图分割问题。之后根据相似度矩阵来获取拉普拉斯矩阵,并利用一种连续的松弛形式将图分割问题转化为拉普拉斯矩阵的谱分解问题,即计算拉普拉斯矩阵前K个最小特征值对应的特征向量。最后利用经典的聚类算法(如K- means算法)对其进行聚类。
1.4.2随机森林
农户退耕意愿受到多方面因素的影响,不仅包括农户的年龄、性别、受教育程度等个体特征,也包括农户的家庭人口、劳动力人数、人均家庭年收入等家庭特征,还受到农户耕地面积、退耕地占比、作物种类丰富度和农业收入占比的影响。由于本次农户退耕参与意愿调查数据分布较为复杂,特征较多,且数据的噪声很大,离散属性变量较多,用传统方法难以获得满意的模型估计结果。而随机森林具有良好的泛化性、对噪声不敏感,很适合用来建立农户退耕参与意愿影响因素模型。随机森林是一种有监督的集成学习分类技术,对于高维数据,随机森林的综合性能指标(如分类精度、算法效率等)明显优于其他单分类器和集成分类器。因此,随机森林技术近年来在生物信息、文本挖掘、图像分类等领域的应用越来越多,成为当前数据挖掘、机器学习和模式识别等领域的一个研究热点。
分类数的确定借助于python进行算法实现,根据农户参与退耕意愿的选择结果,大致可将群体分为3类(强烈、中立、不强烈)。并应用Silhouette指标检验聚类的有效性。Silhouette指标以其简单易用和良好的评价能力而得到广泛的应用。由图2可知,将样本分为3类(强烈、中立、不强烈)的聚类效果较好,Silhouette指标得分最高。
基于表2中对退耕还林参与意愿的影响因素贡献来看,农户家庭特征和农户耕地特征对农户参与退耕还林的意愿贡献得分较高。农户家庭特征中务农人数和人均家庭年收入的贡献得分较高。家庭中务农人数越多,退耕还林参与意愿越强,这与近年来耕地效益越来越低有关。当农业收入和农业投入不成正比的时候,家庭务农人数越多,农户从事非农活动的可能性也就越大,收入来源渠道多样化特征更为明显,农户要求进行劳动力转移的需求通常较为迫切,相对而言,会争取积极参与退耕还林,将劳动力从耕地中解脱出来,以便更好地从事其他副业或外出打工。
如图3所示,浅山区贡献得分大于脑山区和川水区,这与浅山区由于土壤侵蚀严重,使得浅山区土地质量较差有关。当浅山区务农投入大于收益时,农户更倾向于参与退耕还林生态工程,使得务农劳动力得以解放。退耕还林农户家庭年收入的高低在一定程度上对自然资本的依赖性产生显著影响,退耕补偿对农户家庭的收入贡献会随着退耕地占比的减少和农户经济状况的改善而下降[14,15]。河湟谷地居民点在地理空间中按海拔垂直分布的现象导致其自然资源禀赋产生差异,川水区处于低海拔位置,距离城镇较近,在就业成本和就业机会方面相比于浅山区和脑山区有着一定的先天优势,再加上川水区只有少数的贫瘠耕地退耕,使得退耕补偿占家庭经济收入的比重较小。因此,川水区退耕农户对土地收入的依赖程度较低,降低了对退耕补偿的期望。
耕地特征中耕地面积和农作物种类丰富度贡献得分较高。赵铁珍[16]认为农户的耕地面积越大,农户更愿意退耕,而尚海洋等[17]认为通常情况下,农户的耕地面积越大,农户越依赖于耕地资源维持生计,其参与退耕还林的概率就越小。河湟谷地自然条件导致耕地破碎化,使得土地分布分散,浅山区位于土壤侵蚀严重和耕地面积分布最广的地理位置,耕地破碎化较为严重,相反,川水区耕地平坦广布,更利于集中规模化、机械化生产。综上,就本研究区而言,农户参与退耕还林意愿的影响更倾向于农户耕地面积越多,农户更愿意退耕;农作物种类越丰富,农户参与退耕的意愿越强烈,这是因为农户在满足自己粮食需求的时候,更倾向于将多余的贫瘠耕地参与退耕还林工程。
河湟谷地农户退耕还林参与意愿调查中,农户个体特征、家庭特征和耕地特征等为外因变量,个体参与意向为内因变量。通过谱聚类方法和随机森林算法分析研究农户参与退耕还林工程意愿的形成机理,得出以下结论:
(1)依据农户参与退耕还林意愿强烈程度不同对农户参与意向进行5级量化;基于谱聚类分类和Silhouette指标对聚类结果有效性验证,得出农户参与退耕还林意愿的3种类型,分别是强烈、中立和不强烈。然后将意愿强度作为被解释变量,表示农户个体特征、家庭特征和耕地特征的12个变量作为解释变量,运用随机森林算法得出各个变量的贡献得分。
(2)从农户参与退耕还林影响因素的贡献得分来看,影响最为重要的因素是农户的家庭特征和耕地特征,个体特征影响较弱。具体来看,农户家庭特征中务农人数和人均家庭年收入影响作用较强;农户耕地特征中耕地面积和农作物种类丰富度影响因素最为重要。
(3)从研究结果来看,川水区的影响因素中人均家庭年收入贡献得分最高;浅山区的影响因素中务农人数和耕地面积贡献得分最高;脑山区的影响因素中农作物种类丰富度贡献得分最高。