基于主题挖掘的国内农村扶贫开发研究回顾与展望

2021-09-09 07:36阚乾超
现代计算机 2021年19期
关键词:文献贫困户精准

阚乾超

(贵州财经大学信息学院,贵阳 550025)

0 引言

农村扶贫开发是我国为了消除贫困,发展生产,建设农村的工作[1]。但是真正意义上的农村扶贫开发,是从改革开放之后,依托乡村振兴、产业扶贫、金融扶贫、易地搬迁扶贫、教育扶贫等多种发展战略与手段,整合政府、企业、农户等多方独立个体,共同协作,完成扶贫工作的活动。虽然我国农村扶贫开发工作起步较早,但是相关研究相对滞后,直到1990年我国才首次出现了农村扶贫开发的研究文献,相关的研究也在我国正式起步。随着扶贫工作的不断推进与改革,我国农村贫困人口大幅降低,农村环境、观念与人口素质得到极大改善,新时代的农村扶贫开发模式和途径也产生巨大变革,相关研究者的数量大幅增长,研究文献呈指数型增长,这其中不乏众多高质量的文献,为我国的扶贫工作做出了巨大贡献。本文通过构建关键词矩阵,利用LDA模型及主题挖掘等方法,及时挖掘农村扶贫开发的研究热点与主题分布,有助于归纳新的研究热点与趋势,掌握农村扶贫开发的最新动态。因此,本研究采取上述分析方法,对我国农村扶贫开发的研究现状以及发展趋势进行系统的梳理与展望[2]。

1 数据来源与研究方法

1.1 数据来源

本文的文献数据来自于CNKI数据库,检索主题为“农村扶贫开发”,并采用高级检索模式,检索时间为2021年1月27日,共获取数据2002篇,通过数据预处理剔除会议记录、期刊通讯、人物访谈等无效文献139篇,最终获得有效文献1863篇。

1.2 研究方法

本文主要的研究方法有文献计量、知识图谱与主题挖掘等。旨在通过研究文献的外部特征,定量地分析农村扶贫开发的相关文献,运用数学与统计学方法描述、评价、预测科学研究的现状与发展趋势[3],并将所获取数据间的关系绘制成网络知识图谱与主题挖掘图谱,从而反映研究热点的主要分布与变化趋势。

本文主要以布拉德福定律和齐普夫定律为理论基础,采用Gephi、Python等软件和计算机语言技术,对所获取数据从文献年份分布、期刊分布、作者合作、关键词共现以及知识图谱等五个方面进行分析,并借助可视化技术加以呈现。此外,运用LDA模型对文献摘要进行主题挖掘,从而获得农村扶贫开发研究领域的四大主题,对目前的研究现状与热点进行回顾与展望。

2 研究现状与研究热点分析

2.1 研究趋势分析

对农村扶贫开发主题文献相关发文量及其变化情况进行统计,可以分析评价该主题领域的研究水平及发展特点。本文将获得的1863篇农村扶贫开发主题文献按照年份统计并绘制成相关文献数量分布图,如图1所示。

图1 文献分布趋势图

从图1中可以看出,自1990年开始出现针对农村扶贫开发的研究后,该主题的相关文献总体主要分为三个阶段:①萌芽探索期(1992年-1999年),这一阶段是我国开始从大规模农村扶贫开发到扶贫攻坚阶段的过渡时期,平均每年文献约10篇,文献产出增长平缓且不稳定。②稳步成长期(2000年-2018年),这一阶段随着“精准扶贫”与“乡村振兴战略”的广泛认可,文献产出进入快速增长,2017年刊载文献188篇达到历史高峰文献产出增速明显提升。③衰退期(2019年-),这一阶段随着扶贫工作的不断深入以及全面脱贫的目标达成,相应的研究也就快速减少。总体而言,农村扶贫开发的主题研究整体呈现指数型增长趋势,根据普赖斯文献增长规律,说明该领域在国家战略政策的指引下将进入新的研究方向并产生活跃的研究。

2.2 高频关键词分析

关键词是论文和期刊中的重要组成部分,可以根据高频关键词来了解论文的主题、内容、对象、方法等。通过反映某一领域的关键词,可以把握该领域的研究方向与研究热点[5]。根据数据统计,对所有相同关键词进行合并处理,剔除无意义和无效的关键词,最后从1863篇文献获取关键词2002个。

普赖斯公式最早用于确定高被引文献,进而确定某研究领域内的核心作者。因方法相较于高低词频界定公式更简单,比自定义法更科学,逐渐被学者接受用于不同研究领域中[6]。

表1 高频关键词词频

此处采用普赖斯公式计算高频词阈值,公式如下:

上式中,Nmax为最大发文量期刊的发文数,计算得出高频词阈值M约为13,即取关键词频大于等于13的为高频关键词,共计42个,如表1所示。

由表1可以看出在农村扶贫开发的研究过程中,“精准扶贫”“扶贫开发”“农村”“反贫困”“扶贫攻坚”“贫困”“扶贫”“农村贫困”“贫困人口”“扶贫资金”等关键词出现的频次较高,说明研究者们对于农村扶贫开发的研究主题、对象、内容等方面存在较大的共识,研究热点与方向呈集中态势。在全面实现小康的大背景之下,精准扶贫、乡村振兴等战略的实施,针对农村贫困地区现实存在的问题,农村精准扶贫已经成为了农村扶贫开发领域中新的研究焦点,产业扶贫、金融扶贫、新农村建设和乡村振兴等扶贫战略已经成为了农村扶贫的主要途径。此外,“多维贫困”“精准脱贫”“减贫”“制度创新”“返贫”等关键词也相继出现,说明研究者开始重视对农村扶贫开发实践中的具体问题,扶贫效率和扶贫质量等方面的研究。

2.3 关键词矩阵构建

共词分析法是由Michel Callon等提出,当两个关键词经常出现在同一篇文献时,说明它们之间具有一定的关联关系,共现次数越多,则两者关系越密切[7]。通过Python将本文选取的42个核心关键词,构建42×42的高频关键词共现矩阵,由于篇幅有限,此处仅列出部分高频关键词,如表2所示。

表2 高频关键词共现矩阵(部分)

为了深度挖掘出农村扶贫开发领域内关键词的共现情况,文中将生成的共现矩阵导入Gephi软件并绘制相应的关键词共现图谱(见图2),从而反映出农村扶贫开发研究领域的研究热点与基本情况。图2中发现存在明显的两个内部关联的网络。第一是精准扶贫为中心,反映出精准扶贫与民族地区、反贫困、扶贫政策等重要战略之间存在密切的关联,说明目前在农村扶贫开发领域,针对农村贫困地区和民族地区的贫困户问题研究,以及根据政策指导如何高质量实施精准扶贫战略的研究是主要的研究方向。第二是以扶贫开发为中心,反映出扶贫开发与农村、扶贫资金、财政扶贫资金等存在明显的相关性,说明在农村扶贫开发研究领域中,扶贫资金与金融扶贫是主要的扶贫动因,针对于各种扶贫工作的实施,扶贫资金是一切扶贫工作实施的基础。

图2 关键词共现图谱

3 基于LDA的文本主题聚类挖掘

3.1 LDA模型

文档主题生成模型(Latent Dirichlet Allocation,LDA),由Blei于2003年提出,是一种基于贝叶斯概率的主题生成模型,主要包括主题、文档与主题词三层结构[8]。文中主要采用Python中的Jieba分词库对文献的摘要部分进行数据预处理与清洗,并通过TF-IDF计算关键词的出现概率和权重,降低出现概率过大和过小的词汇的权重,从而保留影响程度高的特征词。最后在此基础上使用LDA模型与pyLDAvis工具包,对主题特征词进行主题挖掘以及可视化分析,其中最佳主题数通过调整动态参数和观测pyLDAvis的可视化效果确定。主题挖掘与可视化分析结果见如图3与图4所示,图3中代表4类主题的聚类有明显分隔,说明各主题之间相互独立,主题凝聚的效果良好。将鼠标移动至任一主题范围内时,可在图3右侧观察该主题的关键特征词,具体形式见图4,其中蓝色柱条代表该关键词在文献中出现的总词频,红色柱条代表该关键词在该主题中出现的词频,这有助于直观地了解生成主题内关键词的分布状况。根据LDA模型的聚类结果,本文将农村扶贫开发领域的研究分为农村扶贫开发模式研究、农村精准扶贫研究、农村扶贫开发持续发展路径研究以及突发公共事件下农村扶贫开发研究等四个方面,以梳理该领域的知识体系特征与发展脉络趋势。

图3 主题挖掘结果

图4 主题具体形式

3.2 农村扶贫开发研究

3.2.1 农村扶贫开发模式研究

由于大部分农村地区经济基础相对落后,生产要素与资源配置不平衡,因此,在实际研究中学者们也提出了多种针对不同地域、不同类型农村的扶贫开发模式,可归结与以下四类:

(1)按扶贫主体分类,研究者提出的主要的扶贫模式有政府主导型扶贫。扶贫条件与资源都由政府提供,扶贫项目的具体实施有政府的职能部门来完成,例如易地扶贫搬迁、扶贫贴息贷款等;由政府、企业、贫困户、社会组织、高校科研机构等为核心的多元主体合作,共同参与的扶贫模式,扶贫要素都各主体共同承担,相互合作,主要以产业扶贫、对口帮扶为主;此外还有以农民自己为主导地位的社区主导型扶贫模式(Community Driven Development,CDD),即在扶贫活动中,政府与非政府组织(Non-Governmental Organization,NGO)都处于非主导地位,而是将政府与NGO提供的扶贫资源的决策、使用、控制的权力交给社区与农民自己[9],由农民自己推动农村的发展,让农民自己创业,实现农民的自我管理、组织与服务。

(2)按照扶贫开发手段可分为救济式扶贫模式与开发式扶贫模式。但是随着扶贫工作的深入,救济式扶贫的弊端也逐渐显露,对扶贫工作的影响较为严重。郭劲光、李晓凤、余德华等人指出农村扶贫开发模式由救济型转化为开发型对于扶贫开发成效的必要性。

(3)依据所投入的扶贫要素不同分为物质扶贫模式、资金扶贫模式与智力扶贫模式。往往是根据各个贫困对象的是实际致贫因素而分配的,典型的物质扶贫模式就有民政部门为特困农户提供救济式扶贫,农业部门为贫困农户提供生产资料等;资金扶贫模式就是指扶贫主体直接向扶贫客体提供资金,时期通过发展生产、提高收入而拜托贫困的扶贫模式[10];习近平总书记在实地扶贫考察中多次提到“扶贫先扶智,治贫先治愚”,可见中央治理扶贫的高度重视与扶持。而智力扶贫,也不仅仅是提供智力培训提高技能,而是从精神层次上着手引导贫困户改变旧观念,旧思想,从精神层面解放生产力。

(4)按照农村扶贫开发过程中贫困户所处的地理区位分类,主要包括本地开发扶贫模式、易地搬迁扶贫模式与劳动力输出扶贫模式。

3.2.2 农村精准扶贫研究

其次是针对精准扶贫的研究,随着扶贫工作的深入推进,我国贫困人口大幅度减少,扶贫进入了攻坚阶段,但余下的反而是最难脱贫的群体,为此,需要对扶贫理念进行进一步的创新,精准扶贫战略理念应运而生[11]。现阶段学者们针对农村精准扶贫的相关研究主要体现在两个方面,一是针对农村精准扶贫的问题及影响因素的挖掘。研究表明,主要的制约因素除了传统的地理环境,贫困人民的文化素质、职业技能、受教育水平等因素以外,还有人才引导、网络环境以及物流等相关因素。也即是在农村精准扶贫的过程中,不仅要注意改善贫困地区的交通,加强对贫困人口的技能以及文化素质培养,还要针对不同的贫困户选派合适的扶贫干部来进行责任制的引导,同时在进行产业扶贫与电商扶贫时也要进行适当的倾斜,保证扶贫产品的宣传与物流水平。二是针对精准扶贫成效研究。由于脱贫人数众多,针对这一问题学者们采取了不同的方法展开研究,主要有问卷调查法、访谈法、德尔菲法、实证分析法、回归分析法等[12]。针对已经脱贫的农户,总结脱贫致富的实际经验与方法,加以分类,从而产生了大量不同的扶贫经验,其中旅游扶贫、致富带头人、光伏扶贫、交通扶贫等扶贫手段的扶贫效果相对较好。

3.2.3 农村扶贫可持续发展研究

随着扶贫工作的不断深入,“返贫”,“复贫”的现象凸显,农村扶贫可持续发展问题也备受关注。农村扶贫开发经过了40多年的农村扶贫开发,农村扶贫事业已经取得了巨大的成就,农村贫困人口大幅减少,农村地区的基础设施建设与社会公共事业全面发展,农村贫困户生活水平明显提高。但扶贫工作仍要继续并将长期进行,在实现全面小康的过程中依旧存在一系列突出的问题,主要集中于以下几个方面:各地区尤其是城乡发展严重不均衡,尤其是连片贫困地区、民族地区、边疆地区、革命老区以及偏远山区等,具体表现为基础设施与经济体制不完善,欠缺各种社会公共事业;贫困人口参与不平衡,贫富差距越来越大;人才缺失十分严重;“贫困钉子户”也严重影响了扶贫工作的推进,此外留守儿童与孤寡老人赡养问题也尤为突出[9]。

针对上述问题,研究者们结合了各农村贫困地区的实际情况,提出了相应的建议与策略,例如:利用信息化优势,准确识别农村扶贫对象,并确定扶贫方式;完善农村扶贫开发的利益机制[11];积极争取外部资金,加大对农村基础设施的建设;通过职业培训来提高贫困户的劳动与生活能力;加强对复合型人才的培养与引进;保障农村地区的社会公共服务事业建设;突进扶贫政策与农村发展政策融合;建立口径一致的大数据管理平台,为决策提供依据;平衡各扶贫主体的权力,发挥各类主体作用。

3.2.4 突发公共事件下的农村扶贫开发研究

突如其来的新冠疫情,造成了全球病毒大流行,全球经济遭受重创,停滞不前,在这样的环境下,全面小康的目标面临着十分严峻的考验。针对于突发公共事件下的研究,总体集中于疫情期间,以前年份的文献相对较少,研究对象主要以农村贫困户为主,研究的方向也以疫情期间如何实现扶贫目标,改良扶贫手段的相关措施、建议为主。

4 研究述评与展望

学者们对于农村扶贫开发的研究取得了一系列的成果,为以后的扶贫工作积累了宝贵的扶贫经验与意见。但是总体而言,还有许多值得探讨的地方:

第一,扶贫开发模式研究方面,我国农村扶贫开发有很多不同的模式,各个扶贫模式之间的特点也大不相同,但在实际应用中也有较大关联,而发展的重点应该是产业扶贫与新兴扶贫模式结合的模式研究。产业扶贫是我国农村扶贫开发新时期三大重点之一,主要参与者有政府、农村、企业等,具体是根据实地生产条件与企业合作建设主导产业与基地,政府制定优惠政策,并共同管理运营,实现农户与企业的双赢,从而摆脱贫困。产业扶贫不仅可以增加贫困户的收入,还可以扶持当地的龙头产业从而调整经济结构,从宏观上调整经济体制。新兴扶贫模式,这种模式还属于萌芽探索阶段,以互联网技术为依托,针对目前出现的“淘宝村”、“拼多多村”等农村电商的试点与实践研究,体现在农村电商、农村互联网+等信息技术扶贫。应当将自身的产业发展与新兴的销售方式相结合,从而使贫困地区有系统的扶贫工作线路,为农村扶贫开发提出增效的策略。

第二,问题与对策研究方面,由于我国贫困人口基数庞大,所以学者们很难针对于不同的贫困户开展详细研究,只能以单个村落,村寨,或者贫困地区为研究主体。在后续的研究中心,应当充分来完成扶贫工作利用信息技术处理贫困户的信息,精准识别农村贫困户,并按具体的致贫原因将其分类,在根据不同的政策与措施。此外,针对问题与对策的研究,学者们也仅仅停留在提出问题,解释问题,解决问题的传统层面。而对于这些问题,是如何阻碍扶贫工作,出现问题后的实际情况如何都没有具体说明[12]。因此在后续的研究中,学者们应该针对于信息技术处理扶贫问题,以及针对处理的问题进行深层次分析。

第三,突发公共事件的研究方面,突发公共事件具有影响广泛,危害严重,成因复杂,爆发突然等特点,往往会给我们造成难以估量的损失。也正应如此,学者们往往会忽略突发公共事件带来的影响,从研究文献分布来看,在2020年以前针对于突发公共事件的研究较少,且都是在事件爆发后所开展的研究,这也造成很多问题处理不当,效率低下。在后续的研究中,应当将突发公共事件等不可抗力因素考虑在内,实际模拟问题后果与问题成因,减免不必要的损失,从而更好地指导农村扶贫开发工作。

猜你喜欢
文献贫困户精准
杜造海:从贫困户到脱贫致富带头人
Hostile takeovers in China and Japan
“洞”察脱贫——“精准扶贫首倡地”十八洞村录
精准防返贫,才能稳脱贫
精准“提醒”,促使干部“自励”
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
“鞋底垫厚点,也能走得快”——贫困户崔普选和他的“梦中梦”
精准扶贫 齐奔小康
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing