张孝峰 李鑫 周成毅
[摘 要]到2019年,中国贫困人口已实现85%成功脱贫,扶贫工作成效显著。但在过去六年,出现了大量的贫困人口脱贫后返贫的现象,这些返贫及“难帮扶”人群积累下来,成为最后一批贫困户中的“钉子户”。当前是我国建设全面小康的最后一战,这一战至关重要,任务艰巨、责任重大,非常时期更应当大刀阔斧,学会变革,信息化产业技术的飞速发展,给扶贫模式创新提供了新路径与新思考。
[关键词]精准扶贫;返贫;机器学习;XGBoost模型;小康社会
[中图分类号]F426.61 [文献标识码]A
十八大以来,党中央高度重视扶贫工作,力争在2020年实现全面建成小康社会。这是一个艰苦且充满挑战的过程,但扶贫开发意义重大刻不容缓,必须坚定不移地贯彻实施。坚持“精准扶贫”,从字面上理解,即是把扶贫工作细致化、精准化,提高扶贫精准度,提高贫困人口识别率,减少漏评、误评率。近年来,从党中央到各省、市及地方政府陆续成立扶贫工作小组,专门开展扶贫工作战略研究与扶贫工作实施,一系列利国利民的政策出台,巨额的专项资金与大量的人力投入,扶贫工作成效显著。但距离全面建成小康社会还有一段路要走,可时间已经不多。在这最后的关头,绝不能松懈,更要撸起袖子加油干,加快扶贫模式创新研究与实施,提高扶贫效率,减少返贫率,打好扶贫攻坚收尾战。
1 精准扶贫助力建设全面小康
贫困县全部摘帽,解决区域性整体贫困是我国“十三五”时期必须完成的历史任务和现实难题。习近平总书记在2013年11月于湘西考察时提出了精准扶贫的扶贫理念,精准化成为当下扶贫工作的核心内容。到2019年,这六年来,扶贫工作取得了卓越的成效。农村贫困人口大幅度减少,人民生活水平显著提高。2018年10月17日是第5个国家扶贫日,联合国开发计划署前署长海伦·克拉克曾赞赏说:“中国最贫困人口的脱贫规模举世瞩目,速度之快绝无仅有。”
改革开放40年来,中国的扶贫工作绩效在全世界属于前列,具有示范性和代表性。这40年来,全世界众多国家都在开展扶贫工作,致力于减少贫困人口,中国无疑是最突出的一个國家。在对全球减贫贡献率的统计中,中国一枝独秀,达到了70%,这是一个相当令人震惊的数据,显示出中国扶贫工作方向对、方案优、方针准,这是对中国扶贫工作的总结与高度认可。
一直到2018年,中国贫困人口从2012年的9899万人减少到1660万人,6年时间减少了8000多万人,平均每年减贫1300多万人。目前可以说,在党中央的正确领导和各级政府以及全体人民的共同努力下,中国贫困人口已经实现了85%左右脱贫成功。这说明中国在过去的六年扶贫工作成效卓越,在奔向实现全面小康的路上,已经接近终点,胜利的曙光就在眼前。但越是接近终点的路,越是坎坷不平,越是困难重重,此时,对扶贫工作的要求更高,任务更加艰巨。
2 返贫现象频发问题急需解决
2.1 返贫现象频发
鉴于前面六年的平均脱贫水平,似乎只要保持当下的工作状况与扶贫机制,2020年实现建成全面小康社会并不困难。其实并非如此,到2019年,脱贫效率很有可能会开始降低。在过去六年,出现了大量的贫困人口脱贫后返贫的现象,这些返贫及“难帮扶”人群积累下来,成为最后一批贫困户中的“钉子户”。
从一组数据来看,2014年,中国脱贫人口1232万,2015年1442万,呈上升趋势,在2016年,脱贫人口为1240万,脱贫速率减慢。 2015年8月至2016年6月,建档立卡“回头看”,共补录贫困人口807万,剔除识别不准人口929万,识别不准人口占有相当大的比例。而在2017年,各地对2016年脱贫真实性展开自查自纠,245万标注脱贫人口重新回退为贫困人口,返贫率近20%。这是导致中国农民实际脱贫率不能稳步上升的重要原因。
2.2 返贫致因多元化
返贫现象致因多元化,多方面的原因导致返贫现象频发。无情的“人情”,各种红白事礼金,人情往来,对于刚刚脱贫的群众来说往往难以承担,但在大多数农村地区,保留着较为完整的独特的民风民俗,而且抬头不见低头见,使得这笔花销无法避免。疾病也是导致返贫问题的罪魁祸首之一,目前农村的医疗保障制度正在逐渐完善,报销比例,医疗待遇也在逐渐提高,但是很多大病、重病暂未纳入医保体系,部分疾病即使纳入医保体系,剩余的医疗费、营养费、护理费等也让众多贫困人民有苦难言。此外,在许多贫困家庭中,劳动力并不多,一旦有人患病,往往会牵制住家中的“顶梁柱”导致收入来源缺失,形成恶性循环。同时,一些天灾人祸也是导致返贫的原因,这些都属于不可控因素,一旦发生人们往往毫无抵抗力,只能选择承受。一些农村地区少生优育的观念不强,导致家中未成年人较多,家庭中劳动力占比低,必需花销高,使得家庭脱贫困难重重。
2.3 降低返贫率刻不容缓
当前是我国建成全面小康社会的最后一战,这一战至关重要。六年来党中央高度重视,全国人民团结协作,无数人奋斗在扶贫一线,成效显著。随着脱贫攻坚工作的深入推进,前面脱贫的都是难度较小的,剩余的未脱贫的农户致贫原因更复杂、脱贫成本更高、难度更大,返贫形势将愈加严峻。目前大致已经完成了80%以上的任务,剩下的20%,是一块难啃的硬骨头,要想“啃得动”,就得有一副“铁齿铜牙”。寻找扶贫模式新路径,减少返贫群众,重点帮扶“脱贫钉子户”,持续降低贫困率,才能打好建成全面小康的收尾战。
3 机器学习提供扶贫攻坚新路径
3.1 研究现状
除了在战略上、政策上创新助力扶贫工作,利用好现代信息化技术,同样可以为扶贫之路带来便捷。目前已经有了许多关于利用大数据开创精准扶贫模式新路径的研究,并且取得了一定成效。如陆桂明的基于机器学习实现贫困生的分类预测研究,其统计了某高校2016级-2017级学生的150万组一卡通消费记录,包括学生的基本信息、消费额度、消费地点、消费时间等。对数据进行预处理后,利用XGBoost模型建模,实现分类研究预测,预测识别贫困学生,查准率达到53.68%,查全率达到92.15%,效果相当好。除了XGBoost模型,SVM模型同样可应用于此,但在陆桂明的贫困生预测实验中效果差于XGBoost。梁骁【4】同样利用XGBoost模型进行过识别贫困人口的数据分析方法研究,其方法和思想类似于陆桂明的贫困生分类预测研究。
3.2 研究方法与评价
不论是XGBoost还是SVM,抑或是其他类似的分类或回归模型都是基于机器学习,其思想殊途同归。在此处,主要针对XGBoost和SVM但不仅限于两者进行分析。类似的模型有很多,XGBoost和SVM只是其中具有代表性的一部分。除了预测识别贫困人口之外,同样可以利用其识别易返贫人群。返贫人群往往具有一些潜在的相似性,其家庭客观状况大都存在着“返贫隐患”。利用机器学习,可以找出这些潜在的相似性特征,实现预测分类易返贫人群。
建立贫困户标准化信息库,预测分类贫困群体,有助于提高扶贫精准度,使贫困户判别更加客观全面。而预测易返贫人群同样意义重大,尤其是在建设全面小康收尾战的当口,其作用更是显著。预测易返贫人群,可以对其进行重点跟踪,给予必要的政策与物质支持,防止其返贫,从而避免扶贫“反复性”。以此降低人力与财力成本,同时节省当下宝贵的扶贫时间。
利用机器学习或其他信息化处理技术,都离不开标准化贫困户信息库。政府建立的贫困户信息统计网络平台就起到了收集整理标准化信息的作用,这是利用信息化处理相关问题的基础。其大致步骤大多相同,首先都需要建立判别标准,例如,是否购买有商品房,是否有多处房产,是否有轿车,是否有高档电器,用水用电是否便捷,交通是否便捷,家中病患者数量,病患程度,受教育學生数,文化水平,是否有养老保险,是否有医疗保险,等等。这些都可以作为特征,然后经过数据采集,即通过贫困户网络平台尽可能地收集贫困人口数据,数据量越大,设计的细节越细效果越好。接着进行数据预处理,构建特征库,特征筛选排序,生成模型,训练模型,最终将训练好的模型进行应用与分析。此时,即可进行贫困户或易返贫人群预测分类。当然,在实际实践过程中,还会存在着许多问题,模型不一定适合,准确度可能不够,这些都需要进行深入分析并进行优化。最终建立一个准确率较高的易返贫人群预测分类模型。
方法多种多样,模型也多种多样,但思想大同小异。具体问题具体分析,结合机器学习领域相关知识,为减少返贫人口、扶贫“钉子户”的政策制定与方案实施做出有益参考。
4 结语
2019年是不平凡的一年,是建设全面小康社会的最后一年,这一年任务艰巨,责任重大。之前的几年扶贫成效显著,但如果沉浸在过去的荣光中不思进取一定会失败。在这最后的当口,更要再接再厉,坚定不移地贯彻落实党中央下达的扶贫政策,保持扶贫工作的劲头。绝不能安于现状,要学会创新,非常时期更应当大刀阔斧,不论是白猫黑猫,抓到老鼠就是好猫。稳中求进,进中求突破,稳定扶贫工作成效,防止返贫现象反复发生,同时加大扶贫力度,创新扶贫模式,改善扶贫方法,解决贫困“钉子户”问题。当今信息化产业技术的飞速发展,也给扶贫模式创新提供了新路径,国内一些科学家已经做过充分且可靠的关于将互联网技术应用于扶贫工作的理论研究,许多已经应用于实践并且效果良好。贫困具有多维度、动态性、综合性的特点,判别起来往往很难且费时费力,而构建贫困人口信息统计网络化平台,建成贫困人口信息库,利用大数据及相关技术进行数据对比和综合分析,可以实现预测判别贫困人口与易返贫人群,提高贫困判别可靠性与客观性,减少返贫现象发生,为扶贫工作提供助力。科学技术是第一生产力,在这个关键节点,突破惯性思维,运用好互联网科学技术这把利剑,披荆斩棘,打好扶贫攻坚最后一战。
[参考文献]
[1] 莫光辉,张玉雪.大数据背景下的精准扶贫模式创新路径——精准扶贫绩效提升机制系列研究之十[J].理论与改革,2017(01).
[2] 胥爱贵.把防止返贫摆上脱贫攻坚重要位置[J].领导科学,2018(31).
[3] 陆桂明,张源,周志敏.基于机器学习的贫困生分类预测研究[J].计算机应用与软件,2019(01).
[4] 梁骁,张明,覃琳.一种基于机器学习识别贫困人口的数据分析方法研究[J].企业科技与发展,2017(05).