西北民族大学电气工程学院 邓智育 杨成慧
“大数据背景下推进教育精准扶贫研究”是采用大数据建模视角,结合国家政策,在大数据量化积分模式下,多元分析贫困学生困难原因,避免马太效应,并结合西北民族大学等在兰高校数据、python爬虫模型,对精准帮扶学生模块提供具体的设计方法。
在信息技术与经济理念交融碰撞的时代,大数据理念应运而生,特别是近年互联网与计算机技术的快速发展,各国政府加快了大数据部署,深化大数据应用;美国、澳大利亚、德国等发达国家已将大数据定义为国家战略基础资源,强力支持建设数据开发平台,为大数据积累各种基本条件,并在政治、民生、教育、军事等领域运用大数据解决问题。我国正处在“脱贫攻坚战”的激烈时期,脱贫大计不可贻误;贫困地区之所以落后,不在于地区物质资源的匮乏,而是在于人力资源无法有效形成;并且贫困地区人口具有创业冲动微弱、风险承受能力较低、易于满足、主动型较差、较强的依赖性,所以“人口素质低”才是贫困的本质原因(任友群,郑旭东,冯仰存.教育信息化:推进贫困县域教育精准扶贫的一种有效途径[J].中国远程教育,2017(05):51-56;刘军豪,许锋华. 教育扶贫:从“扶教育之贫”到“依靠教育扶贫”[J].中国人民大学教育学刊,2016(02):44-53),所以一味的扶贫开发不能改变其根本贫困原因;教育扶贫本质在于提高贫困地区人口的基本素质,能够有效切断贫困的恶性循环链,为反贫困提供经济基础(张翔.教育扶贫对象精准识别机制探究[J].教育探索,2016(12):94-96),但我国教育扶贫还处于起步阶段,主要侧重于扶贫主体的角度进行扶贫,评判手段不精准、不能准确快捷的确定精准帮扶对象等相关问题(李兴洲.公平正义:教育扶贫的价值追求[J].教育研究,2017,38(03):31-37;[12]谢君君.教育扶贫研究述评[J].复旦教育论坛,2012,10(03):66-71;马芝君.甘肃民族地区农村扶贫工作研究[D].西北民族大学,2014)。甘肃省现阶段贫困群体基数大、贫困程度深、致贫因素多、脱贫难度较大,自“1236”扶贫攻坚行动开始,年均减贫140万,贫困率由33.2%下降到19.8%,并且随着“教育扶贫”在国内推广,甘肃省学前和高职学生免学费补助经费已有1亿多元,受惠学生10万多人(王振雅.新阶段甘肃民族地区农村扶贫开发研究[D].甘肃农业大学,2016;杨波.甘肃精准扶贫开发新路径探析[J].开发研究,2015(06):59-62),但还是无法全面做到精确识别、精确帮扶、精确管理,还需要细分贫困人群,细化扶贫项目,提高资金效益。
目前国内教育扶贫工作主要表现为各教学单位、学校、地方教育主管部门针对贫困学生的帮扶需要贫困学生提供各种贫困证明手续,以用来证明该生的贫困情况。随着我国经济水平的逐步发展,尤其是十三五时期精准扶贫攻坚战的打响,教育扶贫工作的重点应该转变为重组资源、创新发展。目前国内基于大数据背景下的教育精准扶贫的研究相对缺乏,但是针对农村贫困人口的扶贫攻坚正在全面打响,有西安交通大学刘寒的《甘肃省精准扶贫大数据管理平台的设计与实现》等相关研究,但是不是针对教育领域的精准扶贫,与本课题存在着较大的差异性。还有以中国教育科学研究院曾天山研究员的《以新理念新机制精准提升教育扶贫成效》为代表的相关研究,但是主要是针对扶贫机制方面的研究,并没有利用大数据进行扶贫工作的“精准设计”(李学龙,龚海刚.大数据系统综述[J].中国科学:信息科学,2015,45(01):1-44;程学旗,靳小龙,王元卓,郭嘉丰,张铁赢,李国杰.大数据系统和分析技术综述[J].软件学报,2014,25(09):1889-1908;俞立平.大数据与大数据经济学[J].中国软科学,2013(07):177-183)。
本课题将主要结合西北民族大学等在兰高校,并参考国内外高校对于贫困学生的精准资助现状,提供设计开发高校对于精准帮扶困难学生的大数据管理平台的设计方法。对于该平台的设计包括帮扶贫困学生对象、具体帮扶措施、帮扶成效追访、数据分析管理等多个大数据分析模块。对精准帮扶学生模块提供具体的设计方法,如图1所示。
图1 大数据管理平台架构
本课题的研究成果将以论文的形式展示,将具体以西北民族大学等在兰高校为例,对相关高校帮扶困难学生的信息管理工作进行全面分析,在论文中将通过例图和相关用例分析各个模块的功能。并通过用例分析展示各个模块间的内外交互关系。并以流程图的形式展现具体实现细节。将在论文中具体展现课题相关研究成果,其中包括高校学生贫困评价制度的制定、大数据管理平台的相关模块的设计方法、大数据技术对于高校扶贫工作的意义、以大数据建模的视角提出切实可行的建设改进手段(谢霄男,王让新.关于农村教育扶贫问题的思考和对策建议[J].中国教育学刊,2015(S2):3-4(2016-02-03).http://kns.cnki.net/kcms/detail/11.2006.g4.20160203.1725.004.html;熊文渊.高校教育扶贫:问题与路径[J].当代教育科学,2014,(23):43-46)等。
大数据背景下推进教育精准扶贫的研究,主要是针对目前国内针对贫困学生的认定评判工作中存在的评判手段不精准、不能准确快捷的确定精准帮扶对象等相关问题,以大数据建模的视角提出切实可行的建设改进手段,以期达到精准帮扶的目的。
(1)通过研究分析西北民族大学学生扶贫政策落实情况,结合贫困学生自身性格特点、家庭因素,分析贫困学生特点,运用MATALAB聚类分析模型,将影响因素归类,并构建相应模型。
(2)搜集国内、国外成熟数据库种类,聚类分析不同数据库的设计思路、具体实施路程中遇到的技术难点与开展难点“攻坚战”的思路。
(3)分析国内各地区的扶贫政策与具体实施方案,借鉴国外“教育扶贫”数据库的具体模型,达到完成针对如何对不同地区,不同原因贫困人群“精准教育扶贫”数据库的设计思路与方案。
线路如图2所示。
图2 实施总路线
对相关高校帮扶困难学生的信息管理工作进行全面分析,在论文中将通过例图和相关用例分析各个模块的功能。并通过用例分析展示各个模块间的内外交互关系。并以流程图的形式展现具体实现细节。研究成果的主要用于各大高校资助中心,为学生贫困评价制度的制定提供了相关依据、提供了大数据管理平台的相关模块的设计方法、并且指出了大数据技术对于高校扶贫工作的意义、还以大数据建模的视角提出切实可行的建设改进手段等。
通过python爬虫模型、在校贫困学生问卷调查等方法,搜集有关教育扶贫实行方法与实施中的难点料,对搜集到的数据进行模型处理,构建出直观、易分析的数学模型,并结合现有的数据库设计思路,构建出教育扶贫数据库的设计思路与模型。
图3 教育扶贫大数据库
大数据可以充分利用各学校校园卡数据、人口基础信息库、地区经济数据信息库,采集民生、金融、税收、生活保障、城镇建设等相关领域信息,并通过云储存、云计算等现代新型信息处理手段,将多种信息数据化,并构建相应模型,能够详细预测每个贫困者的行为方式、价值判断、以及贫困原因,分析梳理出不同类型的贫困原因,从而进行更为精准的扶贫;我国教育扶贫现阶段还没有建立统一的扶贫信息系统,无法精确判断是否贫困与贫困原因的准确判断,因此对于具体困难学生的帮扶工作就存在许多盲点(王嘉毅,封清云,张金.教育与精准扶贫精准脱贫[J].教育研究,2016,37(07):12-21),“十九大”中明确指出,要在五年内全面完成脱贫,可见建立一个针对教育扶贫大数据库,以从根本上解决贫困问题的重要性和必然性。教育扶贫大数据库如图3所示。
目前约有贫困人口7000万,贫困县733个,分布在27个省份。全国贫困人口分布,如图4所示。
图4 全国贫困人口分布
2007-2008年,甘肃省属高校学生月生活支出,如表1所示。
表1 甘肃省属高校学生月生活费支出调查统计表(元/人/月)表
高校贫困生致困原因,如表2所示。
表2 甘肃省厲髙校贫困生致困原因分析统计表
对贫困生致困原因的区分只是相对的,实际上以上因素对同一个贫困生个体来说往往是错综交叉的,比如有的学生家庭既处在偏远落后地区又是单亲或多子女家庭。可见,贫困生的致困原因具有区域性、历史性、自然性等特点,难以在现有自然和经济状况下得以彻底解决。
(1)西北民族大学(榆中校区),贫困生与非贫困生模型分析
图5 非贫困生日常花销模型数据(单位:元)
图6 贫困生日常花销模型数据(单位:元)
代码如图7:
图7 代码程序图
(2)贫困信息分析
在走访调查中,自身发展动力不足,因残和因病是主要原因等(见图8)。
(3)2018年贫困生评选标准
看房:从住房面积、房屋结构、建房时间以及交通、用电、饮水、环境方面入手,估算其贫困程度;如果啥都是好的,那是想都不用想的,肯定没戏。
看粮:从承包土地结构、种植结构、人均占有粮食、养殖情况等方面入手,看农户土地情况和生产条件,估算农业收入和支出;那些种植大户,或者说是田地比较多的人员也是不在评选范围内的,不过可以申请三农补助。
图8 贫困信息分析
将课题的研究成果将以论文的形式展示,论文将具体以西北民族大学等在兰高校为例,对相关高校帮扶困难学生的信息管理工作进行全面分析,在论文中将通过例图和相关用例分析各个模块的功能。并通过用例分析展示各个模块间的内外交互关系。并以流程图的形式展现具体实现细节,其中包括高校学生贫困评价制度的制定、大数据管理平台的相关模块的设计方法、大数据技术对于高校扶贫工作的意义、以大数据建模的视角提出切实可行的建设改进手段等。