成 越,王 飞,刘长璇,刘 楠,赵思雅,张雪伍
(江苏理工学院,江苏 常州 213000)
人类社会正在步入大数据时代,决策不再像过去基于决策者个人的感觉和直觉,而是基于大量数据分析的结果,决策结果更加科学合理[1-2]。在即将全面建成小康社会的时代背景下,高校贫困生的认定与帮扶也是脱贫工作的重中之重[3]。但新时期高校贫困生的外在特征已与过去贫困大学生的外在特征有着较大的不同,从而使得高校贫困生的认定过程困难重重,经常容易产生不合理的认定结果[4]。如何提高高校贫困学生的贫困认定精度已经成为高校贫困大学生帮扶工作的一个重要研究课题。论文依托高校校园大数据对高校贫困生的贫困认定策略进行研究,构建基于校园数据库的高校贫困生精准识别认定流程,为创造和谐校园,实现高校贫困生的精准脱贫提供有价值的参考。
“贫困”一词有着丰富的内涵,且始终处于一个不断发展变化的过程中,如资源匮乏、知识不足、心理缺陷等[5]。但作为高校资助进行研究时,“贫困”主要是指经济贫困。因此,高校贫困生主要是指由于经济困难缺乏基本物质生活条件或生活水平达不到社会普遍认可的大学生应有的生活水平的在校大学生。高校贫困生是一个相对概念,不同时期有着不同的认定标准,其最根本的判断标准就是其生活水平是否达到社会普遍认可的最低水平。
传统高校贫困生认定是由学生自行申报,学工人员根据其申报材料和证明材料,并根据班委讨论结果进行认定[6]。但由于社会生活水平有了很大的进步,贫困生的外在特征和表现也发生了很大的变化,学生的证明材料亦核实困难,致使传统的高校贫困生认定方法存在很大的局限性,可能出现非贫困生占用帮扶资源,而真正贫困学生的生活得不到充分的资助保障。
高校大学生来自五湖四海,他们的贫困证明材料主要由生源地民政部门或村委会提供。由于地区间的经济发展水平存在较大差异,不同生源地的贫困标准也不同,致使持有同样贫困证明材料的同学缺乏横向的可比性。例如,一些学生在经济发达地区属于贫困生,而他们在经济欠发达地区却不属于贫困的范围。
贫困证明材料在高校贫困生的认定过程中起着关键的作用。但是由于地理距离和其他因素的限制,使得高校很难对贫困生提供的贫困证明材料进行实地验证。同时,申报材料中家庭收入信息均由学生自行填写,难免出现一些夸大情况。有些需要帮扶的真正贫困大学生由于碍于面子又不愿意申请贫困补助,致使其生活水平大大降低,甚至学习也受到了很大的影响。
传统高校贫困生认定主要以定性指标为主,虽然在一定程度上起到贫困甄别的作用,但由于缺乏可量化的统一标准,致使其针对性和严谨性略显不足。在现实操作过程中,由于贫困生认定人员认知和经验的不足,致使贫困生认定工作缺乏统一标准和尺度,可能导致高校贫困生认定工作中出现不公平、不合理的现象。
随着高校信息化、数字化建设的持续推进,积累了大量的学生日常校园生活数据,如学生食堂消费、校园快递、家庭经济情况、移动账单、一卡通、图书借阅、微信朋友圈、QQ 空间等数据。这些数据能够对高校学生的在校生活进行较为精准的刻画,结合学习生活中同学和老师的评价,从而使基于校园大数据分析的高校贫困生精准认定成为现实。基于校园大数据分析的高校贫困生认定框架如图1 所示。
图1 基于大数据高校贫困生认定框架
基于校园大数据高校贫困生认定的核心思想就是利用海量贫困生数据对基于机器学习的贫困生识别模型进行训练,优化模型参数,再使用优化的高校贫困生识别模型对新的贫困生进行贫困识别。因此,存储了海量贫困生信息的贫困生校园生活数据库就成了基于校园大数据高校贫困生认定的重要数据基础。首先,收集既有的贫困生校园生活数据、贫困生家庭数据和贫困生管理数据;其次,对这些数据进行预处理,并实施数据融合,构建高校贫困生校园生活历史数据库。
利用机器学习、深度神经网络等人工智能算法构建高效贫困生的贫困认定模型,运用高校贫困生校园生活数据库中的数据信息,对贫困认定模型进行充分训练筛选,优化模型参数从而做到准确精细。高校贫困生贫困认定模型的构建与优化是一个反复的过程,随着时间的推移和贫困生校园生活数据库中数据的增加,应该将一部分时间较久远的数据进行淘汰处理。因为贫困的内涵是一个动态变化过程,不同时期有着不同的内涵和外在表现,为了提高模型贫困认定精度,应按照一定周期对早期数据进行淘汰。
首先,将待认定高校贫困生数据和管理数据输入到训练后的高校贫困生贫困认定模型中,通过贫困生识别产生初步贫困生名单。其次,由学工管理人员对模型输出的贫困生及其对应等级进行复核,从而确定高校贫困生最终名单。最后,将认定后高校贫困生相关数据输入到贫困生数据库中,完成对高校贫困生校园生活数据库的更新。
虽然基于校园大数据的高校贫困生贫困认定模型能在一定程度上提升贫困生认定的速度和精度,但学工管理人员要对模型输出的结果进行进一步的判别和确认。特别是因突发状况而导致家庭贫困的学生,模型很难对其贫困状态进行正确的认定,应单独进行人工识别和确认。
随着社会经济发展,贫困标准在不断地变化。为了使模型适应新的高校大学生贫困标准,应不断使用贫困生的最新数据逐步替换贫困生数据库中陈旧数据。同时,应对高校贫困生认定模型进行重新训练和优化,提升模型的适应性和认定精度。
高校贫困生相关数据涉及了学生的家庭、学习、校园生活等学生的隐私信息,具有高度敏感性,一旦泄露将会对贫困生的学习和生活产生极大的不利影响。因此,应对大数据贫困生识别系统的数据安全性给予高度重视,制定严格完善的数据使用制度和保密制度,严防学生个人隐私数据的泄露。
科学合理、客观公正的高校贫困生认定是有效开展高校贫困生资助工作的重要环节。但随着社会经济水平的提升,高校学生贫困的内涵也随之发生了较大的变化,这给高校贫困生的认定工作带来了巨大的挑战。基于高校贫困生校园大数据制定的高校贫困生认定策略能够弥补传统高校贫困生认定方法的不足,实现高校贫困生认定的客观公正和快速高效。