摘要:大数据技术助推了资助工作信息化、精准化的进程,推动了高校资助工作模式的创新,在资助工作过程中如果对大数据过分推崇会导致出现过度数据化。本文基于资助工作实际提出的数据采集机制、指数的分析机制,以及数据运用机制,力图构建出一线管理人员“上手快、用的上、有效果”的数据处理办法,为资助工作提供一定的决策参考。
关键词:高校;资助工作;大数据
基金项目:2020年福建省中青年教师教育科研项目“大数据技术在高校贫困生资助工作中的应用研究”(JAT200560)。
作者简介:汪灵波,泉州师范学院资源与环境科学学院讲师(福建泉州362000)。
中图分类号:G649.2文献标识码:A文章编号:2095-5103(2022)10-0121-04
自“国家大数据战略”提出以来,《促进大数据发展行动纲要》与《大数据产业发展规划(2016—2020年)》相继发布,国家十四五规划和二〇三五年远景目标明确提出,“要推动互联网、大数据、人工智能等同各产业深度融合”。大数据技术正在各行业中广泛应用。高校在校生规模逐年扩大,对高校资助工作的精细化、精准化的要求越来越高,同时,也给教育管理者提出了很大的挑战。因此,本文结合大数据技术在高校资助工作中的运用,探讨大数据技术在该领域存在的局限性,并提出谨慎科学而又实际可行的使用方法和应用路径。
一、高校资助工作中大数据运用的现状
随着大数据技术快速发展,高校资助工作中大数据运用的理论研究也在近十年间有了快速的推进。在中国知网搜索页面以“大数据”并含“资助”为主题词进行高级搜索,得到753篇文献(截至2022年1月),从年度分布来看,从2013年开始有部分研究成果,然后逐年增多。通过筛选,以数据挖掘技术为代表的大数据技术在资助工作中运用的文献有127篇。其中,挖掘“一卡通”(或称为校园卡、餐卡、饭卡等)消费数据的文献有78篇,现有研究呈现出以下几个特点。
(一)偏重于理论和整体上的综合研究
大部分研究以精准资助为视角,从教育信息化的大背景入手,强调大数据运用到学生资助工作中对于高校学生管理的重大意义和理论价值,偏重于理论和整体上的综合研究。王宏鹏从五个宏观方面构建“五位一体”的高校精准资助工作新模式[1]。罗丽琳从高校精准资助制度的整体性等四个方面进行理论模型的构建与制度的创新[2]。其他部分的研究则倾向于勾勒出一个宏大的框架。姚蓓基于大数据算法,从整体上建立贫困生算法预测模型[3]。缪小燕提出从整体上构建高校贫困生资助工作精准化体系[4]。
(二)在数据收集问题上过于理想化
有研究提出对大学生进行数据全样本分析,如对学生网络购物数据、金融消费数据进行分析,提出要对学生的银行卡、支付宝、微信、QQ钱包等消费渠道进行挖掘。还有一些研究提出要对学生互联网行为轨迹如新闻网站活动轨迹、社交软件使用数据、短视频平台活动轨迹包括点击记录、互动记录、发帖记录进行挖掘,甚至提出对学生通信通话数据等进行挖掘。这些研究存在过于理想化的倾向,要想把学生所有的数据收集、储存起来、加以挖掘运用,这在一定程度上忽视了信息收集的合法性与伦理性等方面的规范。
大数据是一把双刃剑。对大学生信息的挖掘应该有限度和边界。《网络安全法》规定“不得收集与其提供的服务无关的个人信息,不得违反法律、行政法规的规定和双方的约定收集、使用个人信息”。《个人信息保护法》规定“个人信息受法律保护,收集个人信息应当限于实现目的的最小范围,不得过度收集个人信息”。从目前实际情况来看,不太可能轻易收集到学生银行流水、线上消费、网络行为轨迹等个人信息的全样本数据。“滥用”大数据来识别贫困生可能存在越界和违法的嫌疑,这是一个不容忽视的严肃问题。
(三)过度推崇以数据挖掘为基础的资助工作模式
依托大数据技术可以实现隐形资助,于无形中帮助困难学生,实现“润物细无声”式资助。但是过于推崇这种以数据挖掘为基础“默默给予资助”的工作模式就出现了盲目崇拜的倾向。部分研究不仅对这种模式大加赞赏,而且还认为大数据技术无所不能,认为只要运用了大数据技术,资助工作中所有难题都会迎刃而解。部分研究认为,资助工作中处处皆可大数据技术化,出现了大数据技术运用的工具依赖。与此同时,把资助工作等同于贫困认定是狭隘地理解了资助工作。现有的资助体系是涵盖“奖、助、贷、勤、补、减、免”等一体化的政策体系,是对学生全方位的资助。而在实际资助过程中,高校方面过于关注贫困生的物质生活需求而忽视了其他方面和其他层次的需求。
二、高校资助工作中大数据运用的局限性
以数据挖掘技术为代表的大数据技术,在高校资助工作中已经显示出一定的作用,但是技术的局限性不容忽视。
(一)宏观层面
新时代的资助工作中心向资助育人转变,单纯的物质资助已经无法满足新时代大学生追求发展、追求卓越等多样化的需求。一方面,单纯地从大数据中甄别出的贫困生已经不能满足当前资助工作发展的需要。新时代高校学生资助工作有新气象,仅从教育部公布的年度中国学生资助发展报告里就可以看出变化,但从2017年开始,每年度的报告中就新增了“资助育人”的相关内容。可见,新时代的学生资助工作将从过去主要解决学生经济困难转变为更加注重资助育人的新模式。另一方面,政策方面只是鼓励使用大数据,并没有要求一定要用大数据。教育部等六部门发布的《关于做好家庭经济困难学生认定工作的指导意见》明确指出,“学校可采取家访、个别访谈、大数据分析、信函索证、量化评估、民主评议等方式提高家庭经济困难学生认定精准度”,由此可见,大数据分析只是鼓励使用的方式之一。
(二)中观层面
中观层面的局限性主要体现在两个方面。一方面,大数据技术运用的技术门槛较高。从目前研究成果来看,能够运用到资助工作中的大数据技术五花八门层出不穷。明心铭利用基于Spark的分布式算法对消费行为特征进行聚类分析“一卡通”消费数据[5]。王煜对“一卡通”消费数据进行类logistic回归分析,来确定贫困状况[6]。伍智鑫基于“一卡通”消费数据,使用Spss软件完成聚类分析[7]。段玉婷利用Apriori关联规则挖掘K-均值聚类结果频繁规则,根据挖掘出学生校园“一卡通”消费强度和就餐率两个指标,来认定贫困生[8]。可以看出,这些对技术的要求高,对资助工作者的知识素养、学科背景与大数据技术驾驭能力的要求高,工作人员能力较弱会导致工作效果不佳。另一方面,大数据的运用需要软件、硬件的成本投入。由于技術门槛高,需要进行必要的软硬件投资和人力资源投资,这就需要充足的经费保障。
(三)微观层面
当下,网络化的消费渠道很多,基于“一卡通”消费的数据不能代表一个人的实际消费情况。一方面,“一卡通”消费数据存在片面性。既排除不了其他合理怀疑,也排斥不了其他渠道的消费。大量的研究集中在对校园卡消费数据分析。“一卡通”消费强度和频率等,涉及交易的金额、日期、时间、次数等具体信息。可以将统计出来的数据与学生平均消费水平进行比较,从而估算出学生大致的消费水平。但是,不可否认的是贫困生的日常消费也并非全部由“一卡通”支付,相反,有人伪装成“低消费”也有可能。另一方面,即便是政府部门开展的扶贫工作也没有单一地依赖大数据技术。数据远远没有想象中的那么可靠,想要依赖某一项指标来评估是否贫困是很困难的。一般来讲,贫困指的是个人、家庭或者群体处于一种综合不利状态[9]。贫困测算主要有两种途径,一是依托大样本的入户调查,二是建立相关可测量的指数与指标[10]。在新时代,测度贫困要从收入或消费等单一维度,扩展至多维贫困[11]。政府部门的扶贫干部在进行贫困认定过程也是通过大规模的入户调查结合部分问卷调查和访谈调查综合得出结论的。因此,从这一层面来看大数据具有一定的局限性。
三、高校资助工作中大数据运用的超越:可能的路径分析
根据高校资助工作中大数据运用的现状和其自身显示出来的局限性,基于高校学生管理者(亦是学生资助工作者)的视角,可以选择工作中需定期接收的数据,以及无障碍获取的数据进行汇总,建立与资助密切相关的指数,在日常工作中及时录入数据、将数据转换成一定的分值,最终为资助工作提供决策参考。
(一)确立数据采集机制
根据在实际工作中能采集得到的数据信息,能够作用于学生资助工作的信息可以有以下几个数据采集来源。首先,学生工作部门自身储备的基础信息,主要包括学生个人基本信息、学生档案中显示出的基本信息和家庭信息。其次,学生工作部门在工作中会定期收到的学校相关部门发送过来的指定信息。主要包括教务系统相关信息、学工系统相关信息(以泉州师范学院为例,正常运行的至少包含学生获评先进、受资助、获勤工俭学机会等几方面信息)、宿管中心数据、易班APP有关信息(以泉州师范学院为例,正常运行的至少有学生请假、学生出入校大门的相关信息)、校医院学生体检数据、校心理咨询中心学生心理普查数据。再次,学生工作部门在校内通过申请、协商获取的数据。如图书馆系统数据、“一卡通”系统数据、校医院学生就诊数据、校心理咨询中心接受学生咨询数据。最后,学生工作部门通过调查、调研获取的数据。如学生家庭深层次信息、学生日常表现信息、学生“第二课堂”参与信息等。
(二)建立数据分析机制
根据采集到的数据,从学生家庭信息、学习情况、生活状况、个人思想、社会实践等方面制定几项相关指数来分析学生贫困的相关信息。
一是学生家庭贫困指数。主要观察点有:家庭所在地的区域经济发展水平、家庭户口状况、家庭居住房屋情况、家庭交通出行方式、家庭总人数、家庭在校生人数、家庭成员健康状况、家庭成员收入来源和水平、家庭成员遭受危重病情况、家庭遭受自然灾害情况、家庭债务情况、家庭其他方面突发状况、学生个人助学贷款情况、学生在校期间缴费情况、学生个人曾受资助的情况、学生个人兼职情况。二是学生贫困测评指数。主要通过同学间测评的方式,主要观察点有:服装、化妆品等日常消费的频率和价位,交通出行方式及消费的价位,手机、个人电脑及其他电子设备消费情况,娱乐休闲消费情况(含旅游、健身、户外运动)等。三是勤学指数。主要观察点有:出入图书馆情况、借阅次数与数量、上课考勤情况(尤其是线上课的签到情况、线下课的迟到情况)、奖学金获得情况、荣誉称号获得情况(包含受到惩罚的情况)。四是学业完成指数。主要观察点有:各门课程考试(或考核)情况,教师资格证、大学生英语、大学生计算机、普通话等考证考级情况,与专业紧密相关的资格证书获得情况。四是勤工指数。主要观察点有:校内勤工俭学申请情况、校内勤工俭学的机会获得情况、校内勤工俭学的所在单位评价情况、校外勤工俭学的开展情况。五是健康指数。主要观察点有:大学生体检报告、校医院(或校医务室)就诊数据、大学生心理普查报告、校心理咨询中心的咨询情况。六是“第二课堂”的参与指数。主要观察点有:学生的政治态度,学生的人际关系状况(尤其是与父母的感情亲疏、与专业师生的人际关系、与宿舍室友的关系),学生在校内基层组织、学生组织、群团组织的任职情况,志愿服务活动参与类型与时长,社会实践活动完成情况、体育锻炼情况、文体活动参与情况、学业学术情况,就业创业情况等。
(三)强化数据运用机制
数据运用主要体现为以下三个方面。一是为学生资助工作做决策参考。将学生的基本信息按照学生家庭贫困指数、学生贫困测评指数、勤学指数、学业完成指数、勤工指数、健康指数、“第二课堂”参与指数等方面指数按照相应的观察点分别输入制作表格,根据学生每一项实际情况进行勾选,各项指数都能从高到低排列出优、良、中、差(其中家庭贫困指数、学生贫困测评指数转换成为特别贫困、一般贫困、疑似贫困、不贫困)四个等级,最终根据各方面指数得出一个初步的推断为学生资助工作提供参考。二是为特殊学生作预警。可以根据宿舍门禁数据进行挖掘,对多次晚归学生、异常未归学生、宅居过长学生进行行为预警;根据校园卡低消费和高消费行为进行一定的预警;可以根据教务系统数据和宿舍门禁数据的比对,对旷课、未归学生进行失联预警。根据教务系统数据对学生学业完成度进行学业预警。三是对特殊学生进行行为预测。根据教务系统数据对部分学生进行学业预测,可以做到成绩排名预测和学业修满情况预测以及部分学生的课程挂科预测。可以根据心理咨询中心数据结合门禁系统、图书借阅数据对特殊学生进行抑郁倾向预测。可以根据学生家庭贫困指数、贫困测评指数,以及学生家庭所在地突发重大灾害或重大突发事件等,对学生展开临时生活困难预测。
贫困是世界各国公认的一个多维度社会现象[12]。正因如此,需要综合考虑各因素。同时必须警惕在资助工作中对大数据技术的过分推崇。当前的情况下,要想完整地收集到大学生所有的数据是较为艰巨的任务,因此,需要立足工作实际,从合法渠道获取的数据入手,制定一线工作人员切实可行的工作路径。
参考文献:
[1]王宏鹏.大数据视域下高校精准资助“五位一体”新模式[J].高校辅导员学刊,2019(11).
[2]罗丽琳.大数据视域下高校精准资助模式构建研究[J].重庆大学学报(社会科学版),2018(24).
[3]姚蓓.數据挖掘技术在高校智慧资助中的应用研究[D].合肥:安徽大学,2019.
[4]缪小燕.大数据背景下高校贫困生精准资助体系的构建[J].大学,2021(26).
[5]明心铭.基于数据挖掘的高校学生行为分析方法与应用研究[D].深圳:深圳大学,2020.
[6]王煜.基于校园大数据的助学金获取关键因素分析[J].中国教育信息化,2018(17).
[7]伍智鑫.基于一卡通数据挖掘的高校贫困生精准扶贫应用研究[J].湖南科技学院学报,2019(4).
[8]段玉婷.基于校园卡的学生消费信息数据挖掘与应用研究[D].绵阳:西南科技大学,2018.
[9]郭尚武,张全红.1990年代以来湖北省贫困指数的测算分析与政策建议——基于多维贫困视角[J].湖北经济学院学报,2015(13).
[10]王宝成.中国多维贫困的测算与结构分解[J].统计与决策,2021(16).
[11]王亚柯,夏会珍.后减贫时代中国老年多维贫困的测度[J].东北师大学报(哲学社会科学版),2021(5).
[12]冯怡琳,邸建亮.对中国多维贫困状况的初步测算——基于全球多维贫困指数方法[J].调研世界,2017(12).
责任编辑:聂慧丽