基于校园一卡通数据的成绩排名预测方法研究*

2018-06-01 01:22邢窈窈
中国教育信息化 2018年9期
关键词:成绩排名一卡通食堂

邢窈窈,唐 丽,郭 磊

(山东师范大学 管理科学与工程学院,山东 济南250300)

一、引言

目前,一卡通成为记录学生众多数据的承载者,除了学生的各种消费数据,还包括各种图书馆数据,与学生的生活息息相关。[1]这些数据背后体现的是学生的消费习惯、生活规律性、活跃度等。这些快速及时的一卡通数据,可以及时更新,是对学生自发行为的反映,受外界影响较小。是否能根据与学生成绩无直接联系的一卡通数据对学生成绩进行预测,是本文研究的方向与重点。

已有文献中,对学生成绩排名的考核大多是采用平均学分绩法,利用学生的多门学科考试成绩对该生进行评价。[2]有不少学者利用问卷调查方法和查阅文献等,构建成绩排名评价体系,[3]对学生的成绩进行评价。 在学习差异比较方面,唐兴芸采用参数方差分析等方法对学生平均绩点进行比较,[4]然而利用这种方法忽略了学生的生活习惯、心理因素的影响。在黄红安、文卫平[5]的研究以及郭继东[6]的研究中,加入了学习动机组成因素。在冯业栋、傅旭东、何建华的大学生助学体系研究中考虑多种因素,[7]给出构建体系的意见。

本文在学习总结前人经验的基础上,采用多方位的评价体系,对学生的一卡通数据进行整理与研究,利用统计学的方法,运用相关性分析,得出10个与成绩排名相关性较大的指标。与人们传统认知相反,借书量,专业书比例,日均图书馆消费、校车总次数等指标与成绩排名不相关,也可以从侧面反映出,大多数学生借书后放到一边,并没有进行深入的学习与领会。文中选取10个相关性大的指标,采取因子分析[8-10]和主成分分析[11-12]的方法,对学生成绩排名进行评价和预测。

成绩排名是衡量一个学生学习能力的标准,结合一卡通相关数据的分析,给出相关的建议,对于刚进入大学的大一学生具有指导意义,使他们能够尽快地适应大学生活,在以后的学习生活中抓住关键和重点,提高学习意识,为以后掌握专业知识与能力做好准备。

二、研究设计

1.学生成绩排名评价指标体系构建

根据研究目的和数据来源,充分利用一卡通数据集中的相关数据,在借鉴国内相关问题指标体系研究的基础和对学生的调查研究中,得知学生成绩排名的侧面评价是多方面的,选用的指标也各不相同。从消费习惯、活跃度、生活规律性、勤奋程度等方面选取了10个指标,这10个指标对学生成绩排名产生不同程度的影响,而且彼此之间还存在内在联系。所选指标及在本文中的代码具体如下:X1(日均消费)、X2(在宿舍时间所占比例)、X3(周沐浴次数)、X4(日均食堂吃饭次数)、X5(文印中心总次数)、X6(日均打水次数)、X7(校医院总次数)、X8(日均超市消费)、X9(日均食堂消费)、X10(晚归次数)。其中,X1是指平均每天的总消费,X2代表一天中在宿舍度过的时间所占比例,X3代表每周沐浴的平均次数,X5指在固定时间段去文印中心打印的总次数,X6代表平均每天打水的次数,X7是指去校医院看病的总次数,X8、X9分别指平均每天在超市、食堂消费的费用,X10代表每天晚于8点回宿舍的总次数。

2.数据来源

本文所采用数据来源于某高校两个学年内学生使用一卡通在校刷卡的数据。

①一卡通数据:学生ID、消费类别、消费地点、消费方式、消费时间、消费金额、剩余金额。

②寝室门禁数据:学生ID、具体时间、进出方向(0进寝室,1出寝室)。

③图书馆借书数据:学生ID、借书日期、书籍名称及作者、书籍中图分类号。

④图书馆门禁数据:学生ID、门禁编号、具体时间。

⑤学生成绩排名数据:学生ID、学院编号、成绩排名等。

3.数据整理及分析

一卡通数据:学生的在校消费、消费类别为POS消费、充值等,消费方式主要有淋浴、开水、洗衣房、文印中心、教务处、图书馆、超市、食堂、校车、校医院等。对10号学院学生的一卡通数据统计,得出日均消费最大金额为27.2元,日均食堂消费最大金额为16.2元,日均超市消费最大金额为6元,可以看出学生的消费主要是食堂消费。

寝室门禁数据:通过对学生的寝室门禁数据分析,学生一学年中平均有54.5%的时间在宿舍度过,有2%的学生一学年中有73.5%的时间在宿舍度过。

图书馆借书数据:对学生的图书馆借书数据统计,在两个学年内,学生平均借书45本,借书超过45本的有37名学生,可见有44.5%的学生有良好借阅习惯。

图书馆门禁数据:分析图书馆门禁数据发现,学生平均有23次早于早晨9点进图书馆且晚于晚上9点出图书馆,仅有一名学生出现过109次此现象。

因子分析与主成分分析相互关联又有着各自的特点,二者都利用降维的思想。主成分分析是找出反映多个变量的独立综合指标,主成分个数等于原指标的个数,一般仅取少数几个主成分作综合指标;因子分析是得出解释多个指标的独立的公因子,若初始公因子难以合理解释,可进一步进行因子旋转求得合理解释。接下来首先利用因子分析能够提取出公因子,并通过旋转成分矩阵对影响成绩的因子进行合理的解释,结合逐步回归,探讨各因子和公因子对成绩影响的比重。而主成分分析主要是预测功能。

(1)因子分析法

采用 KMO和 Bartlett’s检验,得出 KMO值为0.621,根据测度标准,一般 KMO值大于 0.5则认为可以进行因子分析;Bartlett’s检验近似卡方值为356.971(自由度为 91),伴随概率值为0.000<0.05,达到了显著性水平,说明因子的相关系数矩阵不是单位矩阵,相关矩阵间有共同因素存在,适合做因子分析,见表1。

表1 KMO和Bartlett的检验

利用因子分析对10个影响学生成绩排名的因素进行分类,如表2所示。前4个因子能够解释71.943%的总体方差。因子旋转后,4个因子所占比例为26.097%、18.350%、15.038%、15.329%、12.167%,见表 2。

表2 解释的总方差

表3显示10个因素与4个因子之间的关系,因子负荷小于0.6的未被列出。10个因素对顾客满意度有显著的关系。这10个因素可以解释为:消费习惯 (因子1),包括日均食堂消费X9、日均消费X1、日均食堂吃饭次数X4;活跃度(因子2),包括文印中心总次数X5、日均打水次数X6、校医院总次数X7;勤奋程度(因子3),包括在宿舍时间所占比例X2、晚归次数X10;生活规律性(因子4),包括周沐浴次数X3。

表3 旋转成份矩阵a

(2)逐步回归分析法

表4 10个因素逐步回归的结果a

首先,对10个影响学生成绩排名的因素进行逐步回归分析,根据表4可得:排名=-46.656*日均超市消费-16.439*日均食堂消费+16.309*文印中心总次数-3.050*晚归次数+631.189(校正R方为0.454)。

从回归方程可以看出,4个影响学生成绩排名的因素进入了方程,证明这4个因素对学生成绩排名的影响显著。其中,日均超市消费对学生成绩排名的影响最大,日均食堂消费、文印中心总次数、晚归次数对学生成绩排名的影响次之,但仍然属于显著性因素。模型的解释度为 0.454。

接下来,在因子分析的结果上,对四个因子进行逐步回归分析,从表5可得:排名=-107.583*消费习惯+88.234*活跃度-70.175*勤奋程度-38.327*生活规律性+382.218(校正R方=0.469)。表5系数a从回归方程可以看出:消费习惯对学生成绩排名的影响最大,活跃度、勤奋程度在消费习惯之后,而生活规律性对学生成绩排名的影响最小,但仍然属于显著性因素。模型的解释度为 0.469。

表5 系数a

从因子分析的结果,我们可以看出消费习惯对学生排名影响最大,由于一卡通数据反映的是学生在学校的消费情况,在学校消费越多的学生排名越靠前。活跃度越高,成绩排名越靠后,学生可能会有一些别的事情需要处理或解决,学习时间相对来说比较少,所以排名靠后。而勤奋程度越高,成绩排名越靠前,进一步说明学习时间越多、越勤奋的学生,排名也靠前。生活规律性来看,生活越规律,排名越靠前。

如果仅从单因素来看,我们发现日均超市消费和日均食堂消费对学生成绩排名影响很大,学生一卡通数据中显示学生有时没有每天在食堂或超市的消费记录,说明这些学生选择在学校以外的地方吃饭或进行其它消费。而在校学生主要消费在食堂和超市,说明基本在学校消费的学生成绩排名越靠前。结果表明,去文印中心次数越多的学生成绩排名越靠后。据观察,去文印中心次数较多的基本是社团和学生会的相关人员,社团和学生会需要进行的活动比较多,所以,活跃在各种活动中的学生往往排名比较靠后。晚归次数是指在晚上8点之后回宿舍的次数,晚回宿舍的次数越多,成绩排名越靠前,进一步说明勤奋度越高,学生成绩排名越靠前。

就研究结果来看,学生提高成绩需做到以下几点:

①尽量保证在学校的学习时间。

②对于学校举办的一些活动、学生会、社团,要适当参加。

③提高自己的勤奋度,发挥自己的主动性。

④养成良好的生活规律。

(3)主成分分析法

主成分分析法旨在利用降维的思想,将原来具有一定相关性指标转化为少数几个综合性指标,且力保数据损失最少。该方法的具体步骤如下:①对原始数据进行标准化。②计算相关系数矩阵。③计算特征值与特征向量。④计算主成分载荷,确定主成分个数。⑤各主成分的得分。

首先,对各变量进行标准化,将标准化后的数据进行相关性分析及提取主成分操作(4个主成分,累积贡献率71.943%),见表6。从中提取出几个重要指标对学生成绩排名进行评价,进而根据综合得分对学生成绩排名进行预测分析。[13]

表6 解释的总方差

表7 成份矩阵a

由表7数据可知,第一主成分主要影响因子是X1、X8、X9,它集中反映了学生的消费情况;第二主成分的主要影响因子是X7,它反映了学生的身体情况。

根据特征向量矩阵得到主成分计算公式:

根据主成分计算公式计算学生排名预测:(见表8)

根据表8的结果,我们可以看出采用主成分分析法预测学生成绩排名,与原有利用学生成绩相比,在相差15个名次的条件下,成绩排名预测的正确率达到43.6%。通过对学生一卡通数据的研究,学生的消费习惯、生活规律性对成绩排名有一定的影响力。除此之外,学生的学习能力、综合素质及其他因素对于成绩排名也有一定的影响。[14]

表8 排名预测

三、总结

本文通过对校园一卡通进行分析和建模,通过因子分析和主成分分析等研究方法得出学生成绩排名与消费习惯、活跃度、勤奋程度、生活规律性有关。从上述研究结果来看,大学生的成绩排名归结于最重要的一个因素:自律。不论是在日常消费,还是过多的参加活动,亦或是借书种类和对所借书籍的利用程度方面,都说明了自我控制[15]对一个大学生的重要性,这也是由于大学生自身的特点决定的。

在运用主成分分析方法对学生成绩排名预测时,提取了两个主成分,并进行了相关的结果分析,但是由于每个学生的个体差异和成绩影响因素的复杂性,不能通过一卡通提取的特征评价体系进行总体概括和解释,只能分类讨论影响成绩排名的指标体系,如何建立一个完善准确的成绩排名评价体系,对于研究影响学生成绩排名因素、探索成绩排名预测方法有重要意义,也是后续研究的重要工作。

[1]何秀全.校园一卡通数据分析及应用相关研究述评[J].华中师范大学学报(自然科版),2017(S1).

[2]孙余.基于因子分析法的高职学生成绩评价[J].物联网技术,2013,3(3).

[3]万来红,陈治华,谢彬.普通高校公共体育课学生成绩评价体系的构建与实践研究[J].武汉体育学院学报,2015,49(12).

[4]唐兴芸.少数民族学生学习差异比较研究——以黔南民族师范学院为例[J].贵州民族研究,2013,34(4).

[5]黄红安,文卫平.非英语专业本科生英语学习动机组成因素的实证研究[J].国外外语教学,2005(3).

[6]郭继东.研究生英语学习动机与成绩、性别之关系研究[J].外语界,2009(5).

[7]冯业栋,傅旭东,何建华.大学生助学体系研究[J].重庆大学学报(社会科学版),2011,17(4).

[8]林海明.因子分析应用中一些常见问题的解析[J].统计与决策,2012(15).

[9]辛督强,韩国秀.因子分析法在科技期刊综合评价中的应用[J].数理统计与理,2014,33(1).

[10]俞立平,刘爱军.主成分与因子分析在期刊评价中的改进研究[J].情报杂志,2014,33(12).

[11]林海明,杜子芳.主成分分析综合评价应该注意的问题[J].统计研究,2013,30(8).

[12]傅德印.主成分分析中的统计检验问题[J].统计教育,2007(9).

[13]程毛林.Matlab软件在多元统计分析中的应用[J].数理统计与管理,2008(2).

[14]赵琳,王文,李一飞,纪洪超,史静寰.大学前教育经历对高等教育质量的影响机制研究——兼议教育领域综合改革[J].清华大学教育研究,2014,35(3).

[15]吴娜,张晨艳,周宗奎.儿童网络行为与学业成绩的关系:自我控制的调节效应[J].心理与行为研究,2017,15(2).

猜你喜欢
成绩排名一卡通食堂
知其师则知其学:多维成绩评定方式的迫切性与必要性
“互助孝老食堂”值得推广
本科生成绩排名计算方法的研究
食堂
中超联赛职业足球俱乐部赛季初的资金投入和比赛表现与赛季末成绩排名的相关性研究
幸福食堂值得推广
三千食堂
学生成绩排名还是继续公布为好
基于“一卡通”开发的员工信息识别系统
公共交通一卡通TSM平台研究