杨 芳,刘静萍,王亚飞
(1.鄂尔多斯应用技术学院;2.鄂尔多斯市中心医院康巴什部,内蒙古 鄂尔多斯 017010)
第二课堂是我国推行素质教育的重要组成部分,2016年团中央颁布《高校共青团“第二课堂成绩单”制度试点工作实施办法》中提出在全国范围内逐步推行“第二课堂”成绩单制度。第二课堂是相对于第一课堂而言的,它以培养学生课外学习能力和综合素质为目标,以开放式教育活动和实践活动为主要形式,与第一课堂共同构成完整的育人体系[1]。包括思想成长、社会实践、文体活动、社会工作与社团工作、技能特长、创新创业、技能特长、志愿公益等实施活动模块。对于促进学校思政理论课程改革、培养高素质人才具有重要意义。
到梦空间是由团中央校部与全国学校共青团研究中心共同指导开发的多终端免费校园应用程序,旨在推进大学生第二课堂素质教育的开展,为高校第二课堂的教学活动提供了有力支撑[2]。在到梦空间管理系统中,随着第二课堂活动的不断发布,学生参与活动的数据逐渐积累,大量的数据得以保存,如何利用这些数据去发现隐藏在其中的有用的学生学习行为成为第二课堂管理者研究的主要课题之一。数据挖掘技术的发展可以很好地去解决这个问题。通过对历年活动数据的挖掘,发现学生参与第二课堂学习的行为特征,从而指导学校进行更好的课程开设以及管理。真正地促进学生素质教育的发展。
数据挖掘是数据库知识发现中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,挖掘功能的分析方法主要有分类、聚类以及关联规则、序列模式、时间序列等[3]。
数据挖掘技术可以为组织决策提供巨大支持,让组织收获巨大经济利益,受到了学术界的广泛关注。所以,国内外的学者都加入到了数据挖掘的理论技术和应用的研究中,产生了大量的学术成果和成功的企业案例。
笔者选取了鄂尔多斯应用技术学院第二课堂管理程序“到梦空间”的学生学习数据作为研究的数据对象,由于学院2017级学生在到梦空间系统中有完整的三年学习数据,所以选用该年级的第二课堂学习数据进行研究,通过对数据进行挖掘分析来研究学生们的第二课堂的学习行为。
2.2.1 数据清洗。笔者共用到了3张信息表,学生信息表、活动信息表、学生成绩记录表。首先进行空值校验,确保一些关键的属性值不为空,否则会影响挖掘结果。学生信息表中,对学号为空的数据进行删除,对班级为空的数据要根据一定的规则进行填充;学生成绩记录表中,确保关键值属性学号、活动ID、积分数量不为空,对关键值属性进行异常值校验。
2.2.2 数据转换。在数据清洗的基础之上,为了后续的数据挖掘工作需要做一些必要的数据转换。学生信息表中学号可以唯一标识学生信息,只保留姓名、学号、系部3个属性;活动记录表中活动Id可以唯一标识活动信息,只保留活动Id、活动标题、活动分类两个属性。学生成绩记录表中最终保留学号、活动Id、积分数量,姓名为不必要字段,可以去掉。
2.2.3 数据集成。根据数据挖掘的需要,我们首先将3张表集成在一起,根据学号获取学生读者的系部,根据活动Id获取活动的分类,形成一张新表学生参加活动记录表(见表1)。由于关联规则需要将数据进行真值转化,我们对学生参加活动记录表进行真值转化后形成学生参加活动记录(见表1、表2)。至此,数据处理工作全部完成。
表1 学生参加活动记录
表2 学生参加活动记录
2.3.1 分析思路。根据读者参加活动获得的积分数对学生学习情况进行聚类。首先对学生现有总积分进行聚类分析,找出不同等级的学生群,并分析他们的特征;然后分别对这些学生的大一、大二、大三的学习积分进行聚类,找到其中的规律,以便针对不同年级开设不同的第二课堂课程。
2.3.2 建立模型。利用K-Means算法建立模型,首先对学生参与活动总积分进行聚类分析,同时对活动积分按照大一、大二、大三分3年分别进行提取,然后对每一年的积分进行聚类分析,研究不同年级学生的活动参与情况。学生参与活动总积分聚类模型见图1,学生参与活动分年级聚类模型见图2。
图1 学生参与活动总积分聚类模型
图2 学生参与活动分年级聚类模型
2.3.3 结果分析。通过对2017级学生参与活动总积分进行K-Means聚类,得出如下聚类结果,如图3所示。聚类结果共有5个类别,根据以上聚类结果可以发现,2017级633名学生3年以来的积分有46.3%的学生达到46.18的积分,20.1%的学生达到69.46积分,有12.3%的学生达到95.08积分,4.4%的学生达到131.61积分。仅有16.9%的学生积分为24分。根据《鄂尔多斯应用技术学院“第二课堂成绩单”制度实施办法》中的规定:“学生在完成第一课堂学习要求的基础上,需完成‘第二课堂’各模块积分限定表中规定的最低40积分,方为合格”。可以看出,截至大三,大部分学生都已经达到毕业所要求的条件,一部分学生超额完成了任务,还有一部分学生不达标,需要在大四上学期继续努力,完成剩余的积分。
图3 学生参与活动总积分聚类结果
为了弄清楚学生在这三年中各个学年取得学分的情况,我们分别对学生每一年的积分数据进行聚类分析,将这三年的聚类结果统计到一张表上为学生参与活动分年级聚类结果统计表,如表3所示。
从表3可以看出,3年的数据每一类的比例大体上是相当的,但是每一类的均值数量是呈现出随着年级的升高呈现下降的趋势,分析其原因可能有以下几点:①大一、大二学生基础课程较多,专业课程偏少,新入大学学习热情较高,能够非常积极地完成学校布置的各项学习任务。②学生面临着“第二课堂”40积分的学习任务,学生为了早日完成规定的任务,所以在前期会积极主动地参加各种形式发布的“第二课堂”活动。③大三的学生积分偏少,一则是因为大部分学生已经在大一、大二的时候完成了40积分的学习任务,学生在完成任务后降低了对“第二课堂”学习的动力。再则三年级学生专业课开始学习,学生需要分配更多的精力到专业课上。
表3 学生参与活动分年级积分聚类结果统计
2.4.1 分析思路。对学生学习行为的关联规则分析实际上是对学生参加活动信息进行关联挖掘,发现有效地参与活动的规则,然后根据学生参与活动的规则向学生举办必要的第二课堂活动,通过对全部学生的学习行为、对聚类基础上的每类学生的学习行为的关联规则挖掘,发现隐藏在其中的规则,去指导学工处的老师做好第二课堂活动的开设、管理等工作。
2.4.2 支持度和置信度阈值的设定。合理的支持度与置信度是实现有效的关联规则挖掘的关键,阈值设定过大找不到有效的关联规则,阈值设置过小找到的规则又太多,会产生很多非强关联规则,所以我们要根据数据质量不断地尝试确定最小支持度与最小置信度来找到有效的且规则适中的规则。
笔者在对学生参与活动信息的关联规则挖掘过程中,发现学生普遍参与第二课堂活动的积极性较高,最小支持度和最小置信度均需要调整的比较大的时候才能发现规则量适中的关联规则。
2.4.3 建立模型。在SPSS Modeler中利用Apriori关联规则算法建立模型,对所有学生参与活动的信息进行关联规则分析,这些活动类型既是输入又是输出字段,如思想成长既是输入又是输出。在学生参与活动总积分聚类基础上对每类学生参与活动进行关联规则分析,通过设定不同的置信度与支持度得到不同类别学生的活动参与规则。
2.4.4 关联规则结果分析。在全部学生学习行为的关联规则挖掘中可以发现,参加创新创业活动的学生100%会去参加思想成长或文体活动。参加技能特长活动的学生100%会去参加思想成长或文体活动。同时参加创新创业和思想成长活动的一定会去参加文体活动,此规则为二项集。在对学生参与活动总积分聚类的基础上选择聚类-5进行学生参加活动关联规则挖掘中,发现所有的学生都会参加文体活动,参加创新创业、技能特长的学生一定会去参加思想成长活动,参加创新创业活动的学生有94.5%的学生会去参加思想成长活动。综上我们可以得出,学生参加第二课堂活动的积极性普遍比较高,基本每个类型的活动都会积极参加,说明该校的第二课堂的素质教育取得了良好的成效。
为了探索该校第二课堂举办活动的情况,我们通过对活动的统计得到了2017级学生参与活动汇总图,如图4所示。
图4 2017级学生参与活动汇总
从图4可以看出,针对2017级学生目前各类活动举办次数不均衡,其中思想成长和文体活动举办次数最多,分别为272场和258场,创新创业、技能特长、志愿公益活动举办次数居中,分别为62场,45场、51场。实践实习和社会工作与社团活动举办的次数最少。所以要加强实践实习、社会工作与社团活动的活动举办,更好地满足学生对这类活动的需求。
为了探索该校第二课堂各系学生参加的情况,我们通过对各系学生平均积分的统计得到了2017级各系学生参与活动汇总图,如图5所示。
图5 2017级各系学生参与活动平均积分
从图5可以看出,交通运输系对二课管理最好,举办活动最多,学生参与度很高。化学工程系和数学与计算机系次之,土木工程系、信息工程系、艺术系较前几个系部来说二课管理不如前几个系部。
高校第二课堂作为第一课堂的延伸和扩展对于学生在校期间进行全面素质教育具有十分重要的意义,是应用型本科院校培养全面素质人才的必备要求,结合现在该高校第二课堂学习的情况,提出以下几点建议[4,5]:①加大第二课堂的宣传力度,吸引学生的关注,尤其是新生入学时的宣讲。②平衡各类课程的比例,加大目前开展活动较少的社会工作与社团活动、实践学习等类别的活动。③减轻第一课堂的课业负担,能让学生有更多的精力和时间投入到第二课堂的学习中,从而提高自己的综合素质。