杜可敬
随着信息科学技术的不断进步,社会的不断发展,大数据已经渗透到我们生活的方方面面,应用的行业也是十分广泛。其中大数据也渗透到高校的教学管理工作当中,基于大数据的精确学情诊断、个性化学习分析和智能决策支持,大大提升了教育品质,对促进教育公平、提高教育质量、优化教育治理都具有重要作用,已经成为教育现代化必不可少的重要支撑。借助教育大数据能够对学习者的所有信息进行系统地整理和分析,如可以运用大数据设计教育环境,完善教学的场景,配置教育试验场景等,这些都能够充分的调动大学生群体在学习领域中的主动性和积极性,对教育领域的发展有着不可估量的作用。目前随着我国大众化高等教育的普及以及高等学校的不断扩招,面对那么多的大学生每天产生的海量信息数据,如何从中挖掘出有用信息更好地反馈到教学管理上,无疑对高校教学工作是一个很大的难题。因此要想解决此类问题,就要提高大数据意识,应用数据挖掘技术探索数据中存在的潜在价值,从而不断挖掘出高校教学管理中更高效的方法和策略。
当前大数据背景下高校教学管理中主要存在以下问题:(1)互联网的迅速发展引起了网络教育信息的海量增长,然而由于网络结构的庞杂性以及教育信息自身分布的无规律性,信息的获取与应用往往具有局限性。因此如何更加高效的获取、利用教育信息资源更是一个重要的问题。(2)在高校的教学中,特别是高校的基础课程教学上,普遍存在着师资力量不足、生师比过高。譬如在一些学校的高等数学、大学英语等基础课教学中,师生比平均高达1:200人,授课的班级规模越来越大,使得教师在教学过程中很难对每一个学生的学习情况做到很了解。同时对于在对学生的课下辅导答疑等方面也显得力不从心,这必然影响教学的质量。(3)每个学生的基础不同。由于每个学生来自不同的地区,各个地方的教育水平也有所不同,这就导致班级中的学生基础水平参差不齐。如何平衡这些差异、体现素质教育、对不同基础的学生进行分类,进而因材施教是一个急需解决的问题。(4)大数据观念不强及对教学大数据的分析处理能力较弱。大数据作为一种新兴技术,将高校中的教育教学问题和其结合是一个长期、系统的工程,需要高校在教学管理中逐渐树立运用大数据的观念。高校的教学管理者及教师,都应该做到用数据管理、用数据决策,用数据进行评价,将大数据融入到日常的教学实践中,使得教学方式、管理策略更加客观化。
在教学实施过程中往往积累了大量的数据,但目前对于这些数据的处理还局限于表面层次的对数据进行备份、查询以及简单统计,使得这些宝贵数据不能发挥它应有的作用。如何开发这些“宝藏数据”,从中获得有价值的知识是一个重要问题。这里我们考虑采用数据挖掘中的分类技术,可以将大量的数据转化为分类规则,从而可以更好地分析和利用这些数据,得出有用的信息。
对教育信息进行分类,构建一个统一的资源检索平台,改善当前教育信息资源分布无规律、组织结构较为松散的状况,为用户检索与使用教育信息资源提供了便利。另一方面,通过对相关数据的进行分类分析,能够形成对于当前教育软硬件资源分布状况的统计描述,为教学管理人员、科研工作者等提供参考,有利于更好的依据宏观统计把握与调配教育资源。因此,分类分析的思想在处理高校教育教学信息和数据方面发挥了重要作用,在教育领域展现出了极大的社会价值。
1.分类技术的基本思想
数据挖掘是从模糊的、不完全的、随机的大量实际数据中来提取出那些隐含的、有潜在价值的、原先未知的有效信息。数据挖掘的主要任务有关联分析、聚类分析、分类、预测、时序模式等。其中分类是数据挖掘领域中的重要技术和研究热点。对于分类问题我们都不陌生,日常生活中我们每天都在进行着分类过程。例如,当你看到一个人,你的脑子下意识判断他是学生还是上班族;你可能经常会走在路上对身边的朋友说“这个人一看就是白领”之类的话,其实这就是一种分类操作。简单说分类的过程就是对事物做出区别的过程,现在有一名学生叫张三,你想确定他是好学生还是差学生,这个确定的过程就是分类。
分类就是找到一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类是利用训练数据集通过一定的算法而求得分类规则。分类可被用于規则描述和预测。其本意是对我们的数据进行分类,把它们分到已知的某一个类别。举个例子,就像一个果篮中有很多的梨子和葡萄,机器会通过我们训练出来的模型对果篮中的水果进行分类。比如:绿色=梨子,紫色=葡萄。若要让机器知道这种规则,我们就需要一定量的带标签的“绿/紫”标签的数据,然后让模型学习。所以分类往往需要“带标签”数据。目标数据有哪些特征以及这些特征对应什么标签都必须是已知的。
“别和其他坏学生在一起,否则你也会和他们一样”这句话通常来自父母的劝诫,但它透露了不折不扣的近邻思想。在分类技术中,K近邻是最简单易于理解的算法。它的主要思想是通过待遇测样本最近的K个样本类别来判断当前样本的类别。家长希望孩子成为优秀的三好学生,因此可以不惜花重金买学区房、上私立学校或者参加各种补习班,原因之一是这些优秀的学校里有更多优秀的学生。与其他优秀的学生走的更近,从分类技术中的K近邻算法的角度看,就是让目标样本与其他正样本距离更近,与其他负样本距离更远,从而使得其近邻中正样本的比例更高,更大概率被判断为正样本。
“根据以往抓获网瘾少年的情况看,十个坏学生中有九个爱上网玩游戏”说这句话的教导主任就是根据分类技术中的朴素贝叶斯算法来区分好、坏学生。“十个坏学生有九个爱上网玩游戏”即“坏学生”上网玩游戏的概率P(上网玩游戏|坏学生)=0.9。假设根据教导主任处历史记录来看,坏学生占学生总数P(坏学生)=0.1,上网玩游戏发生的概率是P(上网打游戏)=0.09,那么此时若发生上网玩游戏事件,就可以利用分类技术中朴素贝叶斯算法判断出当事学生是“坏学生”概率P(坏学生|上网玩游戏)=P(上网玩游戏|坏学生)*P(坏学生)/P(上网打游戏)=1.0。由此判断该当事学生百分之百是“坏学生”。
“先看抽不抽烟,再看烫不烫头,最后看讲不讲脏话”,这是社区大妈判断一个学生是“好坏”学生的三项关键特征,那么这样一个有先后次序的判断逻辑就构成了一个决策树模型。在分类技术的决策树分类算法中,最能区别类别的特征作为最先判断的条件,然后依次向下判断各个次优特征。决策树的核心就是在于如何选取每个节点的最优判断条件,即特征选择的过程。
分类技术应用的范围也十分的广泛。如在垃圾邮件的判别中,根据邮件正文中的单词是否经常出现在垃圾邮件中,进行判断。例如,如果一份邮件正文中出现“报销”、“发票”、“促销”等词汇时,该邮件被判定为垃圾邮件的可能性比较大;如在商品图片分类中,淘宝上含有数以千计的商品图片,“拍照购”、“拍同款”等应用必须对用户提供的商品图片进行分类。同时,提取商品图片中的图像特征,可以进行按需推送,提高广告的效果。
2.分类技术在高等教育中的应用案例
(1)分类技术在高校学生成绩分析中的应用
高等教育的重点是提升教学质量,为社会培养具有高素质综合能力强的复合型人才。而学生的成绩作为衡量教学质量的一个重要依据,也是评价学生对知识掌握程度,学习态度的一个重要标志。因此对学生成绩进行预测分析,可以为教学管理者深化教学改革,合理安排教学计划,提高教学质量提供重要依据。随着学生成绩数据量的急剧增长,教师很难再像从前一样直接根据学生成绩的分布寻找规律,并根据此规律来进行决策。教师对学生成绩的传统分析处理一般仅仅是统计成绩处于优、良、一般、差级别的人数,而对学生取得这些成绩分布的原因无法了解。如果教师能充分了解引起学生取得这些成绩的原因,必然能更好地“对症下药”提高教学质量。对于在教学过程中产生的海量数据,过去往往仅采用初级的数据备份、查询及简单的统计阶段,使得这些数据没有得到充分利用。现在可以采用数据挖掘分类技术将大量的数据转化为分类规则,从而更好地分析这些数据,得出有用的信息。
(2)分类技术在高校教学质量评价中的应用
教学质量评价是高校教学质量管理中备受关注的一个重要环节,一个科学合理的教学质量评价是保证优质教学的前提。在大数据时代,传统的教学质量评价体系以及跟不上教育改革的发展步伐,在大数据提供的新技术新思路下,我们尝试构建基于大数据挖掘技术的新型教学质量评价体系,紧跟时代步伐积极推进教学改革。传统的教学质量评价往往是按照以下步骤展开:首先教学主管部门按照本校的规章制度和实际情况制定一套评价指标和权重,然后通过网络对评价表进行逐项打分,最后,教务处根据所得分数进行划分教学质量考核等级,并以此作为重要参考对教师进行评奖评优和年终考核。一般情况下,评价主体包括学生评价、同行之间互评、教学专家评价等,各个评价部分按重要程度占不同的权重。网络评分后,我们要合理的利用数据挖掘分类技术对这些大量的评教数据进行分析处理,寻找隐藏在其背后的有价值的信息,从而更好地反馈到教师的教学和管理当中。
(3)分类技术在大学生教学资源特点分析上的应用
高校的教学资源包括高等数学、大学英语、大学语文、大学物理、毛泽东思想概论、思想道德修养、体育等多个学科分类,是一个多分类问题。此外,高校的教学资源看似独立,实质上内部之间相互联系紧密。比如大学英语中出现的历史文化内容,多为大学语文课教授内容。而思想道德修养、毛泽东思想概论同属于政治科目,在内容上也存在着大量的交叉内容。所以我们说高等教育的教学资源具有多个类别标签,根据此特点,我们利用分类技术,分析资源特点,进行类别的划分。
(4)分类技术在高校教学管理中的应用
随着我国目前高等教育的普及,高等学校的数量和规模也不断增大,高校也面临着越来越大的管理压力。为了适应高等教育的多元化和大众化,培养高素质应用型人才,很多高校在培养方案上也进行了大幅度的改革。大部分的高校采取“大专业、宽口径、多方向”的培养模式。即在大学的前两年,学习例如大学英语、大学数学等基础必修课程,而后两年,学生们可以根据自己的兴趣、未来从业方向选一个方向进行深入学习。专业方向的选择一定程度上决定了未来的职业规划和人生发展,所以合理地选择适合自己的专业方向是一件很重要的事。高校教學管理者可以利用数据挖掘中的贝叶斯分类技术,结合学生对专业选择的实际要求,根据学生的实际学习情况和兴趣爱好等方面进行科学合理的分类预测,给大学生选择专业方向以及预测专业方向人数提供指导,更有利于大学生的职业生涯规划。
(5)分类技术在高校教学管理中的应用
在高等学校中,贫困生工作也是学生管理中的一个重要部分。各大高校已经建立了自己的贫困大学生库,面对大量复杂的贫困大学生信息,管理者的工作也越来越艰巨,对于贫困生的状态和发展也越来越难以预测。现在面对海量数据,不应该仅仅停留在简单的查询和备份,而是需要通过对这些数据进行挖掘获得对贫困生准确、有效的综合评价,从而为更公平合理的奖助学金评定工作提供科学依据。可以利用数据挖掘中的决策树分类算法得出影响评定贫困生等级的各种因素,为高校贫困生综合评价提供科学的决策支持,从而使高校学生管理部门能够更科学的了解学生。
3.总结
随着云计算和移动互联网的迅速发展,各类数据均呈现爆炸式的增长,大数据在教育领域也产生了深远的影响。学习行为、思维方式、教育管理、教学评估等无不受到大数据的影响。本文主要讨论了大数据背景下传统的教育教学模式下存在的一些不足,如何利用大数据技术挖掘隐藏在教学管理过程中产生的数据背后的有用价值信息,从而更好地改善教学质量;最后本文简单介绍了数据挖掘分类技术在高校教学管理中应用的几个具体案例。总之,高校的教师及管理者应该增强自身的大数据意识,将传统的教学管理模式和大数据挖掘进行结合,提高教学数据资源的使用效率,更好地应对未来的挑战。
(基金来源:1.北方民族大学研究生创新资助项目;2.项目名称:基于三支决策的原型聚类算法研究;3.项目编号:YCX21171。)