吴梨梨
云教学平台下专业倾向性聚类分析
吴梨梨
云教学平台是高等教育发展的重要辅助.在云教学平台上产生了大量的学生数据,采集并分析这些数据可以预测学生的专业倾向,帮助学生正确理解自己的专业能力和倾向.该文将影响学生专业倾向的因素分解为学科能力、兴趣度、个性深入程度等,依此构建了评估学生专业倾向的模型.在实际的应用中,结合K均值聚类方法,对学生专业倾向做出预测评估.
云教学;专业倾向评估;K均值聚类
在高职院校的大部分教学过程中,都强调师生的互动,许多教学研究与改革的思路都围绕着激励学生主动求学或发现学生在学习过程中的强项、弱项而进行的.可见,学生的潜力、主动性在教学过程中是一项至关重要的研究内容.
影响大学生学习积极性和学习效果的一个重要原因是自身的专业倾向性,即自身的能力倾向性.但是,大学生在高考时完成的专业选择是一个较为盲目的举动,彼时考生及其家长对选专业一知半解,对自身的兴趣度、对专业或技能的适应程度、学习潜力都缺乏科学的、有效的认识.很长时间以来,大学生在大学就读阶段,虽然逐渐对所学专业加深了认识,但是对自身的专业倾向、技能与兴趣倾向的认识却相对滞后,没有形成系统的科学认识.这导致了学生怠学、教师的事倍功半等不良后果.
云计算自2007年发展至今,已经广泛用在多个不同的应用领域.云计算的内容之一就是云服务平台的构建,包括采用虚拟资源池动态地为不同租户的使用需求而服务,实现资源利用最大化.云平台能实现更好的商业计算模式,按需满足用户对存储空间、计算能力和信息服务的需求[1].
传统的教学平台能采集的教学信息有限,而且难以整理使用,近年来日益兴起的信息化教学平台,尤其是云教学平台,能够更方便地采集更多的教学信息,并存储使用.笔者以福建省某高职院校云教学平台为例,采集并分析平台产生的教学数据,用以分析新生的专业倾向,达到更早发现新生专业倾向苗头,合理引导学生理解专业特征与自身专业倾向的效果.
本文的数据来源所在的高职院校,自2014年起租用阿里云构建校园慕课平台,并在使用中拓展了在线考试、实训模拟、教学互动、资源共享、教学互评、帮扶求助等多项功能实践.
慕课形式更加强调学生的独立选择与自主学习能力.因此,通过慕课平台所采集的学生学习数据能够更鲜明地体现学生自己的选择,而不是社会或环境诱导的选项.这对本文所研究的学生专业倾向分析有极大的帮助.
数据挖掘是综合性的学科,它跨越了人工智能数据库技术、模式识别、机器学习、统计学和数据可视化等多个理论和技术[2].数据挖掘并非传统意义上的统计学理论.统计学理论仅仅是一种小样本问题的数据挖掘理论框架[3].数据挖掘并不限于归纳已知的目标或结论,描述和预测才是数据挖掘的两个高层目标[4].聚类分析是数据挖掘中常见的一种分类方法.用于在冗杂的数据信息中将属性值接近的数据信息归于一类,通过不断递归分枝,最终形成内聚性、独立性较好的几个大类.为了能实现“大类”数据之间具有较明显清晰的“距离”,需要对研究样本进行特征提取,并量化这些特征.这些能够描绘样本特征的数据就是特征数据.在本文所述专业倾向特征中,其描述是通过主体学生的行为特征、属性的测量得到的.需要注意的是,数据挖掘虽然可以得到人们预先不知道的知识,但是并不是全能的.聚类分析只能提供一个可能的结果,甚至也许不是完美或实用的,很可能不是一个最优解.这需要研究者结合实际工作进行后续判断与应用.
常见的聚类算法很多,本文所用为K均值聚类算法.K均值聚类算法预设若干个初始聚类中心,再通过递归算法调整聚类中心,最终实现合理的大类距离.[5-6]K均值算法的结果受初始聚类K值的影响,因此,选择合适的聚类中心比较重要.K均值算法分为四步.
①聚类中心初始化.选择K个样本点作为初始化的聚类中心.记为
②聚类.递归将样本集中的每一个样本数据按照最大近似度原则分配给K个聚类中心,形成K大类.在第m次循环时,若有则有为第m次循环时,第j个聚类中心zj所代表的子集合.
在进行专业倾向聚类分析之前,首先对学生的专业倾向表示进行建模.专业倾向与个体的能力、爱好与持久的深入程度都密切相关.因此,学生i的在j专业上的专业倾向Dij分为学科能力Pij、兴趣度Iij、个性深入程度等.在构建专业倾向模型之前,需要确定影响学生专业倾向判断的这几个指标.而在指标确定之后,每个指标的重要程度则由权重值来判断.权重在评价过程中表示被评价对象的不同属性重要程度的定量分配.对学生专业倾向分析类似于人类行为分析,在不同的研究目的中,虽然出现了同一属性的研究,但是这“同一属性”对用户行为的影响程度是不同的,不同的属性在用户行为中权重值是不同的.对属性的权重值判定非常重要,它直接影响了学生专业倾向的评估结果,学生i在云教学平台上各项行为的各属性权重向量可以表示成:
在云教学平台中,学生i在j专业上的专业学科能力属性Pij可以表示成:学生平均解决问题次数Pij1,学生对应学号的平均出错率Pij2,学生平均帮扶解决他人难题次数Pij3,学生平均登陆模拟实训签到率Pij4,对应的权重可以表示为:μp=(μp1,μp2,μp3, …,μpm)(k=1,2,…,q).则 学生i在j专业上的专业学科能力属性Pij表示为:
同理,学生i的在j专业方向上的专业兴趣度属性Iij可以表示成:学生关注时长Iij1,关注话题频率Iij2,新话题参与反应速度Iij3,参与相近话题深度Iij4.学生i的在j专业方向上的专业兴趣度属性Iij表示为:
学生i的在j专业方向上的个性深入程度属性Sij可以由同一个学习群组学生m对学生i的权威认可程度来体现.学生i是否在j专业上具有持久的权威,是随着时间的推移而改变的.设si表示在事件f上给学生i增加的专业权威值,si=cibi,ci为历史权威值,bi为群组 i对事件 f的预期权威值.在bi的权威值成长中,存在这几种类型:①学生i权威值很高,且群组m也认可其权威值,概率为p.②学生i权威值不高,同时群组m也不认可其权威值,概率为q.③学生i权威值很高,但群组m不认可其权威值,概率为1-p.④学生i权威值不高,但是群组m认可其权威值,概率也存在,为1-q.随着时间推移,学生i的j方向专业程度会越来越被群组m所了解,这使群组m对学生i的权威认可增长速度渐渐地逼近1.这里设a为时间衰减函数,a=e-λs,λ>0,λ∈R,R为实数集合.权威值的反馈对应如表1权威值反馈所示.
表1 权威值反馈
因此,群组m对于学生i在j专业倾向上关于第f个事件的权威认可度记为:
其中,
综上,学生i的专业倾向表示为:
为验证本文所提出的针对云教学平台上学生慕课学习中所表现出的专业倾向建模对实际教学结果的辅助效果,本文使用Matlab7.0工具软件构建实验平台,进行学生专业倾向测试与分析.实验在win7-64位操作系统下进行,硬件配置为Intel酷睿i7 7500U的CPU配置,8G的DDR4内存.学生的专业倾向以最终选择的毕业去向为依据.在实验中,学生i的初始专业倾向取值在[0,1]之间,新生取值为0.5.在实验中,采用已经毕业的一届学生的毕业去向(TRUE)为参照,检测本文所提出的专业倾向建模(TEST_MODEL)是否可以正确地逼近真实值.
图1 验证专业倾向建模是否逼近真实值
图1上横坐标为学生i的专业倾向评估次数,纵坐标为其在j专业倾向上的倾向值.从图上我们可以看出在模型中评估刚开始时,K均值聚类没有很好地做好聚类工作,此时评估样本数不足,对聚类形成没有起到很好的帮助.随着学生行为样本采集与评估次数的增加,学生i的专业倾向分析上升到一个较快逼近真实值的过程,这个过程中有一定的抖动,这是由于噪声和孤立点存在而产生的额外影响.随后逐渐趋向于平稳,部分逼近实际值.可见模型在数据样本较大的情况下,确实能够起到评估学生专业倾向的作用,并具有较好的稳定性.
本文基于某高职院校的云教学平台上慕课教学、互动所采集的学生数据样本,通过建立学生专业倾向表示模型,使用K均值聚类的方式对学生行为进行专业倾向分类,借此分析学生的专业倾向.专业倾向的分析结果与往届学生的专业倾向相比对,能预测新生的专业倾向,能在新生入学教育的最初帮助学生正确理解自己的专业能力与倾向.在实际应用中具有积极的教学意义.在建立学生专业倾向表示模型的时候,提出以学科能力Pij、兴趣度Iij、个性深入程度Sfij等为主要属性组成,综合考虑了学科、学生本体、环境影响等对学生专业倾向的影响因素.所提出的专业倾向表示模型,结合K均值聚类方法,在实际应用中有较好的实效,可以比较准确地判断新生的专业倾向.所不足的是,在数据样本量较小的情况下,聚类存在较大的抖动.也就是说,要在新生入学一段时间后,才适合进行专业倾向评估.在实际应用中,这个时间基本上是一个学期.这个时间说长不长,但高职教育的学制较短,从学校教育的角度来说,是希望能更进一步缩短专业倾向评估的周期的.这一方面说明了本文所述方法的有效性,另一方面也对本文所述方法的缺陷做出了改进提示.
Analysis of Professional Orientation Clustering under Cloud Teaching Platform
WU Li-li
(Department of computer science,Anglo-Chinese College,Fuzhou,Fujian 350018,China)
The cloud teaching platform is an important aid to the development of higher education.In the cloud teaching platform,a large amount of student data has been generated.At the same time,many college students do not understand their professional tendencies and wasted their time in reading.In this paper,the factors that influence students’professional tendency are decomposed into discipline ability,interest degree and personality depth,and a model of evaluating students’professional tendency is constructed.In the practical application,the K mean clustering method is used to predict the students’professional tendency.
cloud teaching;professional orientation assessment;K means clustering
TP391
A
1008-7974(2018)01-0074-04
10.13877/j.cnki.cn22-1284.2018.02.019
2017-08-31
福建省教育厅项目“云计算平台下的数据挖掘技术在高职学生专业倾向性分析中的应用”(JA15872);福建省教育厅项目“基于大数据的互联网教育模式在高校学生自主学习的研究与应用”(JA15873).
吴梨梨,女,福建福州人,福州英华职业学院计算机系讲师(福建 福州 350018).
[1]刘鹏.云计算[M].北京:电子工业出版社,2011.
[2]王继娜.浅谈数据挖掘与知识发现[J].内蒙古科技与经济,2013(11):104-105.
[3]Zhu F,Shi W B,Wei J F.Optimization of SVM parameters based on artificialimmune algorithm[J].International Journal of Digital Control Technology and itsApplications,2012,6(22):392-399.
[4]钟晓,马少平,张钹,等.数据挖掘综述[J].统计与信息论坛,2007,22(5):105-112.
[5]王亚雄,康峰,李文彬,等.面向立木识别的有效K-均值聚类算法研究[J].农业机械学报,2017,48(3):230-237.
[6]程艳云,周鹏.动态分配聚类中心的改进K均值聚类算法[J].计算机技术与发展,2017,27(2):33-36,41.
王前)