聚类分析在教学评价中的应用

2010-07-09 13:31
关键词:聚类对象教学质量

董 萍

(三门峡职业技术学院信息工程系,三门峡472000)

0 引 言

教学评价是学生对任课教师教学效果的评价,是评价教师教学效果的主要方式,其目的不仅对教学起着调节、控制、指导和激励作用,而且有很强的导向性,是学校教学管理重要的组成部分,是评价教学工作成绩的主要手段,越来越受到人们的关注[1].同时对教师的教学评价结果也作为学院教师晋升职称、评优、年终考核等的重要依据,并以此督促各位老师要不断提高自己的教学质量.将学生对教师教学质量评价的原始数据进行统计和分析,可以及时发现、解决教学中存在的问题,以改进教学工作.

学院每学期都要组织学生对授课教师进行教学评价,积累了大量的数据.利用聚类分析算法挖掘每学期的评价结果,对教师进行量化考核,真实反映教师的教学水平,完善教师考核工作,从而建议学校注意在改进教师教学方法和提高教学效果方面引起重视.学院通过学生对教师的评价结果可以有计划地分析课堂教学效果与教师整体素质的关系,合理调配一个班的授课教师,使学生能够较好地保持良好的学习状态,从而为教学部门提供一定的决策支持信息,促使其能更好地开展教学工作,提高教学质量.

1 算法的选取

K-means算法是一种简单实用的无监督学习算法,能用于对已知类数的数据聚类和分类.Mas-Queenueen运用随机过程方法给出了K-means算法,该算法简单、快速而且在处理大数据集时是相对可伸缩、高效率的,是一种理论上可靠、应用上高效的聚类方法,它在数据挖掘领域得到了广泛的应用.

该算法的基本思想为:把学院N位教师样本对象划分成k个类,其中,聚类数目k是输入参数,通过不断地迭代来进行聚类,当算法收敛到一个结束条件时,就终止迭代过程,输出一个聚类结果.从而使类内具有较高的相似度,而类间的相似度较低,相似度的计算根据类中对象的平均值来进行[2].

2 算法的实现过程

2.1 算法的基本框架

(1)给定大小为n的数据集,令I=1,选取 k个初始聚类中心,j=1,2,3,…,k;

(2)计算每个数据对象与聚类中心的距离.D(xi,Zj(I)),其中 i=1,2,3,…,n,j=1,2,3,… ,k.如果满

(4)判断:若Zj(I+1)≠Zj(I),j=1,2,3,…,k,则I=I+1,返回第二个步骤,否则,算法结束.

2.2 算法的工作过程

首先,从N个数据对象中任意选择k个对象作为初始聚类中心,其他对象则根据它们与这些聚类中心的相似度(距离)分别分配至最相似的聚类;然后,计算每个所获新聚类的聚类中心,并不断重复这一过程,直到标准测度函数开始收敛为止,一般采用均方差作为标准测度函数.其次更新簇中心.即根据簇中的当前对象,重新计算每个簇的均值,使用这些新的簇中心,将对象重新分布到簇中心最近的簇中.这种迭代地把对象重新分配到各个簇以改进划分结果的过程称为迭代重定位.最终,簇中对象的重新分布不再发生,处理过程结束,聚类过程返回结果簇[3].该算法尝试找出使准则函数值最小的k个划分,当结果簇是密集、簇与簇之间区别明显时,效果较好.对处理大数据集,该算法是相对可伸缩的和高效率的.该算法的基本流程图如图1所示.

图1 K-means算法基本流程图

划分数据对象主要依据是计算数据对象与类中心的欧氏距离,选择距离最近的类,进行划分[4].主要实现代码如下:

private void distributeSamples(){//划分数据对象

int i,pat,clustid,memberIndex;

for(i=0;i<numClusters;i++){//初始化当前聚类个数

cluster[i].numMembers=0;}

for(pat=0;pat<numPatterns;pat++){

clustid=find ClosestCluster(pat);//寻找距离最近的聚类中心

memberIndex=cluster[clustid].numMembers;

cluster[clustid].member[memberIndex]=pat;

cluster[clustid].numMembers++;}}

private int find ClosestCluster(int pat){//寻找距离最近的聚类中心

int i,clustId;double d;clustId=-1;

for(i=0;i<numClusters;i++){

d=eucNorm(pat,i);//计算欧几里德距离

if(d<minDist){

minDist=d;clustId=i;}}

if(clustId<0){System.out.println(“Aaargh”);}

return clustId;}

更新簇中心是通过calcNew ClustCenters方法计算产生的聚类结果,计算出类中心.并比较与上次迭代是否发生变化,若发生变化,则继续迭代,否则迭代结束.主要实现代码如下:

private int calcNewClustCenters(){//重新计算聚类中心

int convFlag,vectId,i,j,k;

double[]tmp=new double[MAXVECTDIM];

conv Flag=TRUE;

for(i=0;i<numClusters;i++){

for(j=0;j<sizeVector;j++){tmp[j]=0.0;}

for(j=0;j<cluster[i].numMembers;j++){

vectId=cluster[i].member[j];

for(k=2;k<sizeVector;k++){

tmp[k]+=Integer.parseInt(pattern[vectId][k]);}}

for(k=2;k<sizeVector;k++){

tmp[k]=tmp[k]/cluster[i].numMembers;

if(tmp[k]!=cluster[i].center[k])

conv Flag=FALSE;

cluster[i].center[k]=tmp[k];}}

return convFlag;}

2.3 算法的实例分析

学院学生对教师教学质量评价共有4项指标(xij代表第i个样本的第j项指标):xi1为教学内容;xi2为教学方法;xi3为教学态度;xi4为教学评价.

为了降低偶然性,以班为单位,每个学生对每个任课教师的各项指标打分,每项指标满分为10分,以各项指标的综合平均分进行统分.表1为某系14名教师教学情况的评价指标和分数表.

表1 某系教师教学情况的评价指标和分数表

以14位教师的情况为样本进行系统聚类分析,其中编号l到14代表了聚类的先后顺序.根据聚类算法分析,参照各样本的指标数据,我们将14位教师分为优秀、良好、中等、差四类最为适合.其中:1号、5号 、6号、10 号、11号、13号和 14号为优秀;2号、4号、7号、8号、9号都为良好;3号为中等;12号为不称职.可以看出,每位教师在类中的位置,与实际情况较为符合.实例检验,聚类分析法对教学质量的评估是十分有效的.

3 算法的结果及分析

利用K-means算法对教务管理系统中2008年两学期三门峡职业技术学院教师的教学评价结果进行聚类分析,分为四类,第一类为差,所占比例为5%;第二类为优,所占比例为45%;第三类为良,所占比例为40%;第四类为中,所占比例为10%.教学评价情况聚类结果表如表2所示.

表2 教学评价情况聚类结果表

将学院教师的教学评价聚类结果以图表形式,如图2所示.

图2 学院教师的教学评价聚类结果

聚类分析法用于评价教师教学质量是合理的.从聚类分析法得出四类教师百分比看,该方法用在教师教学测评上是合理的,而且克服了以得分分类的缺点,因为得分可能出现偏低、偏高的现象.从以上的聚类结果中可以看出,将教师评价结果分为四类:

第一类是评价结果在70分左右的教师,这类教师大部分是由本科学历的助教组成,他们相对比较年轻.这类教师基本上都是刚从大学毕业从事教学工作的,他们在教学和科研能力方面相对较弱,学院要重视对于28岁以下青年教师的培养,学院教务等相关部门应经常组织教师进行说课大赛、粉笔字大赛以及教学和科研交流会,学院每学期也应拿出相关经费组织相关教师出去进修,帮助青年教师提高高业务能力和职业道德水平.

第二类是评价结果在90分以上的,这类教师大部分是由具有硕士学位的副教授、讲师组成,年龄在30~45岁之间.对于这类职称高、学历高、工龄较长的教师具有丰富的课堂教学经验,深受学生的好评,同时这类教师的科研能力较强.学院近几年重视学科建设,坚持实施人才战略,重视高学历中青年教师的引进和培养,已经初见成效.

第三类主要是评价结果在85~90分之间的,这类教师大部分是由具有双师型的讲师和具有五年教龄的助教组成,相对比较年轻.这类教师的教学能力和科研能力也较强,他们的教学内容、教学方法、授课方式容易被学生接受,深受学生喜爱.

第四类主要是评价结果在80-85分之间的,这类教师大部分是由工龄较短的讲师和具有三年教龄的助教组成,师资结构年轻、教学能力和科研能力一般.这类教师要努力提高自己的职称和学历水平,主动进修以提高自己的各方面水平,从而提高自身的教学质量.

从以上聚类分析结果中也可以分析出具有较高学历和职称的教师知识面广阔、教学经验丰富,得到学生的普遍好评.要正确对待、合理利用测评结果,多方面准确衡量教师的工作,才能调动教师工作的积极性.因此教务管理人员在进行班级排课时,要注意一个教学班中配备教师的年龄、职称、学历的合理分配,使学生能够较好地保持良好的学习状态,有针对性地加强对青年教师的培养,使青年教师在老教师的言传身教下,利用“传、帮、带”的方式,不断积累教学经验,提高教学水平,保证人才培养.从而为教学部门提供了决策支持信息,提高教师的师资水平和教学效果,促使更好地开展教学工作,提高人才培养质量,促进教育事业的发展.

4 小 结

本文详细介绍了对已经预处理好的教师评价数据使用K-means算法进行聚类分析的过程,同时对聚类结果进行分析.通过聚类分析方法在教学评价领域的应用,反映出教师的教学质量存在明显的差异,也得出不同教师在今后教学上的努力方向,同时使教务管理者及时发现教师在教学活动中存在的主要问题,以便及时改进,进而辅助领导决策做好学院管理.

[1]张红云,石 阳,马 垣.数据挖掘中聚类算法的比较研究[J].鞍山钢铁学院学报,2001,10(24):364-371.[2]王建会,申 展,胡运发.一种实用高效的聚类算法[J].软件学报,2004,15(5):697-705.

[3]马 飞.数据挖掘中的聚类算法研究[D].南京理工大学硕士学位论文,2008.

[4]胡庆林,叶念渝,朱明富.数据挖掘中聚类算法的综述[J].计算机与数字工程,2007,35(2):17-20.

猜你喜欢
聚类对象教学质量
努力改善办学条件 不断提高教学质量
涉税刑事诉讼中的举证责任——以纳税人举证责任为考察对象
关注学习过程 提升教学质量
提高教学质量,重在科学管理
基于K-means聚类的车-地无线通信场强研究
攻略对象的心思好难猜
基于高斯混合聚类的阵列干涉SAR三维成像
基于熵的快速扫描法的FNEA初始对象的生成方法
区间对象族的可镇定性分析
提高语文教学质量的几点思考