基于Apriori算法的高校教学评价数据挖掘

2010-09-21 08:21李红林孔德剑
中国科技信息 2010年21期
关键词:数据挖掘关联规则

李红林 孔德剑

曲靖师范学院计算机科学与工程学院 655011

基于Apriori算法的高校教学评价数据挖掘

李红林 孔德剑

曲靖师范学院计算机科学与工程学院 655011

高校在教学和管理中积累了大量的数据,本文把数据挖掘技术中的关联规则挖掘算法Apriori应用于教学评价中,通过对这些数据分析,找到高校教师的教学效果与教师的年龄、职称、学历等相关。

关联规则;Apriori;挖掘;教学;评价

教学评价是教学过程的重要组成部分,它以教学目标为依据,制定科学的评价标准,运用一切有效的技术手段,对教与学活动的过程及其结果进行测量,并给以价值判断[1]。教学质量是高校生存与发展的基础,也是高等教育国际化的必然要求。高校在日常的教学和管理中积累了大量的数据,但是这些数据未得到充分利用,大部分学校只是通过统计或排序等方式获得数据的表面信息,对这些信息只是进行简单的数值计算和定性总结,然后将这些表面信息通报给教师,作为晋升职称、评优、绩效工资等的依据。未对这些数据中隐含的内在信息进行深层次的挖掘和思考。如何将这些数据转换成可以进一步利用的信息,为学校管理者提供决策支持,是高校教育中急需解决的一个问题。

数据挖掘(DM,Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用信息和知识的过程[2]。在长期的教学和管理中,随着积累的数据越来越多,人们对从这些数据中挖掘相应的关联知识越来越有兴趣。挖掘关联规则(知识)就是从给定的数据集中搜索数据项之间所存在的有价值联系[3]。

1.关联规则挖掘

关联规则挖掘就是从大量的数据中挖掘出有价值描述数据项之间相互联系的有关知识。Agrawal等人在1993年首先提出从交易数据库发现项目间关联规则的相关问题,并给出了基本频繁集的Apriori算法[4][5]。关联规则反映一个事物与其它事物之间的相互依存性和关联性,如果两个事物或者多个事物之间存在一定的关联关系,那么,其中一个事物就能通过其他事物预测到。关联规则挖掘能发现大量数据集中项之间的有趣联系。

1.1 关联规则的基本概念

关联规则:设D是事务集,I={I1, I2,…,Im}是D中全体项组成的集合,其中Ik(k=1,2,…,m)称为项,包含k个项的项集称为k-项集。一个事务T是一个项集,它是I的一个子集,每个事务都与一个唯一标识符Tid相联系。不同的事务一起组成了事务集D,它构成了关联规则发现的事务数据库。若X,Y为项目集,且X∩Y≠φ,则蕴涵式称为关联规则,X称为关联规则的前件或前提,Y称为关联规则的后件或结论。

1.2 Apriori算法

Apriori是通过对数据库D的多次扫描来发现所有的频繁项目集,在每一次扫描中只考虑具有同一长度的所有项目集。在第一次扫描时,Apriori算法计算D中所有单个项目的支持度,生成所有长度为1的频繁项目集,在后续的每一次扫描中,首先以k-1次扫描所生成的所有频繁项目集为基础产生新的候选项目集。然后扫描数据库D,计算这些候选项目的支持度,删除其支持度低于用户给定的最小支持度的项目集。最后,生成所有长度为k的频繁项目集,重复上述过程直到再也发现不了新的频繁项目集为止。此算法高效的关键在于生成较小的候选项目集,也就是尽可能不产生和计算那些不可能成为频繁项目集的候选项目集。为了实现这一点,此算法利用了这样一个基本性质,即:一个频繁项目集的任何一子集必定是频繁项目集,一个非频繁项目集的任一超集必定也是非频繁项目集。Apriori算法如下:

输入:交易数据库D,最小支持阈值min_sup。输出:Li,D中的频繁项集。处理流程:

2.Apriori算法在教学评价中的实现

2.1 数据采集

本文从学校专任教师中任意抽取300名,其中副高以上职称的教师100人,中级职称的120人,初级职称的80人。同时收集到2008-2009第一学期、第二学期学生对这300名教师的教学质量评价数据。教师教学质量评价结果主要从学生给教师的打分来区别。学生从以下四方面给教师打分:教师的教学态度、教学内容、教学方法、教学效果。

2.2 数据库建立

对收集到的数据进行选择,建立相应的数据库。建立数据库是为关联规则挖掘提供挖掘所需要的数据, 教师的数据存放在数据库中。本文收集到与教学质量相关性最大教学质量评价数据以及与教师本人的某些基本情况相关的数据, 如教师的学历、职称等,并将这两类数据放入数据库中。

3.挖掘实验结果及分析

利用关联规则挖掘算法——Apriori,对数据库中的数据进行挖掘,得到相应的关联规则。

(1) 年龄在30至40岁之间的中青年教师具有较高职和丰富的课堂教学经验,且精力充沛,评定分数较高,且有高的支持度、置信度。由此可见,学校重视师资队伍建设, 提高了中青年教师的各种教育教学实际能力,中青年教师已经成为学校教学工作的骨干,教师队伍结构趋于合理。

(2) 年龄50至60岁以上年龄层的骨干教师置信度较高,这部分教师讲课较受欢迎。但是这些教师现在即将退休或已经退休, 他们留下的空缺必须马上填补, 因此, 需重视对30岁以下青年教师的培养。

(3) 30岁以下的年轻教师,由于刚走上讲台不久,教学方法和教学经验有待进一步提高。由于大学教学内容专业化程度高, 科学性强, 信息量大, 具有一定的宽度和深度, 且大学课堂教学具有较强的学术性。这就要求年轻教师要加强专业知识的学习,不断提高自己的业务水平。

通过学生从教学态度、教学内容、教学方法、教学效果四个方面对教师打分,评价结果显示,具有副高及以上、中级职称、初级职称的教师平均分分别为:97.8、96.6、93.6。

总之,教授、副教授及硕士学历教师科研水平较高,知识面较宽,教学能力强, 在课堂教学中经常向学生介绍学科发展的动态,鼓励学生刻苦钻研, 指导学生进行科学研究, 把教学与科研有机地结合起来, 促进学生科研能力的增长, 深受学生欢迎。初级职称教师还需加强实践、学习, 努力提高自己的教学、科研水平。因此,对于教学管理人员,在班级排课时, 应注意在同一层次的教学班中配备的教师的教龄、职称、学历等的合理分配,使学生能保持良好的学习状态,从而为教学部门提供决策支持信息,促使更好地开展教学工作, 提高教学质量。同时,高校也应采取有关措施去提高教师的学历层次,改善教师的职称结构,做好教学对象分析和教学策略设计,从整体上提高高校教师的教学科研水平,培养出高素质的人才。

4.结论

目前,人们逐步陷入“数据丰富,知识贫乏”的尴尬境地。人们真正体会到数据海洋,无边无际。面对如此巨大的数据资源,如何从中获得有用的信息,数据挖掘技术越来越受到人们的关注。本文把数据挖掘中的关联规则挖掘技术应用于高校的教学评价中,从学生对教师的教学评价的数据中,得出教师的教学评价结果与教师的年龄、学历、职称等因素具有内在联系。

[1]宋中山,吴立锋.关联规则挖掘在教学评价中的应用[J].中南民族大学学报(自然科学版).2006,25(1):72-74.

[2]邵峰晶,于忠清.数据挖掘原理与算法[M].北京:中国水利水电出版社.2003.

[3]朱明.数据挖掘[M].安徽:中国科学技术大学出版社.2002.

[4]Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases.In:buncman P,Jajodia S,eds.Proc.of the ACM SIGMOD Conf.on Management of Data(SigMod’93).New York:ACM Press,1993: 207-216.

[5]Agrawal R,Srikant R.Fast algorithms for mining association rules.In:Bocca JB,Jarke M, Zaniolo C,eds.Proc.of the 20the Int’l Conf.on Very Large Data Bases.Santigo:Morgan Kaufman Publishers,1994:478-499.

Data Mining Based on the Algorithm of Apriori in Teaching Evaluation of University

Li Honglin Kong Dejian
School of Compute Science and Engineering, Qujing Normal University, Qujing Yunnan 655011,China

10.3969/j.issn.1001-8972.2010.21.118

曲靖师范学院专项基金项目(2008ZX003)

李红林(1980-),女,云南人,硕士,讲师,主要从事计算机图像处理、模式识别方面的研究。

AbstractThe massive data is accumulated in the teaching and the management of the universities.In this paper, the Apriori algorithm of association rules which is applied to teaching evaluation.Through to analyze these data, found teacher’s teaching effect in the university relates to teacher’s age, title and education background and so on.

Key wordsAssociation Rules; Apriori; Mining; Teaching; Evaluation

猜你喜欢
数据挖掘关联规则
撑竿跳规则的制定
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
数独的规则和演变
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
“一带一路”递进,关联民生更紧
奇趣搭配
让规则不规则
智趣
TPP反腐败规则对我国的启示