数据挖掘在高校教学评价中的应用

2016-11-28 03:20常军林
中州大学学报 2016年2期
关键词:数据挖掘关联规则

常军林,张 真

(河南交通职业技术学院 交通信息工程系,郑州 450005)



数据挖掘在高校教学评价中的应用

常军林,张 真

(河南交通职业技术学院 交通信息工程系,郑州 450005)

教学评价对于高等教育的发展和教育质量的提高,起着十分重要的作用。但在日常的教学管理中,这些数据并没有得到充分的利用,本文将数据挖掘引入教学领域,从教学评价数据中提取出隐藏在数据之中的有用信息,以便更好地为教学管理服务。

数据挖掘;关联规则;教学评价

高等学校多年来在教学管理中积累了很多有用的数据,但目前并没有得到充分的利用,只是停留在表面信息的分析阶段,并以此作为教师评优评先的重要依据。而事实上,这些数据中隐藏着重要的内在信息,因此,如何深入利用这些数据,转化为进一步可利用的信息为学校的管理者提供决策支持,已成为教学领域亟待解决的一个问题。

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。基于此,本文将数据挖掘技术引入到教学,从教学评价的数据中提取出隐藏在数据中的有用信息,如将关联规则、粗糙集应用于教学评价中,探讨影响教学质量的关键因素。

1 数据挖掘中的几种相关算法

1.1 关联规则

关联规则,是数据挖掘的一个重要课题,用于从大量数据中挖掘出有价值的数据项之间的相关关系。

关联规则定义为:假设I={I1,I2,…,Im}是项的集合。给定一个交易数据库D={t1,t2,…,tn},其中每个事务(Transaction)t是I的非空子集,即t⊆I,每一个交易都与一个唯一的标识符TID(Transaction ID)对应。关联规则是形如X⟹Y的蕴涵式,其中X,Y⊆I且X∩Y=Ø,X和Y分别称为关联规则的先导和后继。

关联规则X⟹Y在D中的支持度(Support)是D中事务包含X∪Y的百分比,即概率P(X∪Y);置信度(Confidence)是包含X的事务中同时包含Y的百分比,即条件概率P(Y|X)。如果同时满足最小支持度阈值和最小置信度阈值,则认为关联规则是有趣的。这些阈值由用户或者专家设定。

1.2 粗糙集

粗糙集理论是近年来才兴起的研究不精确、不确定性知识的表达、学习,从中发现隐含的知识,揭示潜在规律的理论。它模拟人类的抽象逻辑思维,以各种更接近人们对事务表述方式的定性或混合信息为输入,并且通过简单的决策表来简化得到输入内容和输出内容的映射关系。粗糙集理论利用已知的知识库,来考察知识表中不同属性的重要性,以此确定哪些知识是冗余的,哪些知识是有用的。粗糙集理论的运用以学校掌握大量的数据信息为前提,以对观察和计量所得数据进行分类的能力为基础,从中发现、推理知识和分辨系统的某些特点、过程等。

2 数据挖掘在教学评价中的应用

教学评价是指依据一定的教学规范标准和教学目标,通过对学院教与学等教学情况的系统检测与考核,评定其教学效果与教学目标的实现程度,并作出相应判断和改进的一种行为。教学评价包括学生评价、系部评价、教师自评等,由于学生评价是获取教学反馈信息的主要方法,所以本文对数据的分析和挖掘主要针对学生评价数据展开,再结合教师的基本信息(年龄、职称等)进行分析,充分挖掘这些数据所隐含的价值,以进一步提高教学质量。

2.1 数据准备

数据准备包括数据选择和数据预处理。

2.1.1 数据选择

数据选择的主要目的是确定发现任务的操作对象,即根据用户的需要,从原始数据库提取数据形成目标数据。我们可以从学院的教务系统中提取教师的基本信息,如工号、职称、学历、年龄、教龄等,再从系统中提取评价数据。

2.1.2 数据预处理

数据预处理包括去除噪声、缺失值的处理以及删除无效数据等。例如,学生对教师的评价出现极端值0分或者100分,这样的数据应当被当作异常数据作一些相应处理。另外,还有缺失值的情况,若是学生的学号或者班级号等内容出现了缺失,可以忽略;若是评价结果出现缺失,则需要进行相应的处理。

2.2 数据挖掘

数据挖掘就是对所有得到的经过处理数据进行挖掘。

2.2.1 内部挖掘

目前,高校的教学评价体系主要取决于学生评价,内容上主要是对“教师水平、教学内容、教学态度、教学模式”等指标的评价,通过对学生评价数据中这些指标的挖掘分析,就可确定出关键指标。这里以“教师水平”这一指标为例,建立关联函数。

假设x:某教师该项得分占评教总分的百分比

b:该项总分值占评教总分的百分比,0≤x≤b

X0=,X=<0,b>,a为成为关键因素至少应到达的百分比,于是可建立初等关联函数,即

这里由于x0=b,因此g(x,x0,X0)=a-x;

而D(x,X0,X)=g(x,X)-g(x,X0),

通过得到的关联函数值,可定量的描述“教学水平”等因素,从而判断其是否是关键因素,并可根据关联函数值的大小区分出关键程度。

此关联函数值为正,因此“教学水平”是一个关键因素,其关键程度为0.68。

通过以上的关联函数,我们从教学评价数据中挖掘出了影响该校教学评价的关键因素有哪些的重要信息,为教学质量控制指明了方向。

2.2.2 内部与外部特征之间的关联规则挖掘

运用关联规则,针对学生评价数据和教师基本信息,我们来探讨一下高校教师教学效果与教师的学历、年龄、职称等特征之间的关系。

这里,挖掘过程分为三步:

(1)数据准备。如从某校教务系统中随机抽取500份学生评教数据,将职称、年龄和评教分数调入数据库,其他信息忽略不计。因为评定分数、年龄属于数值型数据,职称是文本型数据,于是要先将它们转换成布尔型。之后进行数据的离散处理,对评定分数和年龄分组,例如将年龄分为M1[23,30], M2[31,40],M3[41,49], M4[50,60]四组;评定分数分为N1[90,100],N2[80,89],N3[60,79],N4[0,59]四组;将职称的级别分为G1初级,G2中级,G3副高,G4正高。数据准备阶段为以上三者之间的关系奠定了基础。

(2) 关联规则挖掘。若评定分数 [90,100],表示课堂效果较好,利用挖掘技术,通过关联规则的算法,挖掘出具有较好课堂效果的教师的基本信息特征。

(3) 模式评估,即从初步关联规则挖掘信息。

例如表1是某高校应用B/S结构,通过网上评教原始数据片段,表2是教师基本情况。

表1 学生评教原始数据表

其中SID是学生编号,TID是教师编号,CID是课程编号,A—I是各种评教指标,J是总评,数字代表对应的分数。

这里以表1中的B列指标为例,建立关联函数。

表2 教师基本情况表

依据于上述所讲述的关联函数的内容,不难得出该教师学生评教的总分平均为89,该指标的平均得分为10,该指标的总分为15,规定关键因素至少应达到的百分比为a=9%,则x=10/89=11%,b=15/89=17%,X0=<9%,11%>,X=<0,17%>代入关联函数,得f(x)=0.48>0,证明此指标是影响教学评价的关键因素。

然后,将关键因素与教师基本信息关联。将职称、年龄和评教分数调入数据库,并转化为布尔型。然后,搜索数据库,得到评定分数大于等于90的记录总共有5条,假设最小支持度为5%,最小可信度为18%,经过挖掘,可以得到“年龄在M2[31,40]的评定分数为N1[90,100]的可能性是36%,支持度是9%”,“职称为G2中级,评定分数为N1[90,100]的可能性是27%,支持度是10%”初步结果。

最后进行模式评估,可以挖掘出“年龄在31-49岁的中青年教师具有丰富的课堂教学经验,评定分数的支持度和可信度都较高”,从而为高校的教学部门提供决策支持信息,有助于班级排课时合理有效的配置师资资源,为好为学生服务。

3 结论

将数据挖掘用于高校教学评价,有助于发现目前高校通过传统评价所不能完全获得的有用信息。本文主要是基于学生评教信息和教师的基本信息,介绍了如何挖掘内部或者内部与外部关联性知识的方法。本文的研究只是数据挖掘应用与教学领域的初级阶段,旨在为后续的深入研究做铺垫,如何将挖掘方法计算机化进而以便实现数据的批量处理,将是我们以后的研究重点。

[1]杨永斌.数据挖掘技术在教育中的应用研究[J].计算机科学,2006(12):284-286.

[2]袁方.实用数据挖掘[M].北京: 电子工业出版社,2010.

[3]彭玉青.数据挖掘技术及其在教学中的应用[J].河北科技大学学报,2009(4):21-29.

[4]曹红旗.关于发展性教学评价的认识与实践[J].山东教育科研,2011(5):43-45.

[6]阎四清.数据挖掘——概念、模型、方法和算法[M].北京: 清华大学出版社,2009.

(责任编辑 赵冰)

The Application of Data Mining in Higher Institution Teaching Evaluation

ZHANG Zhen, CHANG Jun-lin

(Department of Traffic Information Engineering, Henan Vocational and Technical College, Zhengzhou 450005, China)

Teaching evaluation plays a very important role in the development of higher education and the improvement of educational quality.But in the daily teaching management, these data have not been fully utilized.In this paper, the data mining is introduced into teaching field, extracting useful information from the teaching evaluation data, so as to provide better service for teaching management.

data mining; association rules; teaching evaluation

2015-12-22

河南省高等教育教学改革项目(2014SJGLX434)

常军林(1973—),男,河南林州人,河南交通职业技术学院交通信息工程系副教授,研究方向为网络、数据库与软件架构。

10.13783/j.cnki.cn41-1275/g4.2016.02.021

TP311

A

1008-3715(2016)02-0105-03

猜你喜欢
数据挖掘关联规则
改进支持向量机在特征数据挖掘中的智能应用
撑竿跳规则的制定
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
数独的规则和演变
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
“一带一路”递进,关联民生更紧
奇趣搭配
让规则不规则
软件工程领域中的异常数据挖掘算法