关联规则算法在评价指标体系中的应用研究

2014-10-29 20:13杨帆季文天傅翠玉
电子技术与软件工程 2014年16期
关键词:项集关联规则

杨帆 季文天 傅翠玉

摘 要

列举了当前许多教学质量评价系统存在的一些不足,对于评价结果主要有优秀、良好、中、及格或者差等,透过这个评价结果,教学管理人员很难找到教师的教学水平高低究竞和哪些评价指标有关,探讨运用关联规则算法来解决这些存在的问题。同样的利用关联规则挖掘方法可以计算出分数较高的教师的优点在哪些方面。从而为教学管理人员提供可靠的决策依据。本文以海南软件职业技术学院学生评教的数据为依据,详细介绍了关联规则算法的应用。

【关键词】关联规则算法 评价指标

目前,我们常见的对一个教师的教学质量的评价大概有以下几种方式:教师之间互相评价;上级领导对教师的评价;学生对教师的评价等。由于高校的教师人数众多而且评价所产生的数据量比较庞大,组织领导对每一位教师进行逐一评价这样大量的工作,既不经济,也因为无法排除人际关系及不熟悉教学过程等因素的影响而使操作难于开展。教学质量评价的方法主要都是涉及教师教学的情况,评价结果主要有优秀、良好、中、及格或者差等,透过这个评价结果,教学管理人员很难找到教师的教学水平高低究竞和哪些评价指标有关。

1 关联规则及Apriori算法描述

关联规则分析就是从事务数据库,关系数据库和其他信息存储中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性。为了在数据挖掘任务中得到有用的和可靠的规则,需要通过支持度和置信度两个阈值来保证。

1.1 支持度

关联规则X?Y 在D中的支持度是D中事务包含XUY 的百分比,即概率P(XUY),它是对关联规则重要度的衡量,表示关联规则的频度。

1.2 置信度

关联规则X?Y在D中的置信度是包含X的事务中同时包含Y的百分比,即条件概率P(XY) ,它是对关联规则准确度的衡量,表示关联规则的强度。

在所有的关联规则算法中,Apriori 算法是比较著名的,这个算法可以从关联规则中挖掘出的频繁项集。Apriori算法发现关联规则的过程一共分为以下两步。

(1)通过迭代的方法,检索出事务数据库中所有支持度不能低于最小支持度项集--频繁项集。

(2)采用频繁项集构造出满足用户最小信任度的规则。其作用主要是为了挖掘或识别出所有的频繁项集。

2 评价指标的构建

在构建教学质量评价指标体系时,一方面要全面客观地分析众多影响因素,同时还要对这些因素进行筛选,哪些是需要的,哪些是要丢掉的。对于影响力差不多的因素要将它们进行重组,这样做是为了使因素的分布广度和代表性能够得到体现。综合上面的剖析,加上评估操作的具体情况,建立教学质量评价指标体系。然后利用层次分析法全面客观的论证这个评价体系,使构建的各项评估指标都是最佳的。详细指标如表1所示。教学评价指标包括U1 教师素养、U2 教学设计、U3 教学过程和教学内容、U4 教学效果和U5 教学特色等一级指标。二级指标包括U11-U53。

3 关联规则算法在评价指标体系中的应用

由于对教师的教学质量评价是多元的,学生一般是对所担任该班课程的老师进行评价。因此,可以构建一个数据仓库。然后对数据的各指标分数进行关联分析,得出相应的支持数和支持度,并根据分析结果来挖取它们之间存在的关联信息。计算出各项指标的得分并统计“[100,90]=很满意、[80]=满意、[70]=基本满意、[60]=一般、[59,0]=不满意”的个数;

3.1 数据准备

从数据中提取该教师的所有担任课程的班级的评价记录,针对各项指标分别统计出不同等级的支持数和相应的支持度,研究各项等级数据的关联程度。如表2所示。其中的“01”至“15”指的是评价指标U11--U53。

3.2 等级划分

根据分数的等级,划分为:[100,90]=优、[80]=良,[70]=中,[60]=及格。通过计算出来的规则离散化的结果如表3所示,不同等级的支持数以及支持度。

3.3 联规则挖掘

通过统计上表所提供的数据,进行关联规则挖掘。然后设置最小支持度为n>0.7,其中成绩为[60]和[70]的最小支持度和在一起计算。通过上表所提供的数据,得出满足条件的指标如表4所示。

4 结语

通过以上步骤,结果表明,该教师对待教学工作认真负责,治学严谨;教学重点和难点设计合理,教学形式新颖,不落俗套。但是在教学环节的完整紧凑,和节奏适度方面把握不好,有时衔接也不够自然。在教学改革方面突破不够,没有能够采用基于行到导向的教学模式。教学管理人员可以根据关联规则挖掘得出以上的结论并有针对性的让教师相应的改进。同样的利用关联规则挖掘方法可以计算出分数较高的教师的优点在哪些方面。

参考文献

[1]陆建江张亚非宋自林.模糊关联规则的研究与应用[M].科学出版社,2010.

[2]王欣徐腾飞唐连章.SQLServer2005数据挖掘实例分析[M].中国水利水电出版社,2012.

[3]袁继东,郁有全。层次分析法在地空导弹团战斗力评估中的应用[J].西安:空军工程大学学报(自然科学版)2011,5(1):80—83.

[4]JamieMacLennan.数据挖掘原理与应用——SQLServer[M].清华大学出版社,2012.

[5]高职院校教学评价结果的数据分析CNKI:CDMD:2.2009.165849.

作者简介

杨帆(1982-),男,海南省东方市人。现为海南软件职业技术学院讲师。

季文天,男,甘肃省兰州市人。现为海南软件职业技术学院副教授。

傅翠玉,女,海南省陵水黎族自治县人。现为海南软件职业技术学院讲师。

作者单位

海南软件职业技术学院 海南省三亚市 571400endprint

摘 要

列举了当前许多教学质量评价系统存在的一些不足,对于评价结果主要有优秀、良好、中、及格或者差等,透过这个评价结果,教学管理人员很难找到教师的教学水平高低究竞和哪些评价指标有关,探讨运用关联规则算法来解决这些存在的问题。同样的利用关联规则挖掘方法可以计算出分数较高的教师的优点在哪些方面。从而为教学管理人员提供可靠的决策依据。本文以海南软件职业技术学院学生评教的数据为依据,详细介绍了关联规则算法的应用。

【关键词】关联规则算法 评价指标

目前,我们常见的对一个教师的教学质量的评价大概有以下几种方式:教师之间互相评价;上级领导对教师的评价;学生对教师的评价等。由于高校的教师人数众多而且评价所产生的数据量比较庞大,组织领导对每一位教师进行逐一评价这样大量的工作,既不经济,也因为无法排除人际关系及不熟悉教学过程等因素的影响而使操作难于开展。教学质量评价的方法主要都是涉及教师教学的情况,评价结果主要有优秀、良好、中、及格或者差等,透过这个评价结果,教学管理人员很难找到教师的教学水平高低究竞和哪些评价指标有关。

1 关联规则及Apriori算法描述

关联规则分析就是从事务数据库,关系数据库和其他信息存储中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性。为了在数据挖掘任务中得到有用的和可靠的规则,需要通过支持度和置信度两个阈值来保证。

1.1 支持度

关联规则X?Y 在D中的支持度是D中事务包含XUY 的百分比,即概率P(XUY),它是对关联规则重要度的衡量,表示关联规则的频度。

1.2 置信度

关联规则X?Y在D中的置信度是包含X的事务中同时包含Y的百分比,即条件概率P(XY) ,它是对关联规则准确度的衡量,表示关联规则的强度。

在所有的关联规则算法中,Apriori 算法是比较著名的,这个算法可以从关联规则中挖掘出的频繁项集。Apriori算法发现关联规则的过程一共分为以下两步。

(1)通过迭代的方法,检索出事务数据库中所有支持度不能低于最小支持度项集--频繁项集。

(2)采用频繁项集构造出满足用户最小信任度的规则。其作用主要是为了挖掘或识别出所有的频繁项集。

2 评价指标的构建

在构建教学质量评价指标体系时,一方面要全面客观地分析众多影响因素,同时还要对这些因素进行筛选,哪些是需要的,哪些是要丢掉的。对于影响力差不多的因素要将它们进行重组,这样做是为了使因素的分布广度和代表性能够得到体现。综合上面的剖析,加上评估操作的具体情况,建立教学质量评价指标体系。然后利用层次分析法全面客观的论证这个评价体系,使构建的各项评估指标都是最佳的。详细指标如表1所示。教学评价指标包括U1 教师素养、U2 教学设计、U3 教学过程和教学内容、U4 教学效果和U5 教学特色等一级指标。二级指标包括U11-U53。

3 关联规则算法在评价指标体系中的应用

由于对教师的教学质量评价是多元的,学生一般是对所担任该班课程的老师进行评价。因此,可以构建一个数据仓库。然后对数据的各指标分数进行关联分析,得出相应的支持数和支持度,并根据分析结果来挖取它们之间存在的关联信息。计算出各项指标的得分并统计“[100,90]=很满意、[80]=满意、[70]=基本满意、[60]=一般、[59,0]=不满意”的个数;

3.1 数据准备

从数据中提取该教师的所有担任课程的班级的评价记录,针对各项指标分别统计出不同等级的支持数和相应的支持度,研究各项等级数据的关联程度。如表2所示。其中的“01”至“15”指的是评价指标U11--U53。

3.2 等级划分

根据分数的等级,划分为:[100,90]=优、[80]=良,[70]=中,[60]=及格。通过计算出来的规则离散化的结果如表3所示,不同等级的支持数以及支持度。

3.3 联规则挖掘

通过统计上表所提供的数据,进行关联规则挖掘。然后设置最小支持度为n>0.7,其中成绩为[60]和[70]的最小支持度和在一起计算。通过上表所提供的数据,得出满足条件的指标如表4所示。

4 结语

通过以上步骤,结果表明,该教师对待教学工作认真负责,治学严谨;教学重点和难点设计合理,教学形式新颖,不落俗套。但是在教学环节的完整紧凑,和节奏适度方面把握不好,有时衔接也不够自然。在教学改革方面突破不够,没有能够采用基于行到导向的教学模式。教学管理人员可以根据关联规则挖掘得出以上的结论并有针对性的让教师相应的改进。同样的利用关联规则挖掘方法可以计算出分数较高的教师的优点在哪些方面。

参考文献

[1]陆建江张亚非宋自林.模糊关联规则的研究与应用[M].科学出版社,2010.

[2]王欣徐腾飞唐连章.SQLServer2005数据挖掘实例分析[M].中国水利水电出版社,2012.

[3]袁继东,郁有全。层次分析法在地空导弹团战斗力评估中的应用[J].西安:空军工程大学学报(自然科学版)2011,5(1):80—83.

[4]JamieMacLennan.数据挖掘原理与应用——SQLServer[M].清华大学出版社,2012.

[5]高职院校教学评价结果的数据分析CNKI:CDMD:2.2009.165849.

作者简介

杨帆(1982-),男,海南省东方市人。现为海南软件职业技术学院讲师。

季文天,男,甘肃省兰州市人。现为海南软件职业技术学院副教授。

傅翠玉,女,海南省陵水黎族自治县人。现为海南软件职业技术学院讲师。

作者单位

海南软件职业技术学院 海南省三亚市 571400endprint

摘 要

列举了当前许多教学质量评价系统存在的一些不足,对于评价结果主要有优秀、良好、中、及格或者差等,透过这个评价结果,教学管理人员很难找到教师的教学水平高低究竞和哪些评价指标有关,探讨运用关联规则算法来解决这些存在的问题。同样的利用关联规则挖掘方法可以计算出分数较高的教师的优点在哪些方面。从而为教学管理人员提供可靠的决策依据。本文以海南软件职业技术学院学生评教的数据为依据,详细介绍了关联规则算法的应用。

【关键词】关联规则算法 评价指标

目前,我们常见的对一个教师的教学质量的评价大概有以下几种方式:教师之间互相评价;上级领导对教师的评价;学生对教师的评价等。由于高校的教师人数众多而且评价所产生的数据量比较庞大,组织领导对每一位教师进行逐一评价这样大量的工作,既不经济,也因为无法排除人际关系及不熟悉教学过程等因素的影响而使操作难于开展。教学质量评价的方法主要都是涉及教师教学的情况,评价结果主要有优秀、良好、中、及格或者差等,透过这个评价结果,教学管理人员很难找到教师的教学水平高低究竞和哪些评价指标有关。

1 关联规则及Apriori算法描述

关联规则分析就是从事务数据库,关系数据库和其他信息存储中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性。为了在数据挖掘任务中得到有用的和可靠的规则,需要通过支持度和置信度两个阈值来保证。

1.1 支持度

关联规则X?Y 在D中的支持度是D中事务包含XUY 的百分比,即概率P(XUY),它是对关联规则重要度的衡量,表示关联规则的频度。

1.2 置信度

关联规则X?Y在D中的置信度是包含X的事务中同时包含Y的百分比,即条件概率P(XY) ,它是对关联规则准确度的衡量,表示关联规则的强度。

在所有的关联规则算法中,Apriori 算法是比较著名的,这个算法可以从关联规则中挖掘出的频繁项集。Apriori算法发现关联规则的过程一共分为以下两步。

(1)通过迭代的方法,检索出事务数据库中所有支持度不能低于最小支持度项集--频繁项集。

(2)采用频繁项集构造出满足用户最小信任度的规则。其作用主要是为了挖掘或识别出所有的频繁项集。

2 评价指标的构建

在构建教学质量评价指标体系时,一方面要全面客观地分析众多影响因素,同时还要对这些因素进行筛选,哪些是需要的,哪些是要丢掉的。对于影响力差不多的因素要将它们进行重组,这样做是为了使因素的分布广度和代表性能够得到体现。综合上面的剖析,加上评估操作的具体情况,建立教学质量评价指标体系。然后利用层次分析法全面客观的论证这个评价体系,使构建的各项评估指标都是最佳的。详细指标如表1所示。教学评价指标包括U1 教师素养、U2 教学设计、U3 教学过程和教学内容、U4 教学效果和U5 教学特色等一级指标。二级指标包括U11-U53。

3 关联规则算法在评价指标体系中的应用

由于对教师的教学质量评价是多元的,学生一般是对所担任该班课程的老师进行评价。因此,可以构建一个数据仓库。然后对数据的各指标分数进行关联分析,得出相应的支持数和支持度,并根据分析结果来挖取它们之间存在的关联信息。计算出各项指标的得分并统计“[100,90]=很满意、[80]=满意、[70]=基本满意、[60]=一般、[59,0]=不满意”的个数;

3.1 数据准备

从数据中提取该教师的所有担任课程的班级的评价记录,针对各项指标分别统计出不同等级的支持数和相应的支持度,研究各项等级数据的关联程度。如表2所示。其中的“01”至“15”指的是评价指标U11--U53。

3.2 等级划分

根据分数的等级,划分为:[100,90]=优、[80]=良,[70]=中,[60]=及格。通过计算出来的规则离散化的结果如表3所示,不同等级的支持数以及支持度。

3.3 联规则挖掘

通过统计上表所提供的数据,进行关联规则挖掘。然后设置最小支持度为n>0.7,其中成绩为[60]和[70]的最小支持度和在一起计算。通过上表所提供的数据,得出满足条件的指标如表4所示。

4 结语

通过以上步骤,结果表明,该教师对待教学工作认真负责,治学严谨;教学重点和难点设计合理,教学形式新颖,不落俗套。但是在教学环节的完整紧凑,和节奏适度方面把握不好,有时衔接也不够自然。在教学改革方面突破不够,没有能够采用基于行到导向的教学模式。教学管理人员可以根据关联规则挖掘得出以上的结论并有针对性的让教师相应的改进。同样的利用关联规则挖掘方法可以计算出分数较高的教师的优点在哪些方面。

参考文献

[1]陆建江张亚非宋自林.模糊关联规则的研究与应用[M].科学出版社,2010.

[2]王欣徐腾飞唐连章.SQLServer2005数据挖掘实例分析[M].中国水利水电出版社,2012.

[3]袁继东,郁有全。层次分析法在地空导弹团战斗力评估中的应用[J].西安:空军工程大学学报(自然科学版)2011,5(1):80—83.

[4]JamieMacLennan.数据挖掘原理与应用——SQLServer[M].清华大学出版社,2012.

[5]高职院校教学评价结果的数据分析CNKI:CDMD:2.2009.165849.

作者简介

杨帆(1982-),男,海南省东方市人。现为海南软件职业技术学院讲师。

季文天,男,甘肃省兰州市人。现为海南软件职业技术学院副教授。

傅翠玉,女,海南省陵水黎族自治县人。现为海南软件职业技术学院讲师。

作者单位

海南软件职业技术学院 海南省三亚市 571400endprint

猜你喜欢
项集关联规则
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
数独的规则和演变
“一带一路”递进,关联民生更紧
奇趣搭配
让规则不规则
智趣
TPP反腐败规则对我国的启示
一种频繁核心项集的快速挖掘算法
一种新的改进Apriori算法*
分布式数据库的精简频繁模式集及其挖掘算法*