利用Apriori算法对医学生成绩进行课程关联性分析

2015-05-09 08:57牛猛
关键词:项集基础课专业课

牛猛

(皖南医学院 教务处,安徽 芜湖 241002)

高校医学生的培养方案,其课程的设置,是按照公共基础课、专业基础课、专业课的先后顺序来安排的。从内容上来说,公共基础课是专业基础课的基础,专业基础课是专业课的基础;从学习效果上说,公共基础课的学习效果对专业基础课的学习有很大的影响,专业基础课的学习效果对专业课的学习有很大的影响,前期开设的专业课的学习效果对与之有关联的后期开设的专业课的学习也有很大的影响。

本文将从具体的课程关联上,对医学生成绩进行分析,利用 Apriori算法对同一专业的课程成绩进行关联规则[1]挖掘:挖掘出有一定关联的公共基础课程成绩对专业基础课程成绩的影响;有一定关联的专业基础课程成绩对专业课程成绩的影响;有一定关联的专业课程成绩对后续专业课程成绩的影响。用挖掘出的规律反馈教学过程,在辅助教学决策、提高教师教学质量和增加学生学习效果等方面都能给出指导性意见。

一、公共基础课成绩对专业基础课成绩的影响

以我校2008级临床医学专业学生学习基础化学和生物化学为例,基础化学,作为公共基础课,是学习生物化学这门专业课的基础。从教务系统中导出2008级临床医学专业的学生基本情况表,共 821人,包含学号、姓名、性别、院系、当前所在级、学籍状态、专业、班级、身份证号等共53个字段;导出2008级临床医学专业包含基础化学和生物化学的学生成绩表,其中基础化学共 824条记录,生物化学共824条记录,包含学年、学期、课程名称、考核方式、成绩、学分、当前所在级、专业、班级名称、学号、姓名、课程性质、课程类型等共22个字段。

然后,对导出的原始数据进行修改,如增加或删除字段,增加或删除记录,将不同数据表连接至同一个数据挖掘库中[2]。将学生基本情况与成绩表中的学号、专业、基础化学成绩和生物化学成绩这 4个字段导出生成用于挖掘的学生成绩挖掘表1,其记录共有820条,如表1-1所示。

表1-1 完成数据预处理的学生成绩挖掘表1

之后,根据 Apriori算法的要求,对学生成绩挖掘表 1中的成绩进行离散化。将平均成绩按大于或等于75分(优良)、小于75分(一般)分别划分成“1”、“0”,分别表示学习成绩为优良和学习成绩为一般及以下,如表 1-2所示。

表1-2 完成数据离散化的学生成绩挖掘表2

之后,给定 min_sup[3]为 0.2,min_conf[4]为0.5,再通过Apriori算法挖掘所有的频繁项集[5],如表1-3所示。

表1-3 从学生成绩挖掘表2中挖掘出的频繁项集

最后,计算最终频繁项集的所有非空子集的置信度,删除小于min_conf的记录,确定模型,生成关联规则[6],如表1-4所示。

表1-4 从学生成绩挖掘表2中挖掘出的关联规则

通过挖掘的关联规则,我们可以发现下述关系:

学生的基础化学成绩,对学生的生物化学成绩有很重要的影响,基础化学成绩是优良的,其生物化学成绩在非常大程度上都是优良的。但基础化学成绩并非绝对因素,基础化学成绩是一般的学生,通过努力学习,有一些都能够获得优良的生物化学成绩。

根据上述关系,我们可以得出如下结论:

基础化学属于公共基础课,生物化学属于专业基础课,并且基础化学这门公共基础课是学习生物化学这门专业基础课的基础。对于同一专业,有一定关联的公共基础课成绩对专业基础课成绩有非常大的影响。

二、专业基础课成绩对专业课成绩的影响

分析同一专业,有一定关联的专业基础课成绩对专业课成绩的影响。以2008级临床医学专业学生学习生理学和内科学为例,生理学,作为专业基础课,是学习内科学这门专业课的基础。

按照之前的方法,将2008级临床医学专业的学生基本情况表与生理学成绩表和内科学成绩表连接至同一个数据挖掘库中,并将学号、专业、生理学和内科学成绩这 4个字段导出生成用于挖掘的学生成绩挖掘表 3,其记录共有820条,如表2-1所示。

表2-1 完成数据预处理的学生成绩挖掘表3

之后,按照成绩是否大于或等于75分进行离散化,如表2-2所示。

表2-2 完成数据离散化的学生成绩挖掘表4

之后,按照 min_sup为 0.2,min_conf为0.5挖掘所有的频繁项集,如表2-3所示。

表2-3 从学生成绩挖掘表4中挖掘出的频繁项集

最后,计算最终频繁项集的所有非空子集的置信度,删除小于min_conf的记录,确定模型,生成关联规则,如表2-4所示。

表2-4 从学生成绩挖掘表4中挖掘出的关联规则

通过挖掘的关联规则,我们可以发现下述关系:

学生的生理学成绩,对学生的内科学成绩有很重要的影响,生理学成绩是优良的,其内科学成绩在非常大程度上都是优良的。但生理学成绩并非绝对因素,生理学成绩是一般的学生,通过努力学习,有一些都能够获得优良的内科学成绩。

根据上述关系,我们可以得出如下结论:

生理学属于专业基础课,内科学属于专业课,并且生理学这门专业基础课是学习内科学这门专业课的基础。对于同一专业,有一定关联的专业基础课成绩对专业课成绩有非常大的影响。

三、专业课成绩对专业课成绩的影响

分析同一专业,有一定关联的专业课成绩对专业课成绩的影响。以2008级临床医学专业学生学习手术学和外科学为例,虽同为专业课,但手术学是学习外科学的基础。

按照之前的方法,将2008级临床医学专业的学生基本情况表与手术学成绩表和外科学成绩表连接至同一个数据挖掘库中,并将学号、专业、生理学和内科学成绩这 4个字段导出生成用于挖掘的学生成绩挖掘表 5,其记录共有820条,如表3-1所示。

表3-1 完成数据预处理的学生成绩挖掘表5

之后,按照成绩是否大于或等于75分进行离散化,如表3-2所示。

表3-2 完成数据离散化的学生成绩挖掘表6

之后,按照 min_sup为 0.2,min_conf为0.5挖掘所有的频繁项集,如表3-3所示。

表3-3 从学生成绩挖掘表6中挖掘出的频繁项集

最后,计算最终频繁项集的所有非空子集的置信度,删除小于min_conf的记录,确定模型,生成关联规则,如表3-4所示。

表3-4 从学生成绩挖掘表6中挖掘出的关联规则

通过挖掘的关联规则,我们可以发现下述关系

学生的手术学成绩,对学生的外科学成绩有很重要的影响,手术学成绩是优良的,其外科学成绩在非常大程度上都是优良的。但手术学成绩并非绝对因素,手术学成绩是一般的学生,通过努力学习,有一些都能够获得优良的外科学成绩。

根据上述关系,我们可以得出如下结论:

手术学、外科学均属于专业课,并且手术学是学习外科学的基础。对于同一专业,相互之间有关联的先授课的专业课成绩对后授课的专业课成绩有非常大的影响。

四、总结

将之前挖掘出的规律反馈给授课的教师和听课的学生,得到他们的认同。因此,教师和学生均要注意课程之间的关联,在讲授、学习课程的时候,要及时联系、复习与之关联的前期相关课程,这样互相促进,对提高教师的教学质量和增加学生的学习效果有重要的指导意义。这样的规律,对于教学管理部门来说,在专业建设、培养方案制定、课程设置、辅助教学决策等方面具有重要的指导意义。

[1]杜孝平,马秀莉,唐世渭,等.快速关联规则挖掘算法[J].计算机工程与应用,2002(11):1-4,47.

[2]谢琦,张振兴.基于 Apriori算法和 OLAP的关联规则挖掘模型设计[J].计算机应用,2007,27(6):4-5,9.

[3]周虹,马丽丽.一种改进的 Apriori 算法[J].佳木斯大学学报(自然科学版),2007,25(4):492-494.

[4]王杰,张静,张继生.等.数据挖掘中关联规则的研究与论证[J].鞍山科技大学学报,2005,28(2):123-126.

[5]佟强,周园春,阎保平.关联规则挖掘算法.微电子学与计算机,2005,22(6):68-72.

[6]陆丽娜,陈亚萍,魏恒义.挖掘关联规则中Apriori算法的研究[J].小型微型计算机系统,2000,21(9):940-943.

猜你喜欢
项集基础课专业课
中职《医护英语》与专业课的结合教学探索
“导入课”在高校专业课实施“课程思政”的实践与思考
不确定数据的约束频繁闭项集挖掘算法
一种垂直结构的高效用项集挖掘算法
关于音乐基础课教学与学习中的几个问题
基于云平台的计算机基础课混合教学模式探究
研究生专业课学分制教学改革探讨
中药学专业分析化学基础课的教学探讨
高等医学院校计算机基础课教学改革浅议
分布式数据库的精简频繁模式集及其挖掘算法*