数据挖掘技术在高职高专医学生综合学业成绩评价中的应用

2014-02-07 02:41吴燕萍楼彩虹郭永松张大然
中国高等医学教育 2014年5期
关键词:约简学业成绩数据挖掘

吴燕萍,楼彩虹,沈 清,郭永松,张大然

(1.浙江医学高等专科学校,浙江 杭州 310053;2.建德市第一人民医院,浙江 建德 311600)

21世纪信息技术的发展促进了我国高职高专医学院校教学管理信息化的推进,部分高校人员已研究将数据挖掘技术应用于教学管理中[1]。以浙江医学高等专科学校为例,依据学生综合学业成绩评价指标体系[2],运用数据挖掘技术分析影响学生学业成绩的关键指标因素及相互间关系,为评价学生学业提供思路。

一、挖掘模型

以学生综合学业成绩评价指标体系(附图)和学校教务管理系统中2009-2011级学生成绩历史数据建立数据库;运用粗糙集约简算法[3]和关联规则Apriori算法[4]建立数据挖掘模型;采用ACCESS Database数据库和Visual C++语言设计开发程序。

附图 学生综合学业成绩评价指标体系

二、挖掘实现

(一)建立数据库。

依据评价指标体系(附图)采集整合教务管理系统的历史数据,包括:

(1)学生学籍信息:学号、姓名、专业、年级。

(2)学生学习成绩信息:教学计划内各门课程成绩、课程成绩加权平均绩点、课程通过率、专业排名、体能成绩、英语等级成绩、计算机等级成绩,获其他证书情况、在校期间处分情况及综合学业成绩评价等级结果。

(二)计算最优约简集。

将抽取的数据经过预处理,运用粗糙集属性约简算法求出核和最优约简集,即学生综合学业成绩评价体系中的关键指标。

(1)依据数据库信息,建立学生综合学业成绩信息系统S={UC∪{d},V,f}。论域U为研究对象,U={U1,U2,……,Um},Ui表示第i名学生,2009-2011级共5340名学生,m=5340;评价指标为条件属性C={C1,C2,C3,C4,C5,C6,C7};评价等级为决策属性D={D1}。其中,条件和决策属性说明如下。

C1:处分情况,按学校规定分为:未受处分、警告、严重警告、记过、留校察看和开除学籍,分别对应值0、1、2、3、4、5;

C2:专业计划内课程成绩加权平均绩点,按专业排名前5%、10%、25%和其他,分别为优秀、良好、中等和合格,对应值4、3、2、1;

C3:体能成绩,0不合格,1合格,2优秀;

C4:课程通过率,0有不及格,1课程都及格;

C5:英语等级成绩:0没有通过英语三级,1通过英语三级,2通过英语四级,3通过英语六级;

C6:计算机等级成绩:0没有通过一级,1通过一级,2通过二级;

C7:专业技能,通过资格证书体现(除英语和计算机证书),0没有其他专业资格证书,1有;

D1:学生综合学业评价结果,0不合格,1合格,2良好,3优秀。

(2)运用粗糙集属性约简算法[3]求核,计算最优约简集。计算得到核Core={C1,C2,C3,C4,C5},计算得到最优化约简集R=Core,得出学生综合学业评价体系中“处分情况”、“专业成绩”、“体能成绩”、“课程通过率”和“英语等级成绩”是关键指标。

(三)关联规则挖掘算法。

根据最优简约集R选择上述五个条件属性(关键指标)和决策属性及其各指标所对应的属性值数据集合作为关联规则Apriori算法[4]数据挖掘的对象。为方便计算,将上述属性值用集合I={I1,I2,…,I23}表示,对应关系如下所示,见表1。

经反复试验设最小支持度1%、最小置信度60%,得到典型规则,见表2。

三、结果分析

根据结果(表2)分析各指标及相互间关系,具体如下。

规则1-4可得学生综合学业评价一般规律:受警告处分或体能成绩不合格或所修专业课程未全不合格,表明满足上述任何一项条件,评价不合格。从支持度分析出,有处分、体能成绩不合格学生比例不高,学生总体道德素质和学习氛围较好。

表2 数据挖掘结果

规则5-7体现德育成绩对智育和能力成绩有一定影响。未受任何处分的学生,专业成绩一般在中等及以上,且通过英语三级或评价为优秀的概率较高;特别是学习态度及学习作风较好、专业课程全通过且成绩中等以上学生,通过英语四、六级的概率高。规则7说明学校英语等级考试通过率较高。

规则8-13反映高职高专医学生各成绩间的一定联系。专业成绩中等学生,所有课程都通过的概率高;课程都通过的学生在其他考试方面的表现也较优秀,通过英语三级的几率更高;专业成绩在中等以上学生在综合学业评价中被评为优秀的概率更大。相反,专业成绩合格的学生得到评价合格的概率较大。以上分析说明,平时成绩良好及以上学生对待专业课程及其他考试(如英语等级考试等)都较认真。

综上所述,高职高专医学生综合学业评价体系的德育成绩、智育成绩和能力成绩三者间存在一定的联系。首先,德育成绩很大程度上会影响学生智育和其他能力成绩。学习作风严谨、学习能力较强的学生在各项成绩上表现均较优秀;另一方面,高职高专医学生在学习能力、学习习惯等德育方面不如本科生。第二,学生成绩间有一定联系。专业成绩不错的学生其他成绩也相对优秀,通过英语等级等考试的概率更高,成绩更好。因此,学校可从加强培养高职高专医学生学习能力、学习习惯等方面着手,对成绩不理想的学生做适当引导,从而提高其综合学业成绩,为今后成为严谨的医务工作者打下坚实的基础。

[1]张宗郁,张亚平,张静远,等.改进关联规则算法在高校管理中的应用[J].计算机工程,2012,1(38):75-77.

[2]浙江医学高等专科学校.学生综合素质测评办法[Z].2009,8.

[3]吴守领,杨 颖,杨 磊,等.基于粗糙集的决策表属性约简方法的研究[J].计算机技术与发展,2012,1(22):32-35.

[4]张梅峰,张建伟,张新敬,等.基于Apriori的有效关联规则挖掘算法的研究[J].计算机工程与应用,2002,39(19):196-198.

猜你喜欢
约简学业成绩数据挖掘
基于回归分析模型的学生学业成绩差异研究
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
大学生成就动机与学业成绩关系的分析
高职生成就目标定向、学习策略与学业成绩关系研究
近似边界精度信息熵的属性约简
广义分布保持属性约简研究
大学生上网情况与学业成绩关系的实证研究
时频表示特征约简的旋转机械故障特征提取方法
基于粗糙集属性约简与进化算法的贝叶斯网络分类器