基于数据挖掘技术影响计算机等级考试的研究分析

2014-07-02 00:26刘红保
无线互联科技 2014年1期
关键词:数据挖掘影响因素

刘红保

摘 要:本文将数据挖掘技术应用于计算机文化基础等级考试中,通过使用ID3分类方法,分析最近几个学期计算机文化基础成绩,发现影响学生通过考试的因素在于学生自身学习意愿是否按时交作业是否做练习题,与任课教师的教学方法、其他科成绩、有无计算机基础等因素关系很大,为计算机文化基础教学提供有效的理论依据。

关键词:数据挖掘;ID3算法;影响因素

1 数据挖掘的概述

1.1 数据挖掘的概念

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,抽取隐含在其中的、人们事先不知道的、但又潜在有用的知识的过程。此定义包含三个层次的含义:①数据必须是真实的、大量的、含噪声的;②发现的是用户感兴趣、可理解的知识;③发现的知识只面向特定的领域。

1.2 数据挖掘的过程

数据挖掘可以概括为三个部分:数据预处理、数据挖掘、模式评估和知识表示。其中数据预处理可以分为:数据清理、数据集成、数据选择和数据变换四个部分。

1.3 数据挖掘的方法

目前比较常用的数据挖掘分析方法有:关联规则分析、分类分析、预测分析、聚类分析等。

2 主要算法设计

2.1 数据搜集,分析影响学生计算机一级成绩的因素,需要以下几个方面的信息

①学生基本信息。应包括如下属性:学号、姓名、性别、籍贯、民族、专业、班级,这些信息可以通过学院的综合教务管理系统获得。②学生调查信息。内容包括学号、学习兴趣、学习前的知识掌握情况、课后上机练习时间量、做模拟题情况等。这些信息主要通过调查,由学生填写。③学生成绩。成绩数据表中包括了学生的学号、平时成绩、等级考试成绩,这个数据库由学院综合教务管理系统获得。④评教数据。包括教师编号、评教情况等。

2.2 数据预处理

①数据集成和变换。主要采用数据库相关技术把得到多个数据库文件数据合并到学生成绩分析基本表中。②数据清理。把不一致的数据补充完整,处理空缺值的方法有:忽略元组、人工填写空缺值、使用全局常量、采用平均值填充、使用最有可能的值填充空缺值。③数据规约。就是缩小所挖掘数据的规模,并且挖掘出来的结果与原有的数据集多获得的结果基本相同。学生基本信息中的民族、籍贯等、成绩库中的考试时间、考试地点等属性是与成绩不相关的属性,需要进行维规约。形成新的影响学生成绩分析的基本数据表如表1。

2.3 进行数据分类挖掘,生成分类规则

如:IF文理科=文AND是否按时交作业=是AND其他平均成绩=优秀AND有无计算机基础=有AND教师评教=优秀AND学生作模拟题>4THEN通过

IF文理科=理AND是否按时交作业=是AND其他平均成绩=优秀AND有无计算机基础=有AND教师评教=优秀AND学生作模拟题>4THEN通过

IF文理科=文AND是否按时交作业=否AND其他平均成绩=优秀AND有无计算机基础=有AND教师评教=优秀AND学生作模拟题<4THEN不通过

IF文理科=理AND是否按时交作业=否AND其他平均成绩=优秀AND有无计算机基础=有AND教师评教=优秀AND学生作模拟题<4THEN不通过

……

2.4 实验结果分析

通过以上分类规则的分析可以看出,学生能否通过计算机一级等级考试的关键因素是按时做作业,提交作业,多做练习多做模拟题,与学生是否具有计算机基础没有关系,与学生是否是文理科也没有关系,即使其他成绩一般,通过多做练习多做模拟题也是可以通过的,说明与其他课程的成绩没有必然的关系,学生不按时提交作业,不做练习不做模拟题,教师再优秀,该学生的计算机一级也是无法通过的。由此可知在今后的计算机文化基础教学过程中,任课教师应该注重学生的平时作业完成情况,着重加强学生的上机实验练习,鼓励学生课后多做计算机一级模拟试题,从而确保学生计算机一级考试的通过。

本文把数据挖掘技术引入到计算机一级等级领域,利用数据挖掘的分类技术对一级成绩数据分类,并使用ID3算法具体实现分类挖掘。实验结果达到了预期的目标,挖掘出了一系列影响计算机一级通过的分类规则,为学院的计算机一级等级考试提供了科学的参考依据。

[参考文献]

[1]纪希禹.《数据挖掘技术应用实例》.机械工业出版社,2009.4.

[2]李庆香.《数据挖掘技术在高校学生成绩分析中的应用研究》.西南大学,2009.12.

[3]刘芳,林海霞.《数据挖掘技术在高校計算机等级考试成绩分析中的应用》.计算机与信息技术,2008.11.

猜你喜欢
数据挖掘影响因素
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
数据挖掘技术在中医诊疗数据分析中的应用
突发事件下应急物资保障能力影响因素研究
环卫工人生存状况的调查分析
农业生产性服务业需求影响因素分析
村级发展互助资金组织的运行效率研究
基于系统论的煤层瓦斯压力测定影响因素分析
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索