宋建驷
(陕西科技大学,西安,710021)
基于数据挖掘的体育成绩管理系统的设计
宋建驷
(陕西科技大学,西安,710021)
随着我国信息化的不断发展,使得我们已经进入了新的大数据时代。因此,对信息的挖掘成为大数据下比较典型的特征。本文利用当前比较流行的数据挖掘技术中的决策树算法,并结合学生体育测试成绩,实现了对学校相关数据的挖掘,更好的利用体育教师对学生的教学。
数据挖掘;决策树SLIQ 算法;体育成绩测试;ASP.NET
随着高等教育的不断发展,对学生体质的关注成为当前社会和学校共同关注的焦点。而如何更好的提高大学生的身体素质,并通过科学合理的数据分析和挖掘,为体育部教师、学校等提供可行性、科学性的方案,成为高校共同思考的一个问题。对于此,本人结合自身的工作,并结合当前的计算机技术,对该话题进行了一定的思考,并设计了一套可应用于大学生体育成绩挖掘的系统,以更好的为各位体育老师提供准确性的教学参考。
1.1 ASP.NET 技术
该技术是由美国的微软公司根据需求开发的,其是以.NET的平台而进行设计。而在设计中,该技术更多的是通过对动态页面技术而实现对网页的制作,简单的说就是依靠网络的软件制作。而随着该技术的在网页设计中的使用,受到越来越多的人的喜爱,其主要的原因是该技术具有如下的优势:
(1)ASP.NET是在.NET和ASP两者技术的基础上共同提出来的,因此,该技术集合了两者的之间的优势;
(2)在该技术中包含着很多的控件,这些空间可大大缩减软件爱好者原本必须用语言变成才能实现的功能,从而使得软件的开发变得简单和简易。
(3).NET架构原本可支持多种形式的开发语言,因此,该技术不仅丰富了原本框架开发中的类,同时还可多种语言进行运用。
(4)该技术其优点还表现在其强大的可移植性。这主要因为该技术的存储是通过HTML,因此,只要储存HTML的代码,则可将其移植到新的软件中,从而大大的缩短了软件开发的时间。
1.2 SQL Server 数据库
SQL Server 数据库管理系统是当期比较流行的数据库管理系统之一。该管理系统通过SQL 语句,实现对各种数据的查询、删除、添加和修改等功能,并可实现对不同数据的存储。同时该系统多别使用在分布式的系统中,因此,其具有操作方便、功能强大等忐忑第三,从而实现对数据的多种访问。在系统中,我们采用的是SQL Server 2008管理系统,其主要的原因是该数据库支持多种开发语言,并支持XML表格访问;其次是多种技术封装,有利于对技术的集成利用;其次其提供的性能更可靠,安全性更好。
1.3 数据挖掘技术
数据挖掘技术根据不同的分类,其可以被分为很多种不同的种类。而根据其挖掘的任务的不同,可以将数据挖掘技术分为如数据总结、分类挖掘、聚类方法等。而一般的数据总结在现实中如OLAP多维分析;分类挖掘则如贝叶斯、非参数、决策树等;聚类方法则包括统计方法。而在该系统的设计中我们采用基于决策树的SLIQ 算法。(其具体应用文中叙述)
根据对体育成绩管理的需求分析,我们将其系统功能分为系统管理、成绩管理、测试类型管理、测试项目管理、成绩分析几大功能模块。
其中,系统管理包括对系统相关数据的维护、备份和参数设置等,同时还包括对系统相关用户权限的设置,对用户的信息的删除、编辑和添加,对系统相关信息的发布。
测试类型管理主要根据高校体育教学大纲而进行设置的。而起主要包括对类型的添加、删除等功能。测试类型添加:该类型主要是添加新的测试类型,同时在添加到过程中系统会自动根据其添加的内容进行验证,包括该类型是否合法和为空;测试类型的修改,则主要是对原来的测试的类型进行相关的修改,并将最后的修改结果自动保存到相应的数据库当中去;类型删除主要对原来的数据进行删除;分值权重设置是对每个不同的测试类型下其分值的相关权重进行的比例的相关设置。
测试项目则是对本学期不同科目考试的项目进行设置,如篮球、排球、跳高等项目。而管理则是在这个基础上对这些考试项目的删除、添加和修改,以及对不同的项目的分值权重的设置。
对该系统的实现,我们采用三层结构,并采用ASP.NET技术,实现动态页面访问,数据库采用SQL Server 2008 数据库。服务器操作系统采用WINDOW Advanced Server,并安装IIS6.0。其具体的架构如图1所示。
图1 系统整体架构设计
在该系统中,我们选用SLIQ 算法,是因为该技术是基于ID3算法、C4.5算法,集合两种算法的优点,是两种算法的改进型。因此,我们采用该算法。同时我们以体育成绩和就业能力的关系进行挖掘为例,具体应用过程主要包括以下几个步骤:
4.1 数据处理
所谓对数据的处理,是将不同结构的数据进行合并,从而得出比较模糊的数据表格。而在这里的所谓的数据处理并不是简单的数据合并,而是将不同的数据类型进行统一的、规范的处理,其需要统一数据中矛盾的地方,如字段名、单位长度等,从而形成最初的数据挖掘。
4.2 数据清洗
所谓的数据清洗,其实质就是将系统中存在的噪声数据、空白数据等进行删除,并通过数据仓库的形式,建立唯一的关联表格的过程。
4.3 决策树的创建
我们以学生成绩与就业的关系作为该数据挖掘的示例,通过上述的数据处理和数据的清洗,并通过决策树建模,我们可以得出以下的决策树结果。
图2 基于SLIQ 决策树生成
其实现代码:
1) fill in config information;
2) create and sort Attribute List, create Glass List;
3) create root:
4) scan class list in order to fill class histogram of root node;
5) push root to queue1; // queue1 是当前叶子节点队列
6) if(root 为纯节点) exit(0);7) white (not empty queue1) do
8)for each of the attribute A do //计算最佳分裂方案
9)if (A is a numeric attribute) then //数值型
10)for every record of A From 0 to maxn- 1 do
11)change class histogram:
12)if(treenode.newinfogain>treenode.infogain) then
13)update tree node 's threshold information
14)else if (A is a categorical attribute) //离散型
15)for every record of A from 0 to rnaxn- 1 do
16)add class information to the node //记录每个属性值对应的类的总个数
17)greedy algrithm to compute the split
18)if(treenode.newinfogain>treenode.intogain) then
19)update tree node 's threshold information
20) for each node N in queue1 do //执行分裂
21) if (not enough info gain(N)) //执行裁剪算法, 判断是否有必要分裂
22)continue;//没有必要分裂, 当前节点成为叶子
23) create left leaf and right leaf;
24) put the two new leaf into queue2; //queue2 是新叶子节点队列
25) split the node by split info in the node
26) refresh class list
27) clean the pure node out of the queue2;
28) queue1=queue2;
29) store the tree node into database //将树转化为线性存储方式存入 DB
4.4 结果输出
通过上述的分析,我们可以得出各科不同的成绩和就业之间的关系。其中篮球分数高的,其就业情况也通常比较好,这说明就业单位在对学生进行选择的时候,通常选择身体体质比较好的学生。
本系统将ASP.NET技术和数据挖掘技术应用于体育成绩管理系统,有效的实现了对相关数据的挖掘,并通过HTML页面将结果展现给广大的体育教师,以此更好的实现对体育教学的制定。
[1] 黄芳.基于数据挖掘的决策树技术在成绩分析中的应用研究[D].山东大学,2010,78-83.
[2] Breiman L Friedman,H H R A,Stone C J.Classification Regression Trees[Z].Wadsworth International Group,2010,134-139.
[3] 饶云波,张应辉,等.基于 ASP.NET 的电子商务平台设计与实现[J].计算机技术与发展,2009,16(5):160-162.
Design of the sports performance management system based on Data Mining
Song Jiansi
(Shaanxi University of Science and Technology,Xi'an,710021)
Along with the development of information industry in our country,so we have entered the era of big datanew.Therefore,mining the information be features of typical large data.This article uses the current popular datamining techniques of decision tree algorithm,and combined with the test scores of students in sports,the mining ofschool related data,better use of PE Teachers' teaching to the students.
data mining;decision tree SLIQ algorithm;physical performance test;ASP.NET