数据挖掘技术在高校体育成绩分析中的应用

2021-12-13 14:57卢佳
科技资讯 2021年27期
关键词:贝叶斯分类器数据挖掘

卢佳

摘要:在大量数据资源中使用数据挖掘技术后,可以获取其中隐藏的所需信息,主要应用在知识预测领域中。针对在校大学生群体体育成绩的研究,可以预测学生后续学习的成绩,采用定期方式收集、整理以及研究学生体育成绩信息,从而更好地保障高校体育教学品质。在教学时使用数据挖掘技术,能够符合所有参与者的实际教学需要:参考研究结论能够给学生推荐优化学习效率的课程体系与材料资源;教师能够参考具体的学习反馈结果进行因材施教式授课活动;高校管理层结合研究结论完善本校课程设置机制等。

关键词:数据挖掘技术成绩分析体育成绩技术应用

中图分类号:TP311 文献标识码:A   文章编号:1672-3791(2021)09(c)-0000-00

The Application of Data Mining Technology in the Analysis of University Sports Performance

LU Jia

(Zhengzhou Institute of Industrial Application Technology, Zhengzhou, Henan Province,451100 China)

Abstract: After using data mining technology in a large number of data resources, you can obtain the hidden required information, which is mainly used in the field of knowledge prediction. The research on the physical performance of college students in school can predict the subsequent learning performance of students, and adopt regular methods to collect, organize and research the information of student sports performance, so as to better guarantee the quality of college physical education. The use of data mining technology in teaching can meet the actual teaching needs of all participants: refer to research conclusions to recommend curriculum systems and material resources that optimize learning efficiency; teachers can refer to specific learning feedback results for teaching activities in accordance with their aptitude; colleges and universities The management combined with the research conclusions to improve the school's curriculum setting mechanism and so on.

Key Words: Data mining technology; Performance analysis; Sports performance; Technology application

1 研究方法

該文在研究中选择问卷调研方式获取第一手研究数据信息,这是以本校体育选修课19级的学生群体作为研究对象,统计与体育课程有关的数据信息,将不全面的数据信息进行筛除,最终获取有效样本数量为257份。得到学生体育课程成绩的分布情况之后,把体育成绩进行式(1)中的离散化处理[1],可得:

分数等级={(A,95≤分数@B,85≤分数<95@C,75≤分数<85@D,65≤分数<75@E,55≤分数<65@F,    分数<60)┤(1)

图1体育成绩分布情况

2 数据挖掘算法

在数据挖掘体系中存在很多的分类器,没有出现最优化的分类器,这是由于其在诸多层面中存在着差异化现象,譬如需要考量学习率情况、分类速率情况、训练数据量情况以及鲁棒性特征等[2],该文选择C4.5的数据分析算法与朴素贝叶斯的数据分析算法进行研究,以此获取分类模型。

2.1 朴素贝叶斯分类器(NBC)

假定x=(x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,)为属性向量,x1表示的是性别参量;x2表示的是家庭人数参量;x3表示的是住所和学校的距离参量;x4表示的是高中类型参量;x5x5表示的是绩点参量;x6表示的是高考体育成绩参量;x7表示的是奖学金参量;x8表示的是课程学习时间参量;x9表示的是复习材料参量;x10表示的是使用网络参量;x11表示的是体育成绩重要性参量;x12表示的是收入参量。C1表示的是输出类别中对应的“优秀”情况;C2表示的是输出类别中的“一般”参量。结合贝叶斯定理[3],能够获取以下函数表达式:

P(C1|x)=P(C1)P(x|C1)P(x)(2)

P(C2|x)=P(C2)P(x|C2)P(x)(3)

最终能够确定朴素贝叶斯分类器:

y^=k?{1,…,k}P(Ck)∏i=19P(xi|Ck)(4)

2.2 C4.5算法描述

C4.5属于ID3算法的优化形式,其产生的决策数能够展开分类活动,因此能够将其概括成统计分类器[4]。如图2所示

3结果及分析

要想更加理想地认知输入变量存在的重要属性,一般情况下,这是会研究变量对预测阶段中学生体育成绩产生的作用,探讨模型中一些输入变量给输出变量带来的影响[5]。通过3个测试后确定输入变量:分别是卡方检验测试手段、信息增益测试手段以及增益比检验手段等。选择属性内容、优点内容、偏差内容、排序内容、排序与dev内容进行检测操作 [6]。各类算法在使用中会产生差异化的结论,各种算法会采用各类方式考量属性对应的相关属性,其结果为各类算法的均值。

对C4.5算法在预测学生体育成绩性能结论的评估内容见表1。

4结语

该文研究的目标是选择数据挖掘技术分析高校体育成绩模型,基于此阐释一类学生体育成绩研究算法,参考已有学生课程表现情况,以此预测学生未来体育成绩。选择该文研究手段对本校体育专业的学生群体进行体育成绩的研究活动,得出的研究结论是朴素贝叶斯分类器有着卓越的分析效能。该文选择传统的课堂教学环境,对收集的数据信息进行数据挖掘研究,此类研究手段能够辅助教师强化学生的体育成绩,选择合理化的举措后强化学习效果。

参考文献

[1]龚卓,周晨,汤如金,等.基于能力导向的计算机辅助设计系列课程混合式教学模式研究[J].文化创新比较研究,2021,5(23):78-81.

[2]巩庆波,吴瑛,耿家先.不同背景特征大学生体育参与的差异性分析[J].南京体育学院学报,2021,20(6):50-57.

[3]胡乾元.大数据分析视角的青少年体质健康影响因素的分析[J].当代体育科技,2021,11(18):236-238.

[4]鲍勤,周静秋,霍倩文.论人工智能在网球技术动作分析中的应用[J].南京体育学院学报,2020,19(11):47-51.

[5]欧丽红.计算机大数据分析及云计算网络技术发展探究[J].科技創新导报,2020,17(20):131-133.

[6]刘爱萍.基于数据挖掘技术的高校学生成绩预测模型构建[J].长春工程学院学报:自然科学版,2020,21(2):98-101.

猜你喜欢
贝叶斯分类器数据挖掘
学贯中西(6):阐述ML分类器的工作流程
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
贝叶斯网络概述
贝叶斯公式的应用和推广
基于AdaBoost算法的在线连续极限学习机集成算法
一种统计分类方法的学习
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究