医学院校本科生成绩与多维数据的分析

2022-04-25 08:36林楠王建张兵兵张建威李巍邢曦文
电子元器件与信息技术 2022年2期
关键词:医学院校本科生医学生

林楠,王建,张兵兵,张建威,李巍,邢曦文

(大连医科大学现代教育技术中心,辽宁 大连 116044)

关键字:学生成绩;多维数据;数据挖掘;K-means聚类算法

0 引言

随着国家教育信息化政策的不断深化,医学院校教育信息化的发展与建设也在不断加强,先进的信息化技术和方法对医学院校教育教学管理的各个方面都产生了深远影响。

将传统数据分析方法与大数据复杂算法相融合的数据挖掘技术引入到医学院校教育教学管理中,对现有的大量多维度的教学管理数据进行多种角度、多种结合、多种维度的挖掘分析,找到对本校教育教学管理具有潜在价值的信息数据,为学校教育管理人员提供决策辅助起到了至关重要的作用[1-2]。

1 相关工作

在医学院校本科生教学管理中,与学生相关的综合信息数据是非常重要的一部分[3]。随着教学信息量的大幅度增加,简单的学生成绩查询、留存、统计等管理方法已经无法对积累下来的海量数据进行深层的科学分析及预测。因此,采用数据挖掘技术,突出医学院校专业特点,以本校部分本科学生的学习成绩和多维数据(包括图书借阅信息、校园一卡通消费行为信息、学生身体健康信息、师资力量信息等)作为研究对象,进行数据处理,采用聚类算法中的K-means算法分析了本校本科学生学习成绩与多维数据之间的关系,根据本校实际教学管理工作进行具体分析并给出相关结论。

2 K-means聚类算法在医学院校本科生学习成绩与多维数据中的应用

2.1 数据采集

采用数据库中的医学本科生的业务数据(如学生成绩数据等)及对数据挖掘分析有益的其它外部数据。

2.2 数据预处理

根据需求明确数据选择,在专属数据服务器上搭建了与数据挖掘目标有关的数据表,确定了表的具体结构。包括学生基本信息表(主要包括:姓名、性别、民族、年级、专业、学院、班级等信息)、图书借阅基本信息表、学生成绩信息表(主要包括:学号、学年、学期、课程类别、成绩、学分、课程名称等信息)、学生体质信息表(主要包括:姓名、性别、身高、体重、BMI评价等信息)等。

对已选择的数据(本科生成绩信息、本科生借阅信息、消费信息,本科生体质信息)进行数据清洗、属性规约和数据变换的预处理操作。

(1)数据清洗。通过对所选本科生数据的分析,发现数据中存在许多缺失值(记录为空或记录为0)。由于原始医学生信息数据量过大,且类似数据所占百分比较小,且对于该问题的分析效果影响不大,所以对这部分数据做丢弃删除操作。

(2)属性规约。医学本科生原始数据中的值属性太多,去除与建模不相关、弱相关或冗余的值属性数据。

(3)数据变换。数据变化的主要作用是缩减该数据的维度,即从最初始的特征里面找到确确实实有效的特征,用来缩小挖掘数据时要顾虑的特征个数或变量的个数。依照需求的倾向,探求有效的特征来表现数据,采用压缩或变动控件的方式来缩减要顾虑的有用变量数量。

2.3 K-means聚类算法

k-means算法[4](如图1所示)是把一组包含多个范本的特征矩阵划分成K个没有交集的簇,从直观角度来说,簇就是许多组聚在一起的数据。

图1 K-means 算法示意图

同一个簇中的数据可以视为是同一个类别,簇就是聚类结果表现。簇中所有数据的均值μ和j通常被称为这个簇的“质心”,在一个二维平面中,一个簇有横纵两个坐标,簇的质心的横纵坐标分别代表该簇数据点的横竖坐标均值,同理可推广至高维空间[5]。

2.4 SCB模型构建

采用传统模型的属性分析方法可以分析出目标学生群,但是由于分析得过于细化,分析出的学生群体过多,不仅会使数据挖掘分析效率降低还会影响我们对教学指导的针对性总结[6]。因此,本文将构建SCB模型来分析医学院校学生用户群体,识别出各类不同学生群体加以指导。

本文将学生成绩(S)、学生消费情况(C)、学生图书借阅信息(B)三个指标信息作为建模指标,命名为SCB模型,如表1所示。

表1 指标含义

使用K-means聚类算法对于已有的医学生数据,按照数据样本之间的间隔大小,先确定划分的K个簇(所有数据的集合,簇中对象是相似的),簇内联系尽量紧密,簇间间隔尽可能大一些。用数据表达式表示,则最小化平方误差E(平方误差被用来评价模型,即值越小越接近质心,效果越好)

3 结果分析及对教育教学管理的指导意义

上述过程得到学生特征分析中的成绩指标(S)、消费指标(C)和借阅指标(B),如表2所示,根据不同阈值设定优势特征和弱势特征,学生群1在SCB的属性大于阈值则定义为优势特征,学生群3在SCB的属性小于阈值,则定义为劣势特征。

表2 学生群体特征描述表

每个群体都有不同的表现特征,总结表2中的聚类结果,将所有群体的优劣特征定义四个等级的类别:重要保持、重点发展、重点考察、重点监督。

重要保持:这类医学生的学习成绩优异,学习能力及学习主观能动性强,对专业知识和本学科知识的把握能力较强。因此,对于这类医学生需重点培养和提高学生“思学做”三位一体的能力,既要加强医学理论和科学研究的创新性培养,又要注重医学实践技术的动手操作能力,培养医学生发现问题、主动思考的能力,并将所学的医学理论与实际操作相结合。

重点发展:这类医学生成绩良好,但自主学习意识不强,是能够通过积极正向引导而提高学习积极性的学生群体,具有很强的潜力价值。要知道,此类医学生是具有较强的学习和实际操作能力的,只是在本专业的学习兴趣上势头不足。对于这类学生,教学教育一定要注重对方式方法的研究,将重点放在兴趣培养等主观能动性激励上,只有切实提高此类医学生的学习积极性,才能帮助此类医学生在专业上有所进步。

重点考察:这类医学生成绩徘徊在及格边缘,只能基本掌握专业内容,对专业知识兴趣不大,可以说是既没有良好的学习习惯,也没有想要钻研医学的精神。对这类医学生群体首先要做的是培养良好的学习习惯,得让他们先“坐”下来、“静”下来,必要的时候,需要教育工作者用“外力”来推动此类医学生学习,其次才是通过养成良好的学习习惯,逐步引导其对医学的兴趣和学习热情,只有这样才能针对性地解决此类医学生的问题。

重点监督:这类医学生成绩较差,没有自主学习意识,甚至对本专业知识根本不感兴趣。针对这类医学生群体不能把目光只局限在知识学习上,要透过现象发现此类问题的本质,即教育工作者需要从多个角度、多个方面来考虑,包括学生的心理因素情况、学生的身体情况、兴趣的引导情况、自身主观能动性情况等,必要时可以考虑转换专业。

4 结语

本文通过对医学院校学生的多维数据挖掘分析,将数据信息化手段引入高校教育教学,既保证了数据分析的科学性,又通过模型建设为多元化的本科医学生数据评价提供了新的思路。同时,也为学校个性化教育的建立实施提供了理论基础和数据支撑,帮助学校做出正确决策或调整策略,进一步深入学校教育教学管理和教育业务信息系统信息化建设,不断提升学校数据信息化理念,着力解决机制不完善、内容单一等漏洞,得出一些可以推广的理念和经验[7-8]。

猜你喜欢
医学院校本科生医学生
微课教学模式在医学院校健美操课程中的实践研究
医学院校就业指导课教学现状及对策研究
能为与应为:从本科生成绩单看绩点制的功能
云南省某医学院校学生健康素养调查与分析
One Heath视角下昆明市高年级本科生抗生素认知与行为
医学生科研能力培养中人文精神教育策略的思考
论中职医学生信息素养的培养
医学院校大学生网络成瘾调查及干预对策研究
以医史学史料为载体提高医学生人文素质
“Without Contraries is No Progression”: Contraries in William Blake’s “The Sick Rose”