张秀玲
(长春金融高等专科学校现代教育中心 吉林 长春 130012)
伴随着科技的不断发展,信息技术在各行业领域中的应用变得更加广泛。在这一背景下,传统的数据收集和统计模式已经无法满足相关行业能力的需求,特别是在数字化校园技术中,针对数据信息的挖掘分析急需更加先进的技术,因此对于相关领域研究人员而言,了解数据挖掘技术和数字化校园技术的相关理论,认识在数字化校园建设中对数据挖掘技术的具体使用需求,探索数字挖掘技术在数字化校园建设中的具体使用路径,是其必须要关注的重要课题。
所谓数据挖掘技术,一般是指依靠相关方式从相关实际应用数据中把部分信息最大化地进行提取利用和加工处理,一般来说,这些数据是提取者之前并未了解,但是却知晓这些数据具有一定的利用价值,在实际使用数据挖掘技术的过程中,可以采用多种数据挖掘技术,例如分析分类技术、序列模式分析技术、关联分析技术等,但是在针对上述技术进行选择的过程中,应当充分基于现实情况,依靠数据挖掘,能够为相关人员的决策行为带来全方位的数据信息支持[1]。
所谓数字化校园,指的是在互联网技术背景下,使用所有可以有效利用的资源和设备,实现对教学资源、教学环境、教学活动等内容的整体性全方位管理。把当前的数字化信息技术和现代校园管理工作进行融合,能够有效推进现代教育事业的发展,在这一大背景下,学校的相关配置能够得到有效的优化,也能够有效推进现代学校的建设和进步。值得注意的是,数据挖掘技术在应用过程中涉及到多个环节,如数据清理、数据变换、数据决策树等,这些都是数据挖掘技术在使用过程中的重要算法,对不同级别的信息实现合理优化分类,确定当中存在的具有较高使用价值的数据信息[2]。在这一背景下,可以使用多种类型的数据挖掘工具,例如Clementine、MineSet。在这些技术当中,Clementine技术是把不同种类的数据挖掘技术进行整合,例如关联规则技术、神经网络技术等,让这些技术同时出现于对应的可视化图形界面之中,在使用Clementine技术的情况下,数据模型能够在很短的时间中进行快速建立,帮助相关人员对数据进行有效分析,为其提供合理化建议[3]。
在数字化校园系统当中,认识管理系统指的是基于教师为核心,对教师的心理、治理、能力、绩效等因素以及彼此之间的关联性进行分析,从而建立相关的人才培养机制,实现学校的正规化管理。因此在使用数据挖掘技术具体操作的过程中,第一步从数据库中获得教师的性别、年龄、工龄、学历、职称、发表论文等信息;第二步是使用Apriori算法,在数据立方体上搜索频繁项集;第三步得出在Minsup=16%时,{副教授、硕士、核心}support为16%,作为频繁项集,在进行二步挖掘之后,获得6个关联规则,运算其置信度,依次为:
Conf{副教授/硕士 核心}=37%,Conf{硕士/副教授 核心}=47%,
Conf{核心/副教授 硕士}=42%,Conf{副教授 硕士/核心}=67%,
Conf{副教授 核心/硕士}=70%,Conf{硕士 核心/副教授}=67%
通过以上信息运算可以发现,教师群体中职称为副教授,学历为硕士同时发表论文等级为核心的教书数量占据人数总量的16%。依靠以上数据分析,能够帮助学校领导作出相关决策,提升学校教师的整体层次。
一般情况下,校园教务系统内容主要涉及有评价、选课、成绩上交、课程设置、考场布置等功能,在教务系统中,含有大量的学生成绩信息、学生基础信息、课程信息等内容,基于上述数据的关联性,教务人员可以从这些数据中选取学生成绩和个人信息,使用C4.5算法来对学生知识的掌握情况进行了解,探寻彼此之间所存在的关系,并有针对性地制定教学内容,提升学生们的学习热情。
数据挖掘算法常见有:K-means算法、Apriori算法、PageRank算法,数据挖掘技术的创新应用路径主要可以分成明确目标、数据准备、数据处理以及数据分析(可视化)这些过程[4],如图1所示。
图1 数字化校园建设中对数据挖掘技术的应用路径
确定目标是数字化校园建设中使用数据挖掘技术的起源,因此该阶段工作具有十分重要的意义。在数字化校园建设过程中,其存储的数据信息资源与学校的教师、学生等高度关联,因此,使用数据挖掘技术必须要基于学生和教师资源为基础,以协调教师和学生之间的关系为目标,有效推进校园教学活动开展。
在使用数据挖掘技术的过程中,需要开展数据的搜集和描述工作。一般情况下,数据准备涉及两个程序,依次为数据选取与数据预处理[5]。笔者以所在学校为案例,其数据选取工作包含有学生家庭状况、阅读消费状况、月度图书借阅情况、社会实践活动参与情况等,以上均为数据选取的内容。针对某一学生来说,在数据挖掘过程中,需要依靠校园一卡通系统查阅学生的阅读伙食消费状况,依靠对学生数据的各个字库中开展数据挖掘,之后把这些数据开展深层加工处理。学校还需要将学生在文字表现中所呈现的不同点开展量化处理,之后把全班学生分成若干个级别。学校使用了1~5级来进行表示,其中处在1级别的学生为综合素质最强,之后以此类推。
把以上数据作为基础,在本次研究活动中,把全校学生级别作为类型标识属性,把家庭背景、月度消费、必修课平均成绩、图书阅读量、社会实践活动等作为属性集合,之后依靠构建数学模型,计算出每一种属性的增益,如表1所示。
表1 学生数据表
依靠对以上五项内容的增益情况开展对比,并描绘出相关的数据表以后,能够让相关人员对学校中相关学生的等级有较为直接的认识和了解。学校可以通过数据挖掘技术得出相关结论。第一,不难发现,在专业课中表现的好坏是衡量学生级别的重要原因之一;第二,图书馆借书次数较为频繁,不难发现本校学生都比较重视学习,但是积极参加社会活动的学生,其综合素质评价并不一定会很高;第三,月度消费额较高的学生都较为重视学习以外方面的内容,如社会实践活动等,但是在学业上的精力投入会略显不足;第四,并非是来自贫困家庭的学生都是优秀学生,也不是家庭情况较为优越的学生都是后进生,以此可以衡量大学生是否优秀的关键是观察其个人努力的状况等,综合以上信息,经过全面的数据挖掘以后,能够把大量复杂的信息在进行处理后变得直观明了。
综上所述,数据挖掘技术在在数字化校园建设中的应用,能够有效地将大量的数字信息提炼出有价值的信息,不仅有利于提高学校的管理效率,更有利于加快数字化校园的建设,同时,对学校的长远发展还具有重要意义。