数据挖掘技术在高校思想政治教育中的运用

2018-06-22 02:59关翠玲
微型电脑应用 2018年6期
关键词:数据挖掘聚类辅导员

关翠玲

(陕西财经职业技术学院, 咸阳 712000)

0 引言

随着我国信息化建设进程的不断推进,许多高校都已经建立起各类基于业务的数据库用于日常管理,作为应用广泛的新兴学科,数据挖掘技术在高校教育信息化中的应用前景较好,为高校的管理、建设、服务过程的绝学提供了全新而科学的分析途径。在新形势下,高校学生思政管理工作面临着巨大挑战,所以适时不断调整思想工作的途径,加强先进经验的交流,可以有效的提高高校思政工作的效果,对此,本文借助数据挖掘技术进行尝试,通过聚类结果分析,所挖掘到的信息对学生工作具有一定的参考价值。

1 数据挖掘技术在思想政治教育中的实际应用

1.1 思想政治教育管理

随着高等教育的不断发展与普及,给高校思想政治教育带来一定挑战,在通常情况下,学校相关部门会对教育管理工作进行数据收集,但是目前对这些数据的处理还处于底层的查找与简单分析阶段,不能够挖掘出其中的价值。为了更加具体的了解思政教育工作者的工作情况,学校每学期会组织学生对辅导员的工作进行评议,填写辅导员“工作考核量化表”如何从中提取有价值的信息,对高校思想政治教育有非常重要的意义[1]。

1.2 解决方案

数据挖掘属于一个方案得到肯定的过程,是数据分析研究的深层系手段,将数据挖掘技术运用到辅导员工作考核中具有特别意义。例如:通过数据挖掘技术手段分析“辅导员工作考核量化表”中的数据,可以了解“某所高校思政管理整体水平”,在管理中“哪些方面做得好,哪些方面做得不到位”等相关问题。通过这些结论进一步完善高校思政教育管理。本文提出运用聚类分析的数据挖掘技术对辅导员的工作成效数据进行分析,将大批的数据转换为聚类结果,从而更好的对数据加以利用。数据挖掘过程,如图1所示。

图1 数据挖掘过程

步骤1:明确数据挖掘的对象和主要目的,通过数据挖掘虽然不能预测最终结果,但是可以对所研究的问题进行预测,所以挖掘目标的确定是数据挖掘的关键步骤[2]。

步骤2:数据采集,该过程的任务比较繁重,并且需要时间比较多。在品势的教育管理中,要认真的收集数据信息,一部分数据是直接可以拿到的,一部分数据则需要通过调研才能获得。

步骤3:数据预处理,将收集到的数据转变成可分析的数据模型,该模型是根据算法来准备的,不同的算法对数据模型的要求是不一样的。

步骤4:数据类聚挖掘,通过类聚挖掘能够将数据模型划分为相似的多个组,该过程主要为数据模型的输入过程以及聚类算法的选择进行实现。

步骤5:聚类结果分析,该过程主要分析研究聚类数据挖掘之后得到的多个组属性。

步骤6:知识应用,将研究所得的信息集成到辅导员的管理教育环节中,思政工作者通过该结论促进教学管理,形成良好的管理方针[3]。

2 数据挖掘技术在思政教育工作中具体方案实施

2.1 确定数据挖掘对象

收集并整理某大学2017年“辅导员工作考核量化表”,整理其中关于辅导员教育管理的120张考核量化表,尝试解答高校思政教育中存在的问题,经过对有价值数据的挖掘,得出结论为教学管理带来有效的指导价值。

2.2 数据采集

从学校学生工作处,搜集2017年度“辅导员工作考核量化表”。

2.3 数据预处理

“辅导员工作考核量化表”要求辅导员在“坚持标准,奖惩分明,客观公正的对待每一位学生。”“认真做好勤工助学活动。”“正确分析学生的思想动态”等几个指标项目中,根据辅导员的实际工作表现,划分为“优秀、良好、合格、较差、差”五等类型等级。最终获得比较完整的考核记录工作考核量化表117张。

2.4数据转换

在工作考核量化表中考核等级的项目共15项,如何将数据合成到一个聚类分析的模式中非常关键,按照“管理态度”“管理能力”“管理方法”“管理效果”四方面属性来对工作考核量化表中的数据进行重新组合:其中

“管理态度”=(坚持标准+与同学之间感情融洽+言谈得体+办事客观)/4

“管理能力”=(准确掌握贫困生情况+准确掌握特殊群体+严格教育与查出违纪学生+胜任工作+组织学生做好评优工作)/5

“管理方法”=(每周3次以上探入班级宿舍+积极参加检查学生早操+学生奖学金发放到位+有准备的与学生谈话+检查宿舍卫生)/5

“管理效果”=(积极参加团活班会+课下了解学生思想状况+评论与建议)/3

通过以上处理,可以将工作考核量化表关系到的十五个考评等级统一演化到四个属性中。然后针对117份数据样本信息的4个属性采取聚类挖掘的方法进行研究。通过样本预处理得到数据样本,如表1所示。

表1 聚类的数据样本

2.5 数据聚类挖掘

数据的聚类挖掘采用划分方法中的经典算法K均值以及K中心点算法,其中K代表类别个数(K=3),主要挖掘思路为:将n个对象划分为K个簇,使同一簇中的对象具有较高的相似度,K均值算法主要是使用簇中对象的平均值作为参考值。K均值算法的复杂度可以通过进一步计算得出O(nkt),n代表簇的数量,t代表反复迭代的次数,在一般情况下,k与t都会远小于n。针对所要分析的数据样本,四类属性都是通过数据转换而得到的,所要的数据都是算术平均值,所以产生孤立点的可能性非常小,最终选用K均值的算法来运用于本研究的数据聚类中。

一般情况下,K均值算法当局部取得最优解时会终止,所以一定要对数据样本进行改进,考察数据样本信息的综合比例分布情况,采取进一步措施对K均值算法进行改进得到三个等级样本,代表三个等级样本数据如表2所示。

表2 三个样本代表数据

3 数据挖掘算法流程

3.1 算法实现的流程

算法实现流程,如图2所示。

在K均值算法中,函数LoadPatterns的作用主要是将数据信息装载到程序中,目的是为了从数据库文件中读取相关信息,并且将文件中的数据转换成样本数组。函数RunKMeans()的作用是算法的主程序,将所有对象同簇中心距离进行对比,然后将对象划分到最近的簇中。函数ShowCenters()代表算法所描述的聚类中心。函数ShowClusters()表示样本的标识符号[4]。

3.2 主控程序RunKMeans()的调用

主控程序调用结构,如图3所示。

图2 数据挖掘算法流程图

图3 主控程序调用结构图

图3中函数EucNom(pat,1)目的是算出样本和质心的平方差,从而找到最短距离的簇,然后运用DistributeSamples()将所有对象划分到最近的簇当中,算出所有簇中对象的平均值,作为新的质心,如果所有新的质心不发生改变,则聚类结束。

4 聚类结果分析

本文运用K均值算法对120个数据通过数据转换得到的样本数据进行分析,对管理态度、管理能力、管理方法、管理效果4个属性进行数据挖掘聚类,设置初始k值为3,最终挖掘到的结果,如表3所示。

表3 簇样本数据

根据以上结果,每个簇所包括的数据样本最后的比例分布范围如下:

簇1(较好)共计36个样本,删除定义样本,剩余35个数据样本,占35/117=30%。

簇2(中等)共计74个样本,删除一个标准样本,剩余73个数据样本,占73/117=62%。

簇3(较差)共计10个样本,删除一个标准样本,剩余9个数据样本,占9/117=8%

“管理态度”=0.77*30%+0.61*62%+0.31*8%=0.634

“管理能力”=0.77*30%+0.57*62%+0.31*8%=0.6092

“管理方法”=0.74*30%+0.54*62%+0.28*8%=0.5792

“管理效果”=0.79*30%+0.56*62%+0.30*8%=0.6082

从总体得分由高到低排序为:管理态度、管理能力、管理效果、管理方法。总体上证明该校的思政管理水平属于中等偏上的。

4 总结

数据挖掘,主要是通过对原始数据的分析、提炼,找到最优价值的信息的过程,属于一类深层次的数据分析方法。将数据挖据技术运用在高校思想政治教育中,有利于对思政教育工作者的多项工作指标进行分析,对其综合能力进行评定,为高校进一步完善思想政治教育管理决策,准确定位人才培养目标,加强教育团队建设提供有效的数据依据。

[1] 刘强珺,丁养斌.基于数据挖掘技术的高校思政教育管理研究[J].电子测试,2015(1):101-103.

[2] 范宸西,韩松洋.思想政治教育在高校内涵式发展中的重新定位[J].中共珠海市委党校珠海市行政学院学报,2015(4):50-54.

[3] 吴小龙,张丽丽.大数据视角下高校思想政治理论教育创新[J].江西理工大学学报,2017(8):20-23.

[4] 李平荣.大数据时代的数据挖掘技术与应用[J].重庆三峡学院学报,2014(5):159.

[5] 舒正渝.浅谈数据挖掘技术及其应用[J].中国西部科技,2010(2):148-150.

猜你喜欢
数据挖掘聚类辅导员
探讨人工智能与数据挖掘发展趋势
1+1我们这样学队章:我们的辅导员
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于K-means聚类的车-地无线通信场强研究
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
以人为本做好辅导员工作
基于改进的遗传算法的模糊聚类算法
一种基于Hadoop的大数据挖掘云服务及应用
高级数据挖掘与应用国际学术会议