董 婧,李 丽
(曲靖师范学院信息工程学院,曲靖 655011)
高等教育信息化系统中积累的数据量日益增多,而高校管理人员往往缺乏数据分析意识以及有效的信息处理手段,导致在选择资源时无法得到有效、优质的信息,一些有用的潜在信息得不到发掘利用,出现“信息孤岛”的现象。数据挖掘与数据分析技术的日益成熟为高校管理工作的开展提供了新的机遇,也带来了新挑战。越来越多的高校开始关注大数据的科研价值,有效挖掘教育大数据的潜在信息,并为高校和受教育者提供科学决策,是高校教育发展的现实需求和未来趋势。大数据对教学状态数据以及教学质量监控提供了新路径,实现了“智慧”高等教育教学内容创新研究、“智慧”高校管理、“智慧”人才培养和“智慧”评价。
科学评价高校现存专业办学质量和投入产出比可以为管理和决策者提供科学依据和数据支持,推进教育决策科学化。已有研究多是注重对考核模型的研究,忽视了真实数据的类型多样性和海量性,数据指标不够细致,缺乏有效性判定。本文依据云南省二本院校毕业生就业与培养质量调查问卷与年度目标责任制考核大数据,利用因子分析、相关分析和生存分析等统计学方法分析了二级学院各专业的生存现状和年度学校目标管理责任制考核影响因素。最后根据研究结果发现现存问题并为高校管理者决策时提供科学依据,实现“智慧”高校管理。
对高校教育大数据的深层次挖掘与利用离不开数据挖掘技术、统计学和信息学。本研究利用概率论建立数学模型,收集曲靖师范学院教育教学大数据,经过数据录入、清洗等预处理工作后,进行量化分析和总结,做出推断和预测,为相关决策提供依据和参考。具体用到的有因子分析、相关分析和生存分析。因子分析研究高校目标责任制考核多个指标内部相关的依赖关系,把具有错综复杂关系的变量归结为少数几个综合因子,便于研究其与考核结果的相关关系;相关分析研究高校目标责任制考核等级与主要考核指标因子间的依存关系,对具有依存关系的现象探讨其相关方向以及相关程度,并以相关系数作为统计指标来说明相关关系密切程度;生存分析主要研究生存率曲线的变动趋势,生存过程影响因素分析及结局预测,本研究利用生存分析客观评价二级学院下属各专业人才培养质量,预测专业未来生存情况。
根据各学院毕业生填写的《曲靖师范学院毕业生就业与培养质量调查问卷》(2017届和2018届),收到6300余份有效调查问卷,包含了个人信息、就业情况(就业毕业生填写)、升学情况(升学毕业生填写)、自主创业情况(自主创业毕业生填写)、未就业情况(“待就业”和“其他暂不就业”毕业生填写)、教育培养情况(所有毕业生均填写)、对母校的评价共七个部分的内容,对学校的人才培养、就业工作以及学校下一步改革和发展有重要意义。十四个二级学院也都据此发布了2017届和2018届《学生就业质量年度报告》,根据以上所有大数据信息,进行了各学院各专业的生存分析。
2018年度目标管理责任制考核数据来源于曲靖师范学院目标管理责任制网络管理平台。各二级学院通过目标管理责任制考核系统提交的考核数据,数据类型多样,包括了结构化、半结构化和非结构化数据格式,具体涵盖了文本文件、图形图像、视频等多媒体信息,数据量巨大。考核主要包括年度工作任务、基础管理工作、特色发展目标、学生测评得分四项基本内容。其中特色发展目标指对增强学校核心竞争力具有重要影响的工作,包括教学与学生发展、学科建设、科学研究、师资队伍建设、服务地方、国际交流与合作6个一级指标和若干二级指标和三级指标。
生存分析基于曲靖师范学院毕业生就业与培养质量调查问卷项目中抽取的专业名称、毕业生对薪酬待遇满意度、毕业生对学校人才培养工作满意度、毕业生签约单位满意度、毕业生签约单位与期望值匹配度、毕业生对就业服务工作满意度等信息设定因子,统计了各等级满意度的人数,其中满意度分为三个等级:不满意、满意和很满意(见表1)。根据以上信息建立有效的专业满意度模型,分析了十四个二级学院的所有各专业的生存情况,快速准确地了解学生对各个专业的满意度情况,下面列举了专业总体差异相对显著的学院进行分析。
表1 生存分析中满意度因子等级量化标准
通过对各学院各专业进行生存分析,研究发现数学与统计学院三个专业的总体显著性值为0.002,说明三个专业生存曲线之间的差异非常显著,而数学与应用数学专业和信息与计算科学专业差异最显著,显著性值达到0.001。该学院的数学与应用数学专业整体满意度最高,是数学与统计学院的王牌专业,而信息与计算科学专业累积生存函数下降最快,满意度最低。信息工程学院三个专业的总体显著性值为0.195,说明三个专业生存曲线之间的总体差异不是很显著,计算机科学与技术专业整体满意度最高,是该学院的王牌专业,而信息管理与信息系统专业累积生存函数下降最快,满意度最低。经济与管理学院四个专业的总体显著性值为0.222,说明四个专业生存曲线之间的总体差异不是很显著。会计学专业整体满意度最高,是该学院的王牌专业,而市场营销专业累积生存函数下降最快,它与会计学专业显著性值为0.072,差异最显著,满意度最低。音乐舞蹈学院四个专业的总体显著性值为0.424,说明四个专业生存曲线之间的总体差异基本不显著,四个专业的发展比较均衡,但总体而言航空服务专业整体满意度最高。学校和相关二级学院应高度重视整体满意度低的专业生存问题,从人才培养方案、教学大纲、教师教学、学生就业等各个方面进行全面监控和改革,改善现存的问题。
图1 学院各专业累积生存函数图
目标管理责任制考核围绕学校年度和阶段性重点工作、发展的关键性指标确定目标考核体系,根据制定的考核指标和各教学单位的完成情况,本研究选取了年度工作任务、基础管理工作、国家级省级教学改革与教学质量工程项目、国家级省级职业资格证书、国家级省级学科专业竞赛获奖、国家级省部级项目、核心期刊论文、学科建设、师资队伍建设、服务地方、国际交流与合作、学生测评得分十二个考核因素作为自变量,各教学单位考核等级结果作为因变量,研究各考核因素与考核结果的相关关系、相关程度以及贡献强度,一方面可以分析各教学单位根据既定的考核目标的完成情况以及特色目标发展情况,另一方面也检测了考核结果是否达到了学校的考核目的,是否实现了学校年度和阶段性重点工作、发展的关键性指标。
提取方法:主成分分析法。
首先使用因子分析法实现降维,即把多个变量化为少数几个综合变量来考察原变量间的联系与区别。通过变量共同度表和主成分表(见表2)可以看出,按照特征根从大到小的次序排序,第一主成分即国家级省级学科专业竞赛获奖,特征根为3.641,方差贡献率为36.41%;第二主成分即国际交流与合作,特征根为1.703,方差贡献率为17.03%;第三主成分即国家级省部级项目,特征根为1.473,方差贡献率为14.73%;第四主成分即国家级省级教学改革与教学质量工程项目,特征根为1.26,方差贡献率为12.60%,前四个因子的方差累积贡献率为80.773%,最终选择前七个因子作为主成分来分析其对考核结果的影响。
表2 变量共同度表和主成分表
通过考核结果与主影响因子的相关关系研究可以得到高校的年度任务执行情况,使用相关分析中的距离分析方法来分析以上选择的七个因子与考核结果之间的相关程度,结果如表3所示。
表3 近似性矩阵
通过近似矩阵可以观察到变量之间的距离关系的强弱,其中考核结果与国家级省级学科专业竞赛获奖之间的距离相关系数为0.664,说明这两个变量之间的距离关系很强,国家级省级学科专业竞赛获奖变量对考核结果的贡献程度最大;其次,国际交流合作与考核结果之间的距离相关系数为0.625,对考核结果的贡献程度排在第二位,主要体现在外国语学院52.7%的考核分数都来源于此项考核指标,而其他学院此项指标的得分普遍很低;再者是国家级省部级项目,与考核结果之间的距离相关系数为0.429,对考核结果的贡献程度排在第三位;然后是学生测评得分,与考核结果之间的距离相关系数为0.398,对考核结果的贡献程度排在第四位;教师发表核心期刊论文因素对考核结果的贡献程度排在第五位;而国家级省级教学改革与教学质量工程项目和学生取得国家级省级职业资格证书两个变量与考核结果的距离相关系数最小,分别为0.074和0.04,说明他们的距离相关强度最弱,对考核结果的贡献程度非常小,几乎不起作用。
从对2018年度二级学院目标管理责任制考核数据的影响因素分析可以看出,对考核结果贡献程度最大的五个变量依次是国家级省级学科专业竞赛获奖、国际交流合作、国家级省部级项目、学生测评得分、教师发表核心期刊论文,由此可以看出2018年度二级学院工作重心普遍在于组织学生参加各种学科专业竞赛,鼓励教师进行科学研究,努力提升学校教育国际化水平。
针对高校信息化系统的日趋完善与数据量呈几何级增加,研究选取了曲靖师范学院毕业生就业与培养质量调查问卷与年度目标责任制考核大数据,经过数据预处理后,利用因子分析、相关分析和生存分析等统计学方法分析了二级学院各专业的生存现状和2018年度学校目标管理责任制考核影响因素。研究发现多数二级学院各专业间的总体显著性值差异不是很显著,但是诸如数学与统计学院的信息与计算科学专业累积生存函数下降最快,满意度最低,应高度重视整体满意度低的专业生存问题,从各个方面进行全面监控和改革,改善现存的问题,实现“智慧”人才培养。此外,2018年度二级学院工作重心普遍在于组织学生参加各种学科专业竞赛,鼓励教师进行科学研究,努力提升学校教育国际化水平。学校决策层根据该考核结果,结合年初所制定的年度任务与目标,可以分析所制定考核方案的合理性,实现“智慧”高校管理。