瞿华礼,裴云霞
(宣城职业技术学院,安徽 宣城242000)
基于聚类分析的开放教育学生满意度研究
——以宣城广播电视大学为例
瞿华礼,裴云霞
(宣城职业技术学院,安徽 宣城242000)
如今大数据时代,数据挖掘技术的应用进入到了各个领域,这在数据分析方面具有较好的应用价值并能够在获取潜在的知识方面满足使用者。生源是办学单位的生命线,能否为学生提供较好的教学服务和生活服务已经成为影响学校竞争力的决定性因素,文章从学生满意度出发,利用聚类分析技术,找出聚类中心,系统分析了学生在开放教育所提供的各种服务中的满意程度,为学校管理者的管理和决策提供依据。
数据挖掘;聚类;学生满意度
随着科技和网络技术的发展,成人高等教育已经有开放教育、各高校开办的网络教育、成人教育学院等多种模式,加上普通高校的扩招和生源数逐年减少,从而使成人高等教育生源竞争愈演愈烈。作为其中的开放教育面临的市场竞争也越来越大,开放教育的学生作为渴望知识技能的消费者,他们是在办学单位的组织职能中的主体,在这样的大环境下,学生对学校所提供的服务满意与否会对学校的生存与发展产生最直接的影响。
在客户满意度理论的基础上,本文建立学生满意度测评体系,通过测评体系,办学单位可以直接获取学生的需求,知道学生在开放教育消费中的满意与不满意所在,可以从中挖掘出潜在的需求,这将对开放教育的服务质量进行改进,并能同时提高教职员工的服务理念,也可以在专业素质上得到大力的提升,从而保证开放教育的办学质量,也会促进其大力创新并与时俱进,学校管理者可以通过研究学生满意度做出正确决策,进而改进服务体系,使学校的发展呈良性循环态势。
2.1数据挖掘概述
数据挖掘(data mining)是一种从大量、模糊原始的数据中获取隐含的并且有价值的信息[1]。它与传统的数据分析有着根本的区别,它是在没有确定假设的情况下发现潜在的信息和知识,挖掘出的结果是一些不能靠直接观察判断,甚至跟直觉背离的有效实用的信息,并根据挖掘的结果做出相应的决策。数据挖掘是一门具备了描述和预测功能学科的分支,近年来,已经在很多领域进行了成功的应用,例如房地产、电商、保险等行业。
数据挖掘有很多种方法,比如聚类分析、关联规则和分类等[2],本文中笔者运用聚类分析的方法,对采集到反映开放教育的学生满意度的数据进行挖掘。
2.2聚类分析介绍
聚类就是依照事情相关属性,将事物聚集成类,聚类之后,数据将被划分为组,也称为簇,在每一组中,组内的数据相似,而不同组之间的数据尽可能不相似[3]。在实际应用中,我们可以用聚类分析的方法分析市场,描述相应的消费者群体信息,可以有针对性的措施对待不同的消费者人群采用不同的策略而赢得市场,比如,根据一个消费者的网上购买记录,可以挖掘出她的消费类型与消费能力,这样商家可以通过网页推送她可能感兴趣的商品以增加销售量。
通常的聚类方法有快速聚类、分层聚类和两步聚类等[4],本文采用了快速聚类的方法对数据进行分析。
3.1数据采集
根据笔者多年开放教育的工作实践,本研究采用了学生满意度调查问卷,在问卷中,专业班级作为观测分类,一级指标分为3类:管理服务、教学服务和学习环境,其中管理服务中细分为:班主任服务、考务服务和后勤服务;教学服务细分为:面授教学、实践指导和网上教学资源;学习环境细分为校园教室条件、教学设备水平和人文关怀程度,这二项指标分别从软硬件方面全方位涵盖了开放教育办学过程的主要环节,有核心的9个问题,题目的答案分别设置为3个等级:非常满意、满意和不满意,在数据化的过程中,分别为3、2、1来代替。本研究中设计的满意度指标体系如表1所示。
表1 开放教育学生满意度指标
本问卷填写的对象为宣城广播电视大学2015秋季388名本专科毕业生,对象的选择基于毕业生在3年的学习中,对办学单位有着全方位的感受,经历切实具体,反映在问卷上的回答较有说服力。
本研究的数据采用统计软件SPSS13.0按步骤进行分析。
3.2数据清洗
在数据准备的过程中,数据清洗是很有必要的,否则会影响挖掘的效果[5],笔者在数据准备中删掉了漏填严重的数据,这样的数据不能真实地反应事实;删除问卷填写上超出设定答案的样本;最终为有效样本情况,有效样本总量为361份。
将问卷数字化过,在SPSS中创建一个实验数据表,建立实验数据。
4.1分析过程
使用统计分析软件SPSS for windows13.0版中聚类分析中的快速聚类功能处理数据样本,根据聚类分析的步骤,笔者根据研究目标打算将9个指标全部纳入聚类变量,考察各个变量的影响程度,同时确定3个目标分类,即非常满意、满意、不满意,标签观测量选定为专业班级,迭代最大次数设置为10,统计的结果要求显示初始聚类中心、方差分析表和每个观测量的聚类信息,分析结果如表2,3。
表2 最终聚类中心间的距离
表3 最终聚类中心
4.2试验结果分析
从表2最终聚类中心间的距离可以看出,这3类之间的距离都比较远,已经很好地对各条样本做了分类;从最终聚类中心可以看出,在第一类中,各项指标都是处于非常满意的状态,在第二类中,网上教学资源和教学设备水平均为不满意状态,第三类的各项指标处于满意状态;从聚类结果(表3)来看,第一类中有72条有效样本,第二类中有227条样本,第三类中有62条样本,丢失0条,结合最终的聚类中心,可以得出,大多数学生对网上教学资源和教学设备水平都接近于不满意的状态。
通过问卷调查与数据分析,本文展现了开放教育学生满意度的基本因素状态,可以得出基本结论是学生整体满意度较高,满意及以上的比例达到83%,在管理服务方面的满意度是比较高的,可以说明教师的服务是周到有效的,在网上教学资源和教学设备两项中,大多数的学生满意度不高,通过网上体验和实地调查,发现电大在线上有些课程的资料是10年前就已经出现,而且更新的量不大;在优美的校园环境中,机房和多媒体的设备相对陈旧,有一定的损坏程度,导致学生的感受差,从聚类结果的详表中看,不满意的学生的专业班级中计算机类、护理类等对教学设备需求较强的班级学生所占比例较高。
[1]闵超,孙建军.学科交叉研究热点聚类分析[J].图书情报工作,2014,(01):109-116.
[2]韩家炜,等.数据挖掘概念与技术[M].北京:机械工业出版社,2012:316-320.
[3]陈超.基于数据挖掘的个性化学习模式研究[J].电子设计工程,2013,21(12):20.
[4]陈封能,等.数据挖掘导论[M].北京:人民邮电出版社,2011:21-26.
[5]张文彤,邝春伟.SPSS统计分析基础教程[M].北京:高等教育出版社,2015:32-33.
责任编辑:胡德明
Research on Students’Satisfaction Degree of Open Education Based on Clustering Analysis——A Case Study of Xuancheng Radio and Television University
Qu Huali,Pei Yunxia
(Xuancheng Vocational&Technical College,Xuancheng 242000,China)
In the big data era,data mining technology has been applied into various fields,which is of important application value in data analysis and can satisfy users in acquiring potential knowledge.Since students are the lifeline of a school,providing them with good teaching and life services has become a decisive factor affecting the competitiveness of the school.The article,from the perspective of students’degree of satisfaction,finds out the clustering center with cluster analysis technology,and makes a systematic analysis of the students’satisfaction with various services in open education so as to provide evidence for the management and decision-making of the school administrators.
data mining;clustering;students’satisfaction
TP311
A
1672-447X(2016)03-0026-003
2016-01-10
安徽广播电视大学青年教师科研项目(qn15-18)
瞿华礼(1980-),安徽霍邱人,宣城职业技术学院讲师,研究方向为数据挖掘;裴云霞(1981-),安徽宣城人,宣城职业技术学院讲师,研究方向为软件开发。