高职院校人才培养工作状态数据采集平台建设的思考*

2012-01-29 13:56吉国庆
职业教育研究 2012年9期
关键词:数据仓库数据挖掘关联

吉国庆

(常州工程职业技术学院 江苏 常州 213164)

高职院校人才培养工作状态数据采集平台建设的思考*

吉国庆

(常州工程职业技术学院 江苏 常州 213164)

“高等职业院校人才培养工作状态数据采集平台”是高职评估新方案的重要组成部分,也是其特色和亮点。高职院校应充分认识该数据采集平台的意义和深刻内涵,切实做好数据采集(建设)和数据分析(使用)工作。应利用好数据采集平台来完善教学质量保障体系,促进教学管理制度化、规范化和标准化,从而提升管理水平,提高管理效益,深化内涵建设,使高职院校逐步从规范管理向知识管理方向迈进。

高职院校;人才培养;工作状态;数据采集平台;建设

为促进高等职业院校加强内涵建设,深化校企合作、工学结合的人才培养模式,推动教育行政部门完善对高等职业院校的宏观管理,逐步形成以院校为核心、教育行政部门为引导、社会参与的教学质量保障体系,促进我国高等职业教育持续、稳定、健康发展,办出有中国特色的高等职业教育,教育部颁发了《关于印发〈高等职业院校人才培养工作评估方案〉的通知》,并于2008年开始实施。评估新方案的一个重要特色是“高等职业院校人才培养工作状态数据采集平台”(以下简称“数据平台”)的建立和运行。各高职院校的第一次数据采集结果是2008年10月30日前上报教育部的。

对于高职院校而言,数据平台的重要工作有两项:一是数据采集(建设),二是数据分析(使用)。建设是基础,使用是根本,两者必须有效结合起来,才可能通过数据平台来完善教学质量保障体系,促进教学管理的“三化”(即制度化、规范化、标准化)建设,从而提升高职院校的管理水平,提高管理效益,深化内涵建设,逐步从规范管理向知识管理方向迈进。

数据平台的数据采集(建设)工作

加强数据平台的机构管理 高职院校要高度重视数据平台建设工作,不断完善管理制度,成立数据平台建设管理机构,建立数据采集管理制度,明确数据采集责任人。数据平台管理机构的成员必须要熟练掌握平台的操作管理和运行,还要做好数据采集的前期准备工作以及培训工作,定期对各二级部门数据采集负责人以及具体操作人员进行培训和指导。

加强数据平台的规范化、常态化管理 从教育部反馈的数据采集工作情况分析来看,很多高职院校的状态数据采集出现数据格式不合规范、忽略数据表项单位、关联数据不一致等问题,造成数据采集结果严重失真,既不利于教育行政部门了解院校办学情况,也给院校自身管理提供了错误的参考信息。所以,高职院校必须通过建立健全数据采集的制度规范,包括建立院系两级状态数据平台建设管理办法、状态数据采集工作流程、工作办法、数据平台日常管理与维护、状态数据审核等。

建设技术队伍予以保障 数据平台的有效运行有两个关键点:一是正确掌握字段的含义,解决数据的归类问题,要将数据正确归入某个字段并放在相应的地方。对字段的准确理解,是保证数据准确的重要环节。二是正确掌握操作技术,解决数据的输入和输出问题。要将数据正确地输入到某个字段,顺利地导出,使平台能正常运行,正确生成二次、三次统计数据。因此,了解采集平台的结构,并在此基础上准确把握字段的含义和运行技术是十分重要的。所以,要从根本上改变这种状况,高职院校必须加快培养一支既懂技术又熟悉数据操作的技术队伍,为数据平台建设提供支持和保障。

数据平台的数据分析(使用)工作

数据平台具有三大功能,即统计汇总,反映现状;管理监控,促进学校规范化;分析开发,帮助决策,把有价值的数据转化成知识。基于知识管理理念的数据平台的功能不仅仅是对数据进行统计汇总以反映教学运行现状,更重要的是通过数据分析,把有价值的数据转化成对院校管理监控有用的信息和知识,来完善高职院校教学质量保障体系,使院校逐步从规范管理向知识管理方向迈进。所以,有效开展数据分析(使用)工作对于许多高职院校而言势在必行。

数据平台的数据分析 (使用)工作方法 数据平台是对Excel VBA的二次开发利用,它具有数据采集、汇总分析、数据导入和数据导出等功能。但目前数据平台没有针对高职院校的数据分析窗口。高职院校上报的单机版数据平台其实就是一个由海量数据构成的数据仓库,在数据仓库里存放的大多数是绝对数据,主要为自然数据。高职院校要对自然数据进行分析,就要找到适合的分析方法,聚合和关联数据仓库中的各类绝对数据,生成有用的相对数据。由于数据平台具备数据仓库的特征,可以采用与其匹配的数据挖掘方法。数据挖掘的基础是有可供使用的数据仓库。这几年数据平台的版本一直在更新升级,高职院校采集的字段越来越多,汇总后的数据量可以达到数十万条。由于采集字段的增加,数据和数据之间的关联度越发复杂,使得数据平台的数据仓库特征愈发明显,从而让数据挖掘理论和方法用于数据平台进行数据分析成为了可能。

如何使用数据挖掘理论对数据平台进行数据分析 数据挖掘的具体分析方法包括分类、估计、预测、相关性分组或关联规则、聚类、描述和可视化、复杂数据类型挖掘等等。这些方法可以广泛运用到数据平台的数据分析中,其中利用关联规则和聚类两种理论比较简单可行。

1.利用数据关联规则理论进行数据平台的数据分析。数据关联规则是数据仓库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据仓库中隐藏的关联网。数据平台中的数据存在是一种结构化数据组织形式,利用其依附的数据模型可能刻画了数据间的关联(也就是单机版中的状态数据汇总)。但是数据之间的关联是复杂的,除了依附在数据模型中的关联,绝大部分是隐藏的。关联规则挖掘的目的就是找出隐藏的关联信息。对于高职院校而言,使用数据关联规则关键在于,能否在数据平台确定核心要素,根据核心要素所反映的人才培养工作状态,分析其存在的问题,围绕核心要素到数据平台挖掘与其关联的数据进行分析。例如,我们把核心要素确定为产学合作,如果利用平台中“4.2校外实习实训基地”、“7.5产学合作”两个单表进行简单数据分析,无法判断学院产学合作的深度,应当把上述两个单表和下述“6.3.1校外兼职教师基本情况表”、“9.3社会捐赠情况表”、“9.4就业单位与联系人表”、“9.5应届毕业生信息表”等一起进行数据挖掘,把分散于多个单表中的关联数据集中起来分析,就可以看出高职院校的产学合作深度。比如,把“企业提供兼职教师数”和“6.3.1校外兼职教师基本情况表”进行数据关联;“对学校设备捐赠总额”和“9.3社会捐赠情况表”进行数据关联等等。不同的数据,我们只要能够寻找出隐藏的关联,就能产生新的有效信息。

2.利用聚类理论进行数据平台的数据分析。聚类分析是数据挖掘中的重要方法之一,就是将集中的数据进行分组,使得每一组内的数据尽可能相似而不同组间的数据尽可能不同。在对数据平台中某一时段的工作状态数据或系部之间差异进行分析时,就可以用聚类分析。例如,用当年填报的状态数据与历年来填报的状态数据进行聚类分析,看学院的发展趋势(如生师比、生源数、专业建设情况等的变化)。通过对“生师比”这个项目进行聚类分析,可以反映出学院的招生规模是动态的还是趋于稳定的,学院的师资建设是否能够跟上学院的发展,学院的生师比是否达标等等。获得聚类分析得出的信息后,学院可以及时调整人才培养工作重心。学院也可对各系部、各专业进行聚类分析,如系部教师构成状况、系部教师的科研水平、系部产学合作等等。单纯某个系部的数据反映不出太多有价值的信息,但把各系的相关数据进行聚类分析就可以发现各系部、各专业发展的不平衡性。实践表明,科学使用数据挖掘理论中的方法原则,充分挖掘数据平台中的各类数据,使之有效地转化成各种有用信息,能更好地服务于高职院校人才培养工作。

总之,高职院校不仅要把数据平台建设好,更要把数据平台使用好,建立健全定期分析制度,充分发挥数据平台对高职院校工作状态反映和监控作用,把数据平台建设与学院决策和发展联系起来,在使用中进一步优化其智能化程度,体现知识管理的特征,形成自我诊断、自我发展的良性发展长效机制,引导高职院校逐步向知识管理方向迈进。

[1]吕一中,李晓芳.通过状态数据预审增强评估考察的针对性与有效性[C].高等职业院校人才培养工作评估研究课题组.高等职业院校人才培养工作评估解读与问答.北京:高等教育出版社,2009:201-204.

[2]何锡涛.高职评估数据采集平台的建设与使用[J].高教发展与评估,2009,25(3):89-112.

[3]方开泰,潘恩沛.聚类分析[M].北京:地质出版社,1983.

[4]尚学明.试论高等职业院校人才培养工作状态数据采集平台的性质与功能[J].山东商业职业技术学院学报,2008(4).

吉国庆(1974—),男,常州工程职业技术学院工程师,研究方向为教育信息化。

*本文系常州工程职业技术学院2010年度院级科研项目《状态数据采集平台系统解析与规范化管理的研究》(项目编号:KJY2010-02)的阶段性研究成果

G710

A

1672-5727(2012)09-0169-02

猜你喜欢
数据仓库数据挖掘关联
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
探讨人工智能与数据挖掘发展趋势
基于数据仓库的数据倾斜解决方案研究
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
“一带一路”递进,关联民生更紧
基于数据仓库的住房城乡建设信息系统整合研究
奇趣搭配
智趣
探析电力系统调度中数据仓库技术的应用
数据复用在存储数据仓库中的运用