大数据背景下的上海市中职校报名系统的研究和实践

2015-03-15 05:33裴文俊
微型电脑应用 2015年12期
关键词:中职校大数据

裴文俊



大数据背景下的上海市中职校报名系统的研究和实践

裴文俊

摘要:随着上海市中职校招生工作规范化要求的推进,通过招生报名数据进行政府决策支持的重要性凸显。随着报名考试人数的增加,合理运用大数据技术是一种趋势。根据报名系统现状,从招生报名信息化角度,结合实践应用,对大数据环境下的报名系统开发设计进行了研究和分析。

关键词:大数据;中职校;招生报名系统

0 引言

信息技术的发展提高了人们对大容量数据存储、分析、查询和使用的能力,伴随着物联网和云计算等技术的广泛应用,数据的种类不断扩大,数据的“量”从KB发展到了ZB, 质量不断提高。社会各个领域数据的快速积累,推动了大数据时代的来临,只有对大数据进行全面的利用,才能充分发挥它的技术价值。美国苹果公司为了在硅谷开设店面,也要用大数据工具进行慎重分析后才拍板。可见,数据就是生产资料,弄清了数据就能促进目标又快又好地实现。

2008年起,上海市开展了部分中等职业学校试行自主招收在沪农民工同住子女工作,随着招生学校、招生计划和招生类型的不断扩大和提高。2013年12月上海市人民政府发布了《关于来沪人员随迁子女就读本市各级各类学校的实施意见》,2014年上海市教育委员会明确了中职校招收随迁子女的报名条件,教育行政部门同时希望对非沪籍进城务工人员子女在沪就学的报名信息审查的基础上,科学分析流动人口子女的相关情况后作出教育资源配置的正确决策。原有的仅以采集信息和报名数据为主的报名方式,多依赖于工作者经验和汇总统计下级数据而成。

原有的报名方式不适应决策支持的需要,因此,利用大数据推进招生报名系统建设、开展数据处理和分析,从而提高招生录取工作的管理水平势在必行。基于大数据的数据挖掘,提供准确的决策支持数据为政府决策,对于促进教育公平、社会和谐稳定发展、提升城市整体素质,具有重要的现实意义。

综上所述,大数据技术的发展是教育招生考试发展的重大挑战和机遇,利用大数据改革现在的决策模式,提高随迁子女招生报名的效率,推进中职校招收随迁子女工作的科学性,具有非常重要的现实意义。

1 随迁子女招生报名系统的现状

1.1中职校招收随迁子女报名人数基本情况

上海市中职校实施招收在沪进城务工人员随迁子女,自实施以来的招生计划和报名人数的变化情况,如图1所示:

图1 2008-2013上海市中职校招收随迁子女计划数和报名人数比较单位:人

随着招生计划和报名人数的增长,以每名考生关联1名家长的信息数据,再结合考生照片和证件复印件等佐证材料计算,数据量将成倍增长,这些数据聚合在一起的数据量是非常大的。但目前这些数据还静静地躺在报名数据库中,仅用于日常管理工作,管理者还没有充分发现报名数据资源的利用价值。实际上,通过大数据技术的信息系统,对这些数据的整合、分析和利用,获取有用数据,研究分析事物的相关性和预测事物的发展,结合现实社会中的其他数据,相互补充,提高报名政策制定的有效性和前瞻性是非常有意义的。

1.2中职校招收随迁子女的报名系统情况

上海市中职校招收随迁子女的报名系统经历了从无到有,从本地化到网络化的变迁,如表1所示:

表1 上海市中职校招收随迁子女报名系统变化

可见,上海市中职校招收随迁子女的报名系统还停留在为解决业务工作而设计开发的层面,采用最简单的数据库技术,对招生考试的报名数据进行获取、分析、处理、存储和检索。目前的报名系统并未实现从大量复杂的数据中获取有意义的相关性,并找出规律,指导招生考试的科学管理。

此外,即使有独立的报名系统,还存在与招生考试和录取的其他环节信息不共享,数据重复采集等问题。各时期的报名系统的比较如表2所示:

表2 上海市中职校招收随迁子女报名系统各阶段功能比较

1.3 中职校招收随迁子女的报名系统存在问题

随着招生人数不断增长,异地中高考方案的最终落地和城市发展带来的人口迁移,上海市普通全日制中等职业学校招收在沪进城务工人员随迁子女的报考人数增加,必将是大势所趋。

然而,目前报名系统在大规模的招生考试数据面前,缺乏从数据中获取信息的能力,没有针对指导决策支持而进行的特定应用分析,表面上数据量大,实际上信息含量不高,主要存在以下问题:

(1)信息孤岛现象:报名数据在考务和录取等环节需要与各个系统通过另外接口交换,信息不易共享,形成信息孤岛和信息流失。在数据利用上,各系统相互独立,存在功能重复开发。

(2)数据采集类型单一:目前报名系统仅仅采集姓名、性别、家庭住址和父母姓名职业等文字类型数据,数据种类单一化,与招生考试其他系统的数据标准不统一,数据交换复杂而低效。

(3)后续开发利用欠缺:面对海量的数据,现在的开发技术还停留在简单的统计和报表,没有进行深入挖掘,缺乏深层次的内因分析和规划,因而不能体现招生考试的价值和考试导向功能。

2 基于大数据的信息管理系统构建

2.1大数据的概念和特点

根据维基百科中的大数据定义,大数据是指利用常用软件工具来获取、管理和处理数据所耗时间超过可容忍时间的数据集[1]。同时,参考研究机构Gartner的描述,大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产[2]。所以,如果仅从数据量或类型等某一个方面描述大数据都是不够准确的,大数据是一个综合的概念,大数据应当是达到一定数据规模,并且数据类型繁多和复杂的数据集,它同时具备快速反应客观情况、能被用于数据分析和处理,最终获得有价值信息能力的有用数据。

因此,大数据应该具有以下的特点:

(1)量大类型多:大数据首先应当是数据体量上要达到一定的规模,数据的单位和维度也越来越多,随着互联网和数据库技术的发展,各种系统的数据积累后形成的数据集。其次这种数据不应是平面化、简单化的,传统意义上的结构化数据,而应是立体的,包括文字、图片,甚至音频视频等大量非结构化的数据。

(2)价高反应快:大数据不是简单地大量数据堆积,不是静止不动的,那是没有意义的,而是具有内在信息价值的数据。对每一条数据归纳、抽象和分析等及时有效处理后,都能获得有意义的价值线索和规律。同时这种价值反馈的相应时间应该是快速和实时的。

2.2数据挖掘的概念和作用

就招生考试报名而言,数据量取决于考生数量和采集信息字段的数量和类型,相应的深度数据分析技术可以利用数据挖掘技术。数据挖掘技术是一种独立的利用信息技术进行数据分析的方法。它包括通过对数据仓库中的数据进行分析,获得有用知识和信息的一系列方法和技术。

数据挖掘就是从大量有噪声的、模糊的或者随机的数据中提取隐含的、先前未知的、对决策有潜在价值的知识和规则,并能够根据已有的信息对未发生行为做出结果预测,为决策提供依据[3]。

数据挖掘为从数据中隐含的未知的潜在的和有用的信息中进行的不平凡的提取过程[4]。目的是将大量的数据转化为有利于各种类型使用者的信息。如果在中职校招收随迁子女报名系统中使用基于大数据技术的数据挖掘,能预期以下收获:

(1)确定进城务工人员从事的行业信息、居住区域信息、收入税收等信息;

(2)预测招生中职校学校的人数;

(3)支持与考试录取系统的数据自动对接;

(4)便于构建学生档案;

(5)使决策者掌握更多务工人员、随迁子女和学校专业的发展趋势。

2.3基于大数据的随迁子女报名的数据分析

随着随迁子女报考数量的增加,随迁子女招生与中考招生报名系统合并,随迁子女数据、中招报名数据、父母数据和考试科目数据等各个系统产生的数据聚合,必将产生海量的数据。同时,现代招生报名过程中要求采集字段的多样化,除了文字信息外,还有考生照片和佐证材料等。数据类型一定会足够丰富,随迁子女报考中职校所引起的数据量必将形成大数据格局。

同时,如果当随迁子女报考中职校过程中发生群体性等特殊事件,若运行中报名系统足够敏感,具有很强的数据分析能力,就能根据数据变化及时反应出问题并呈现给决策者,决策者可以及时发现问题从而解决问题,保证招生报名的平稳运行。

显然,以大数据为基础,结合数据挖掘技术为工具的招生报名系统,能够及时评估报名的发展趋势,跟踪实时变化,分析报名的动向,从而协助招生报名管理机构搞好报名工作。

3 大数据背景下的报名系统模型

3.1报名系统模型设计

依据大数据的特点和中职校招收随迁子女报名工作的实际,报名系统可分为数据收集系统、数据处理系统和数据应用系统,如图2所示:

图2 报名系统模型图

3.2 报名系统功能分析

报名系统的准备工作就是制定考生报名信息标准、各字段的标准字典码库。因为只有对数据进行统一和整合,才能实现数据共享,真正实现数据的整合、分析和利用。一般报名数据信息标准包含以下内容。

字段名   类型   长度   说明主键设置导入方式校验信息其他备注

标准字典码库内容包括:证件类型代码、省市代码、考生类别代码、区县代码、民族代码和学校代码等。

获得大量基础数据后,完善的报名系统框架构建是提升报名系统价值的关键。大数据下的报名系统不能仅仅为了完成基本业务工作,应当从新技术的视野出发,进行整体构建,目标是从报名系统中获得有价值信息。报名系统基本设计如表3所示:

表3 报名子系统功能介绍

4 基于大数据的随迁子女报名系统设计

4.1功能模块设计

根据上文的模型思路,结合目前随迁子女招生管理实际,报名系统框架模型如图3所示:

图3 报名系统框架模型图

4.2业务流程分析

根据上海市中职校招收随迁子女的报名规定,用户主要涉及考生、报名点管理人员、区县和市级招生管理人员。市级招生管理人员主要是配置报名参数,如招生学校、专业、采集信息字段、上传文件格式大小和报名时间等;报名点管理人员和区县管理人员主要是指导考生报名和验证审核相关报名资料;考生按规定时间登录网站进行报名和输入相关信息。报名过程中管理人员可以查看报名人数、报名情况和统计情况等,考生可以查看和修改本人信息,查看审核结果等。考虑报名系统的实际工作要求和外系统的相关联系,设计流程图如图4所示:

图4 中职校招收随迁子女报名流程图

4.3基于大数据的随迁子女报名系统开发实践

2014年上海市教育委员发布了《关于做好2014年全日制普通中等职业学自主招收进城务工人员随迁子女报名工作的通知》,首次明确了进城务工人员报考随迁子女需要“上海市居住证”或“灵活就业居住证+临时居住证”的招生模式。决策者们希望通过报名,掌握务工人员的群体的基本特征信息,以便作为制定和调整随迁子女报考政策的参考依据,所以笔者在规划设计2014年上海市全日制普通中等职业学校自主招收进城务工人员随迁子女信息管理系统时,尝试运用大数据技术和数据挖掘技术,对数据采集进行了整理,重新设计了报名系统等,如图5、图6所示:

图5 2014年上海市中职校招收随迁子女报名系统登录界面

图6 2014年上海市中职校招收随迁子女报名模块界面

在2014年的系统设计中,同时对进城务工人员的分布情况、持证情况和行业分类做了数据分析的探索,一共进行了12项数据分析比较,如表4所示:

表4 2014年上海市中职校招收随迁子女报名系统数据分析项目

当报名系统获得基础数据后,可以综合运用数据挖掘技术进行相关分析。如运用关联规则的Apriori算法,可以分析出父母是某个行业的,与随迁子女考生报考的学校和专业的关联性;再如报考了某学校的A专业的考生会同时报考B专业的可能性,这些既能帮助考生正确选择志愿,又能帮助学校进行招生专业规划。以最简单的数据挖掘方法—分类分析法为例,分析父母持证情况,如表5所示:

表5 2014年上海市中职校招收随迁子女报名系统父母持证情况表

当报名结束后,决策者可以方便地从上表中得出本市进城务工人员的基本行业分布,外来人群的社会保险缴费比例(就业类居住证有缴费要求),务工人员的在沪稳定性(根据签注年限)等信息。基于这些信息,城市管理者可以制定人口调节政策,各行业主管部门可以调整相应管理政策,教育决策者能制定年度招生计划,合理配置各种教育资源。

5 总结

准确的数据是政府进行正确决策的依据,利用大数据建立的随迁子女报名系统具有以下功能:

(1)有利于随迁子女招生工作。深入研究报名数据中规律,结合已有的经验,能够提高招生考试的信息化建设,和招生考试工作的效率。

(2)有利于随迁子女教育决策。对报名数据的开发和利用,可以辅助决策者及时制定和调整决策。

(3)有利于社会稳定。以科学准确的数据为支撑的随迁子女招生政策,可以获得进城务工人员的认同,使他们能安心地为上海建设做出他们的贡献。

信息化技术的高速发展,大数据一定会对招生考试报名系统带来巨大的影响,管理部门应当以此为契机,不能再简单地用经验做决策,应当建立基于大数据的,能及时、准确地反应客观情况的报名系统,实现招生考试的现代化和科学化。

参考文献

[1] 马建光,姜巍.大数据的概念、特征及其应用[J].国防科技,2013,34(2):10-17.

[2] 林伟胜,许卓伟.大数据时代信息系统建设的一些思考[J].信息与电脑,2013,01.

[3] 裴文俊.基于大规模学业考试服务平台的决策支持系统研究[J]招生考试研究,2014.

[4] 郭茹.数据挖掘技术在教育领域的应用[J].科技和产业,2014,9:121-124.

收稿日期:(2015.04.09)

作者简介:裴文俊(1977-),男,上海市工商外国语学校,高级工程师,研究方向:数据库应用、数据挖掘和决策支持,上海,200231

文章编号:1007-757X(2015)12-0047-04

中图分类号:TP39

文献标志码:A

猜你喜欢
中职校大数据
情境教学法在计算机应用基础教学中的应用
关于中等职业学校学生社团良性发展的几点认识
新课改下中职校和谐教学课堂的构建
中职 《电机与拖动》 课程教学的改革与创新
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索