文/齐凤林 高珺 张凯
根据教育部关于高等教育质量监测国家数据平台数据填报工作部署,高校每年开展教育质量监测数据采集填报工作。采集数据根据获取方式不同分为两类,一类是信息系统已有的数据,通过数据同步自动获取;另一类游离在系统之外,需要进行集中采集,最终将这两类数据拼接在一起,形成完整的符合“高等教育质量监测国家数据平台”(以下简称“国家数据平台”)录入要求的数据集。这些数据为本科教学评估、专业认证等业务提供数据支撑服务。因此,各高校非常重视数据的采集质量,尤其是数据的客观真实性、准确性和及时性。复旦大学在数据采集填报中,由复旦大学本科生院牵头,校园信息化办公室提供技术支持,成立数据采集小组,统筹相关工作。
图1展示了传统的高校数据采集模式。在分发过程(1)中,数据采集小组将需要填写的表格分发给院系部门。院系部门完成数据收集后,将结果反馈(2)给数据采集小组。若采集小组审核录入时发现错误,则再次反馈给院系部门对问题数据进行调整(3)。
整个采集过程可能存在以下三个问题。
若院系部门误填或漏填数据,需要重新执行过程(3),就会再现“(2),(3)”之间多次调整数据的过程。由于数据采集工作涉及院系部门较多,这种反复确认拖延了整个采集时间,降低数据采集效率。
图 1 传统数据采集模式
传统的数据采集模式中,院系部门收到的表格一般是只有列名的空白表格。院系部门需要人工填写每一个字段信息,无疑增大了数据填写的错误率,也会导致格式不统一,影响采集过程。
院系部门按照表格模板填写内容,实际填写的内容可能会和业务部门规定的统计口径不一致。例如在采集课程信息时,院系填写的实际授课情况与教务处掌握的课程信息之间可能存在出入。
上述问题都会降低数据采集效率,影响数据采集的结果,达不到精准、高效采集数据的目的,使教学评估的数据采集工作流于形式。
复旦大学网上办事服务大厅(eHall)自2015年9月正式上线以来,逐渐实现从业务服务向数据服务的转型。一表通平台作为eHall中一个关键子系统,目的是减少用户纸质填表业务量。数据采集工作本质上是各院系部门的填表工作。一表通平台针对传统数据采集模式存在的问题,重塑数据采集流程。图2展示了一表通平台数据采集模式。其中,数据采集小组和院系部门直接和一表通平台交互。
图 2 一表通平台数据采集模式
根据数据提供主体的不同,将《高等教育质量监测国家数据平台数据填报指南》(以下简称“填报指南”)中的表分为两类。
1.单个业务部门即可填写的表单
如表1“校区及地址”只需要学校办公室填写即可,此类表格的数据采集相对简单。
表1 填报指南“校区及地址”
2.需要多个校内单位共同完成的表单
如表2“专业核心课程情况”,教务处可以提供前几项内容的权威信息,后三项关于教学学时的信息只有院系可以精确提供。
表2 填报指南“专业核心课程情况(学年)”
本文讨论的采集工作主要针对此类表单。
为方便设计模板表格,将所有待采集表单中的数据项进行分类。图3以采集教职工基本信息为例,根据数据来源,将采集字段分为三类。依据三类数据项的特点,设计下载的表格模板。
图 3 采集教职工基本信息示例
1.有权威数据源,且不可更改的数据
“工号”和“姓名”是人事处提供的教职工基本属性,默认是不可更改的。为方便院系填写,将其预载入表格模板。由于表格模板只包含本部门教职工的基本信息,无需将“单位号”包含在模板中。“入校时间”默认从教职工入校开始,无需再次确认,也不会出现在模板中。
2. 没有权威数据源,但有可参考的数据
“是否实验技术人员”会随着教职工在校内的发展情况而变动。业务部门能够提供历史数据作为参考,所以这类数据出现在模板中,允许院系部门核正。
3. 没有权威数据源,也没有可参考的数据
“是否工程背景”既没有权威数据源,也没有参考数据,只能由院系新增填写,在模板中以空白呈现。
图4是院系部门填写的表格样例,为方便系统测试,彩色部分特别标注错误输入数据。
图 4 院系部门填写的示例表格
由数据采集小组维护权限表,分配访问一表通平台的填写人员权限。院系部门在填写过程中,需要执行以下操作:
1.在一表通平台下载各类数据表格模板;2.对表格信息进行核正,补充空白字段信息;3.将填写表格上传一表通平台。
该模式设置双重数据校验。
1.表格模板校验。制作模板表格时,设置表格中的内容输入提示,对于输入范围有限制的字段,预先设置好选择范围。
2.一表通平台校验。系统在接收用户上传的表格时,逐个对接收数据进行校验,包括录入字段取值范围、字段间逻辑关系、数据条数是否删减等。当填写表格上传至一表通平台时,系统友好定位出错数据位置,精确到行和列,方便用户快速修改。
数据采集小组作为管理者,可以通过单位数据中心查看每个院系部门的填报进度,还可以根据填报进度对相关院系部门进行催办。
数据采集小组可以在填报的任意阶段,对全校填报数据进行导出。由于此前经过了双重数据校验,导出的结果符合国家数据平台的要求。
本文分析了传统数据采集模式存在的问题,针对数据采集自身的特点,提出提升采集效率、降低错误率的一表通数据采集模式,该模式具有以下特点:
1.根据表单采集主体的不同,将关注点放在需要多部门合作的表单上。
2.通过增加双重错误校验,提升了部门填写效率,降低了采集数据的错误率。
3.通过系统直接反馈上传结果,避免人工反复确认环节。4.数据采集小组可以查看填报进度,对院系部门进行督办。
5.导出数据操作简单,为数据采集小组节省大量汇总整理时间。
下一步,将引入数据批次概念,将每次收集的数据归为一个批次。在此后的数据采集中,将最近批次的数据预载入表格模板,进一步减少院系部门填写量。如此迭代,数据采集工作会变得越来越轻松。