基于教学质量保障的数据仓库的构建探讨*

2020-12-13 04:20黄丹霞焦怡博
北京电子科技学院学报 2020年2期
关键词:数据仓库学院教学质量

黄丹霞 韩 英 焦怡博

北京电子科技学院,北京市 100070

引言

在大数据时代,教学数据将成为大学的一项重要资产,应和其它有形资产一样得到相应的重视和管理。 建设数据仓库对于数据资产的整合、共享、分析、应用等具有基础性的战略意义,将成为学院在5G 时代的核心竞争力之一,为学院建设“智慧校园”打下坚实基础。

国务院2015 年发布的《促进大数据发展行动纲要》(国发〔2015〕50 号)指出:“数据已成为国家基础性战略资源,大数据正日益对全球生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生重要影响”。 迈尔-舍恩伯格在《大数据时代》中指出:“通过收集、处理、分析全体数据而不是抽样数据,发现事物的相关关系,大数据从根本上改变了人类探索世界的方法——从探寻‘为什么’到发现‘是什么’,因此大数据时代的思维变革、商业变革和管理变革比以往任何时候都更加深刻[1]”。

对于高等教育而言,借助大数据的支持构建高校教学质量评价体系既是必然趋势,也是当务之急。 高等教育发达国家和地区的高校已经陆续建立了基于大数据的高校教学质量评价体系,如美国通过使用“学习管理系统”(Learningmanagement Systems)、“帆布”(Canvas)和“渴望学习”(Desire2 Learn)等教学系统,对高校的教学管理与教学质量改进进行反馈与监控[2]。 教育部从2016 年建立了“教育部高等教育质量监测数据平台”,高校各类数据通过网络在平台上报、在线即时生成数据分析报告,而不再采用人工报送纸质版的方式。

1 大数据时代构建数据仓库具有重要意义

“信息技术与教育的深度融合,使得全方位、深度追踪、量化学习过程,采集和汇聚教育场景中各类数据、乃至其它各种跨界数据成为可能”[5]。 因此,顺应大数据时代发展趋势,建立学院自有的数据仓库,开展教学数据的规划、采集、维护与利用工作,具有重要意义。

首先,通过持久收集多维度教学数据,实现多维度教学反馈,可更加精准地分析课堂教学质量。 现有的教学质量评价,取决于学生期末教学评价、同行评价、专家听课、管理干部听课等阶段性评价或终结性评价。 通过建立数据仓库,持久收集多维度教学数据,例如课堂到课率、师生课堂与网络论坛互动情况等,结合学生的各类学习状态数据,如学生专业与班级排名、在线学习时长、图书借阅记录、论文阅读与发表数量、参与项目研究等,借助大数据的数据分析与数据挖掘技术,可对课堂教学质量尝试开展过程性评价,进一步提高评价的准确度。

其次,通过大数据的方式找到规律,可使学院教学质量监控更加精准高效,实现“发现问题—反馈问题—改进相关保障制度与保障条件—解决问题”的教学质量保障闭环体系实时、有效运转,为各类决策、精力投入、教学资源配置提供科学依据。 以图形分析、报表等方式直观展示数据,实时计算和查询各类数据,可让各个岗位的管理者更快、更准确地发现问题。 例如学生管理者可横向对比班级之间的学生到课率、可随时发现各类人群如某段时间缺课较多人群、不及格学分较高人群等,有针对性开展工作;例如教学投入决策时可横向、纵向作大类比较,可计算人均投入、比较相关指标,可实时查询各类明细等。

最后,在数据仓库的基础上建立数据应用平台,可实现数据应用与共享,联通“数据孤岛”,使学院的管理工作更加精准高效、与兄弟院校的合作更加顺畅。 数据共享包括高校之间、学院内部各部门之间的数据共享。 高校之间的数据共享,顺应了慕课时代高校之间学分互认、教学资源开放共享的大趋势,也可为高校管理者横向对比各类数据提供参考;内部管理部门之间的数据共享,可在数据报送时免去大量的临时统计工作,可免去跨部门业务办理过程中管理人员大量的人工核对,同时也为办事师生节省跑腿时间,从而把更多精力投放于教学。

2 学院教学质量保障体系与信息管理系统现状

学院当前的教学质量保障体系设计思路是一个动态运行的完整闭环:“要通过质量监控和自我评估,充分了解教学状态,科学分析和反馈质量信息,改进教学工作和管理机制,从而实现自我监控和自我完善。”其设计思想是在教学管理制度的运转过程中,实现教学质量信息的分析、收集,把其中发现的问题反馈给教务处、人事处、财资处、后勤处、网信处、图书馆等相关职能部门,各部门联动增强师资队伍、教学设施、教学经费等各方面的保障;同时定期开展自我评估、完善教学质量标准体系,包括专业质量标准、课程质量标准、实践教学质量标准等;相关标准的改进和完善又将反过来指导和作用于教学管理制度的改进。

目前学院已有教务系统、财务系统、人事管理系统、科研管理系统、学生管理系统、档案管理系统、图书查询系统等多个单机版或网络版的信息管理系统,它们各自围绕部门的核心业务需求量身打造,每天产生大量与教学相关的数据;其中一部分系统如教务、科研等已经过多年运行使用,正在进行升级迭代工作,以整合原有系统功能、加入新的管理需求,通过系统架构与硬件的升级改造实现改进系统运行效率、加大数据共享力度、进一步提高管理效率与服务水平。

动态运行的教学质量反馈与改进机制,需要教学质量信息的即时分析与收集,需要即时、动态的数据支撑。 因此,要实现学院教学质量保障体系的动态运行,使教学质量保障闭环系统有效运转,当前的信息化管理仍存在以下问题:一是缺少统一的规划与数据管理机制。 各部门信息管理系统的数据格式根据各自业务需求规划而成,缺少统一的数据字典,数据更新与维护机制更是依靠各岗位管理人员的管理水平,缺少统一管理。 二是尚未实现数据共享。 随着数据报送业务的不断增多、数据跨部门需求的不断增强,数据联通的管理需求日益强烈,数据孤岛使得管理者在涉及跨部门数据、跨部门业务需要大量的人工核对。 三是在数据利用方面,目前只能对单一的教学数据开展数据分析。

因此,实现教学质量保障体系的闭环有效运转,除了进一步加强基础设施建设、完善教学质量监控数据采集途径之外,建设学院自有的数据仓库是必不可少的措施。

3 数据仓库构建目标

在充分利用学院现有数字资源的基础上,利用信息技术开展数据治理,把分散于各部门管理信息系统、格式不一的数据源加以整合,根据统一的数字字典转换成需要的维度和,转换成指标的集合,打通数据通道、联通数据孤岛、实现数据共享,打造统一的数据应用与展示平台,为学院内部教学质量管理提供有力保障,实现以改进教学质量为目标的教学质量监控;为学院领导与各部门的管理决策提供依据;为教学相关的各类评估与日常业务提供数据呈现、实现数据共享。 整体构建逻辑架构如图所示。 它涉及了数据仓库建设的主要内容,笔者将在下个要点中展开阐述。

数据治理整体又可分解为数据标准、数据采集、数据整合与数据应用四方面的工作。

首先需要建立学院自有的本科教学数据管理规范。 建立了数据的标准化规范,就解决了“要读取什么样的数、各从哪里读取”的问题;据此开展系统化的数据采集工作,解决“如何读取数据”问题;搭建数据仓库进行数据的加载、转换和抽取,解决“数据如何进行规整存储”问题;最后根据需求开发应用层的数据展示功能,解决“查询哪些数据、展现哪些指标”的问题。

由此也可以看出,数据仓库的建设不仅仅是简单的信息技术问题,它同时也涉及到学院各管理层级的管理制度与相关指标体系。 日常教学管理、专业建设、课程建设、学生工作等各方面清晰的管理思路、顺畅的管理流程,是开展数据治理、建设数据仓库的重要前提,直接决定数据仓库的建设成效。

4 数据仓库构建内容

除了铺设、架构必要的数据采集设备外,以下几项相关工作是数据仓库建设的重要内容。

4.1 数据管理制度

建立完善的数据管理制度,明确维护数据的业务岗位、职责人群、维护频率、操作权限,落实每个相关岗位与数据的权责关系,保障所有本科教学元数据的唯一性和规范性;建立统一的数据标准与数据安全规范,明确数据的读取、存储、维护、修改、备份、使用、删除、生命周期等各方面的规程。

4.2 数据规范

建立统一的数据规范。

首先,明确数据范围,解决“要读取什么样的数”的问题。 从数据源的层级来看,可分为教师与学生的个人状态数据、校园教学活动数据等个体级数据;与课程评价指标体系、课程建设情况相关的课程级数据;与专业评价指标体系、专业建设相关的专业级数据;反映学院基本情况的人、财、物、学、研、管等各类学院级数据。 从数据的类型来看,可分为结构化数据、半结构化数据与非结构化数据。

数据范围与数据应用需求密不可分,范围的确定可根据数据应用需求提前规划设计。

其次,明确数据源,解决“数据各从哪里读取”的问题。 根据数据范围,确认相应的数据来源、维护者与维护周期,确保数据的唯一性、规范性与准确性。 这需要通过规章制度对把数据维护范围与业务岗位相对应,从数据的源头确保数据质量。

4.3 数据采集工作

数据采集工作主要解决“如何读取数据”问题。 数据的采集首先要有规律、保持一定的连续性,从而形成数据积累。 其次可运用一定的技术。 在线学习平台、教务管理平台以及科研、人事、学生、图书馆、资产等已有的管理系统是教育数据的重要来源,可通过接口定期导出或实时读取;移动APP 技术可读取学生使用移动终端通过移动网络产生的学习数据;对接一卡通数据可得到学生的在校活动、阅读书籍等数据;网络爬虫则可发现相关教学资源。 另外可在未来的基础建设中铺设相关数据采集设备,以补充现有数据源的不足。

4.4 数据的清洗、集成、变换和分类汇总

数据的清洗、集成、变换和分类汇总主要解决“数据如何进行规整存储”问题。 数据清洗解决通过一些途径产生的不规范数据;数据的集成和变换,则重点要遵守行业规范。 教育部于2012 年发布了《教育管理信息教育管理基础代码》等七项教育信息化行业标准,以提高数据的可访问性、可共享性,解决高校内部、高校之间数据格式不兼容、不统一、无法共享的问题[3]。 此外,国际上一些通过标准也值得借鉴,如IMSQTI(问题与测试交互)标准、xAPI(学习体验记录)规范等[4]。 以此为前提,建立学院自有的数据字典,以规范学院后续的信息系统建设工作。

在数据存储中,数据仓库架构工作十分重要,可提高系统存储的科学性与合理性。 将数据处理的要求涵盖在系统处理架构设计标准中,按照系统处理的要求以及数据处理和调用的要求设计系统处理架;通过集群架构的设计,实现数据的分类存储;此外,选择合理的存储方式提高数据存储的安全稳定性,例如当前应用广泛的分布式存储[6]。

4.5 数据应用与展示

数据应用与展示主要解决“查询哪些数据、展现哪些指标”的问题。 可以考虑分为外部评估、自我评估、内部管理、服务师生(各类跨部门业务实现一站式整合)、数据上报、“驾驶舱数据”等展示模块[7][8]。 “外部评估”与“自我评估”包括教学评估前、评估中需要向专家展示的学院、专业状态数据;“服务师生”通过数据整合实现跨部门数据和业务的一站式服务,如教师职称评审、评优推荐填表、本科研究生教学情况查询等,一次登录,全院查询,免去师生多账号多密码登陆和办事跨部门跑腿;“内部管理”可在日常教学检查、教学督导中实时展示教室使用情况、教师与学生上课情况、实时查询相关师生状态数据;“数据上报”包括教育部每年核定高校办学条件的高基报表(高等院校的基本情况报表)、教育部每年通过“高等教育质量监测国家数据平台”向各高校征集的7 大类88 张反映高等学校教学基本状态的数据表格等,实现相关表单直接导出核对,以日常工作中的数据积累,代替报送前的分工、临时统计;另外可为学院各级管理人员设计相应的“驾驶舱”数据,推送与岗位相对应的关键数据,如院领导可查看办学条件各类关键指标、学生管理者可收到学籍警告等各类学生信息。

数据展现是整个系统设计目标的体现。 在全院范围内,由上至下开展系统的顶层设计,清晰规划数据展现需求,可实现全院统一规划,达到事半功倍的效果。

4.6 数据安全与保密

经过长时间的积累,存储教学相关的海量数据,既有利也有弊。 通过数据分析发现数据之间的关联性,可为学院教学管理的智能决策提供参考。 反之,数据仓库中的师生学习、工作记录一旦被侦察,将会对信息安全产生巨大威胁。 结合学院的行业特色与上级部门的网络安全管理要求,需要做到多方并举,做好数据安全与保密工作。 一方面,需要设置严格的数据访问控制策略,区分严格的数据访问权限,实现强制访问控制、自主访问控制或基于用户角色的访问控制[9]。 另一方面,在选用数据仓库和服务器时,尽量选用自主可控的国产化产品,可成为信息安全的有力保障。

5 结语

搭建大学自有的数据仓库,实现对本科教学全过程数据的采集、清洗、集成、变换、分类汇总与分析展示,可提高数据分析与利用效率,实现数据在高校之间与高校内部各部门间的共享,实现方便的教学数据报送,实现精准的教学质量监控,实现数据展示与对比,为管理提供决策依据。在数据仓库的搭建、运行与管理中,行业管理规范、数据管理制度与安全保密措施至关重要,必须贯穿数据仓库建设的每一个环节。

猜你喜欢
数据仓库学院教学质量
努力改善办学条件 不断提高教学质量
基于数据仓库的数据倾斜解决方案研究
提高教学质量,重在科学管理
海盗学院(12)
数据仓库系统设计与实现
海盗学院(7)
如何提高英语课堂教学质量
提高语文教学质量的几点思考
西行学院
数据复用在存储数据仓库中的运用