高校教育数据治理问题及对策*

2021-12-16 08:10蒲天银饶正婵
关键词:数据管理管理教育

蒲天银,饶正婵,雷 宏

(1.铜仁学院大数据学院,贵州 铜仁 554300;2.铜仁市大数据管理局,贵州 铜仁 554300)

目前信息技术高度发展,各行各业每天会产生大量的数据,因此,数据挖掘、数据仓库、大数据、云计算等新的数据研究领域应运而生.与20世纪60年代软件行业出现软件危机相似,当前的数据信息虽然看上去很多,但是在实际应用中人们发现,大部分数据在应用前都需要重新过滤,知识再发现,才能得到有效的信息.通过目前的数据现象来看,中国软件评测中心吴志刚提出“数据危机”这个说法不无道理,那么,如何有效地解决好数据危机问题,数据治理就提上了一个极为重要的日程.

1 数据治理概述

关于数据治理的定义一直是学术界讨论的重要话题,然而由于关注点、表述的不同,至今尚未形成一个统一的定义.现有的研究大致形成了以下两种观点:一种观点认为,数据治理是有关数据决策权和职责的分配.数据治理研究所给出了类似的定义,数据治理是指针对信息相关过程的决策权和职责体系[1].另一种观点认为,数据治理是一个围绕数据全生命周期的活动集合.国际数据管理协会在2009年的报告中对数据治理的定义是,数据治理是对数据资产管理行使权力和控制的活动集合(包括计划、监督和执行)[2].

大数据时代的到来为数据资产的管理和应用带来了新的挑战,大数据治理的需求应运而生.国际著名数据治理专家Sunil Soares将大数据治理定义为广义信息治理计划的一部分,通过协调多个职能部门的目标来制定与大数据有关的数据优化、隐私保护与数据变现的政策[3].从本质上来讲,大数据是数据存在和发展的新阶段.同样,大数据治理是数据治理发展的阶段.

2 数据治理的必要性

不仅仅行业数据多而复杂,高校数据也同样如此.高校在发展过程中会产生各类数据,如学生信息数据、职工信息数据、科研信息数据、教学信息数据、资产数据、财务数据等等.而每一大类数据又包含各种不同小类的数据,有些数据之间存在明显的重叠.由于高校大多没有考虑数据治理问题,在信息化建设过程中,各内设管理机构,根据自身业务建设信息化管理系统,而这些系统相互之间又没有形成有效的数据通道,各自为政,这导致高校虽积累了大量的业务数据和用户行为相关日志数据,但还是普遍存在数据质量不达标,冗余数据大量存在、数据准确性不高以及业务单位共享数据难度较大等问题,这些问题已严重制约了高校的信息化管理及信息化教学水平的提升.

3 高校数据治理问题分析

3.1 重视不够,信息共享不足的问题

虽然数字化校园、智慧校园已提出了一段时间,但是,高校在事业发展过程中,更多注重科学研究、人才培养等职能建设,对学校的智能化建设重视不够,因此,在信息化建设过程中没有形成顶端的数据管理中控中心,没有形成良好的规划设计,各业务部门分开建设、管理业务系统,数据之间无法互联互通,共享不足,普通存在“数据孤岛”现象,数据流通的范围、时效性等仍受到严重的影响.

3.2 体系缺失,管理混乱的问题

由于决策层没有重视数据管理的重要性,相关职能部门也没有这方面的思考,因此在实际运行过程中,没有建立必要的数据管理体系,缺少对数据使用的精确管理和监督,导致管理职责不明确,数据没有权威性.比如一些高校,有人想要了解学校的实际学生人数,却不知道应该找招生管理部门、学生管理部门、学籍管理部门、学费收缴管理部门中哪一部门.每个部门都有自己的数据,但都不全面、准确,因此数据质量当然不高.其问题的本质就是高校缺少数据管理体系,各职能部门数据之间存在明显的重叠,导致数据管理混乱.

3.3 数据结构化标准不一致的问题

高校跨部门的数据质量管理规范与标准未建立,各类数据的生产、使用、管理、维护等环节标准不统一,引起部门之间提升的数据结构不一致的问题.如提交教职工信息表,一是格式上不统一,有的部门做成xls格式,而有的部门做成doc格式;二是内容上的不统一,有的表格里需要填写性别、民族,而有的表格不需要.

3.4 数据分析管理过程缺失问题

高校应加大对非结构化数据采集、储存和分析工具的建设力度,便于真正地提升数据管理质量.数据管理经历了从数据挖掘、云计算、大数据、区块链等数据管理过程,就如何从任意一项数据中发现有效信息这个问题,这是一个最基本的数据管理模式.但是目前大部分高校还没有数据分析管理这一过程,即使有,也只是形式上的.如大部分高校未对每年的招生录取信息进行分析,未对每年的财务资金收支作具体分析,未对每年的科研项目作详细分析.而恰恰这些问题都是向决策层提供参考的必需信息,因此高校想要解决“数据危机”,进行数据分析管理过程是必不可少的.

4 高校教育数据分类及治理策略

4.1 高校教育数据分类

参考文献[4]中关于教育数据分类,笔者结合对当前高校数据类型的理解,将教育数据从数据产生的层次、来源主体、业务活动、采集技术及设备分类等四方面进行分类,结果如表1所示.

表1 高校数据分类Table 1 Classification of Colleges and Universities Data

表1(续)Table 1(Continued)

表1中的分类只是数据治理过程中考虑的部分侧重点,每一大类数据中具体的小类数据及数据项不一定考虑周全.但不管什么样的数据治理,笔者都大到数据系统小到具体的数据元素.治理方法有考虑管理层的体系机制治理,技术层面上的应用工具方法等.

4.2 教育数据治理举措

数据治理涉及的范围广,可以从顶层体系制度设计到数据具体运行,可以从大数据的管理到具体的数据元素的管理.无论从哪个角度来看,要做好数据治理工作,可以从四个方面加以考虑.

4.2.1 构建科学的治理机制体制,确保治理保障有效 国家针对推进大数据工作及数据安全问题出台了《国务院关于印发促进大数据发展行动纲要的通知》(国发〔2015〕50号),将出台的《中华人民共和国数据安全法(草案)》;在教育方面,相继出台了一系列国家政策文件,规划教育大数据的建设,指导教育大数据的管理和利用.2016年6月,《教育信息化“十三五”规划》提出“制订出台教育数据管理办法”“实现教育基础数据的有序开放与共享”“利用大数据提升教育治理能力”;2019年2月,《中国教育现代化2035》《加快推进教育现代化实施方案(2018—2022年)》做出了面向教育现代化“大力推进教育信息化,构建基于信息技术的新型教育教学模式、教育服务供给方式以及教育治理模式”的重要部署.

具体落实到数据治理过程中,必须从两个层面来进行分析.笔者在参考文献[5]提出的模型基础上进行了部分改进,改进后模型如图1所示.

图1 数据治理管理机制模型Fig.1 Data Governance Management Mechanism Model

一是从管理层面进行管理制度体系建设,这个体系主要包括管理机制、管理办法、操作规范、考核机制.具体来讲,第一需要建立完善的管理机制,形成完备的治理人力、物资、后勤保障体系,如高校应该高度重视数据治理工作,充分利用现代教育中心、网络中心或信息中心现有的团队,加上大数据专业技术研究队伍,建立相应的数据治理组织团队;第二根据国家相关制度与条例,出台相应具体的管理方案;第三需要有可执行的操作规范;第四需要对工作绩效设置一个合理的考核评价机制.

二是从具体的数据治理技术层面强化落实.在这个层面中,主要完成三步曲,即数据的采集识别、数据具体的治理工作、有效新数据的确认.在采集识别阶段,主要完成数据采集、数据识别与分析、新数据标准制定、新数据最终标准确认.在数据治理阶段主要完成,数据的抽取集成、数据的质量检测、数据分析与确认、数据的清洗与转换.

4.2.2 构建学校统一的数据标准体系,确保分析维度统一 由现有数据可以看出,数据相互之间利用率不高,数据共享困难,主要还是因为数据标准不统一,比如一个学生基本信息表的数据字段,现有的很多系统存在数据格式、数据类型以及数据取值范围不规范等问题,导致数据后期使用存在难以交换的难题,从而使数据整合以深度挖掘数据价值受到阻碍.建立通用的数据标准,分析梳理业务流程,形成数据标准规范,同时规范数据管控制度、流程规范文档、信息项定义等,可以帮助整个智慧平台提升数据标准性和一致性,为数据整合交换打下基础.

4.2.3 定期进行数据过滤,确保数据干净有用 从理论上讲,经过信息处理产生的数据在具体的应用场景中发挥效能后,从短期来看可能这些数据就没有用处了,但是数据通过数据挖掘、大数据技术处理后会发现其特有的价值.现实中普遍存在数据存储问题、数据信息不完整等问题.对于数据存在的数据不完整、准确率低以及一致性差等问题,可通过数据过滤,过滤即按照一定的规则清理“脏数据”.根据业务规则将预先制定好出现数据质量问题时的处理规则放入过滤库,利用过滤工具对数据进行过滤,可以有效提升数据质量[6].

4.2.4 掌握数据治理重点环节,确保数据质量提升 判断一个数据有没有用,是在特定的场景中体现出来的.在大数据技术高度发展的今天,要保证数据治理质量,必须从全面性、标准化、共享化、时效性、安全隐私性五大方面加以明确[4](表2).

表2 数据治理目标标准属性表Table 2 Data Governance Target Standard Attribute Table

从表2可以看出,数据的共享化和安全隐私性这两组属性的矛盾性,此处看似矛盾,实际上并不矛盾,原因如下:

教育数据开放指教育领域的数据开放,是数据开放的一个子集,教育数据开放多以数据服务的形式提供,根据用户需求和数据分析结果,提供数据开放服务接口,包括原始记录数据服务、统计分析数据服务、公共数据服务和个性化数据服务.数据开放性是衡量教育数据共享程度的指标,教育数据的共享性包括纵向共享、横向共享和跨界共享.

教育数据安全性即指教育数据从采集、存储、分析到使用的整个过程中都能保证数据是安全可靠的,即不会遭到破坏或丢失教育数据.隐私性即指在教育数据的整个使用过程中,对数据隐私的控制和保护.在教育领域,学生是教育数据最大的来源主体,也是教育的主要参与者和服务者,因此研究者关于隐私权的讨论也更多关注的学生的权利.

构建智慧校园的目的就是让高校数据在网上跑动,便于管理与分析,这就必须将数据上网,在此过程中,特别需要注意开放数据与保密数据两者之间的平衡.针对高校教育数据的治理,数据层次范围、数据格式标准以及如何把握好数据治理过程中,涉及到师生信息的开放与隐私矛盾平衡,既做到数据的有效共享,体现智慧校园价值,又要能保证师生个人信息秘密,这些方面都是至关重要的.只有把这些问题一一解决,才能真正达到数据治理的目的.

猜你喜欢
数据管理管理教育
国外教育奇趣
枣前期管理再好,后期管不好,前功尽弃
企业级BOM数据管理概要
题解教育『三问』
定制化汽车制造的数据管理分析
航发叶片工艺文件数据管理技术研究
教育有道——关于闽派教育的一点思考
数据挖掘在学生成绩数据管理中的应用研究
数据挖掘在学生成绩数据管理中的应用研究
办好人民满意的首都教育