我国高校数据治理成熟度的实证研究

2023-12-30 15:33陈桂香吴晨璐薛志谦
高教发展与评估 2023年6期
关键词:成熟度数据管理一流

陈桂香,吴晨璐,薛志谦

(1. 盐城工学院人文社会科学学院,江苏 盐城 224051;2. 苏州大学文学院,江苏 苏州 215031;3. 南京航空航天大学经济与管理学院,江苏 南京 210016)

“教育数字化转型”与广义的“数据治理”概念等同,数据治理(Data Governance,DG)作为一个新兴热点领域,已在高校科学决策、高效管理、创新服务和迅速应变等方面都显示出了全方位的功效。[1-2]目前,学术界对于高校数据治理的研究主要聚焦在高校数据治理模型、高校数据治理路径(或方式),这两方面议题的核心则在于探索提高高校数据治理的综合效率。在高校数据治理模型研究方面,学术界主要有两种视角:一是强化技术实现的视角[3-5];二是兼具管理与技术融合的视角[6-9]。后者更加注重管理因素的强化,认为高校数据治理实施模型应包括体制机制、统一数据平台、数据标准、队伍建设等要素。在高校数据治理的方式(路径)方面,袁利平[10]、周江林[11]、包冬梅[12]等学者从制度体系、质量标准、数据应用、数据安全等方面提出高校数据治理对策,学者赵磊磊[13]则从人工智能赋能高校数字化转型方面进行研究。高校数据治理评估方面的研究相对较少,胡水星[14]等以相关政策文件意涵与专家建议为立足点,构建了5个维度、17个关键要素的评估体系;秦中云[15]构建了大数据环境下高校图书馆数据治理成熟度模型。

当前,高校数据治理现状的研究显得相对薄弱,尤其实证量化研究更显不足。本文借鉴DAMA-DMBOK2(Data Management Association,又名DAMA International,简称DAMA;The DAMA Guide to the Data Management Body of Knowledge(2nd edition),简称DAMA_DMBOK2)[16]、DCMM(Data Management Capability Maturity Assessment Model,数据管理能力成熟度评估模型,GB/T 36073-2018,简称DCMM)[17]、美国斯坦福大学数据治理成熟度模型[18]等国内外经典数据治理成熟度评估模型,结合高校实际,设计高校数据治理成熟度评价问卷,综合运用问卷调查、小组访谈等方式收集数据并进行分析,旨在探究我国高校数据治理整体水平及存在的问题,并提出对策建议,以期为高校数字化转型提供参考。

一、研究方法

通过问卷调查和分组访谈建立数据样本,运用统计分析软件SPSS和质性分析软件MAXQDA进行分析,实证研究我国高校数据治理成熟度现状。

(一)数据来源

以全国东、中、西部地区代表本科高校校领导、智慧校园建设技术支持人员及管理人员、职能部门管理人员、普通教师为调查对象,充分保证调查对象对高校数据治理工作具有较深的了解。2022年8月15日至31日,通过问卷星网络平台发放问卷,共收回问卷307份,删除信息缺失问卷,有效问卷302份,占比98.37%,调查样本数据特征如表1所示。

表1 样本单一变量统计特征

(二)研究工具

根据研究目标,参考借鉴DCMM模型、DAMA_DMBOK2模型及斯坦福大学数据治理成熟度模型等经典数据治理成熟度模型,设计了《高校数据治理成熟度评价调查问卷》,共有50个题目,围绕组织建设、数据治理、数据架构、数据管理、数据应用等5个维度(一级测量指标)展开。“数据治理”有狭义和广义之分,广义的数据治理,包括数据建设、数据挖掘与数据治理三方面。但作为一级测量指标的“数据治理”是狭义的,是相对于数据建设、数据挖掘利用而言的。5个维度各有5个测量指标(二级测量指标),每个测量指标下又有2个观测点(三级测量指标)。其中,组织建设分为数据素养、治理组织、数据战略、战略支持度及经费保障等5个测量指标;数据治理分为数据治理制度、数据治理沟通、数据标准、数据安全与隐私及治理技术等5个测量指标;数据架构分为数据模型、数据分布、数据集成与共享、元数据管理及主数据管理等5个测量指标;数据管理分为数据需求、数据设计与开发、数据质量、数据运维及数据退役等5个测量指标;数据应用分为数据应用人才队伍、数据分析能力、交付方法、数据服务能力及数据开放共享等5 个测量指标。以上测量指标均采用李克特5级量表进行正向计分测量,用1-5 分分别表示“很不赞同”“不赞同”“普通”“赞同”“非常赞同”。运用SPSS 24.0进行统计分析。

课题组于2022年9月至2023年2月,对部分高校智慧校园分管校领导(12人)、信息化部门负责人(16人)、师生代表(14人)进行小组访谈。访谈对象涵盖东中西部9 个省的25 所普通本科高校。访谈采用焦点小组访谈和电话询问相结合的方式进行。访谈结束后,将访谈录音整理成文字资料,运用MAXQDA 质性分析软件进行文本分析。

(三)信效度分析

通过SPSS分析,整个问卷量化问题Cronbach’s Alpha系数为0.988,5个维度的Cronbach’s Alpha 系数分别为0.939、0.951、0.958、0.956、0.940,均大于0.9,表明问卷内部稳定性和一致性较高,即信度较好。通过探索性因素对问卷的结构有效性进行检验,经KMO 和Barlett 球形度检验,问卷KMO 值为0.98,显著性P<0.001,表明问卷结构较好,即问卷有效,可以进一步开展统计分析。

二、调查结果与分析

对我国高校数据治理成熟度进行整体性分析和差异性分析之后,再从组织建设、数据治理、数据架构、数据管理及数据应用5个维度具体分析我国高校数据治理成熟度。

(一)高校数据治理成熟度整体水平分析

DCMM将数据管理能力成熟度分为初始级、受管理级、稳健级、量化管理级及优化级五级。借鉴DCMM 数据管理成熟度等级划分,根据调查得分均值确定高校数据治理成熟度等级,如表2所示。

表2 高校数据治理成熟度评价得分与等级对照

问卷调查发现,我国高校数据治理5个维度的均值及整体均值均超过3.7,如图1所示。结合专家访谈结果,研究认为:大多高校数据治理各维度成熟度及整体成熟度都处于稳健级(3级)左右;高等教育数据治理成熟度在整个教育系统中处于中等偏上水平,对基础教育、职业教育等发挥着重要高位引领作用,这与《中国智慧教育蓝皮书(2022)》报告结果相一致(基础教育、职业教育、高等教育2022年中国智慧教育发展指数分别为0.74、0.74、0.79)。这一结果表明,在国家大数据战略、教育数字化战略行动等引导下,高校通过数字化赋能教育教学改革的动力强劲,不论是在体制机制,还是在数据架构、数据治理、数据管理、数据应用等方面都取得了重要突破。其中数据治理平均值最高(=3.823),说明高校数据治理能力在规则和技术双轮驱动下,实现了“规范化发展”。但是,数据应用平均值较低(=3.741),数字化与高校教育教学及科研的融合度不高。这一结果也印证了教育部科技发展中心的调研报告“接入统一身份认证的业务系统数量只占学校业务系统总数的1/3左右”[19]。

图1 高校数据治理成熟度整体水平

(二)高校数据治理成熟度整体差异性分析

进一步单因素方差分析发现(如表3所示),不同类型的高校也存在差异性。总体上看,“双一流”高校数据治理各方面的成效略优于非“双一流”高校,这与教育部调查相一致。但是不同类型高校数据治理不同维度优劣势不同:“双一流”高校在组织建设和数据治理(=3.811、=3.833)2个维度比非“双一流”高校(=3.769、=3.818)具有较明显优势;在数据架构维度略具优势;在数据管理、数据应用维度,非“双一流”高校又出现了“反转”,尤其是在数据应用维度,非“双一流”高校(=3.765)相比“双一流”高校(=3.686),优势显著。究其原因,部分非“双一流”建设高校因传统信息化系统没有“双一流”建设高校“根深蒂固”,反而在校园应用系统的更迭换代等方面更具后发优势。

表3 5个维度测量指标分组差异性分析

(三)高校数据治理成熟度分维度分析

1.组织建设维度

“从表面上看,数据治理的问题是由数据基础薄弱、数据不完整和不一致造成的,实际上分析深层原因,是数据管理体制不健全、内部管理职能不清造成的。”[20]调查表明,组织建设维度5个二级测量指标、10个三级测量指标的均值均超过3.6,如图2 所示。这表明我国高校高度重视组织建设,学校领导层及师生具有较高数据素养(=3.864),实施大数据战略已形成共识,并得到来自校内、校外的支持合力(=3.894)。不容忽视的是,经费保障平均值相对较低(=3.680),这与专家访谈结果相吻合,62.07%的专家将理念、经费、制度、人才、技术作为当前高校数据治理水平的前位制约因素,其中经费是仅次于理念的重要影响因素。

图2 组织建设二级测量指标分析

进一步单因素方差分析发现(如表4所示):不同类型高校只有战略支持度二级测量指标的均值基本持平;而其他4个二级测量指标的均值,“双一流”高校均超过非“双一流”高校,尤其是数据战略和数据素养测量指标的优势更为明显。这表明:“双一流”高校,尤其是部属高校更接近中央,更能紧跟中央战略决策部署,更能从战略高度系统谋划、统筹推进数字化建设,更具全局性、长远性和奠基性,也更能轻松获得中央的重点支持,更兼长期实力累积,因而有着比普通高校更强的筹资能力与“造血”能力,在数据治理的经费方面具有绝对优势。

表4 组织建设二级测量指标分组差异性

2.数据治理维度

调查显示(见图3),我国高校普遍重视数据安全与隐私保护,均将其作为数据治理的重要因素看待,并有较完善的数据安全和制度及策略(=3.912)。然而,治理制度、治理标准和治理沟通3 个测量指标均值相对偏低(=3.780、=3.790、=3.796),这可能与我国数据治理法律制度和标准不够完善有关,也反映了我国高校数据治理协同不够,高校需要定期开展校内外利益相关者交流沟通活动,健全数据治理沟通协同机制。

图3 数据治理二级测量指标

进一步分析可见:非“双一流”高校只有安全与隐私指标的均值超过“双一流”高校;治理制度均值,两类高校基本持平;非“双一流”高校其他3个二级测量指标的均值均低于“双一流”高校,尤其是数据标准建设明显落后,这表明非“双一流”高校为促进数字化应用,更重视数据安全及师生隐私保护;“双一流”高校在数据制度和数据标准制定方面走在前列,对其他高校起示范引领作用,如表5所示。

表5 数据治理二级测量指标分组差异性

3.数据架构维度

研究显示(见图4),我国高校比较重视数据集成与共享、主数据管理工作,这归因于数据集成与共享是数据管理平台的关键部分、主数据建设在数据战略中处于核心地位有关。主数据,即核心业务实体数据或核心功能数据,具有高价值、超越业务、超越系统的属性。[21]32尤其是这2 个二级指标的三级测量指标共享机制和可用性,均值都超过了3.8(=3.831、=3.848),表明了高校数字化转型和治理取得了明显成效。值得重视的是,我国高校对元数据管理却显得不足(=3.738)。元数据是“关于数据的数据”,是高校数据治理的指南;元数据管理是指创建、存储、整合与控制等一整套流程的集合。[21]16调查表明,我国高校元数据管理水平较低,这与高校数据领导力及师生数据素养有关。

图4 数据架构二级测量指标

通过单因素方差分析可知:非“双一流”高校与“双一流”高校在数据架构管理的5个二级测量维度上各有优势和劣势,虽然非“双一流”高校在数据模型、数据集成与共享、元数据和主数据管理方面都领先,但优势微弱,而“双一流”高校则在数据分布方面显著领先;两者整体成熟度基本持平,这与数据架构侧重于技术和基础设施设计的“中性”属性有关,不同高校的人才、经费、科技等综合实力差异在短期内不能在该维度得到体现或显著体现,如表6所示。

表6 数据架构二级测量指标分组差异性

4.数据管理维度

数据生存周期管理是将组织原始数据转化为可用于行动的知识的一组过程。[21]2数据生命周期管理是一种系统、基于策略的信息收集、使用、保留和删除方法。[22]由图5可以看出,我国高校尤其重视数据运维(=3.858)。但是,我国高校在数据退役管理方面还比较薄弱(=3.752)。正如接受访谈的某高校信息化建设办公室人员所说,“学校从未制定过数据销毁相关制度,基本上数据一经采集、永不销毁。虽然我们都意识到数据存储应该有个期限,但学校主要精力还是在数据建设上”。当然,因数据价值具有相对性,目前关于数据的保存期限还有诸多争议。

图5 数据管理二级测量指标

进一步单因素方差分析表明:非“双一流”高校在数据管理方面有着较高的成熟度,除了数据需求测量指标比“双一流”高校略逊一筹外,其他4 个二级测量指标均超过“双一流”高校,凸显其在数据治理方面的“应用型”导向,如表7所示。说明非“双一流”高校更加重视数据全生命周期管理,并将其作为数字赋能教学、科研、管理、服务和决策的前提,来扎实推进和夯实。

表7 数据管理二级测量指标分组差异性

5.数据应用维度

数据应用服务是数据资产价值变现最直接的手段,也是数据资产价值衡量的方式之一。通过良好的数据应用服务,对内提升组织的效益,对外更好地服务公众和社会。经调研,发现我国高校在数据开放应用方面整体处于较低水平(见图6,=3.741);在数据分析应用人才队伍和服务能力建设方面尤显不足(=3.745、=3.702),特别是数据服务增值效果最不尽人意。表明大数据技术与高校教育教学管理服务业务还未能深度融合,数据流动开放和增值赋能水平比较低下。

图6 数据应用二级测量指标分析

进一步分析显示:不同类型高校存在差异性,非“双一流”高校数据应用维度的5个二级测量指标和10个三级测量指标全部超越“双一流”高校,这表明非“双一流”高校在数字化应用赋能方面具有后发优势。这可能是因为非“双一流”高校没有太多数字化建设的历史包袱,可以轻装上阵,跨越传统惯性,在借鉴其他高校历史经验的基础上,发挥小而灵活的优势,从而实现在数据应用维度的相对领先,如表8 所示。这与访谈结果一致,多数非“双一流”高校师生表示:学校注重用户体验,坚持“让数据多跑路,师生少跑腿”,师生满意度和获得感不断增强。

表8 数据应用二级测量指标分组差异性

三、存在问题及分析

从调查数据和访谈情况看,在国家系列数字化政策引领下,我国高校数据治理水平不断提高,与其他先进行业数据治理水平的差距不断缩小,但也主要存在以下几个方面的问题。

(一)数据治理缺乏顶层设计

我国高校数据组织维度得分较低,在5个一级测量维度中居于倒数第二。目前,我国高校对数据治理的重要性认识和重视程度不够,数据理念和数据思维缺乏,大部分高校未能从战略高度对数据治理进行规划部署,也未从人、财、物及制度等方面予以保证。数据治理需要技术、平台、制度一体化推进,要求高校必须加强顶层设计与系统谋划。数据治理允许有两条线路演进,“自上而下推动”与“自下而上创新”。然而,诸多高校要么统一推进、整齐划一,扼杀了基层单位探索的积极性和创新性;要么“放手”“甩手”,任由基层组织“各自为政”“各行其道”,因各基层组织数据制度、标准、规则不统一,导致数据资源无法集成和共享,数据价值无法充分挖掘,或者基层组织应用系统发展盲目、无序,导致重复建设、低端复制和资源浪费现象严重。

(二)数据融合创新程度不高

数据应用维度得分在5个一级测量维度中居于末位。当前,我国高校多处于夯基垒台阶段,无法积厚成势;部分高校的数据集中尚未完成,集成共享与开放增值更无从谈起;由于缺乏跨组织、跨部门的治理机构,我国大多高校业务流与技术流双轨行进,从而导致业务与技术“两张皮”现象;高校基于跨业务域数据支撑的决策支持类、总结考核类应用普及程度较低。[23]43这说明高校数据技术与业务融合度亟待提高。

(三)数据治理经费保障不力

调研发现,经费是当前高校数据治理水平的前位制约因素。目前,我国仍有超过1/3 的高校未提供IPv6 服务,已提供IPv6 服务的高校中有半数仅提供了一项服务。[23]38IPv6、人工智慧等新型基础设施建设是“互联网+教育”的载体,是实现高等教育教学质量跃升的重要前提。当前,国家推进高校新基建,要求高校要按照“适度超前,5~10年不落后”“同等条件下,应优先选用国产自主可控设备”[24]。硬件信息化基础设施及软件的升级均需高校具有雄厚的经济基础,数据中心(平台)运行与维护也需要较大成本,经费不足成为高校数据治理极其重要的制约因素。

(四)高校治理水平参差不齐

整体来看,“双一流”高校在组织建设、数据治理、数据架构三个一级测量维度比非“双一流”高校具有较为明显的优势;而非“双一流”高校仅在数据管理、数据应用维度略具优势。分维度看,在信息化经费投入、人员配置及基础设施建设方面,“双一流”高校远高于非“双一流”高校;在制度建设、规划制定和执行方面,“双一流”高校整体情况要好于非“双一流”高校;在建设成效方面,无论是数据治理的深度广度,还是信息化对于教学和科研的支撑力度,“双一流”高校都领先于非“双一流”高校。这说明不同类型高校之间存在“数字鸿沟”。“数字鸿沟”不同于传统鸿沟,对高校的优势和劣势具有“杠杆效应”“倍数效应”,这不利于我国高等教育的均衡发展。

四、数据治理建议

(一)加强数据治理顶层设计

传统离散式、应急式数据治理应不能满足高校当前敏捷化、动态化的业务创新需求,这要求高校须由单点治理部署转向广范围、细粒度、一体化全面布局。首先,高校需组建跨组织、跨部门的治理机构,加强对数据治理和数字化转型的顶层设计和统筹协调。主要包括数据治理委员会、数据工作小组、数据管理员,分别对应决策层、统筹层和执行层。其次,高校可探索实行CDO(Chief Data Officer,首席数据官)制度。在当下数字化2.0时代,国外高水平大学深入推行CDO制度,世界500强企业大都设置了CDO 职务,建议可在部分高校开展试点。最后,高校须坚持收放有度,“自上而下推动”与“自下而上创新”协调推进,避免校内二级组织数据治理各自为政、资源浪费和效益低下。同时,高校还需绘制治理“蓝图”,即数据治理中长期战略规划,并动态更新,定期进行评估,及时进行优化调整。

(二)注重数据开放与融合创新

从教育教学维度看,要以先进设备的集成、多种终端的组合改造传统教育方式,实现规模化的个性教育。从科学研究维度看,要以信息技术拉近科研人员的交流距离,形成信息化创新生态视角下的科研创新活动的数字空间。从教育管理维度看,要重视用户体验,将复杂业务流程封装为整体功能模块,对高校业务流程进行再设计、再改造,为师生需求提供“一站式”解决方案。从教育决策维度看,须打破“数据孤岛”,使数据信息系统高度集成、可视可算,不断提升决策科学化和民主化水平。同时,高校要积极融入国家和地方教育数据资源平台,实现数据全域、海量、多维,这是大数据成为“金矿”的前提。数据服务增值需要特定的技术和人才,高校应与第三机构合作,深度开发数据,为用户提供针对性的数据增值服务。

(三)提升数据治理筹资能力

在我国高校大数据教育管理发展初期,有效的融资机制尚未形成之际,政府加大对高校大数据教育管理投入的资金支持是必要的。政府部门要一体化推进驻地高校数字化转型(部属高校经费支持与省属高校等量支持)、完善项目式资源配置碎片化模式、市场化运作智慧校园建设融资模式。政府部门要发挥国家产融合作等平台作用,完善相关优惠政策,调动合作对象的积极性,鼓励引导资本规范参与高校数字化校园建设,构建社会资本有效参与的投融资体系。另外,争取社会捐助是高校化解数据治理面临资金困境的较好出路。高校可采取项目的形式,积极争取企业对数据治理的资金投入。高校还应拓展银校合作项目,争取更多银行对智慧校园建设的资金支持。

(四)促进数据治理协调发展

为消弭我国不同类型高校之间的数字鸿沟,首先,要坚持分类发展原则,出台具有针对性的高校数据治理指导意见和考核评价标准,鼓励不同类型高校特色发展、差异化发展;其次,要构建公平的高校教育资源竞争准入机制,对非“双一流”高校一视同仁,在一些国家级项目、奖项等体现学校核心竞争力的领域打破非“双一流”高校进入现有竞争赛道的“限额申报”约束,为其争取更多办学资源、促进数字化转型提供更多机会;最后,要设立非“双一流”高校数据治理发展通道,在国家实施教育数字化战略行动的大背景下,进一步加大中央财政支持地方高校改革发展资金支持强度,并对资金管理办法中支持方向、相关分配因素、权重等进行调整完善。同时,在教育强国推进工程中央预算内投资等方面加大对非“双一流”高校的财力支持或有所倾斜。

猜你喜欢
成熟度数据管理一流
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
产品制造成熟度在型号批生产风险管理中的应用
关注一流学科
CTCS-2级报文数据管理需求分析和实现
我校获批4门省级一流本科课程
整机产品成熟度模型研究与建立
“双一流”建设如何推进
不同成熟度野生水茄果实的种子萌发差异研究