张世明 彭雪峰 黄河笑
摘要:随着国家大力推进治理能力现代化,对教育管理现代化也提出了明确要求,大数据等数据治理能力在教育管理中的作用与日俱增,该文在对国内外数据治理文献研究和实践案例分析的基础上,发现国内外对教育领域数据治理的研究处于刚起步阶段,特别是将信息技术作为核心竞争力的开放大学对数据治理的研究几乎没有。该文结合开放大学实际给出了数据治理框架,并提出了应用实践路径和实施建议,希望能推动开放大学体系对数据治理的研究。
关键词:开放大学;数据治理;功能框架
中图分类号:G434 文献标识码:A
数据科学的发展使得各行各业事务处理及业务管理、决策的视角、过程和方法、理论都有了非常大的变化,越来越多的组织和个人认识到对数据进行治理的重要性和紧迫性,越来越多的政府机关、企事业单位和个人开始关注并加入数据治理的大军中。IBMCJ=2004年联合业界多家公司、学术机构等成立了数据治理论坛(Data Governance Council)。数据作为一种资产具有巨大的商业价值的观念得到了普遍认可,我国各地相继成立(大)数据交易所,各大数据交易中心/平台/网站也陆续上线,百度、阿里、京东等都在布局大数据战略。数据治理国家层面非常重视,国家国务院办公厅先后印发了《政务信息资源共享管理暂行办法》和《政务信息系统整合共享实施方案》。
数据治理不仅受到了政府及行业的重视,也正逐渐受到学术界的重视。通过文献研究发现,国外对这方面的研究起步较早,而国内研究相对滞后。对教育领域数据治理问题的研究更晚一些,特别是国内对该方面的研究才刚开始。开放大学是以现代信息技术为支撑的新型高等学校,现代信息技术是其核心竞争力,对开放大学数据治理的研究无疑是非常有价值和意义的。但本文在对CNKI和WOS中教育领域数据治理相关文献进一步分析后发现目前还没有对开放大学数据治理的研究文献。因此本文拟定对开放大学数据治理的框架进行研究,希望能引起学术界对开放大学数据治理研究工作的重视并投入其中。
本文检索CNKI和WOS两大主流文献数据库中与数据治理相关文献。CNKI检索到488条,WOS检索到14359条。按年分析发现,国外学术界对数据治理的研究从2001年开始年文献数量超过100篇,2016年达到高峰近2400篇。国内2004年起才有人关注该领域,到2016年起年文献数才超过100篇,2017年文献数不到200篇,可以说国内这方面的研究相对滞后且目前还处于研究初期。
(一)数据治理的概念
对数据治理的概念,目前国内外还没一个统一的定义。国外学者或研究机构分别从不同的角度对数据治理给出了定义。国际数据管理协会(Data Management Association)認为,数据治理是数据管理十大职能中最核心的部分,体现在管理和使用层面之上对数据进行规划、监督和控制,以实现顶层的战略设计以及支持决策。有学者认为数据治理是定义了一系列数据使用和管理的规则和政策;有学者定义数据治理是有关组织数据资产的决策规则和管理职能及责任的划分;还有些学者从数据管理控制的责任、技术和过程等角度定义数据治理是为了确保组织数据资产能得到合理使用而集中人、技术和过程的数据管理维护方法或过程;也有学者将数据治理定义分为早期和后期,认为早期定义主要关注数据规划监督控制中的技术、流程、职责和政策等四者的统一,后期定义更关注商业机构和角色支持等。国内对数据治理的概念界定和使用上比较混乱,多数文献对数据治理的定义没有说明和界定,或者把数据治理等同于数据管理,认为都是与数据收集、传输、存储、使用与控制等数据生命周期各阶段活动有关的管理工作。上述研究表明国内在数据治理的概念上还没有共识,研究还处于浅层次。
本文认为数据治理是从使用零散数据变为使用统一主数据、从具有很少或没有组织和流程治理到组织范围内的综合数据治理、从尝试处理主数据混乱状况到主数据井井有条的一个过程,是在数据管理策略指导下对业务流程和风险管理两方面数据的采集、存储、使用和控制的过程。数据治理是将数据作为组织资产而展开的一系列的具体化工作,是对数据的全生命周期管理。
数据治理的价值在于通过规范管理使组织能更有效地对数据进行规划、使用和控制,从而降低数据使用成本,提升数据质量,提高业务效率,为组织或机构带来竞争优势。数据是一种没有在资产负债表中显示的特殊资产,其管理成本和价值创造是明显的。顾立平认为数据治理是图书馆事业发展的重要机遇,有效的数据治理可以避免公司错误的发生,数据治理能提升企业决策水平。
(二)数据治理的框架研究
科学的框架是数据治理的基础。国外企业或学者在这方面的研究比国内要早也要更丰富些,影响比较大的有国外学者Khatri和Brown的决策域模型和Seiner的五层框架模型。决策域模型框架包含了数据准则等五个决策域,并提供了一个共同术语的通用框架,被后面的研究广泛采纳。五层框架模型包含执行层、战略层、战术层、操作层和支持层等。许晓东等设计了高等教育数据治理的分析框架,而包冬梅等提出了高校图书馆的数据治理框架。在实践层面,数据治理协会(Data Governance Institute)认为,数据治理由战略设计、治理结构、利益相关者界定、数据治理办公室、数据管理协会、数据治理过程、数据收集规则、问责制度、风险控制、管理决策等10个部分组成。IBM认为数据治理框架应由保障机制和核心领域两部分组成,保障机制分为政策、组织、流程和工具四块内容,而核心领域包括数据模型、数据生命周期等8个方面。两部分形成管理矩阵,可以提升数据治理各个层次的管理控制能力及协作水平。Infomlatica认为数据治理植根于企业IT治理之上,是企业治理的主要部分之一,包括策略和流程、组织、标准和定义、技术等四个关键要素,缺一不可。相对而言,国内的研究比较简单且局限于数据治理的个别方面,不够全面。而国外的研究也并没有形成标准化的框架模型。
(三)教育系统数据治理研究现状
教育是国家发展的基础,民族的未来,国家兴旺的根本。关注教育行业的数据治理和充分利用教育行业的数据是一件惠及国人的大事。教育行业的特殊性决定了其数据治理也具有一定的特殊性。
1.教育数据治理的特点
由于我国教育管理体制的特点,决定了教育行业数据的分布分散性、来源多样性,治理工作的复杂性和多样性。各级教育行政主管部门对数据治理的认识还需要一个过程。相关政策和法律尚不完备,尚需健全。
2.教育领域研究现状
目前,CNKI中研究教育领域数据治理论文只有27篇,而w0S也只有95条。进一步分析检索到的这些论文的时间分布发现,国外从2015年开始每年都有10篇以上的研究文献主题是教育领域数据治理,而国内在2017年之前都只有零星的个位数量的论文涉及,国内对教育领域数据治理的研究才刚开始。Putro、Surendro和Ogier、Hall和Bailey分别以印度尼西亚大学和英国格拉斯哥大学某学院为对象,研究了数据治理中的文化影响和通过数据资产框架来评估图书馆的数字资源。国内最近有不少文献研究教育治理和IT治理,研究内容鲜有涉及数据治理,如有学者研究了信息化大数据背景下的教育治理问题,信息化教育中的IT治理问题,美国高校的IT治理特点和启示。也有少量学者专门研究数据治理问题,但这些文献主要以探索研究为主,大都是一些经验总结和叙述,对数据治理框架模型的设计还有需要优化和完善的空间。
3.教育领域实践现状
数据治理的概念和支撑技术在互联网浪潮的推动下得以迅速的发展,诸多大型企业和行业组织将数据治理作为其重要的管理手段和核心资产,教育系统数据治理也正越来越受到关注,也有一些不错的实践案例。
我国国家教育部印发《教育部机关及直属事业单位教育数据管理办法》推进各类教育数据的规范管理、互联互通和共享公开,确保数据安全,更好地服务教育改革发展。上海市提出“创新教育数据资源管理机制,……,构建基于大数据的教育决策支持体系,推动高效灵敏的教育管理决策,缩短教育决策响应周期”。
在高校领域,数据治理也正在受到关注,国内外都有一些实践案例。为了改善因学校规模扩张而导致的学生事务处理能力下降,学生满意度降低的现状,美国特拉华大学率先形成了一个集中的在线学生信息系统,通过管理系统和教务系统实现学生的自我管理,以提高学生服务的质量和效率。更有甚者开始建设实体中心和网络门户业务一站式协同的学生服务中心,这些中心逐步演变为今天的一站式服务中心。美国伊利诺伊大学厄巴纳-香槟分校以学校战略规划为抓手实现数据治理,以数据辅助学校制定管理决策,取得了较好效果。国内不少高校推出了自己的一站式服務中心。如哈尔滨工业大学一站式服务中心除了处理师生业务外还设有便民服务中心、公共活动区等服务性功能区域。华中科技大学还根据自身情况,给服务中心量身定做业务种类,让保卫处,宣传部等部门派人进驻服务中心,开设对外服务窗口。同济大学综合服务大厅、南开大学、安徽大学等都推出了类似师生一站式服务。
无论是上海市的教育大数据决策支持体系,还是国家教育部的教育数据的互联互通和共享,以及建设高效的服务中心都离不开有效的数据治理。无论是高校、地方政府还是国家教育部都需要通过数据治理从底层打通各个业务系统的数据孤岛,实现数据的互通和流动,构建了一个适合自身情况的数据治理平台。
开放大学是以现代信息技术为支撑,以远程开放教育为主要形式,“办学网络立体覆盖全国城乡,学历与非学历教育并重,面向全体社会成员,没有围墙的新型大学”。这决定了其社会定位、办学规模、管理模式、服务对象、师资队伍、学习模式等方面都与普通高校有着极大的不同,这也给开放大学数据治理带来了挑战并使该项工作具有了与普通高校不同的特点。
(一)开放大学数据治理的特点
开放大学作为从电视大学转型的新型大学,其办学与普通高校相比有其独特性,主要表现在以下几个方面。
1.社会定位不同:开放大学是国际高等教育和终身教育发展的重要形式,“办好开放大学是适应高等教育从大众化到普及化趋势、适应全民学习终身学习需求的重大战略举措”。开放大学主要面向成人开展专科、专升本科教育,同时顺应经济社会发展需求开展大规模的非学历教育培训。
2.办学规模不同:国家开放大学办学网络立体覆盖全国城乡,有注册在籍学生359万人,其中本科学生105万人,专科学生254万人,包括近20万农民学生,10万士官学生,6000多残疾学生。很多省级开放大学的办学规模对普通高校来说也是无法想象的,如上海开放大学。
3.管理模式不同:开放大学实行“统一办学、分级管理”,国家开放大学在教学、管理、服务等业务工作实行一体化运作,而内部管理按照总部、分部、学院、学习中心的职责和任务,“实行分级管理,国家开放大学隶属于教育部,对地方开放大学进行业务管理和指导,省级开放大学由省教育行政部门直接管理,县级学习服务中心隶属于县级教育行政部门”,各级开放大学之间并无行政隶属关系。省级开大比如上海开放大学则是“大学+平台+系统”的办学结构。
4.服务对象不同:开放大学是面向全体社会成员,强调面向人人,有教无类,为一切学习者服务,实现校园教育向社会教育延伸,通过更加灵活更加便捷且公平开放的学习方式为社会成员提供多样多层次的教育服务,培养的是应用型人才。
5.师资队伍不同:通过多年探索开放大学形成了具有远程开放教育特色的师资队伍,教师在能力素质要求、角色分类、合作模式等方面都不同于普通高校。教师除了在专业素养方面外还必须具有远程教学、资源制作、学习支持服务等复合能力。不同于普通高校以专职教师为主,开放大学还整合优质社会资源,形成了“专兼结合、专职教师为骨干、兼职教师为主体”的特色师资队伍。
6.学习模式不同:不同于普通高校面授为主的学习模式,开放大学的学习模式是依托现代信息技术,以学习者为中心,基于网络自主的学习、课堂面授辅导和远程学习支持服务三者结合的新型学习模式。
正是由于以上与普通高校不同的办学特点,使其数据治理与普通高校有着极大的不同,主要表现在以下几个方面:(1)基础研究较差:无论是开放大学还是电视大学都视学习支持服务体系建设为其战略任务,认为“学习支持服务体系是否完善、高效和到位,会直接影响到远程教育教学的质量和学生的满意度,学习支持服务的能力和质量对于开放大学教学质量的保证具有越来越重要的战略意义”,数据治理问题并没有得到重视,这方面的研究几乎没有。(2)系统复杂程度更大:开放大学无论是办学规模、管理模式、服务对象、学习模式等都比普通高校具有更大的复杂程度,其系统复杂性远远高于普通高校,主要表现在信息系统复杂性、数据多样性、业务流程复杂度、管理多样性、需求多变等方面都远高于普通高校。这也给数据治理工作带来了更高的难度和复杂度。(3)技术要求更高:开放大学巨型的办学规模给数据治理系统提出了更高的计算能力、存储能力、数据处理能力等性能要求;“统一办学、分级管理”的管理模式也给数据治理框架的设计带来了较高的技术要求;以远程开放教育为主要形式的线上线下相结合的新型学习模式也凸显了数据治理的重要性和迫切性,数据治理对战略的决策支持作用更大,同时也对数据治理工作提出了更高的技术要求。(4)服务需求更多样:开放大学的服务对象是全体社会成员、强调面向人人,服务对象的多样性决定了其信息系统的多样性和数据的多样性,这也对数据治理工作的带来了更高复杂性的要求,同时对数据治理成果的应用也带来了多样的服务要求。
(二)开放大学数据治理面临的挑战
根据开放大学信息化发展的现状,结合当今行业数据治理的要求,现阶段开放大学进行数据治理将面临着如下挑战。
1.缺少战略支持和共识导致治理规划无法执行:学校领导层面对数据治理的战略认识是重要影响因素。开放大学是系统办学,总校与分校是业务指导关系并没有行政上的隶属关系,会导致总分校对数据治理难以达成一致,规划执行也会出现偏差。
2.数据多头管理,缺少专门部门控制和监督数据的采集、存储和使用等数据管理行为。信息系统的策划、开发和管理等职能没有集中统一进行。特别是开放大学总分校不同法人分级办学的现状,致使数据治理的职责分散,权责不明确,缺少基于全校层面的数据治理部门,数据治理的规范及其相关流程和标准等都没有统一起来,数据治理监督方法和手段缺失,即使有也无法得到有效落实。相关规范、流程和标准的执行更是没有考核体系来保障。
3.系统建设分散,数据标准和数据模型没有在校级层面进行统一。开放大学历史上一贯重视信息化能力建设,电大时期各部门都逐步建立了各自的信息系统,数据信息的生产、使用和管理只是为了满足自己的需要,数据也仅存在于各自的信息系统中,信息系统之间并没有任何联系,形成了一个个信息孤岛。由于数据多源、数据规划和标准没有统一,导致数据冗余、共享性差、不规范、不一致等多种问题层出不穷。
4.缺少统一的主数据,学校核心系统间的人员等共性信息并没有在一个唯一的系统中存储,这些共性数据在多个系统间的管理维护没有一个统一的流程,以保证其唯一性、准确性和规范性。缺乏学校层面的主数据管理,无法保障主数据在开放大学业务范围内保持一致、完整和可控,无法保障学校业务数据正确性。
5.没有形成统一的学校层面的数据质量管理体系。学校各部门只对各自系统数据进行质量管理;没有统一的可跨分校和部门的数据质量保障机制、数据质量管控流程与标准,由于业务需求不清导致数据分析随机性非常强,数据分析结果和质量都难以保证;数据采集没有全面实现自动化,数据处理存在人为干预的现象,数据质量管理团队存在人手、经验及监管等多方面的问题;缺乏数据质量管理所必需的基础设施支撑。
6.没有完整的数据生命周期管理。目前学校层面的管理规则和流程中没有对业务数据实现全生命周期管理的,过期和无效数据也无法识别;很多教与学的系统只采集结果数据,缺乏对过程性数据的采集;现有的技术可以完成对教与学的过程性数据的采集,但这些过程性数据往往是非结构化的,隐性的,难测量的;非结构化数据还未纳入管理范畴;缺少对数据生命周期状态的查询工具。
综上所述,开放大学数据治理还存在着诸多不足,尚未到达战略高度,也没有形成系统的方法论。无论学术界还是实践层面,对数据治理都尚未达成共识。这也意味着开放大学数据治理还大有可为。通过数据治理能够帮助开放大学建立数据标准,提高数据质量,达成数据共享,更好地遵从内外部有关数据使用和管理的法律法规,并能使学校管理层在业务、管理、战略决策中重视使用发挥数据资产的社会价值和商业价值,从而提升开放大学现代信息技术核心能力。良好的数据治理必将为信息化时代的开放大学事业发展带来不可替代的竞争优势。
为了有效管理开放大学信息资源,必须构建学校层面的数据治理框架如下页图1所示,由战略、保障机制、关键活动、实践与优化四层组成,四个层面内容既有机结合,又相互支撑。
(一)战略
战略处于体系的顶层,有二层含义:一是数据治理工作应在学校战略规划的指引下进行设计,包括学校业务发展目标、IT治理规划以及数据治理相关发展规划。数据治理相关的保障机制、关键活动以及实现(包括实践与优化)都是在学校战略目标和规划指导下进行的。二是数据治理必须得到学校领导的战略支持。如果学校领导层没有数据治理的战略准备,数据治理工作将无法有效开展。
(二)保障机制
開放大学数据治理工作的有效开展离不开组织、制度和流程三方面的保障。
1.组织。这里是指明确数据治理的组织架构,规范相关部门和人员的职权和责任。建立数据治理责任体系,明确数据生命周期各阶段所涉及到的部门的工作职责,并根据学校实际情况,在各主要部门设立专门的数据责任人,由责任人来负责数据质量、反馈业务系统需要。有效的组织架构是数据治理成功的基本保障,开放大学数据治理组织架构如图2所示。数据治理委员会由学校领导和管理人员组成,隶属于学校信息化领导小组。根据学校战略定义数据治理的愿景和目标;学校内跨业务部门和IT部门进行协调;设置数据治理计划的总方向;协调策略分歧。委员会成员还应包括学校各部门的负责人代表,以及来自视数据为组织资产的信息技术等部门的代表。这些高层管理人员都是数据治理计划的拥护者,以确保数据治理在整个学校内获得支持。数据治理工作组是数据治理委员会的下一个级别,由数据治理委员会中各部门负责人主持。工作组执行数据治理计划,负责监督数据管理员工作。各业务部门至少有一位业务分析员,信网中心等信息科技部门应设置数据质量分析员、数据管理员、集成开发人员。这些人员负责本部门数据质量,履行职责,解决具体问题。
2.制度。数据治理工作涵盖内容广泛,从规划到实施,从业务到流程,从前台到后台,从管理到技术,这就要求各项工作都必须从制度上加以规范和保障,以确保学校各级全面配合。开放大学数据治理制度从类型上可分为章程、管控办法、考核办法等。数据治理章程阐明数据治理的主要目标、相关工作人员、职责、决策权利和评估标准等,如数据治理规范就属于章程。管控办法是基于规章制度与工具的结合,是可落地的操作办法,如数据质量评估办法等。考核可对制度执行起到根本保障。实际操作中可根据学校情况,就数据治理方面可建立与个人绩效挂钩的考核办法。从内容上来分,完善的开放大学数据治理制度应包括对数据治理战略、数据标准管理体系、数据质量管理体系等三个方面的规划,以及元数据和数据安全等两个管理体系,还有数据中心整体架构设计和数据生命周期适用等,共七个方面。
3.流程。流程是任何组织运作的基础,学校业务离不开流程的驱动。这里主要是指遵循学校数据治理的规则和制度建立相应的流程。实际操作中可结合所使用的数据治理工具,与工具提供商进行协商,建立符合开放大学需要的流程管理。
(三)关键活动
主要指与开放大学数据治理相关的关键IT功能,包括数据模型与框架、主数据、元数据以及数据的生命周期、标准、安全、质量、服务等九个关键活动。
1.数据模型。数据模型是数据构架中重要一部分,也是数据治理的关键、重点。包括概念数据模型、逻辑数据模型和物理数据模型等。逻辑数据模型主要用来描述开放大学的概念化结构,使数据库设计人员在设计时不需要考虑具体技术问题,只要集中精力分析数据及其之间关系,与具体的数据库管理系统(DBMS)无关。通俗的讲,逻辑数据模型是根据业务规则确定的,关于业务对象及其数据项、业务对象之间关系的基本框架,逻辑数据模型是学校数据资产的全面的、准确的描述。概念数据模型是用户从数据库所看到的模型,是具体的DBMS所支持的数据模型,如网状数据模型、层次数据模型等等。此模型既要面向用户,又要面向系统,主要用于DBMS的实现。物理数据模型描述数据在计算机储存介质上的组织结构,与具体的DBMS、操作系统和硬件都有关。
2.数据服务。数据服务是指利用开放大学持续积累下来的历史数据来分析并优化业务流程特别是服务流程,达到提升业务效率、提高服务水平的目的。包括三个层次:(1)是通过数据报表、分析及挖掘等各种工具对数据进行多维度加工,形成运营分析报告和发展预测报告等,为学校管理层提供更好的决策支持服务;(2)是通过建立独立的权威的数据服务接口或平台来满足内部各业务部门、分校等系统内外对数据应用的各种需求;(3)是通过多源数据融合技术对不同源的数据信息进行综合,吸取不同数据源的特点,形成比单一数据更好、更丰富的统一信息,并建立唯一的权威的数据服务接口,加快数据流转,提升服务效率。
3.数据生命周期。指的是数据从创建到销毁的整个过程。一份数据的完整生命周期应该有数据的识别、数据的收集,数据的传递,数据的存储,数据的加工,维护使用包括被销毁等六个阶段。
4.数据框架。是指一系列数据处理技术,涉及到数据收集、数据加工、数据分析与展示、数据应用等四个方面,其中收集数据有三个来源包括感知、业务和互联网;数据加工包含数据的存储和整合;数据分析与展示包括数据挖掘和学习分析;数据应用是指将数据分析结果用于改善不同的业务,最终服务学校的整体改革与发展。
5.主数据。主数据是指从学校各部门多个业务系统中整合出来的最核心的、最需要共享的数据集合,一般包括人(教师、学生、管理人员等)、物(校舍、设备、图书、课程等)及其相互关系的信息。主数据管理是指对数据进行集中的清洗和完善最终形成统一的、完整的、准确的、权威性的主数据库,然后以服务接口的方式共享给需要这些数据的系统。
6.元数据。元数据就是描述数据属性的信息,是一种中介性质的数据。通过元数据可以为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具。元数据标准是一系列数据对象和数据项的集合,包含了描述数据资产具体对象时的全部规则。为学校各类数据资产制定元数据标准是一种实现数据的描述、管理和检索的可行的普遍的做法,也是实现数据交换的基础。
7.数据标准。数据标准是学校依据自身实际建立的一套多层次的数据标准化体系。学校各类数据采集必须遵循统一的标准,这是建立可流通可共享的主数据库的基础,也才能提高数据质量。统一数据标准也是开放大学数据治理初期做顶层设计建立治理框架的重要內容之一。从数据治理角度标准又可分为基础性标准和应用性标准。前者包括数据字典、数据分类与编码等,用于保证对同一数据的理解在多个系统间是一致的,也是系统间数据汇集交换的基础;后者包括元数据、数据交换等相关标准规范,主要是数据系统或应用平台功能开发所涉及的各个环节的标准和规范,以确保数据收集、传输、加工、使用的效率和质量。
8.数据安全。由于学校应用系统集中了大部分重要且敏感的数据,对数据使用的安全、数据的隐私、访问权限的管理、数据的安全审计、制度及流程、应用系统的权限控制等这六个方面的管理是非常重要的。
9.数据质量。数据质量包含对数据本身和过程两方面的质量。本身质量是对数据的真实性、完备性、自治性。过程的质量管理是指对数据在使用、存储和传输等过程中开展的质量管理。在实践过程中,导致海量数据无法得到有效的开发和利用的主因之一就是数据质量低下。数据治理工作的有效推进离不开完善的数据质量管理,数据资产能为学校提供有效的增值服务也是以此为基础的。
(四)实践与优化
主要指在学校战略规划指导下,在组织、流程、制度等保障机制支持下,通过学校数据治理工作的具体实践,对关键活动进行总结,对学校数据治理框架体系进行不断优化与完善。这些具体实践包括制定和执行开放大学数据治理相关技术规范和实施办法,建设学校数据治理的支持平台,开发与运维工作,以及其他IT支持等一切与数据治理相关的工作。
以上是开放大学数据治理框架,数据治理作为开放大学的战略活动之一,在学校领导战略支持下,关键的是下面三层,这是治理框架的核心内容和领域。本文将这部分进一步细化并定义为开放大学数据治理功能架构,如下页图3所示。开放大学数据治理功能架构可以划分为IT功能和组织功能两部分,数据治理离不开IT系统的支撑,IT功能架构就是传统意义上的系统功能结构图;为了保障数据治理任务的顺利实施还必须从政策机制、标准流程、法律规范等层面上有一个具体的指导思想,即数据治理的组织功能。在下页图3中为了区分这两个功能,组织功能用虚线表示。
异构数据库层:是数据的存储层,负责数据关系的维护和存储。为了保护开放大学多年来已有的投资,需要对多个数据库系统进行维护和存取。由数据库层提供统一数据访问子层,屏蔽了异构数据的差异性,为上层提供统一的数据访问接口。
核心支撑层:是系统的工具、规则、引擎层,包括ETL工具、数据导入导出工具、数据检索工具、工作流引擎、数据的策略(包括安全、存储、缓存策略等)引擎和安全规则引擎。通过这些工具为核心业务层服务。
核心业务层:是数据治理业务逻辑处理层。包括数据质量、安全、访问权限、策略、生命周期等业务的逻辑处理。考虑到开放大学数据治理系统的复杂性,在实际实施时可以考虑将这些功能划分为一个个的子系统。其中对主数据、数据安全等六个方面的管理属于数据治理的核心内容。
增值业务服务层:是数据治理的价值所在,是在原有数据基础上经过数据治理后使单纯的数据变为组织的资产,通过资产的再利用从而实现资产增值。如在开放课程平台上实现个性化推荐课程、根据课程学习情况制定师资配置计划,根据学生地区分布密度和访问时段分布制定师生支持服务中心人力配置方案,等等。
开放大学要有效开展数据治理,可以从国内外高校建设一站式服务中心的实践中得到启示,利用数据治理来解决学校业务中的痛点问题可以收到事半功倍的效果。
(一)国内外高校实践启示
开放大学数据治理作为一项战略活动,在实践上可借鉴国内外普通高校建设一站式服务中心的实践。从特拉华大学、伊利诺伊大学厄巴纳一香槟分校和同济、华中科技大学、安徽大学、南京医科大学、哈尔滨工业大学等建设一站式服务中心的实践来看。(1)开放大学数据治理要取得预期的成效,离不开学校领导的战略支持,数据治理的顶层设计必须从开放大学战略规划人手,这是首要条件。伊利诺伊大学厄巴纳一香槟分校数据之所以能够为其各级管理者提供决策支持,也是得益于该校以战略规划为抓手的数据治理顶层设计。(2)在校领导战略支持下,还有部门共识、部门协作、组织职责的重新定位和外部团队的助力也是关键的成功因素。(3)最重要的一点是必须找到合适的抓手,适时切入,才能事半功倍。特拉华大学和同济等国内外高校建设一站式服务中心就是抓住了学校师生对学校服务不满意的痛点,通过数据治理规划将各自线上线下的业务进行集中整合,既精简了流程提高了效率,又根据自身需要提供更多的方便师生的服务,大大节省了师生的宝贵时间,提升了服务满意度。
(二)实践切入点建议
开放大学要有效开展数据治理,也必须找到当前业务中的痛点,利用数据治理来解决痛点问题。上海开放大学校长袁雯认为“在线的便捷与面授的高效结合,辅之以随时随地的学习支持,构成新型教学供给的‘三元素”。通过开放课程平台将高质量的课堂面授开放给全体社会成员并实现精准的个性化学习支持服务将是开放大学建设新型大学的主要途径之一。本文认为师生支持服务系统和开放课程是当前开放大学业务中的两个主要痛点。
1.业务痛点一:师生支持服务系统
有点类似于普通高校的一站式服务中心,但由于开放大学分级办学模式和学生都是成人的原因,开放大学的师生支持服务系统必须是一个物理上分布式的以线上业务为主、线上线下结合能提供7*24小时服务的综合服务体系。这个综合服务体系主要包括两部分,一部分是面向学生为主的学习支持服务系统,另一部分是面向教师和管理人员的办公服务系统。
学习支持服务系统作为远程教育系统的主要组成部分之一,电视大学系统多年来一直专注研究,在开放大学无疑也具有非常重要的地位,所以开放大学在在线学习平台的设计开发及运维服务等方面较普通高校具有明显的先发和规模优势。但开放大学由于经费预算规模限制、信息技术及科研力量不强、主观不重视等原因,对管理人员和教师的支持服务如在内部办公管理信息化特别是业务流程整合、数据标准化等数据治理关键方面的研究与投入与普通高校相比还是有不少差距。这也成了制约开放大学进一步内部整合资源提升服务能力的短板。因此面向教师和管理人员的服务支持系统也就成了开放大学的痛点之一,建设师生支持服务系统显然是数据治理的一个重要抓手。
当然这方面最近也有不错的实践,如上海开放大学梳理组织架构形成了7万多条的人员中心并将原有办事中心、學习平台、消息服务等整合形成主要面向教师和管理人员的网上服务大厅,解决了困扰多年的内部办公多平台无法保证信息一致性的问题。
2.业务痛点二:开放课程平台
开放课程最早起源于英国开放大学。国内开放大学是由电视大学转型而来,但又不同于电视大学,其最大的不同就是开放大学是面向全体社会成员提供学历与非学历并重的教育服务的新型大学。这就意味着开放大学要服务一切学习者,实现真正的有教无类。而开放大学所拥有的师资等教学资源是非常有限的,要服务面广量大的全体社会成员必须借助于信息技术手段特别是网络技术的发展成果,建设开放课程平台,将开放大学优秀的课堂授课内容在互联网上向社会大众公开,必将成为开放大学达成其战略目标的不二选择。在这方面,国内外普通高校早已现行一步,无论是MIT、Yale,还是国内的清华北大复旦等高校都已在网上开放各自的部分课程。国家开放大学也已和国内主要在线教育平台“网易云课堂”“好大学在线”“爱课程”“学堂在线”“中国大学MOOC”开展合作尝试优质在线开放课程,但这离其服务全体社会成员的战略目标还有很长的路要走。开放课程平台建设必然也会成为开放大学的主要痛点之一。
3.基于业务痛点切入数据治理框架的实施建议
开放课程平台和师生支持服务系统都是牵涉众多的系统项目,但由于服务内容和对象都有所不同,在数据治理框架建构上也有所区别,如下表所示。
当然就具体的开放大学个体而言,每个开放大学都还有一些其他的痛点,但开放课程平台和师生支持服务系统作为未来开放大学群体的关注焦点,也恰恰都是必须通过信息化手段才能解决的且牵涉到几乎全校所有部门的两个重要服务平台,开展数据治理工作时选择这两个痛点作为切入点,在获得学校领导的战略支持、达成全校上下的部门共识、执行时部门之间的通力协作等都会相对容易,而且在取得一定成效后容易形成行业标杆,这也对数据治理工作具有积极的推进作用。由于开放课程和师生支付服务系统涉及到的图2所示的业务部门是不同的,当然相关治理组织、标准流程、制度机制及IT底层也都是有区别的,要视学校的具体情况而定。
(三)开放大学数据治理实践关键点
开放大学数据治理实践操作中,除了抓住业务痛点作为切入点外,在治理框架的四层结构中还必须结合自身的实践情况有所侧重。本文认为结合当前开放大学信息化能力发展现状,开放大学数据治理实践方面有以下关键点值得重视。
1.数据治理规划要与学校战略目标一致。这里所说的一致并不是简单地以学校现有的战略目标为核心来制定开放大学数据治理规划。技术可以改变生产关系,现代信息技术作为开放大学的核心能力,对开放大学的战略目标起关键作用,现代信息技术与战略是相互影响的。制定数据治理规划时要考虑到该规划对学校战略的影响,必要时要对原有的学校战略做出调整,形成新的战略。同样地在调整学校战略时,也要考虑对技术能力的影响,必要时也要对数据治理规划做出相应的调整形成新的数据治理规划。通过这样的相应调整使战略与技术相互适配达到新的平衡。
2.建立多元的均衡的数据治理组织架构。数据治理根据切入点不同和推进阶段不同会涉及到开放大学信息、业务、后勤保障、师生、组织管理等众多部门,这些部门的责权利会面临着重新调整和分配。所以在建立数据治理组织体系时,要将这些利益相关方尽可能纳入进来,让他们参与决策和监督,相互制衡,可以较好地平衡这些相关方的职权利,并能给数据治理工作带来最大化的支持力量。如以上述二个切入点作为抓手开展数据治理工作,学生作为比较重要的利益相关方,建立相关组织体系时,建议在治理委员会和工作小组中要有学生代表。
3.建立有效的数据治理绩效评估体系。绩效评估是一切管理工作的基础。数据治理作为数据管理的核心功能之一,其成功的基础也离不开有效的绩效评估体系。必须将数据治理纳入学校绩效评估体系,并与个人绩效挂钩。
4.在信息技術部门重构基础上打造新的数据治理队伍。信息化要真正成为开放大学的核心竞争力,从而为开放大学带来竞争优势,首先要革命的部门就是信息技术部门,美国高校的IT治理实践也充分说明了这一点。开放大学现有信息技术部门的这种僵化的科层制管理机制已经无法与信息化爆炸式发展所带来的管理创新的要求相适应,其用人机制也无法有效吸引行业人才加入,其在学校的地位也无法与数据治理这项战略任务相匹配。
5.技术平台及IT技术选择上要考虑快速扩展能力和适用性。开放大学作为面向全体社会成员的办学规模要求在技术平台或IT技术选型上要考虑系统的伸缩能力,无论是师生支持服务系统还是开放课程平台的系统规模振幅较大,要选择具有快速扩展和收缩能力的技术如云技术等,在对服务产品的选型上要考虑对象需求的多样性和适用性,选择能提供多终端稳定支持的服务产品。
五、结语
对于开放大学而言,作为一类以信息技术为支撑的正处于转型发展中的新型高校,数据治理作为一项战略工作必须得到足够的重视和充分的研究,本文在国内外文献研究和高校实践分析的基础上,给出了开放大学数据治理的初步框架,并在此基础上进一步给出了功能架构,然后结合开放大学当前实际情况提出了开放大学要开展有效的数据治理实践应从建设师生支持服务系统和开放课程平台人手的建议。希望本文的研究能为开放大学数据治理的实践工作提供一定的指导并能推动开放大学体系内对本系统数据治理的研究。
收稿日期:2018年5月19日
责任编辑:许林