寇 贇 徐 建 严军峰
(1.陕西机电职业技术学院科研信息处,陕西 宝鸡 721001;2.陕西机电职业技术学院电子与信息学院,陕西 宝鸡 721001)
智慧校园的建设使得高校产生了大量的数据,在智慧校园建设的中后期,为了能实现数据的有效挖掘,对管理层、师生做好服务工作,需进一步推进数据治理,建立数据管理机制、标准体系。对各应用系统产生的业务数据汇聚共享。进入“十四五”阶段,智慧校园的建设需要进一步升级,从数据的有效性、应用方面、依靠人工智能技术等不同角度与智慧化、智能化应用融合进行探索,不断拓展学校各项工作的覆盖面和融合度。而在智慧校园持续推进的过程中,数据是智慧校园建设成果中的“黄金”产物,数据是产生智慧的源泉——无数据、不智慧[1]。因此,为进一步突出智慧校园建设的效果,本文从智慧校园数据治理面临的瓶颈与对策进行探讨分析。
各高校在信息化建设的基础上,随着系统的更深一步使用,为了更好地服务师生,进一步开展智慧校园建设,各业务平台如人事、学工、教务等业务平台积累了大量有关学生信息、学习活动轨迹信息、教师信息等方面的数据,如果对该数据不能有效地进行挖掘、探索,则不能达到智慧校园建设的目的,不能为管理层提供决策机制,不能为师生做好服务工作。2020年年初,新冠肺炎疫情席卷而来,改变了高校传统的线下教学模式,开始转向学生在线听课情况、在线课堂等,这也是当下越来越多的学校正在尝试开展数据治理的原因之一。如西北工业大学从顶层设计、数据治理环境、数据管理体系和数据价值体系四个方面先行,利用构建、运行、监控、评价等方法逐步展开数据治理工作[2]。上海海事大学以实现数据完整采集归集、建设学校数据“湖”、实现公共数据按需共享、加快提高数据服务能力为目标提出数据治理[3]。中国人民大学利用数据共享中心的建设,整合多年信息化发展形成的数据,重组现有数据标准,构建学校共享数据库[4]。华西医院通过平台实现高质量、高可用性数据,结合数据挖掘方法和共享技术,实现医疗数据资源的高效利用[5]。范德比尔特大学采取了一系列的数据治理策略,充分利用了数据的价值,为学校在教学、管理、科研、服务、医疗等方面提供了科学决策依据[6]。以上各高校数据治理实践表明,高校智慧校园经过建设后,要进一步加强数据治理建设,将数据变成互联互通状态显得十分重要。
智慧校园建设过程中的数据治理工作是一项非常有意义的数据资产挖掘工作。要真正实现数据治理的目的,需要各业务系统相关部门,如学生处、教务处、人事处等业务部门管理者提出需求,提出相关部门在处理工作中想利用数据解决的问题,对数据的标准建立、数据的质量等相关过程积极参与进来。而不是把自己作为消费数据的人员,只依赖于技术团队提供的可直观操作的界面工具。同时需各级管理者积极参加相关培训,培养数据分析思维。
首先,智慧校园在建设的过程当中,在各业务部门建立了对应的业务系统,容易出现在不同的业务系统获取到的数据不一致的情况,如学校在校生人数,在招生系统里可以查询到报考本校的所有学生,在教务系统里查询到的是在籍学生人数,两个系统产生的数据因有部分学生退学等相关原因,导致数据不一致;其次,在工作展开收集相关数据时,因更新不及时会存在获取到的数据不可靠的问题,影响数据的决策性。因此,获取到的数据来源要有源可查、要及时更新。
学校在进行数据治理的时候,会遇到各业务部门之间共享数据的问题。一方面,有些业务部门对于分享数据有抵触心理,认为本部门有拥有这些数据的特权,没有达成“数据共享是必须,不共享是例外”的共识,或担心数据的安全问题;另一方面,部分业务部门进行数据共享时,业务信息系统之间进行数据互通可能会存在技术障碍。如学校的某些业务系统是定制或者采购,在学校资金充足的条件下,则会要求供应商提供数据开放或数据导出接口服务,但学校要花费大量的时间与供应商对接需求。当然,也会存在部分学校在数据治理工作上投入的资金有限,则数据治理就会相对比较落后。如果部分系统有数据导出功能,可以定期导入到数据分析工具中。因此,数据需要在整个学校各业务部门互通,不应该以竖井的形式进行,也不应该被视为某业务部门的独有特权。
数据治理是集中人、过程和信息技术的数据管理过程或方法,要确保高校各业务部门数据资产得到合理的使用。同时其也是技术与制度相结合的一套持续改善管理机制。
数据治理的技术路线如图1所示:数据治理技术层面首先要对对应的数据标准进行数据采集,协同各业务部门,围绕核心业务工作,找出哪些数据是关键数据,或者说关键指标。关键数据、指标要切中要点,能够对学校办学提供重要支撑,比如学科建设和专业建设。其次要对采集的数据进行梳理与质量初检,可通过实现数据源头实时采集,做到准确可靠,并针对目前人工智能背景下的神经网络、网络爬虫等智能挖掘技术在数据采集方面的应用特点与差异,制定校本化的数据采集质量标准,强化教育数据采集的规范性。再次要进行数据清洗与整合交换,建立共享数据中心,可依托主数据管理平台,融合教务、人事、学工、图书、一卡通、财务、网上教学等应用。最后要进行数据管理与质量评估、可用服务接口设计,对数据价值模型建立及展示,进行多维度数据分析和呈现,对师生日常行为进行画像,从而在数据中发掘应用价值。
建立数据治理体系是数据治理工作的基础,为了有序实施数据治理,应采用规划先行的原则,制定适合各校业务特点的管理流程。相比较数据治理技术路线,结合建设智慧校园的实践经验,更应该从以下制度层面展开数据治理。
3.2.1 提升数据统一管理意识
为了提升学校数据治理能力,需要管理层认识到数据是流通的、共享的、有价值的,要将各业务系统产生的数据进行物理或逻辑的集中存储、整理、分类、分级和发布,并提供相应的授权访问,从而发挥数据的最大效用。
数据中心的建设首先要完成数据整合和内容整合工作,提供数据集成和管理、个性化数据服务、针对互联网和内部网的数据搜索功能等。各业务部门依据业务职责提出各种内部数据需求,并分别按本部门形成和管理的数据、需要其他部门提供的数据分别汇总,确定数据内容、数据同步周期和数据提供方式等。同时数据中心对各种数据进行归类,对各部门需要其他部门提供的数据归纳为部门间共享数据。对于跨业务系统的数据共享应根据需求,协调共享数据资源,其他业务部门有义务实时提供本部门业务系统所产生的权威数据到学校数据中心。
3.2.2 制定数据治理相关制度和规范建设
为充分利用数据为教学、科研、管理和决策服务,规范各信息系统数据管理,保证各类数据完整合理、有序流动,以及数据安全,规范数据治理相关制度显得非常重要。各业务系统可结合本部门实际情况,制定数据维护与管理规范,明确数据维护的权限和职责,制定数据维护的规程。对数据新增、删除和修改应记录审计日志,同时提供方便简捷的日志查询功能。同时各业务系统部门应建立各自完整的数据存储和安全策略,从而保障数据资源的安全可靠性。如有新系统上新,则在系统投入使用之前,应建立统一的数据质量标准、管理标准以及数据标准体系,可提高各部门数据共享效率,避免形成孤岛。
3.2.3 加强数据资源的开放和安全使用
各业务系统产生的数据均为学校所有,任何部门无权独占。各业务系统有义务确保各自所维护数据的及时性和准确性,按照需求向数据中心共享数据。同时数据的流通需要建立安全机制,因此需建立数据审核机制,可保证数据的规范和准确。各数据产生业务部门应当建立完整的数据录入和审核制度,明确责任人,做到数据的录入和更新应及时进行,确保与实际业务同步。及时审核新产生的数据,做到录入、审核过程可追溯。
3.2.4 加强数据质量监控和考核
为了保证数据管理的科学性,保证数据的提供的准确性、及时性、便于利用,符合安全、保密要求,必须建立健全数据质量反馈制度,以保证数据的质量。可指定部门对产生的数据质量进行考核,各业务部门有义务监督其他业务部门所提供数据的质量是否符合准确、及时和规范性要求,将数据质量反馈也纳入各学校信息化建设考核当中。同时数据使用部门可以提出关于数据准确性、时效操作性和一致性的意见,并送达数据提供部门,协助和督促数据提供部门不断提高共享数据的质量,同时不断完善数据平台的性能和功能,并定期检查、跟踪反馈记录。从而保证数据治理工作常态化开展,推动数据质量不断提升。
本研究从数据治理技术路线和制度层面展开分析、探讨,突出智慧校园建设中数据治理的重要性。数据治理工作的展开需要进一步加强顶层设计、制度健全以及建立统一的数据标准体系。当下疫情的防控工作,对学校数据治理能力提出了更高的要求,因此在“十四五”规划阶段,数据治理工作应该更深入同时也需结合人工智能相关技术进一步探索数据治理,挖掘数据的丰富价值。