杨学利
辽宁建筑职业学院,辽宁 辽阳 111000
标准无论在生活还是学习中影响是深远的,如度量的标准、安全的标准等。如果标准不对或没有可遵循的标准,则容易引起混乱。同样,对于一个学校来说,采用统一标准的数据格式也是很重要的。
数据标准化[1]可以保证在学校范围内数据从定义到接口以及后期使用规范等都是统一的标准。对接入的应用系统所需数据起到规范和约束作用,是智慧校园信息化发展的先决条件,是保证一所学校信息化发展到一定高度的基础。对于学校而言,所谓数据标准就是对数据的性质以及含义、接口类型和出处等做出合理的规范,以此保证现有和后续的业务系统对数据的定义和使用有一个统一理解,使学校基础数据始终保持一致性,最大限度地实现信息资源的价值[2]。不能因为学校发展和数据量的增多逐年增加投入系统整合的成本,并且始终要保障信息共享和各类分析的准确性。
数据标准建设对于学校来说是数据建设的首要任务。但是学校从零开始建设信息标准是不可行的,我们必须在一个初具规模的基础之上进行适用学校的校标建设迭代,从而形成我们学校的可执行标准。职业院校一定要基于国家标准、教育部标准、行业标准,这将大大有利于标准的有效性扩展、兼容国家可持续迭代,最大程度对接国家上报数据标准,有利于建成学校自己的一套标准体系。
高职院校数据标准的建设可彻底消除数据在不同系统间互相访问受限制的问题,始终保持数据从定义到使用规范的高度一致[3],这可以为学校的二级管理部门形成自己数据报表提供依据和数据支撑,能够准确掌握目前学校现有的应用系统运行和使用情况,加强部分信息资源的使用率,找到问题结点精准施策,提高系统集成度,改善学校数据质量,去除冗余和垃圾数据,为信息化不断发展中的后续应用系统铺平道路,减少不必要的人力和物力的支出,保障后续系统能和现有数据实现无缝对接。
同时,数据标准建设也为师生提供相应的支撑。数据标准建设可提升业务规范性,保障人员对数据业务[4]含义理解一致,支撑业务数据分析挖掘以及信息共享。对于管理老师而言,有数据标准作为支撑,可提升系统实施工作效率,保障系统建设符合规范,同时降低出错率,提升数据质量。对部门领导而言,数据标准建设可提供更加完整、准确的数据,更好地支撑决策、精细化管理。
我们最终是通过统一数据标准的制定结合学校完善的数据标准管理体系,实现数据的标准化管理,保障应用系统数据的完整性、一致性、规范性,为学校将来发展提供数据支撑,为后续的数据管理提供标准依据[5]。
由于我们国家和国外一些发达国家相比,信息化建设起步比较晚,对于高校信息化也是近几年才逐步开始重视起来,所以许多学校并没有把学校数据资源当作一种重要资产来对待,也就没有让数据融入到学校管理和教务教学中去,或者有些学校融入得并不完全,只是简单做一个分析,做一下表面文章,并不能从真正意义上解决学校的实际问题,了解学校某一方面的具体情况。
目前多数职业院校应用系统的建设都是二级部门根据自身业务需求而建立,不能从学校发展出发做一个整体的规划。另外,不同系统的建设厂商为了自身的权益考虑,在建设方式和数据标准上都可能有所不同,所以不同系统之间数据的不一致性难以避免,究其根源就是没有一套统一的数据标准来进行约束和统一管理。
学校在对数据管理和使用过程中,由于缺乏标准约束和整体规划设计会出现很多问题,主要有以下几点:
首先,由于应用系统出处不同,数据存储结构不一致,当某一应用系统需要调用其他系统的数据时,由于这些数据在原始存储时候没有统一的规范标准,所以数据在不同系统中存储结构不同,这样就导致数据无法进行直接关联,所谓的数据共享和数据价值[6]也就无从谈起。
其次,系统对数据定义和理解也不一致,不同系统对数据的命名、含义、取值范围等定义也有所不同,有些时候名字是相同的但是所代表的意义却是不同的,所以在数据关联时容易发生混淆,对系统分析处理问题造成很多的影响。
再次,也是数据发生错误的最主要的原因,就是数据来源不一致。目前有许多高校由于业务系统没有进行数据关联,采集数据时候都是按照自己业务需要进行单方面录入,这里也不乏个人原因,比如学生在输入自己个人信息时,入团时间、入党时间等很可能会出现前后录入时间不一致,这样就会对相应的统计结果有一定误差。
数据标准在特定的环境中存在相应的变化。各校的应用系统和数据形式不一样,在进行数据管理中要因地制宜。从大的方向数据标准可以分为数据结构[7]、数据来源和技术业务三个标准。
从数据结构角度上分为结构化数据标准和非结构化数据标准。结构化数据标准主要是针对比较统一的数据,通常这类数据主要包括信息项分类、格式、长度和定义等。非结构化数据就是针对一些数据在名称、格式、分辨率等方面不是很统一的数据。
从数据来源角度上可以分为基础类数据标准和派生类数据标准。基础数据就是业务系统直接产生的原始数据和相关代码数据,这些数据主要是保障业务系统日常运行时的数据的统一性;派生类数据主要是指在业务系统使用过程中,后期加工计算出来的后续数据,比如统计报表数据和实体标签等。
从技术业务角度看,数据就是指在实际工作中,针对不同的部门的业务系统通过实际业务沟通而制定的数据标准,通常指业务定义命名、管理部门标识和相关业务主题等。技术数据指标就是通过信息技术对相关数据做出统一的规范和定义,通常指类型、字段长度、数据格式等。
随着信息时代的到来,移动终端的不断普及,高校从招生宣传到管理模式也在发生着变化,高校之间竞争也日益激烈。相关教育部门对学校规范要求也是日趋严格,各个高校也逐渐意识到时刻掌握自身的优缺点的重要性。通过数据分析解决问题,增强自身的竞争力,是最行之有效的方法。建立符合高校自身的数据标准势在必行。建立数据标准需要有相应的数据标准管理组织[8],其主要就是负责数据标准的统一管理和实施,承担基础数据的制定、维护和后期应用、监督等工作。管理组织一般由数据标准决策层、管理部门和具体工作的实施人员组成。另外,数据标准管理工作要想顺利地进行,需要学校管理层制定相应的管理制度,主要是指数据标准管理措施、数据标准规范和数据标准管理操作文件等,只有这样相关负责部门才能有理有据地开展工作。根据多数学校的情况数据标准建设一般可分为以下几个阶段,具体如下。
由于高校之间情况有所不同,所以要从实际情况出发,结合不同厂家给出的具体方案,根据现行国家标准和行业通用标准以及数据标准化经验的积累,梳理出一套符合高校数据场景的数据标准,梳理出数据标准建设的具体范围,定义数据标准体系框架、分类等,制定详细的实施计划。根据当前高校数据治理和标准化的数据要求,数据标准通常包括主数据标准和代码标准。主数据标准主要涵盖了高校的院系信息、人员信息、人事信息、教务信息、办公信息、财务信息、学工信息、科研信息、资产信息、组织信息、校友信息、外事信息、卫生信息、统战信息等主题域的信息数据子集分类标准。其中还包括了信息标准分类规范、信息子集编制规范、数据项元数据定义规范说明等。代码标准包括全局代码、院系部门代码、人事代码、教务代码、办公代码、财务代码、学工代码、科研代码、资产代码、组织代码、校友代码、外事代码、卫生代码、统战代码等主题域的代码标准。
信息化建设办公室可根据厂商提供的参考标准和学校自身情况,以及学校在未来几年的整体规划情况,对企业标准文稿进行合理修改并评审,形成符合学校的数据标准初稿。已形成的校标(学校数据标准)要与相关业务部门进行沟通征求意见,与之相关的部门都要进行实地调研,以免在建立以后出现不必要的麻烦,然后形成校标的草案。如果进行得顺利则没有大的变动,最后就可以形成学校的数据标准的基本准则。
根据数据标准的体系框架[9]和具体分类,先确定好分类数据的标准模板,然后由相关人员依据行业和学校具体需要进行数据标准的编制。数据标准建设工作繁琐而且工作量比较大,后续管理工作也非常困难。高校可根据自身情况设计一套完善、易用的数据标准管理工具,帮助工作人员完成数据标准的管理工作。上述我们了解高校数据标准落地大致思路是,首先厂商根据参考标准以及实施经验形成企业标准,然后校方根据学校业务系统具体数据情况和学校信息化建设的规划对企业标准进行评审修改后经业务专家评审,最终形成校标。因此,数据标准管理工具的设计应该包括高校参考标准管理、业务系统标准管理、企业标准管理、校园标准管理四块功能。
高校参考标准主要有国家标准、教育部标准和行业标准,参考标准管理其主要功能有标准的增删改、标准文档的上传下载、标准文档在线查看。
业务系统标准管理是在高校各个已建的业务系统所采用的标准规范,包括各个业务系统的数据模型标准和代码标准,通过对业务系统标准的管理,主要是实现以目录的形式展现高校所有业务系统中的数据全景,对了解高校的具体业务起到关键辅助作用。加强对高校各个业务系统的管控能力,形成高校所有业务数据的视图。它是高校执行标准落地的主要参考。数据标准主要是为了使业务系统之间实现数据共享而建立的,业务系统管理主要实现数据模型分类管理、数据模型对象管理、数据模型对象的日常查看、数据模型对象的日常维护、数据模型对象字段的日常维护等功能。
企业标准管理[10]就是借助企业数据标准化管理的经验,为高校数据治理和标准化解决实际问题。管理工具支持单个数据对象的在线添加及编辑,也要支持批量数据模式的整体导入。其功能主要分为代码模型和代码管理,主要是数据模型分类管理和对象管理,数据模型对象的日常查看和维护,数据模型对象字段的日常维护,以及查看、新增、删除,等等功能。
校园标准管理就是针对学校自身情况而定的,工具主要是单个数据对象的在线添加编辑,批量数据的整体导入。其功能主要分为代码模型和代码管理,主要是数据模型分类管理和对象管理,数据模型对象的日常查看和维护,数据模型对象字段的日常维护及查看、新增、删除等功能。
各学校情况有所不同,数据量和数据类型也有很大的不同,所以不是所有的数据标准都能够完全落地,实际工作中可能会存在历史系统无法改造的情况,所以首先确定数据标准落地策略和落地范围,并制定相应的落地方案,然后推动数据标准落地方案的执行,对标准落地情况进行跟踪并评估成效。
不是所有的数据都需要建立数据标准,高校中实际数据模型中有上万个字段,有些模型还会经常变换更新,如果把这些信息全部纳入到标准体系中工作量巨大,很难真正实现落地。因此仅需要对核心数据建立标准并落地,既可达到预期效果,同时也提升了工作效率。数据标准范围圈定建议:共享性高、使用频率高的字段需入标;监管报送或发文涉及到的业务信息需入标;结合数据使用情况,对于关键数据的字段尽量入标;数据应用有使用需求的字段需入标;与系统人员沟通其系统内重要信息来辅助入标判断。
数据标准落地工作中的困难在所难免,如某些历史系统无法改造或者改造成本过大,导致无法落标。这就需要结合不同的系统,建立不同的落标策略。对于新建系统,一般采用强制落标的策略,即新建系统必须符合数据标准,在新系统启用之前对其进行数据标准落地评估,如评估结果不合格,则令其整改。
对于已有的历史系统,建议采用落标的策略。首先将已有系统的标准问题找出来,然后进行分析和整理,综合多方面考虑,包括工作量、整改风险、周期、成本等等,最后制定最有效的落标策略,比如等到以后系统升级改造时再落标,通过逻辑转换方式落标,通过数据仓库落标。
综上所述,高校数据标准体系建立需要各个部门通力合作,并非哪一个部门可以完成,在实际建设过程中会面临很多困难和挑战,需要在实践中不断调整策略和方法,各个部门需要密切沟通,加强业务系统用户的体验度,把契合点前置问题后移,最后找到双赢的点,最终形成一套符合自身的数据标准体系,为学校的发展和竞争力打牢基础。