企业级数据中心优化治理体系的研究与应用

2015-03-15 05:33范叶平
微型电脑应用 2015年12期
关键词:数据质量治理体系

范叶平



企业级数据中心优化治理体系的研究与应用

范叶平

摘要:数据逐步成为企业的核心资产,企业管理的核心是决策,而决策的依据是数据,只有准确掌握企业核心信息和数据,才能为企业的生产运营状况掌舵。针对数据中心资源管理及应用现状,以数据中心资源为研究对象,通过分析产生数据质量问题的原因,提出数据中心优化治理目标,明确数据管理职责,最终从组织、标准、管理和技术4方面构建数据中心优化治理体系模型,加强数据中心数据管控的执行力,形成公司数据管控常态化运作机制,保障数据中心的数据质量,充分发挥数据中心数据资产的价值,提升数据中心的服务能力。

关键词:治理体系;数据管控;数据质量;数据资产

0 引言

国家“十一五、十二五”计划期间电力企业信息化取得了跨越式发展,建成了一体化企业级集成平台,搭建数据中心软硬件平台,支撑了数据横向共享与纵向贯通、决策分析等应用,在数据管理、共享、分析等方面取得了一定成果,但在数据字典管理、数据资源管理、数据中心规范化建设、数据运维能力等方面仍存在不足。

1)数据字典缺乏统一管控

业务系统数据字典缺乏统一管控,数据字典设计不规范,未形成统一审核流程,一方面不利于企业数据架构的统一管控,信息的全面共享;另一方面当业务系统数据字典变更时,未及时通知数据中心,导致数据中心与业务系统的数据接口异常,影响数据中心数据的采集、共享利用。

2)数据中心数据资源缺乏统一管理

随着业务系统的不断接入,数据中心数据资源的不断丰富,同时数据中心根据需求建立了多个数据存储区域(如运营监测、辅助决策、综合查询等),数据资源多处存储,但由于缺乏对这些数据资源的统一管理,业务部门无法了解到数据中心存储了哪些数据、多少数据、存在哪里,不利于数据资源的统一检索、共享利用。

3)数据中心建设规范化有待提升

根据业务应用需求,各单位基于数据中心实现了业务数据接入、存储、共享使用,但在建设模式上统推、自建并存,存在数据重复接入、重复存储、模型不统一、编码不统一等现象,影响数据共享融合的数据质量。

4)数据运维能力有待提升

现有各单位数据中心运维团队主要以技术运维为主,可满足日常技术运维,但在数据中心数据资源统一管理、数据中心规范化建设方面支撑能力不足。

为了适应SG-ERP和“三集五大”的建设要求,更好地发挥和利用好数据中心的功能,提升数据中心的服务能力,用好、保护好、增值好企业数据资产,迫切需要开展数据中心优化治理,建立健全技术支撑体系和管理支撑体系工作。

1 企业级数据中心优化治理体系建设的内涵

企业级数据中心的优化治理体系[1-4]以保障公司核心业务为目标,将分散、多样化的核心数据通过标准化、质量探查、清洗、集成、监控和信息挖掘等操作进行优化,形成企业内部数据管控体系,将数据管理与公司组织机构相结合,以管理绩效为手段,加强保障数据质量管控的执行力,形成数据管控常态化运作机制,使数据治理在企业内部持续运行,保障数据的数据质量,为数据的集成和挖掘应用提供有力保障。

数据中心优化治理工作包括问题调研与现状梳理分析、工作思路及目标、组织保障、综合治理和形成常态化运作机制5个步骤,主要从问题调研与现状梳理、工作组织保障、数据管理组织、健全数据中心管理规范[5-8]、数据管控平台、常态化运作机制6个方面开展工作,形成“一个流程、两个维度、一个平台、一个机制”的数据治理体系,如图1所示:

图1 数据中心优化治理体系的内涵

“一个流程”----数据的全生命周期管理

数据的全生命周期一般指数据的产生、存储、交换、加工到归档的全过程,属于技术管理领域的概念。而本成果对数据全生命周期的定义侧重于在数据管理和应用的视角,将周期的起点从业务系统数据进入数据中心ODS,即“数据接入”,从源头上保障数据的质量;终点不止于数据的归档,而是数据的应用,数据的价值只有在应用中才能得到体现;“数据集成”环节强调对企业级数据加工及再加工过程的统一和整体的管理,即做到有数据质量保障的数据集中与共享,进而为下一环节“数据应用”奠定基础。

“两个维度”----管理与技术双管齐下

数据管理工作是一项极具挑战性的复杂工作,该项工作既涉及管理领域的内容,又涉及技术领域的内容,为了更好地指导工作,我们对“一个流程”中的3个环节从管理和技术两个视角进行细分。如,将“数据接入”的内容从管理视角划分为数据接口管理、数据检查规则管理、监督检查、数据的变更和维护等。然而要做到对数据接入的精细化、专业化管理,就要从技术视角确立了数据接入方面的工作内容,包括数据完整性验证、数据精度验证、业务逻辑验证技术工具的建设、数据接入在IT系统落地过程中需要完成的业务系统和外围系统改造工作等。其他环节的管理维度与技术维度工作内容的划分,与此类似。

“一个平台”----数据管控平台

数据管理工作是一项巨大且庞杂的工作,为了有效落实数据管理各项工作要求,必须依靠系统化的工具和手段来进行数据管理维护工作。因此,需要构建数据管控平台实现组织、制度和流程体系的有机融合。

“一个机制”----常态化运作机制

数据治理体系横跨“一个流程、两大维度”,为了保障数据中心优化治理工作持续有效,必须搭建一套符合数据中心优化治理工作的“常态化运作机制”。

2 企业级数据中心优化治理体系建设的主要做法

2.1开展调研梳理,找准问题关键

2.1.1问题调研

信息通信分公司组织调研,深入业务部门、基层一线运维,通过访谈、系统操作、问卷调研,全面了解数据中心管理、应用中存在的问题。通过全面调研,共计收集问题245项,除部分问题得到直接快速解决外,最终需要集中统一解决的问题共计185项。

2.1.2问题分析

经过分析,问题主要体现在4个方面。1)数据管理问题:数据未实现全面在线生成,数据的及时性和真实性得不到保证;部分信息系统设计、开发和实施质量不高,影响系统应用和数据生成;数据质量有待提升,数据准确性、完整性还有差距;各专业的业务数据未实现有效关联与集成,数据开放共享程度不够,数据结构和编码标准存在差异,给数据管理与利用带来困难。2)管理规范问题:公司依然存在专业管理壁垒,导致数据共享程度不够;业务部门主导各专业系统建设,导致系统功能重复及数据标准不一致;缺乏数据长效管理机制,导致数据治理治标不治本;未形成明确的数据问题整改流程,导致数据问题责任不清,难以持续改进。3)技术问题:缺乏企业级的数据标准,导致数据共享困难;未形成有效的面向服务的系统架构(SOA),导致系统集成困难;数据中心软硬件容量和性能不足,导致数据处理能力受限;数据授权访问没有有效的监控,存在潜在的安全隐患;面临不断增加的大量的数据问题,缺乏溯源支撑,难以快速定位。4)集成问题:数据接口不稳定,数据重复录入,业务流程未实现跨系统贯通等。

2.2理清工作思路,确定总体目标

工作目标:在 “SG186”、SG-ERP建设成果的基础上,总结、理清中心基础环境、应用和数据现状,构建并完善数据中心数据治理体系、服务能力、资源状况的全局视图,全面监控数据中心核心要素的运行状况,为各级决策者、管理者、执行者提供全方位、多角度的可视化展示和数据分析服务,支撑精细化管理,对数据中心做到“心中有数”。

总体思路:以保障公司核心业务为目标,以两级数据中心建成投运、各项业务顺畅运转、功能发挥为重点,以数据中心的指标数据、业务应用、基础环境深化梳理、数据管理体系建立健全为支撑,以数据中心管控平台建设成果验收、数据全生命周期流程监测为抓手,加强数据中心数据管控的执行力,形成公司数据管控常态化运作机制,保障数据中心的数据质量,充分发挥数据中心数据资产的价值,提升数据中心的服务能力。

2.3建立工作组织,落实保障机制

成立组织机构,明确职责划分,保障数据中心优化治理工作顺利进行。领导小组由科信部领导、信息通信分公司领导担任组长,负责指导开展数据中心优化治理项目建设,开展方案审核、督导检查和总结验收工作,协调解决重大问题。项目管控组由信息部门项目专员、建设团队项目经理、信通运维团队负责人担任组长,负责组织开展数据服务质量管理项目建设工作;负责把控整体建设进度与项目质量;负责协调需求管理、系统部署、系统集成和外围接口组之间的问题解决;负责定期向领导小组汇报项目整体工作进展情况。项目建设团队负责梳理调研数据中心环境、ODS数据情况,提出优化和治理方案,制定数据中心管理规范。配合团队由信息通信分公司运维专职和各业务系统运维厂商组成,配合数据中心梳理工作,协助项目建设团队完成数据中心运维管理规范。

2.4构建治理体系,实现治理优化

为了实现企业数据中心优化治理目标,构建完整的企业级数据中心优化治理体系,必须从组织、标准、管理和技术保障四个方面建立支撑体系。明确数据中心数据组织架构和角色职能划分可以有效地保障企业级数据中心优化治理目标的落实;数据标准是数据中心优化治理体系的基础;数据中心优化治理体系管理规范定义了数据管理应当遵循的规范;技术平台的建设和优化为数据中心优化治理体系规范管理提供支撑。这四方面构成了完整的数据中心优化治理体系,保证数据管理有标准、有制度、有稽核、有手段,使得各项优化治理工作能够得到有效落实,达到数据中心优化治理的目标。

2.4.1优化数据管理组织,明确数据管理职责

为了实现企业级数据中心优化治理目标和主要工作内容,必须优化数据管理组织,明确数据管理职责,数据管理具体角色和职能的划分,如图2所示:

图2 据中心数据管理组织机构

2.4.2完善数据中心模型,完备数据资源梳理

依据公司SG-CIM模型、主数据标准,结合公司数据中心建设及应用现状,通过收集数据中心相关设计文档,制定数据梳理模板,采用人工和技术监控相结合的梳理方法,对数据中心的数据字典管理、数据资源进行梳理。

1)信息系统相关设计文档核查:依据《公司信息化项目竣工验收管理办法》在IRS系统中核查业务系统的《需求说明书》、《系统概要设计报告》、《数据字典》或《数据库设计说明书》。

2)数据字典梳理:梳理数据字典是否与系统实际开发情况一致,需确保数据字典的全面、完整、准确。数据字典梳理内容包括数据库信息、物理实体、实体属性,如图3所示:

图3 字典梳理信息及关系

3)数据资源梳理:在数据字典梳理工作基础上,根据统一模版梳理数据中心指标数据、明细数据、数据接口,形成数据中心指标数据资源手册、明细数据资源手册、数据接口资源手册。

经过梳理,减少无效模型55个、完善无注释模型1239个、消除重复模型36个,优化接口22个,涉及接口对象692个,完善了数据中心模型及数据中心接口,形成了企业级数据中心数据资源全景视图及优化指导手册。

2.4.3规范数据管理流程,健全运维管理体系

通过对数据中心优化治理工作,依据公司上下线管理办法,结合公司数据中心日常运维实际,项目搭建了“两大制度、六大流程”,如图4所示:

图4 大制度、六大流程

建立了数据中心“全闭环制度体系”,其范围涵盖了企业级数据全生命管理,为数据中心数据管理提供了完善的制度流程保障,丰富了数据中心运维管理体系。

2.4.4筑牢数据管控基石,巩固技术支撑体系

数据管控平台作为数据管控的基石,是面向企业级数据中心的数据质量管理的全过程管理工具,从数据源头到数据接口加工过程处理、到数据质量诊断、再到数据质量评估、最后到数据质量问题分析与处理;采用全链分析方法,根据数据血统关系获得数据的来源与加工过程,根据数据影响关系,对数据质量问题快速定位,从而实现该数据对象的全景展示;具体包括以下内容:

1)对企业数据中心的数据集成全过程的质量问题管理与监控,包括业务系统数据进入数据中心前数据质量规则检查(如完整性检查、及时性检查等)、数据中心内部管理及数据加工处理过程中的数据接口监控(如ETL过程监控、OGG处理过程监控、DBlink处理过程监控)、数据中心外部应用,如图5所示;

图5 数据管控平台

2)通过数据血统关系、数据影响关系建立企业数据全链关系图谱并基于此提供质量问题归并;

3)建立数据质量规则库,并从完整性、准确性、一致性、及时性四方面进行数据质量度量,基于规则识别数据质量问题,并根据具体的数据质量诊断任务,定时进行数据质量诊断并生成数据质量诊断结果;

4)以元数据描述了企业数据血统关系图谱、数据影响关系图谱及数据全链关系图谱,对外提供统一的数据描述及全景视图,主要包括数据全景视图、应用全景视图、基础环境全景视图。

2.5形成常态运作,强化管理效果

2.5.1完善数据梳理方法,形成常态化梳理机制

在“一个流程、两个维度、一个平台”数据中心优化治理的运行过程中,不断完善梳理方法,结合技术手段,巩固和完善数据中心资源梳理方法论,形成常态化梳理工作,丰富数据中心全景视图。

2.5.2构建数据监控机制,提升异常数据处理效率

为确保未来新建系统或系统重大改造后,也同样能满足业务系统进入数据中心的“数据质量高、数据价值大”的目标要求,根据数据中心管理办法,结合数据中心基于规则的数据质量评价标准,建立有效的数据质量监控机制,在数据中心数据处理主要阶段设置数据质量检测点,实现源系统核心数据稽核、源系统维表稽核、数据实体检查、处理过程检查和关键指标检查,实现从源系统接口层到数据应用层的全流程数据质量监控,便于数据质量问题提前发现和及时处理。同时,管理在数据质量监控中产生的告警信息,并集成元数据信息,实现拓扑呈现,提供数据中心数据处理状态和质量状况的全局视图。

2.5.3建立日常例会制度,加强组织内部沟通协调

针对数据中心深化应用形成周例会、月度例会制度,以例会形式反映数据管控中遇到的问题,会议由公司领导主持,各相关业务部门、系统运维单位、系统使用单位相关人员参加,在例会上,对所收集的问题、数据管控的情况进行分析讨论,属于各部门流程问题的,由各业务部门安排进行治理。属于数据中心运维单位原因导致问题的,由科信部牵头组织处理。对于涉及多个部门的问题,在会议中进行协调处理。

3 企业级数据中心优化治理体系建设效果

3.1完善管理体系,提升运维水平

通过本次数据中心优化治理工作,制定了2大制度、发布了《国网江西省电力公司数据中心数据质量管理办法》、完善了6项制度流程,优化了数据中心制度规范,构建了执行、监督为一体的数据中心运维管理体系,完善了数据中心运维管理体系,有效地提升了数据中心运维管理水平,实现了数据中心运营安全价值保障。具体效益如下:

1)管理覆盖企业数据从数据源头到数据接口加工过程处理、到数据质量诊断、再到数据质量评估、最后到数据质量问题分析与处理策略的全过程,涵盖数据的产生、加工、应用的全过程。对企业级数据中心的数据质量的全方位控制与提升可以起到有益的促进效果;

2)设计开发的数据全链图谱关系及数据质量诊断规则引擎使得用户通过简单的规则配置即可实现数据质量问题的自动诊断与报告,极大的减轻了企业数据质量管理人员的工作量,提高了效率;

3)成果实施后,信通分公司2014年数据治理、集成、维护等相关信息化项目较2013年节约资金726.07万元。省公司所属百余家单位仅在财务结算、物资招投标、生产设备

管理、人力资源报表管理、项目工程管理等方面因数据整理的人工费用每年可节约近千万。

3.2创新数据管控,树立行业典范

依据“一个流程、两个维度、一个平台、一个机制”数据治理体系设计开发的数据管控平台,针对数据中心相关的硬件系统、网络系统、系统级软件、应用程序和数据等六大类组成要素,收集、整理基础技术参数、性能指标、厂商信息、业务属性、关联关系、管理属性等信息,完善扩充档案信息,可对数据中心硬件、应用和数据的性能及运行状态进行全面深入监控,可视化集成并自动告警,提升各级管理人员对数据中心的把控能力及精益化管理水平。在此基础上,从运营维护、技术管理、业务管控、辅助决策等工作维度出发,构建多层次多视角的数据中心全景视图,形成动态管控管理机制。

4 总结

“一个流程、两个维度、一个平台、一个机制”的数据治理体系从数据全生命周期的角度阐述了数据治理工作各个环节的内容与结构,贯穿了数据接入、数据集成和数据应用等各项数据治理工作的重要环节,通过对企业数据中心优化治理实施,证明该体系具有科学性和可实施性。经过该体系的实施,实现了数据中心管理工作规范化、制度化、常态化,有抓手、可控制,为公司利用信息化手段管理数据质量提供有效支撑,从而提高其数据资产的价值,提升企业对外服务能力。

参考文献

[1] 中信银行股份有限公司数据治理工作组.商业银行数据治理体系构建思考[J].中国金融电脑,2012(2):23-27.

[2] 李闽一,范小赞.中国联通数据管理体系规划与建设[J].业务与运营,2009,6:27-31.

[3] 李谦,白晓明,张林,等.供电企业数据资产管理与数据化运营[J].华东电力,2014,42(3):0488-0490.

[4] 匡红刚,王涛,唐融,等.数据质量闭环管控框架数据估值的应用研究大数据时代[J].华东电力,2013,41(3):0547-0549.

[5] 孟庆.大规模数据整合的难点与数据中心优化方向[J].信息化建设,2012,5(255):12-13.

[6] 施超.数据中心安全隐患分析与治理[J].智慧城市,2012:37-38.

[7] 席敏晖.浅谈企业级数据中心运维管理[J].信息技术,2014,12:46-47.

[8] 琛江,谷和启.浅析企业级数据中心运维管理[J].系统管理, 2013,8:63-67.

收稿日期:(2015.06.06)

作者简介:范叶平(1979-),男,安徽南瑞继远软件有限公司,工程师,研究方向:电力行业信息化管理、架构设计,合肥,230088

文章编号:1007-757X(2015)12-0051-03

中图分类号:TP3

文献标志码:A

猜你喜欢
数据质量治理体系
新加坡法治反腐的实践经验及启示
大数据视角下的国家治理现代化
高校治理体系和治理能力探究
高职院校学生管理问题现状研究及对策初探
电子商务平台数据质量控制系统及仿真模型分析
强化统计执法提高数据质量
浅析统计数据质量
金融统计数据质量管理的国际借鉴与中国实践
浅谈统计数据质量控制
国家治理体系和治理能力现代化实现路径