◎谢定芬
大数据时代企业的主数据管理
◎谢定芬
本文讨论主数据管理系统在大数据时代的意义与作用,以及主数据管理系统如何在企业中通过数据整合以及数据清理从而帮助后台技术人员向高层管理人员及前端业务人员提供数据支持。本文同时将探讨主数据管理系统的循环过程,并展望了将主数据管理系统建立在云端以及移动平台的可能性。
如今,数据已经渗透到每个行业和业务职能领域,成为重要的生产因素。当今的信息化时代主要是由数据主导的,因此企业若想做大做强必须首先掌握核心的业务数据,这有利于企业通过分析这些核心数据从而获得最大限度的价值,并借用数据来对企业的品牌管理进行优化改造,拓宽市场渠道增加市场份额,最终实现企业核心竞争力的提升,然而这一切的主要手段被称作主数据管理(Master Date Management,简称MDM)。
所谓主数据管理,主要是指用以确保企业的业务数据特定的范围内保持一致、完整、互相关联以及精准的一组规程、技术和解决方案。简而言之,主数据管理的主要作用在于使企业从零零散散的业务系统中提取到所需要的核心数据或最需要共享的数据(主数据),并把这些数据集中起来,进行统一的筛选、整合和提炼,最终形成具有权威的主数据,再以服务的方式将这些完整统一、准确无误的主数据面向企业当中需要使用这些数据的系统或应用进行分发。主数据管理主要用于强化企业各业务系统的共性数据当中的实体和模型的管理,可以有效避免出现大的业务概念不一致的现象,同时可以有效的降低应用孤岛、数据孤岛出现的几率,因此可以作为企业的数据标准。
现今,企业已经逐步认识到了核心数据具有重要的资源价值。作为一种具有稀缺性和差异性的核心数据资源,主数据管理将逐渐成为企业的重大竞争优势之一。主数据管理对企业而言主要有以下几个方面的价值:
和大数据相辅相成。这两者的都是以数据为核心的,仅仅在关注点上各不相同。大数据主要的关注点在于数据的体量和类型,主数据主要的关注点在于数据的组织结构。现代化的企业为适应市场的需求,必须将主数据作为核心,以此作为线索将各类大数据进行有效的串联,通过主数据获取企业的预期效益和价值。具有良好结构的主数据可以在很大规模上帮助相关数据分析师在建模之前节省清理、组织数据的时间。由于大数据系统下的数据多具有无组织、杂乱、缺乏实际应用意义,主数据分析师可以根据本企业或本行业内部情况,通过配套的主数据管理系统对这类数据定义赋值,从而向数据用户提供全方位的商业定义。
业务价值广泛。通过主数据管理,企业可以为主数据建立完整统一的访问端口,以及完整统一的、内容丰富的、纯净无杂质的数据中心。其业务价值不仅在于可以为企业的每个业务部门提供有效的共享信息平台,还可以为企业的业务流程以及经营决策提供切实可靠的数据载体。通常来说,在数据孤岛的情形下,各部门各自拥有一套数据系统,且这些数据系统中的数据大多具有非统一以及无序的特性,比如某产品在财务部门的数据系统中编号为89002-FA,但是在销售部门的数据系统中编号为89002-SA。高层管理人员在对此产品进行季度分析时,将会看到财务和销售两个部门提供的两个不同产品编号,从而被误导而做出可能导致错误的决定。然而,一个优良的主数据管理系统可以对各部门的数据系统进行审计并整合,对重复、多余的数据进行合并处理和统一编号,然后依据各部门人员的职能分配在统一的主数据仓库中调取和观测数据的权限,从而为各个部门提供统完整的数据共享平台。
增强IT建设灵活性。主数据管理可以增强IT结构的灵活性,构建覆盖整个企业范围内的数据管理基础和相应规范,并且更灵活地适应企业业务需求的变化,同时,降低接口成本、数据清洗和维护成本等,使企业有效降低成本。
尽管目前的许多企业越来越重视主数据的实际价值,但对于如何发挥主数据的作用还并不十分了解。为确保企业实施的项目能够按部就班的进行,企业可以从规划方法论出发,从不同的阶段开展工作。比如information MDM产品解决方案,将主数据的生命周期划分为九个阶段:一是访问,对主数据的来源和现状进行探索,实现不同数据源和应用程序的数据集成方案,这是主数据获取的入口。二是发现,探索数据内容以及内在结构,并从中发觉到异常情况,对数据的优势和劣势进行精确的分析,对于其中出现的数据错误和问题要明确的指出。三是建模,建立正确、灵活的MDM业务及数据模型,其目标在于有效面对企业随时可能发生的变化以及困难,项目的顺利完成离不开正确的数据模型。四是清洗,对于整个系统数据出现两种或两种以上的定义或者使用方法时,我们需要对错误以及矛盾进行解决,建立信息正确以及结构完整的主数据。五是识别,迅速对数据进行配对,删除重复数据并最大限度的防止出现重复。六是解决,对数据中重复的部分进行整合,确保数据的唯一性和真实性。七是关联,要对企业内外部的合作伙伴系统或第三方软件,乃至于外部产品的广泛数据做出有效关联。八是治理,对主数据进行创建、使用、管理和监控,确保对数据问题进行跟踪,同时保证长期满足数据质量预期。九是交付,通过服务的方式,将具有统一性、完整性和准确的主数据分别发放给企业当中一定范围内的业务系统以及其他系统,以满足各类系统的需要。
云计算、社交计算、移动计算被并称为大数据的三大驱动。从当前形势来看,部分主流MDM软件可以对云中数据、社交数据、移动数据等不同类型的数据进行有效的管理。由此可见,未来必将支持不同的移动终端接入,采用云中部署、混合部署等新模式的主数据管理多域部署情况将更加普遍。
未来,MDM平台将逐步实现与大数据的无缝集成,为大数据提供一系列全面、先进、成熟的数据管理解决方案,为企业用户迎接“集成化的大数据时代”做好了准备。新形势下的大数据时代,大数据目前所存在的最重要的问题不在于庞大的数量,而是在于高质量。大数据背景下的企业数据治理和提升数据质量的工具将由主数据管理解决方案担负,不但保证了核心数据的真实可靠和较高的质量,还可以使企业精准的发掘到业务数据中所隐含的各种价值,真正把大数据转化为大机遇。
(作者系中国建材集团合肥水泥研究设计院工程设计公司土建室主任,高级工程师、国家一级注册结构师,MBA毕业)