李瑞华,冯治东,郭红波
(榆林学院信息工程学院 陕西 榆林 719000)
经济社会和信息技术的融合引发了数据的急剧增长,数据已经成为衡量一个国家基础战略的必备资源。数据产业化已经对全球生产、流通、消费、分配产生重要的影响,在这样一个全新的社会形态下,国家治理模式逐渐转移到以数据治理为基础的治理模式,如何对数据实施规划、存储、管理、挖掘、应用,从而使得数据潜在的价值得以释放,进一步推动社会经济的增值,是实现数字化转型的重要内容[1]。
榆林矿产资源丰富,能化工业的起步较晚,众多企业在原材料准备、生产设备、生产流程、废物处理、销售业务、经营管理中基本都已实现了信息化,其信息系统中的海量数据为企业的生产运营提供了大量的数据支撑,但是面对新信息时代的智能化发展要求,如何挖掘元数据之间的存在关系,探索数据矿藏中蕴含的“知识黄金”是企业未来生存和发展的必然途径[2]。改变原有资产的管理模式和意识形态,注重数据资产的保护和挖掘,是当前能化工业亟待解决的问题。
榆林作为能化工业的发展城市,关于数据治理存在以下几方面的问题。
传统的能化工企业只注重有形资产的管理与实际业绩的提升,“数据治理”的理解较为狭义,忽略企业在生产过程中各项数据的有效利用与数据分析,如有数据管理往往也只停留在财务报表的范围之内,没有真正实现数据资源资产化的管理。
榆林地区煤化工企业较多,很多企业的数据质量意识淡薄,数据管理职能缺失,数据操作不规范,数据质量问题严重。各企业对数据的存储没有统一的量化标准、存储标准,造成数据不一致、不完整和不正确[3]。没有统一的数据标准导致数据难以集成和统一,没有质量控制导致海量数据因质量过低而难以被利用,没有能有效管理整个大数据平台的管理流程。
能化工业的数据管理一般根据行业的生产步骤与环节分散存储在不同的系统平台,各平台数据存储相互独立,信息数据无法共享,形成信息孤岛,因此无法获得对产业生产过程的多因素的实时分析检测与管控,从而造成数据不可知与不可取。
能化工业的智能化建设是基于大数据、物联网、人工智能等信息化技术,其数据治理必须解决数据标准化、元数据和主数据的管理工作;加强生产现场、服务过程等动态数据的采集、传输和汇集体系;加快大数据平台建设,创新数据融合分析和共享交换机制[4];强化业务场景的数据建模、挖掘数据价值、提升数据洞察力,从而将知识化后的数据转换为企业的资产,因此提出基于技术架构的能化工业智能化建设中数据治理的基本框架,本框架包括三种形态。
第一种形态为治理的对象。这些对象是原始数据,它只是对生产过程、交易过程的原始记录,不能体现数据存储的实际价值,其内容也是晦涩难懂,且能化工业的信息系统中海量元数据存在不一致、冗余、离散等问题,需要建立一个集成平台,将分散数据集中存储。
第二种形态为规范化。根据行业规范要求制定权威的数据标准,统一能化工业生产初期、成产过程、废料排放、产品销售等不同阶段的数据标准,统一业务语境,这需要能化工业统一数据标准以及业务语境,同时协同IT人员收集业务数据并根据标准进行数据迁移、集成,进一步数据挖掘,变离散数据为有效知识[5]。
第三种形态为知识。基于规范化的数据资源目录发掘数据业务画像,进一步挖据数据价值,得到可靠、可信、可懂的企业数据资产,挖掘数据中的红利,使得数据从无形的、不可知到有规律可寻、便于决策的知识,可实现数据治理的有效性、可用性。
基本框架制定了数据治理的过程,具体的数据治理的实施方案内容包括但不局限于:集成数据资源元数据、抽取数据产生数据聚合平台、数据资源资产化,数据资产的应用。
数据聚合:能化工业由于在生产过程中,各种机器设备的运行状态、掘进过程、各项数据指标的采集、化学反应过程、废料指标等根据行业功能不同分别在不同的机器设备以及不同的数据库中存储,数据不统一、不集中。需要通过能化工行业业务人员和计算机技术人员,将不同系统的生产元数据通过数据预处理,结合行业标准抽取有意义的数据,聚合在一个平台,形成一个有标准、可控的、集成的数据平台[6]。
数据资源资产化:能化工业的信息化系统中存储的数据是电子化的元数据记录,元数据本身不具有资产属性[7]。通过聚合平台提取有效地原始数据,并通过数据挖掘工具分析元数据之间的关系,使其挖掘结果能够生成便于企业进行生产管理、业务决策、生产预警等的先验知识和规则。从而形成企业的有效数据资产。
数据产权与安全:数据一旦成为资产,就一定有产权方和实际控制人。数据实际控制人一般是数据库的管理人员,但是煤化工企业是数据的产权方,数据资产产权的确定涉及法律层面,应对数据实际控制者的行为严加管束,做到合法、合规[8]。数据资产的使用场景与使用手段需明确,即使是数据资产的拥有者,在使用数据资产时必须明确任何数据都有隐私与敏感属性,同时注重数据的安全性[9]。保证数据使用中的存储管理、用户管理、访问控制权限等,数据资产的所有权和安全性是数据治理的重中之重。
数据资产的应用:数据资产具有资产的效力,通过历史数据的分析获得先验知识可以提升企业智能化生产和管理的能力,便于企业决策、制定未来的发展规划、财务智能预算等各方面的智能化发展,同时数据资产可以对于企业的安全生产提供预测,便于企业开展发展规划。
数据作为能化工业智能化的核心资源,其获取与利用对于工业智能化的发展具有重要的作用,能化工业的数据治理是为了实现能化工业数据资产化而进行的数据决策分配的活动过程,是一项复杂的系统工程,本文主要在数据治理的技术层面对能化工业的数据治理提出理论探索,给出了基本的治理框架,仅供能化工业的智能化建设过程参考。