常永娟 贺月
摘 要:随着电力企业的信息化建设的发展,运行的事务管理系统保存了海量的运行数据,成为电力企业决策管理的最有价值的原始资源。然而,各地區及部门间信息化建设的不平衡性和独立性致使无法构建有效的知识管理系统,难以提供企业级的决策分析支持。数据仓库的建立可以解决为电力企业提供决策分析信息存在的困难。本文引入了数据仓库的概念,详细介绍了数据仓库的构成、内容和技术特点。研究了数据仓库建模的方法。结合电力系统的特点,提取出适合于数据仓库建立的主题概念。通过数据处理技术对电力系统事务管理系统保存的海量数据进行整合,构造面向决策的电力系统数据仓库。
关键词:电力企业 电力系统 电力主题 逻辑模型 物理模型
中图分类号:TP311.1 文献标识码:A 文章编号:1674-098X(2021)02(c)-0124-03
Construction and Application of Data Warehouse in Electric Power Enterprise
CHANG Yongjuan HE Yue
(Information and communication branch of State Grid Hebei Electric Power Co., Ltd., Shijiazhuang, Hebei Province, 050013 China)
Abstract: With the development of information construction of power enterprises, the running transaction management system has saved a large amount of operation data, and has become the most valuable original resource for decision-making and management of power enterprises. However, due to the imbalance and independence of information construction among regions and departments, it is difficult to build an effective knowledge management system and provide enterprise level decision analysis support. The establishment of data warehouse can solve the difficulty of providing decision analysis information for power enterprises. This paper introduces the concept of data warehouse, introduces the structure, content and technical characteristics of data warehouse in detail. The method of data warehouse modeling is studied. Combined with the characteristics of power system, the topic concept suitable for data warehouse is extracted. Through the data processing technology, the massive data stored in the power system transaction management system are integrated, and the decision-making oriented power system data warehouse is constructed.
Key Words: Power enterprise; Power system; Power theme; Logical model; Physical model
电力系统数据仓库的体系化结构环境与操作型数据库的环境存在着很大程度的不同[1],集中体现在两个方面。(1)应用层面上:基于操作型环境的应用主要体现在联机事务处理(OLTP)的处理上,而体系化结构的数据仓库环境则主要表现在获取决策分析层面上;(2)数据源层面:电力系统中操作型数据库的数据来源通常为手工录入数据和自动录入的遥测、遥信等信息量,而体系化的数据仓库环境的数据来源来自操作型数据库,其在电力系统中的应用体现在自动化的应用场所[2]。
为了简化方案设计、组织管理和最终实现的措施和方法,本文提出数据仓库体系结构,描述电力系统数据仓库中组件之间的相互关系。电力系统数据仓库的体系结构如图1所示。由数据源,ETL(Extract-抽取、Transform-转换、Load-加载)工具、数据仓库主体以及分析主题数据库等四个方面构成。
1 电力系统的数据特点
近年来,电力公司逐年增加了建筑信息化建设的成本,这在电力企业信息化方面取得了长足的进步。电力公司已经积累了大量的电力系统运行数据。这些数据主要来自一些已经建立并运行的自动化应用系统,例如SCADA/EMS,DMS,MIS和GIS[3],对于电力公司而言,它成为重要的原始运营数据。在市场经济环境中,当取消对电力公司的管制并将其整合到商业环境中时,准确的能源市场信息和知识将为电力公司提供基本的决策计划。然而,由于公司之间的信息化结构的不平衡以及业务运营的独立性,当今的电力公司无法基于散布在业务部门之间的信息来构建有效的知识管理系统。结果,累积的原始数据不能为公司提供良好的决策分析,这主要表现在以下几个方面:(1)数据整合不良;(2)各种信息来源导致数据冗余;(3)缺乏用于企业级决策的支持系统[4]。
在已有的信息系统的基础之上建立数据仓库,形成“数据驱动”型的结构是解决当前电力企业应用系统各种弊端的有效手段[5]。数据仓库建立的目的是为决策服务提供支持,由于数据仓库的数据量庞大,其数据更新必须简单易操作,否则对数据仓库的维护存在的很大的困难。因此在数据仓库建立伊始,必须进行合理的设计,使数据仓库满足在数据量不断增加的情况下对数据的查询保持高效的要求,实现为决策者提供强有力的信息支持[6]。
2 电力系统数据仓库的设计
电力系统数据仓库的设计可以分为以下四个阶段:
(1)主题概念的设计:必须从分的调研电力企业的实际业务和用户需求,从而能够根据用户的需求划分成主题元素;(2)逻辑模型的设计:建立与主题元素对应的并且适合当前数据仓库的逻辑表示方法(星形模型或者雪花模型);(3)物理模型的设计:设计符合逻辑模型的数据仓库存储方式(即数据仓库的表的结构、字段等属性);(4)数据处理的设计:构建数据仓库时,数据进入仓库前的数据检查工作、数据仓库构建后对仓库中数据的进行追加、抽取等工作。
2.1 电力主题概念的设计
数据仓库的建设需要具备可行性和实用性,必须从“需求驱动”和“数据驱动”的角度出发考虑,并制定相应的建设方法。根据不同的业务范围,对发电企业提出如下的数据仓库主题设计方法。
(1)发电量/负荷量数据仓库。
在进行数据仓库的建设时,首选的主题应是发电量及负荷量。发电量/负荷量数据仓库能够对最小时间间隔内每台机组的发电量、上网电价、所带负荷等相关数据信息进行准确的记录。这里所说的最小时间间隔应视其具体条件来取值,一般为1/4h或者1/2h。发电量或负荷量均可以通过数据仓库调出供用户分析使用,并统计、描绘时、日、月、年的发电量以及相应的负荷曲线。
(2)电力设备数据仓库。
对各个发电设备的基础数据、缺陷数据、检修方式数据、可靠性统计数据等信息,参照设备的实时运行参数进行集成操作,形成统一的格式,按照时间先后顺序录入到数据仓库中,形成决策分析的知识数据,从而为设备状态的综合评价提供良好的数据基础。在统一格式的运行数据的基础上,进一步采用智能算法等数据挖掘方法,设计研发电力设备状态检修的辅助决策支持系统。
(3)发电成本数据仓库。
作为最为直接有效的信息资源,各项成本费用的发生情况是进行成本分析的原始资料。成本费用分为固定成本和动态成本两方面。通过按时间(小时、日、月、年)的计算方式得到各自成本。采用统计计算方法计算供電企业每小时、每日及每月的成本。计算结果保存作为数据源数据存储到发电成本数据仓库,成为电厂“竞价上网”依据的数据基础。在数据仓库的基础上构筑电厂成本模型,开展深层成本分析,为进一步进行发电成本的预测和控制奠定基础。
2.2 逻辑模型的设计
OLTP采用实体-关系模型解释数据间关系,不仅消除冗余数据,并且确定了数据的正确性。维度建模采用直观的标准数据结构表达数据,是符合这种实体--关系模型的逻辑设计方法。维度模型由事实表和维度表组成。事实表和维度表均为复合索引。同时,通过索引每个维度表与事实表的特定的部分精确对应。
设计出一个企业级的数据仓库是数据仓库构建的具体实施方案首条任务。当数据仓库建成之后,再按照该数据仓库中的数据模型来构建数据集市。深入透彻的研究企业的数据结构,并广泛调研用户的需求是进行数据仓库的建模之前必须完成的任务。
2.3 物理模型的设计
不同的数据集市通过维度表的密切关联,是通过对数据仓库中的数据进行有效的物理建模实现的。集成不同主题之间的数据,解决了企业的信息“孤岛”,并最终实现企业级的数据仓库的建设。
以电力营销的业务为例,对数据仓库的物理建模技术进行详细的说明。通过对电力营销部门相关企业数据以及业务流程图的分析,确定出相应的决策主题,列写出与各主题相对应的事实表及维度表。
3 客户的应用
电力系统数据仓库的使用流程图可以表示成图3的形式。最终建设电力系统数据仓库的目的,是能够让电力系统企业的工作人员容易方便地使用数据仓库技术,用以获取最有价值的决策信息。从而能够迅速、准确判断实时变化的网络运行状态,并制定相应的应对策略。因此需要在数据仓库的服务端设计出的服务接口,提供友好的操作界面。目前较为广泛采用的是B/S模式,它通过Web为各用户提供查询、分析等服务。
电力设备的数据仓库用Oracle Discover作为前端数据展现工具。用户可以对查询的字段以及显示的形式等进行自定义,并提供了动态随机的查询方法。不仅可以实现报表生成、Web发布等功能外,还可以对那些规模比较大的报表以饼图、曲线图等各形式直观地反映给用户。
4 结语
随着电网建设的进步,电力公司的信息化建设取得了长足的进步。由于各个地区和部门之间信息化建设的不平衡,交易管理系统之间的信息交换存在障碍,并且从大量数据中获取支持决策所需的信息存在技术困难。有关电力公司的运营信息以及部门之间联合运营的困难,数据仓库技术为电力公司提供了有关其决策信息的良好而有效的手段。
在实际应用中,由于整个企业范围的数据仓库的构建非常庞大,因此设计复杂,需要大量的业务和技术专家,这不可能一蹴而就。因此,在实际应用中,具有紧急决策分析需求和大量历史数据的部门应首先建立部门级数据集市,然后积累经验,扩大应用范围,并逐步统一,公司中每个部门的数据集市根据数据仓库总线的结构而定。同时,由于电力系统数据仓库的建设仍处于初期阶段,因此在业务需求和功能实现方面仍有许多方面需要改进。此外,电力系统数据仓库的设计需要根据用户使用的反馈信息进行进一步修改。
参考文献
[1] 杨雷.基于数据挖掘的电力调度管理系统设计与实现[D].北京:电子科技大学,2019.
[2] 庄新闯.电力负荷数据管理系统的设计[D].上海:东华大学,2018.
[3] 邱菊,王岩,黄佩卓,等.大型电力企业基于GBase分布式数据仓库建设初探[J].计算机应用与软件,2018,35(5):184-189.
[4] 张瑜,潘红芳.内蒙古电力数据仓库的应用[J].电信科学,2016,32(4):175-180.
[5] 许杨子.电力交易运营数据仓库主题模型建立的研究及应用[J].信息记录材料,2018,19(7):194-195.
[6] 童光华,李宁,张银昌,等.基于数据挖掘技术下电力计量数据仓库模型研究[J].自动化与仪器仪表,2018(5):40-42.