多维数据建模在电网调控一体化系统中的应用

2015-06-06 10:45尹寿垚王茂海
东北电力技术 2015年2期
关键词:数据模型调控建模

尹寿垚,宋 鑫,郭 骏,张 勇,张 哲,王茂海

(1.国网电力科学研究院,江苏 南京 211106;2.国家电网公司华北分部,北京 100053)

多维数据建模在电网调控一体化系统中的应用

尹寿垚1,宋 鑫1,郭 骏2,张 勇2,张 哲2,王茂海2

(1.国网电力科学研究院,江苏 南京 211106;2.国家电网公司华北分部,北京 100053)

目前调控一体化系统所使用数据模型全部是关系型模型,关系型模型具备良好的扩展性,通用性强,但难以支持多维观察、数据钻取以及复杂的多维数据集运算等功能。对BI技术的建模思想进行介绍,然后结合电网调控系统的目前数据结构方式以及存在的不足进行分析,并提出基于BI的建模思想对电网调控的数据模型进行重新构造,建立一种电网调控多维方式的数据模型,同时分析多维数据模型在电网调控中应用的优势,为电网调控数据建模方式以及分析方式提供参考。

多维建模;BI技术;数据钻取

BI(Business Intelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确提供报表并提出决策依据,帮助企业做出明智的业务经营决策。

商业智能的关键是从许多来自不同的企业运作系统的数据中提取出有用的数据并进行清理,以保证数据的正确性,然后经过抽取、转换和装载,即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图,在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理,最后将知识呈现给管理者,为管理者的决策过程提供支持。

目前,智能电网[1]调度技术支持系统的建设尚处在试点和初步发展阶段,偏向于基本、常规的功能,智能化程度不高。随着电力系统的飞速发展,人们对电网运行数据的监控、分析的要求越来越高。此外,调控一体化系统大多采用关系模型,关系模型具备良好的扩展性,通用性强,但难以支持多维观察、数据钻取以及多维数据[2]集运算等功能。

1 BI在国内发展以及在电网调控领域应用

商务智能在中国[3]的发展尚处于起步阶段,大部分企业对商务智能仍然缺乏必要的了解。国内虽然有宝钢、中国海关以及大型银行和电信公司进行过或正在进行数据仓库和数据挖掘项目[4],但是大部分企业在这方面的应用还几乎为零。商业智能目前在国内应用的主要问题如下。

a.起步较晚

商务智能在国外,尤其是欧美发达国家,已有一段较长的发展历史。但在国内,商务智能正处于起步的阶段,国外商务智能产品逐渐深入数据的挖掘与分析,但成功率不高。而国内的商务智能产品的功能还有待完善,国内商业智能市场[5]还没有形成高中低端搭配、渠道健全、功能完整的局面。

随着国内企业信息化趋向成熟,目前最突出的问题是大量业务数据的分析,还有知识在企业内以及供应链上下游企业之间的共享。商务智能将不再是简单的查询和报表,而成为集数据整合、分析和应用于一体的平台,它需要分析数据背后的规律,把数据转换成真正有价值的信息和知识。可以预见,商务智能将成为国内企业信息化建设不可或缺的一部分,帮助企业积极应对日益激烈的市场竞争。

b.差距较大

目前国内各行业商务智能的发展水平仍是参差不齐,不同规模的企业应用商务智能的差距也在拉大。商务智能在国内的发展呈现区域以及行业的分布不均。在区域上,华北、华东和华南地区商务智能软件占据了绝大部分的市场份额。而在行业上,电信、金融、服务业等领域的很多企业都建立了部门级数据集市以及简单的前端展示系统,正继续向企业级的商务智能应用发展。此外,目前国内市场应用商务智能的企业并不多,应用深入的企业更少,成熟、专业的商务智能实施顾问短缺。

商用BI软件功能强大,但使用复杂、难以掌握,且难以融合到具体的应用系统中,因此几乎无法在电力生产管理系统中看到商用BI软件的应用。利用智能电网调度技术支持系统的BI软件将充分挖掘电力系统中的海量数据,全面提升智能电网调度系统在辅助决策,可视化展现,数据分析与挖掘等多个方向的技术突破,值得进一步研究。

2 电网调控传统数据建模

目前调控一体化系统所使用的模型绝大多数为关系型模型,而且基本上一直都是使用关系型模型,其有自身的优势。

a.数据结构单一。关系模型中,不管是实体还是实体之间的联系,都用关系来表示,而关系都对应一张二维数据表,数据结构简单、清晰。

b.关系规范化,并建立在严格的理论基础上。构成关系的基本规范要求关系中每个属性不可再分割,同时关系建立在具有坚实的理论基础和严格数学概念基础上。

c.概念简单,操作方便。关系模型最大的优点就是简单,用户容易理解和掌握,一个关系就是一张二维表格,用户只需用简单的查询语言就能对数据库进行操作。

关系型模型也有自身的不足之处,如难以支持多维观察、数据钻取以及复杂的多维数据集运算等功能,多维处理功能以及前端查询速度比较慢,查询语句比较复杂,因此在电网调控一体化系统海量数据的今天,利用关系型数据使用户很难全面、准确地对关键性指标[6]进行分析。

因此需要对调控一体化系统现有的数据模型进行分析,设计出通用的维度,并整理出适合不同应用分析场景的多维数据分析模型,并在此基础上进行多维展示、数据钻取以及数据挖掘运算等功能,利用现有的关系型模型的海量数据结合BI建模的思想,建立多维数据模型,方便用户进行指标数据的全面分析并提供简单的数据查询的方式。

3 多维建模的方法和优点

电网调控一体化系统多维数据建模方法,其基本思想是利用使用经典的星形模式和雪花模式[7],可以根据分析人员的要求快速、灵活地进行电网调控多维场景的设计,然后进行丰富的维度定义,最后定义相关调控场景关键指标的事实表并形成结构良好的电网调控多维数据模型[8]。采用星型模式和雪花模型设计的数据模型有利于提高查询的效率,而且星形模式和雪花模型比较直观,通过分析星形模式和雪花模型,很容易组合出各种查询,使得前端可以展现出更多的查询主题。多维数据建模后使用转换软件进行数据的抽取、转换和加载,将智能电网调度技术支持系统现有的关系型模型的数据无缝加载到多维数据模型中,实现了多维数据模型的建模。

BI多维数据模型的建立为数据的分析和展现提供了多个角度,针对每个核心指标可以从电力系统的时间,厂站、区域、电压等级、责任区等多个维度去分析指标的内涵。BI多维数据也可以提供数据在各个维度间的联动,利用上卷和下钻的手段可以实现对指标的全面分析[9]。上卷可以从指标的细节角度逐步向上分析,研究指标的宏观内涵。而下钻是从指标的高层内涵逐步向细节[10]进行分析,一点点的展现指标的各个方面。

电网调控一体化系统多维数据建模方法,可分为以下几个步骤。

a.设计电网调控系统常用的主题

b.设计电网调控系统常用的多维模型的维度

需要结合电网调控系统主题以及电网调控数据分析,设计电网调控系统常用的维度。根据调控一体化系统的数据,分析出主要的维度:日期、日间、电压等级、区域、厂站、责任区、告警类型、越限类型、五类分组等主要的维度,并分别为各维度建立维度表。有了丰富的维度表可以对电网调控系统主要指标从多个维度进行分析。

由图1可以看出,此模型支持从时间维度进行“年→月→日”钻取,支持从设备维度进行“区域→厂站→设备”钻取,从越限类型维度可以进行全部统计或对某类越限进行统计或在多个维度上进行切片、切块操作。

图1 多维模型示例

c.设计和加载电网调控系统常用的多维模型的事实表并形成多维数据模型

电网调控总体状况多维模型设计思路,主要是依赖于EMS系统的相关表结构和电网调控系统常用的主题,建立电网调控一体化系统分析主题的多维模型。多维模型包含维度表和事实表,由维度表和事实表一起构成了多维数据模型的基础,事实表主要存储的是调控各主题的关键指标,电网调控关键指标包括遥测越限时间、遥控次数、事故发生次数、断面越限时间、母线电压越限时间、数据不刷新时间、数据跳变次数、电量值、负荷值等。多维数据模型的事实表建立后利用ETL工具将电网调控一体化系统中的数据加载到相应主题的事实表,实现了电网调控一体化系统关系型数据模型无缝转换成多维数据模型。

利用上述步骤完成电网调控关系型模型转变成多维数据模型,电网调控一体化系统多维数据建模充分考虑利用BI建模思想并结合电网调控的特点,完成了对电网调控多维数据模型体系建立的实质性研究。利用已建立的多维模型的数据支撑,可以实现电网调控各分析主题的全面展示。

基于母线电压越限多维模型设计了母线电压越限DashBoard,可以从时间、区域、厂站、母线等多个维度对母线电压越限持续时间的指标进行全面和多维展示,并且实现了由区域到厂站,由厂站到母线的多维数据钻取(见图2)。电网调控各主题的多维模型建立为指标全面展示提供了丰富的数据源和数据支撑。

由于年龄偏小,无法用言语表达具体的不适,患病期间情绪不好,容易哭闹;护理人员应该轻抚患儿,增加安全感;给家长宣传小儿腹泻的相关知识,缓解家长紧张不安的心理压力,促使其积极配合治疗,避免过度焦虑与医生产生矛盾。

图2 母线电压越限的多维展示

4 结束语

综上所述,基于BI技术的多维数据建模,将现有系统中关系型数据模型无缝转换成多维数据模型,解决了关系型模型难以支持多维观察、数据钻取以及多维数据集运算等功能。多维数据模型的建立为电网调控领域提供了丰富的多维数据,为电网调控领域的海量数据分析[11]提供了丰富的分析数据源。对推进电网调控的科学发展,提高电网调控的管理水平具有重要意义。

参考文献:

[1] 刘国民,宋 雨,周庆捷.智能电网信息化体系架构研究[J].东北电力技术,2012,33(2):15-17.

[2] Erik Thomsen.Olap Solutions:Building Multidimensional Infor⁃mation Systems[J].U.S.:John WILEY&SONS,2004,32-50.

[3] 高 涛,邓 玲.智能电网及其国内外发展概述[J].东北电力技术,2012,33(2):5-10.

[4] 段云锋,吴唯宁,李剑威,等.数据仓库及其在电信领域的应用[M].北京:电子工业出版社,2003.

[5] 杨 超.商务智能的中国攻略[J].每周电脑报,2004,30(4):51-52.

[6] 孙 峰,司红代,孙晓非.智能电网多指标综合评估体系研究[J].东北电力技术,2011,32(9):1-7.

[7] 徐义峰,徐云青,陈春明.雪花模型在OLAP多维建模中的应用[J].科技情报开发与经济,2005,8(2):45-47.

[8] 严任远.基于数据仓库的企业OLAP多维模型的设计与实现[J].情报杂志,2006,2(3):32-34.

[9] J.W.Han,J.Pei,G'Dong and K.Wang.Efficient Computa⁃tion of Iceberg Cubes with Complex Measures[J].U.S.:SIGMOD,2001,167-233.

[10] 毛秀丽,彭明霞,陈明昭.OLAP中多维数据库旋转的应用[J].计算机应用,2002,11(2):38-49.

[11] J.Han.Towards On-Line Analytical Mining in Large Databas⁃es[J].U.S.:ACMSIG-MOD,1998,17-23.

Application of Multi⁃dimensional Data Modeling in EMS System

YIN Shou⁃yao1,SONG Xin1,GUO Jun2,ZHANG Yong2,ZHANG Zhe2,WANG Mao⁃hai2
(1.State Grid Electric Power Research Institute,Nanjing,Jiangsu 211106,China;2.The North China Branch of China State Grid Corp,Beijing 100053,China)

Multi⁃dimensional modeling methods of BI technology,to change the current EMS system using the data model is the rela⁃tional model.The relational model has good expansibility,strong universality,but it is difficult to support multi⁃dimensional data,multi⁃dimensional observation,data drill and complex set of operations and other functions.The modeling idea of BI technology is in⁃troduced,and analysis is made combining with the current EMS system data structure mode and the existing shortcomings,Recon⁃struction of the grid regulation data model based on BI modeling is put forward,a multi⁃dimensional way of regulating the grid data model is established.At the same time the application analysis of multi⁃dimensional data model in grid control advantages is made,providing the reference for the data modeling and analysis of grid control mode.

Multi⁃dimensional modeling;BI technology;Data mining

TM73

A

1004-7913(2015)02-0038-04

尹寿垚(1984—),男,硕士,工程师,从事电力调控系统研究与开发工作。

2014-11-25)

猜你喜欢
数据模型调控建模
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
如何调控困意
经济稳中有进 调控托而不举
面板数据模型截面相关检验方法综述
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
顺势而导 灵活调控
财政支出效率与产业结构:要素积累与流动——基于DEA 和省级面板数据模型的实证研究
SUMO修饰在细胞凋亡中的调控作用
基于分位数回归的电力负荷特性预测面板数据模型