李扬 谈婷婷 潘小胜 张灵元
摘要:在電网调度运行业务进行相应的信息化建设以及电网运行的过程中,相应电力数据系统所产生的大部分数据只能进行删减或者修改,使得数据之中蕴含的更深层次内容无法被有效发掘。为此,本文针对数据挖掘与构建决策分析系统中的关键技术进行深入分析,以此为数据挖掘的电力系统数据分析与决策系统提供一定的参考意见。
关键词:数据挖掘;电网系统数据;决策系统;分析
引言
数据挖掘技术可以有效发现数据库中蕴含的重要知识,而且在国际研究领域被进行广泛的应用,数据挖掘可以将相应的人工智能以及数据库技术进行有效融合,然后在数据库中对一些具有重要作用的知识进行有效挖掘。在电力系统中数字化技术被进行大范围的使用,使得相应管理信息系统在电力系统中形成大量的数据,为此,相关单位要对原有的统计分析方法进行不断的完善与改进,以此对越来越多的数据进行有效分析。
1数据挖掘原理以及相应系统
1.1数据挖掘的原理
数据挖掘是一种全新的信息处理技术,数据挖掘可以有效发现数据库中存在的深层知识,而数据是在数据库中汲取深层次的有利信息的过程。所挖掘出的数据具有多种多样的特点,当下阶段我国信息技术飞速发展,而数据挖掘是其中一种非常重要的产物,会对诸多学科知识进行有效结合,其中包含有计算机学、智能监控、数据库与深度学习等,除此之外,数据挖掘技术还与相应的可视化技术、信息科学与心理学之间存有较为紧密的关联。
1.2数据挖掘系统
数据挖掘系统只有具备数据库、知识库、数据库服务器、数据挖掘引擎、挖掘算法及人机交互界面等模块才能被称作完整,而且数据挖掘系统中还要包括相同的数据清理、集成以及过滤。在进行相应事物设计时,数字库自身具有储存实时运行数据的功能,在进行主题设计时,数据仓库要具备储存历史数据的功能。在数据储存量上数据仓库要远远大于数据库的数据量。而数据库以及数据仓库的服务器都是由一台或者多台计算机构成的,可以有效的形成一个向上的数据接口,在将相应的数据接口提供给底层数据库或者数据库群,以此有效保障数据库中存储的数据可以被随时有效的调动。在进行数据挖掘过程中,会将接触到的专业知识与规则以及技术人员自身的经验与常识放置在数据库中,在进行数据搜索时具有非常重要的辅助功能。在数据挖掘系统中数据挖掘引擎是其中非常重要的组成部分,可以将数据库与使用者进行有效连接。数据挖掘引擎自身由各种各样的模块组成,这些模块自身具有一些特点的功能,可以进行有效的聚类分析、偏差分析、特征化等。将人工智能与计算机进行有效结合,可以为使用者和数据挖掘系统提供一定的互动活动,而且自身具备的可视界面可以为用户数据查询与定制计划提供一定的帮助,并且用户可以应用数据挖掘系统对数据系统的实时状态进行查看。
2构建决策电力数据分析系统的关键技术
2.1数据的变换与清洗
在从业系统或数据来源进行数据提取时,要对其进行有效的清洗以及变换,在完成后在将其放置在相应的数据库中,这也是数据仓库中最为基本的原则。在对相应数据进行变换时,可以通过手工编程与使用专门的工具对相应数据进行有效转换。专门的工具操作相对简单,对人力资源没有较高的要求,但这种方法在使用过程中不够灵活。手工编程自身具有灵活的特性,但实际的操作过程较为复杂,为此,在进行实际使用时,可以将两种方法进行有效融合,在应用专门工具对相应数据进行转换时,要增加手工编程的方法。在数据传送的过程中,这两种方法都可以对相应数据进行有效的变换与清洗,可以将其在业务相对不拥挤、服务器使用较轻松的晚间进行使用。在OLTP系统中因为相应的数据量较为庞大,需要较长时间对相应业务进行有效处理,使得业余空闲时间无法有效完成相应业务处理。在数据传送过程中对进行有效的清洗,可以使数据传送效率得到有效提升。
2.2选择适宜的存储格式
当下阶段数据立方体的存储方式包含有多维 OLAP(MO-LAP)、关系 OLAP(ROLAP)与混合 OLAP(HOLAP)。而且不同的存储方式会对性能产生不一定的影响,但没有相应定量的标准,只会以其中的相对定性为标准。在相应的文章内容中,会通过实际操作过程中产生的经验,为不同情况下不同存储格式提供适宜的性能指标。多维存储模式可以将分区聚合与其源数据复本以多维结构的形式存储在分析服务器计算机中;关系存储模式可以将分区的聚合有效的存储在关系数据库的表中。关系存储模式中的查询以及响应在正常情况下存有要慢与其他两种存储模式。将多维存储模式与关系存储模式进行有效的结合,可以形成相应的混合存储模式。在多维存储模式中,为了使相应的查询时间得到有效缩短,会牺牲较多的存储空间。而关系存储模式为了使空间得到有效减少,会牺牲一定的查询时间,混合存储模式会将这两种模式进行有效的结合,使得无法对两者存储模式性能量化指标进行明确。根据原有的实践经验,文章可以为其提供一个相对接近的量化指标:选择一个大约2G的表,多维存储模式自身所需要的存储空间较大,而且大于混合存储模式以及关系存储模式。当相应的聚合数出现增高时,关系存储模式自身便会需要更大的存储空间。当对其相应的性能产生较高要求时,信息存储过程中产生额外信息所需空间将接近多维存储模式。同样选择一个大约 2G 的表进行测试,多维存储模式会将产生的原始数据有效的导入本地,使得处理时间得到有效缩减,当相应聚合小于30%时,关系存储模式的处理时间会小于多维存储模式,但相应的处理时间根据聚合数的变化而产生变化。
3结束语
综上所述,构建相对稳定的电力数据分析系统,可以使数据来源中存在的问题得到有效解决,而且电力数据分析系统可以依据数据主题的不同为其构建不同的数据集合,使得相应搜索查询更加便捷,构建决策电力数据分析系统的关键技术要在实践过程中进行不断完善,以此为电力企业的发展提供相应的数据以及技术支持。
参考文献
[1]王磊,陈青,高洪雨,等.基于大数据挖掘技术的智能变电站故障追踪架构[J].电力系统自动化,2018,42(3):84-91.
[2]陈毅波,陈乾,眭建新.基于大数据技术的电网运营分析决策系统研究[J].电力信息与通信技术,2015,13(8):128-131.
[3]万顺,桂宁,陈家静,等.大数据下电网数据挖掘技术研究[J].信息通信,2019(1)182-183.
[4]魏艳平.基于大数据平台的电力营销分析决策系统的研究与设计[D].成都:西华大学2017.
国网安徽省电力有限公司芜湖供电公司,安徽芜湖 241000