李田
数据挖掘技术及其在电力行业过程监控中的应用
李田
(南京国电南自轨道交通工程有限公司,江苏 南京 210032)
随着信息科技的发展,数据挖掘技术已经融入到各个各业的不同领域中,并以自身特性发挥出至关重要的作用。在电力行业中,为了满足日常生产生活中的用电需求、降低电网负担、增强管理水平,也应当对技术方法进行开发,并尝试在电网运营监管的过程中使用数据挖掘技术,顺应时代发展规律,实现管理方法升级。
数据挖掘技术;电力行业;过程监控;计算机信息技术
数据挖掘(Data Mining,简称“DM”),是一种基于现代化计算机信息技术基础上的数据处理技术。该技术可以实现有效数据的自动筛选。在数据库的基础上,可以自动、智能地将有效的信息筛选出。而这种作用可以分为两个方面,一方面,数据挖掘可以在大量的、纷繁复杂的数据中将有价值的数据筛选出来;另一方面,数据挖掘可以在不完全、模糊的数据中提取出对我们有价值的潜在的数据。可以说,它是所有信息处理工作的第一步,任何的信息处理工作都需要对有效信息进行一次筛选,这样可以节省一定的时间,提高信息处理的效率。比如数据的统计分析、知识的发现。当然这两种工作中数据挖掘的具体作用不同,在统计分析中,他所对应的数据一般是具有一定统计规律的。而在知识的发现中,主要是利用数据挖掘来挖掘一些隐藏的有价值的数据。
人力资源管理信息系统建设的核心是全面支撑人资集约化,主要体现在ERP系统中,通过人力资源各个模块的管理,最终实现人事、劳动等相关方面报表的数据统计。分析数据挖掘在电网运营管理中的主要业务,需要从ERP系统的各个管理方面入手。在系统中,除了人力资源管理,最重要的就是财务管理。员工的工资、成本管理、资产监控等模块的财务统计分析是财务管理中的数据挖掘统计需求。财务的系统管理可以提高企业的财务运转能力,提高企业的运营效益。此外,物资管理也是企业管理的一个重要部分,而物资集约化管理也是主要业务之一。其中,包括物资的计划、采购、库存、配送和废旧回收,一定程度上对业务的标准进行了完善,对业务的具体执行方法进行了统一规范,这样使企业的整个管理体系更加完善。
要想全面实现数据挖掘功能模块,就需要使用大量的数据。所以,需要在电力企业的所有管理系统中提取数据,主要是ERP系统、生产管理系统、物资分析评估等。进行完数据的提取后,就要对物料的使用情况进行分析。对各个等级的电网系统各方面的物资使用情况分别进行分析,而且根据不同等级地区的不同特点,各个模块所包含的内容也有所不同,但都包含公司代码、维修日期、电压等级等基本参数。根据需要,我们以时间为顺序进行数据挖掘,可以实现对数据的统计分析和预测分析等多种分析方式。
系统的需求分为功能需求和非功能需求。在功能需求中,终端客户可以根据一定的条件进行检索,在自动检索中,要根据不同的检索形式、不同的检索要求设置不同的程序算法,而且根据数据挖掘的功能和目的来设置过滤的数据条件,对数据进行筛选。除了这些基础设置,我们还要采取一定的系统支持,主要采用ETL系统支持,最终选用合适的展现终端,终端可以根据对清晰度的要求来自行选择,整个系统就可以进行自动的运算与执行,达到我们所要求的目的。而系统的非功能需求就是指除了系统的基本运行之外的,主要是单个系统与国家电网数据库的结合,完成不同层次的数据库建设。而在建设中,主要要遵守通用性原则、适应性原则以及高效性的原则,这样就可以满足不同背景下不同客户的需求,并且在一定程度上缩短工作时间,提高工作效率。
在电力企业的运营监控平台内,通过数据挖掘技术,将各层面、各角度的数据信息进行整合,并在数据通道的连接作用下,传导到数据处理中心,利用显示终端设备对其进行分析与处理。在这一数据处理的过程中,主要覆盖了源数据、数据仓库、显示终端这三个部分,并在其连接与配合的作用下,发挥出系统的功能优势,构建起了科学的数据系统框架。源数据在经由数据通道传导到终端显示设备,并完成数据挖掘处理的这一过程,可以对所有涵盖的信息资料进行筛选,并从中剔除无效数据,精选出具有优势指导性的数据内容,实现在终端设备上的合理利用。在数据挖掘技术的作用下,使企业在监控过程中的信息处理效率得到强化,并完成了整体系统管理工作中的核心环节,实现了运行信息的高效整合。值得注意的是,在对挖掘、筛选出的数据信息进行分析处理的工作中,要根据实际情况对终端处理系统进行选择,在系统监测、营运分析、协调控制、综合管理、全景展示这五个方面,对筛选的数据资料进行处理,在完成不同的工作内容的同时,满足过程监控中的不同需求。
数据仓库作为系统框架下的内容,属于非功能性需求,但也在具体的监控工作中发挥着一定的作用。在结构上由操作数据存储(ODS)与数据仓库/数据挖掘(DW/DM)两部分组成。在功能上,ODS将业务国际内容作为基础,并通过实体-联系(E-R)模型对其操作过程进行处理,形成事物数据与主数据两部分。在结构上,ODS层应与原系统保持一致性,在表格的设计中,将两者的数据内容进行整合,以满足监控工作中的特殊需要。DW/DM在结构上,属于多维度的数据库,在不同的数据需求内容中,表现出差异性的工作方式。然而,在基本的概念内容上,所有维度中的根数据关系都以包含的关系为设计基础,使检索和应用具有较高的简便性。
在完成整体框架结构的设计工作后,为了保证数据挖掘工作的顺利展开,应当对数据挖掘的计算方法进行确认,并重点关注选择的方法与设计的科学性,使系统能正常的发挥功能作用。在数据挖掘的过程中,可以根据流程顺序将其划分为具体的两个部分,即从数据源传输到ODS层、从ODS层传导到DW/DM层,这个两个步骤下的传导都是在ETL工具的作用下实现的。从系统的角度进行分析,在完成数据传输的过程中,需要在数据源、映衬关系、数据目标,三点要素的共同作用下完成。在内容上,数据源是待处理的数据信息,总量大,种类丰富,但其中包含了有效信息与无用信息;映衬关系是进行数据处理过程中的计算方法,指代实现数据目标的筛选过程;数据目标是指通过数据计算剔除无效数据之后得到的具体数据表格,其中,只会对有效数据源进行规则陈列。
4.1.1 基础型数据
电力运营监控系统中的基础数据是指在系统运行过程中形成的基础数据信息,其主要内容有电流大小、电能大小以及电流稳定性等。
4.1.2 电力企业的运营数据
运营数据是指电力企业的生产过程中形成的数据信息,其中包括电力销售量、电量交易价格以及用电数据等。电力企业通过对这些数据的分析处理,可以发现电力系统运行过程中需要着重关注的问题。
4.1.3 电力企业管理数据
管理数据主要是指ERP、协同办公等数据,这些数据通常只能在特定的条件下同步与共享,对这些数据的分析处理能够方便各部门供电服务工作的有序开展。
在电力系统运行时,异常情况的产生会进一步形成异常数据,所以,必须要及时对异常数据进行处理,这样有利于提升电力企业供电服务以及电力管理的工作效率,对发现的问题及时采取措施解决。电力系统出现数据异常通常表现在以下几个方面:①业务方面的异动。业务方面出现的异动一般是指在电力业务方面,部分电力数据出现异常的变化,进而产生问题。②接口方面的异动。在数据传输时,如果发现数据接口产生异常,接口就会发生异动。③数据质量方面的异动。按照配置规则,及时并准确地对数据接入进行校验,针对校验结果,形成的异动信息。
在十九大提出的“推动信息化与工业化深度融合”的背景下,各个电力企业都积极融入大数据时代,通过信息化手段提升电力企业的核心业务模式。电力系统信息化与智能电网建设相辅相成,电网信息化在大数据时代的背景下已逐渐显现出顽强的生命力与较大的发展潜力,许多电力企业通过建立集团统一的信息化生产管理平台,在信息化的基础上,逐步将大数据处理统一应用于集团层面,建立了完备的统一生产系统与多业务平台。这种生产系统与多业务平台从本质上来说均属于大数据时代背景下的数据集成分析处理平台。从系统架构层面看,无论是涉及数据存储的数据架构,还是涉及数据分析处理的技术和应用架构及上层业务架构,均与大数据的抽取与集成、分析、解释技术密切相关。因此,大数据时代的电力企业信息化建设需要分别从上述角度进行深入考虑,使大数据集成和分析平台高效、易用并且可扩展。
在电网运营监控的建设过程中,应用数据挖掘技术,可以通过构建系统框架、建立数据仓库、设计数据挖掘的模型与过程,实现对电力行业过程监控的升级,实现电力企业管理内容与科学性提升的同时,提升了管理的效率水平,为加快电力行业的现代化建设作出了显著贡献。
[1]宣黎强,周宏,孙鹏,等.电力施工现场全过程监控系统的设计与实现[J].现代国企研究,2017(18):154.
2095-6835(2019)02-0144-02
TP311.13
A
10.15913/j.cnki.kjycx.2019.02.144
〔编辑:张思楠〕