蔡荣彦
摘要:本文通过介绍神经网络技术与算法,提出了利用神经网络进行电力营销基础数据准确性校验的框架模式,经实验数据验证,有效提高了营销基础数据校验的自动化程度。“大数据”时代的今天,数据挖掘技术层出不穷,为海量电力营销基础数据的自动分析和校验提供了一条解决之路。本文选择神经网络算法,通过SPSS软件对电力营销基础数据进行建模、分类、自动得出校验规则,实现偏差数据的筛选,为基础数据的更正提供校验依据和异常清单。
关键词:神经网络 电力营销 SPSS
中图分类号:TP183 文献标识码:A 文章编号:1007-9416(2014)12-0084-01
1 引言
随着坚强智能电网的迅速发展,电力营销业务数据以日剧增。电力营销基础数据质量的高低直接影响电力营销工作各项指标的优劣。如何校验电力营销基础数据的准确性是提高电力数据质量的关键问题。传统校验规则的生成,需要大量各业务领域专家分析探讨,费时费力,且自适应能力差。
2 神经网络简介
2.1 概述
人工神经网络(Artificial Neural Networks,简写为ANNs),简称为神经网络(NNs),它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。
2.2 神经网络算法
一个神经网络分为输入层、输出层和隐含层。输入节点对应预测变量。输出层的节点对应目标变量。在输入层和输出层之间的隐含层决定了神经网络的复杂度。节点间的每个连接对应一个权重,节点的值通过它所有输入节点的值与对应连接权重乘积的和作为函数的输入而得。
2.3 神经网络分类
神经网络模型主要考虑网络连接的拓扑结构、神经元的特征、学习规则等。典型的神经网络模型主要分3大类:以感知机、BP反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以Hopfield的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以ART模型、Koholon模型为代表的,用于聚类的自组织映射方法。
2.4 神经网络应用
神经网络通常用于两类问题:分类和回归。由于其良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等优点,在很多复杂度很高的领域,都取得良好效果。
3 SPSS简介
SPSS(Statistical Product and Service Solutions),是IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称。
SPSS的神经网络模块,包括多层感知器(MLP)和径向基函数(RBF)两种方法。这两种方法都是有监督的学习技术,且都采用前馈结构。为提高效率,本文选择速度较快的径向基函数方法进行数据分析。
4 实验分析
本实验使用SPSS神经网络模块作为数据分析工具,以标准电力营销基础数据为数据模型,对神经网络进行训练建模。为方便说明,简化标准数据集,截取训练数据片段如下:
在径向基函数方法中,“因子”选择“用户分类”做为神经网络输入层,“因变量”选择“电压等级”做为神经网络输出层。训练后的神经网络参数结果如表1:
通过以上参数估计结果,根据键结值>0的网络节点关系可见:
(1)输入层“用户分类=低压居民”时,通过隐藏层H(1),至输出层的分类为“[电压等级=交流220V”;
(2)输20V入层“用户分类=高压”时,通过隐藏层H(2),至输出层的分类为“[电压等级=交流10kV”。
分类结果符合客观实际和电力营业规范,可见该神经网络模型的正确性和有效性。至此,无需专家参与,即可得出以下校验规则:
(1)用户分类为低压居民的,电压等级不应为交流10kV;
(2)用户分类为高压的,电压等级不应为交流220V。
将实际营销客户基础数据代入该模型进行校验,分类不符合以上规则的则可判定为偏差数据,进一步由电力营销业务人员进行核查、清理、整改,修正用户分类和电压等级的业务逻辑关系。以此类推,对用户档案信息、计量资产、电价电费、台区、线路等信息均可通过神经网络分类进行逻辑关系梳理,生成校验规则,为基础信息普查整改提供依据,有效提高基础数据准确性和实用性。
5 总结与展望
本文提出了一种基于神经网络的电力营销基础数据自适应的校验方法,并使用SPSS工具进行仿真实验。实验证明,该方法准确有效、自适应结果良好,有效提高了校验效率。下一步将对比其他数据挖掘方法,完善和修正实验模型,整合企业数据库,搭建高效易行的电力营销基础数据校验平台。
参考文献
[1]邵峰晶,于忠清.数据挖掘—原理与算法.中国水利水电出版社,2003.
[2]刘军,吕俊峰.大数据时代 数据挖掘在电力企业的应用前景.