大数据资源优化在电网客户关系系统中的应用

2015-12-20 06:46李婷
电网与清洁能源 2015年9期
关键词:客户关系决策树调度

李婷

( 四川大学 锦城学院, 四川 成都 611731)

随着计算机信息技术的飞跃发展,人类进入了大数据信息化时代, 在电网系统管理和设计中,需要构建电网客户关系信息系统,实现对电网数据分析与客户优化对接,提高电网服务质量。 在电网客户关系系统中,存储着海量大数据信息,需要进行大数据资源优化调度,提高电网客户关系系统运行的稳定性。 研究电网客户关系系统中的大数据资源优化调度和管理方法具有重要意义[1]。

在电网客户关系系统设计中,需要构建大数据信息管理系统和数据库,数据库作为信息存储和处理的重要工具和载体,在数据信息存储、调度和信息检索等领域中发挥着重要的作用,大型电网数据库是将数据信息通过集成和融合处理,将大量网络计算资源、存储资源与软件资源进行统一管理,实现对信息资源的统一调度,最终为电力网络的管理决策部门和电网用户提供准确的数据分析和服务[2-4]。传统大数据资源的调度方法采用能量谱密度函数特征调度算法,由于电网与客户关系数据信息受到外部非线性特征信息的干扰,对大数据资源的调度性能不好。 基于此,提出一种基于决策树主特征提取大数据资源优化调度方法,并应用在电网客户关系系统设计中。 首先,构建电网客户关系的决策树控制模型和资源调度模型,对大数据资源调度任务节点进行信息表征,提取主特征实现大数据资源优化调度;其次,在构建的电网客户关系系统中进行大数据资源的调度仿真,展示了本文算法在提高数据调度匹配准确性和实时性方面的优越性能。

1 模型构建和大数据资源调度任务信息表征

1.1 电网客户关系系统大数据资源调度模型总体设计

构建电网客户关系系统大数据资源调度模型,为进行系统设计和资源调度提供准确的数据基础。电网客户关系大数据库信息流的集合划分机制是实现对电网客户关系系统大数据分区访问的关键,在电网客户关系系统网络数据监控过程中[5],整个电网客户关系数据调度控制网络模型用一个连通的无向图G=( V,E)来表示,所有节点都有相同的传输半径r。 引入C4.5决策树模型进行资源调度分配,得到决策树模型如图1所示。

图1 C4.5决策树电网客户关系大数据资源分布模型Fig. 1 C4.5 decision tree power network customer relationship big data resource distribution model

图1中, 电网资源树与上层节点的最小竞争窗口值以及平均子节点数目相关,大数据调度标签生成阶段( TagBlock),采集数据集合为S,当X哿U,电网客户关系数据调度大数据信息系统状态响应函数表达式为:

当满足调度最优决策方案, 在决策树中表现为映射值{No,Yes},采用主特征提取和建模方法,提取的主特征类型为19类。假设在数据资源调度中,所有的虚拟节点性能相同, 实现了电网客户关系系统信息流的异步传输控制[6],此时,电网客户关系系统大数据信息流异步层最小竞争异步递进值为:

对于性能权值为wi的存储集合应该具有( wi/wmin)n个虚拟节点,电网客户关系数据调度的时间减弱函数为:

在电网客户关系系统中, 数据定位子空间中传输树资源流量控制加权系数表示为:

式中:CW0min为数据资源调度传输树中最底层根节点的预测初始化值;而CWlimin为第Dn步的数据资源传输控制值。由此可见,资源分区访问特征的差异主要是由于层和层之间的平均子节点数目控制产生的。 设定χ调节系数,对于每层的最小竞争窗口值该调节系数为定值;A为层最小竞争窗口的上限值,可以调节由于最小竞争窗口过大而引起的流量预测偏差问题,其取值为:

其中,

把电网客户关系系统信息流量序列广播为定位信息, 通过电网客户关系系统大数据信息流集合划分机制与模式匹配设计, 实现电网客户关系系统大数据资源调度模型总体设计,为进行下一步算法改进设计提供准确的数据基础。

1.2 大数据资源调度任务节点信息表征

在1.1节进行总体模型设计的基础上,进行大数据资源调度任务节点信息表征,电网路由节点的自相关变量与接收外部输入数据紧密相关,表现为网络系统中的干扰信号,C4.5决策树下主特征序列模型为s1( t),s2( t),…,sp( t),采用联合特征信息增益提取方法, 数据捕获状态空间为S={( k,n),0≤k≤K,0≤n≤N},把电网客户信息的感知信息发送给调度者,用q( n)表示下一跳节点在时隙n时的队列长度,u( n)表示下一跳节点在n+做出的决策行动,u( n)=0。 在每个电网客户关系网络中通过节点周期性广播方法广播自己的信标信息( beacon),该信息包含电网客户ID、用电量和用电设备等信息,并在广域的电网客户关系系统大数据信息定位空间中进行多层迭代,把拓扑树结构中的每一层节点携带的信息量进行抽取对比,并对流量信息占用概率进行特征匹配,得电网数据信息主特征量:

式中:tn+1时刻和tn时刻相差一个调度迭代周期,通过调度节点的任务信息表征,电网客户关系数据调度系统相当于一个多层节点的非线性映射器,其资源调度的规律为:

在最大独立集的基础上建立一棵根在云平台多处理分叉树的数据聚集树, 然后各个节点按主特征建模进行数据聚集树分层, 以此为基础进行数据调度。

2 电网客户关系系统中大数据资源调度优化实现

在第1节进行系统总体设计和任务信息表征的基础上, 本文提出一种基于决策树主特征提取大数据资源优化调度方法, 并应用在电网客户关系系统设计中。

在决策树模型中, 给定的定电网客户关系大数据看作信息集合中的2条数据轨迹A,B。 对于轨迹A上的任意一点ai, 计算数据库分区访问的输出概率中第m个高斯分量的均值矢量:

其中,混合数M的大小决定了输出概率的精度,假设电网客户关系大数据资源定位信息在干扰和噪声作用下轨迹A、B之间的空间有向距离则可以表示为:

式中:NA为A的数据信息流特征分割权向量。根据A、B之间的分区方位的协方差矩阵, 计算正交加权约束的主特征信干比,得到:

提取主特征实现大数据资源优化调度, 电网客户关系数据调度通信接收端检测到异常数据对资源调度具有干扰作用,需要对其进行滤波设计,采用匹配滤波器检测方法去除资源调度中的干扰性因素,得到滤波器的系统函数为:

通过上述处理,减少系统中的存储数据冗余,提高电网客户关系大数据调度效益。 在不同电网客户关系系统定位信道中, 信道占用概率的准确求解可以提高抗干扰能力,信道占用概率计算中,资源调度的通信信道满足约束条件:

通过特征压缩, 得到电网客户关系大数据的聚类中心为:

通过特征压缩,得到电网客户关系大数据的,采用竞争集来描述一个节点在传送数据时, 提取决策树的主特征,进行联合特征识别,其检验统计量为:

采用相位重加权方式,去掉路径相移偏量,得到大数据资源调度特征响应简化后的表达式为:

在电网客户关系网格模型中, 各空闲时间片长度分别记作x1,x2,…,xm+1,假定网络结构模型为某种几何空间S,构建模糊隶属函数,大数据资源多源节点中形成新的映射,在大数据资源调度网格模型中,对大数据资源调度任务所需的计算资源为:

式中:rect( t)=1,|t|≤1/2。通过求得式( 17)的极小值,实现对资源的优化调度,综上分析,实现了电网客户关系系统大数据信息流集合划分机制与模式匹配,为实现对电网客户关系系统大数据库构建位和特征分析奠定基础。

3 仿真实验与应用

为了验证本文设计的大数据资源调度算法在提高数据调度匹配准确性和实时性方面的优越性能,进行仿真实验。 实验硬件环境描述为:操作系统UNIX; 编程语言Matlab语言。 编程环境GCC( GNU Compiler Collection)。 实验中,采用某大型电网公司的客户关系系统进行系统仿真,采集原始数据作为实验样本数据,离散采样率为fs=10f0Hz=10 kHz,带宽B=1 kHz。 电网客户数据特征提取计算过程中,全局迭代次数为500次,变量的维数n为30,算法独立运行30次。 进行资源调度决策树构建,本体特征的权值向量W={ws,wt,wu}T。实验中,采用10个计算节点组建电网客户资源大数据资源调度环境,网络路由节点通信半径为10 m,Sink节点位于该区域中心,节点通信轮次为134轮次,带宽为1。 根据上述实验环境, 进行电网客户关系系统的大数据资源调度仿真,进行数据信息时间采样,得到采样波形如图2所示。

图2 电网客户关系数据采样Fig. 2 Customer relationship data sampling in the power gird

由图2可知, 原始的电网客户关系数据不能规律性地反应数据特征, 难以实现有效的资源调度。本文采用决策树主特征提取方法面对上述数据资源进行特征分析,得到主特征提取结果如图3所示。

图3 电网客户关系资源数据主特征提取结果Fig.3 The main feature extraction results of the customer relationship resources in the power grid

由图3可知, 采用本文方法进行决策树主特征提取,能有效准确地反应电网客户关系系统中大数据的内部特征细节,为进行资源优化调度提供准确的数据输入。 以此为基础进行资源调度,为对比算法性能,采用本文算法和传统算法,以资源调度的准确匹配率为测试指标,得到仿真结果如图4所示。

图4 电网客户关系数据资源调度匹配性能对比Fig. 4 The matching performance of the grid customer relationship data resource scheduling

由图4可知,采用本文方法相比K-means算法和FRFT算法具有较高资源调度匹配率,性能优越。

表1 资源调度匹配率对比Tab. 1 Resource scheduling matching rate

资源调配率对比如表1所示。 由表1可知,随着迭代次数的增加, 本文算法的匹配率可到100%,而K-means算法和FRFT算法的匹配率只能达到96%。由此可知,本文方法的资源匹配率更高、性能更好。

4 结语

在电网客户关系系统中存储着海量大数据信息,需要进行大数据资源优化调度,以提高电网客户关系系统运行的稳定性。 传统大数据资源调度方法采用能量谱密度函数特征调度算法,由于电网与客户关系数据信息受到外部非线性特征信息的干扰,对大数据资源的调度性能不好。 提出一种基于决策树主特征提取大数据资源优化调度方法,并应用在电网客户关系系统设计中。 通过构建电网客户关系的决策树控制模型和资源调度模型,对大数据资源调度任务节点进行信息表征,提取主特征实现大数据资源优化调度。 仿真结果表明,采用本文方法能实现对电网客户关系系统中的大数据资源的优化调度,提高数据匹配能力,从而提高系统可靠性和稳定性。

[1] 魏理豪, 王甜, 陈飞, 等. 基于层次分析法的信息系统实用化评价研究[J]. 科技通报, 2014, 30( 2): 142-148.WEI Lihao, WANG Tian, Chen Fei, et al. The information system based on analytic hierarchy process( ahp) practical evaluation studies[J]. Bulletin Science Technology, 2014,30( 2): 142-148( in Chinese).

[2] 朱继萍, 戴君波. 中长期电力负荷预测相关影响因素优化选择[J]. 计算机仿真, 2008, 25( 5): 225-228.ZHU Jiping, DAI Junbo. Related factors affecting medium and long term power load forecasting optimal selection[J].Computer Simulation,2008,25( 5):225-228( in Chinese).

[3] 陈靖, 路志英, 刘洪, 等. 基于改进ANP的配电网综合评估方法及应用[J]. 电力科学与工程,2015,31( 5):21-31.CHEN Jing, LU Zhiying, LIU Hong, et al. Based on the improvement of the distribution network comprehensive evaluation method and application of ANP[J]. Electric Power Science and Engineering, 2015, 31( 5): 21-31( in Chinese).

[4] 杨杰, 郑宇清, 吕晓燕, 等. 应用电网雷害分布合理布置500 kV线路避雷器[J]. 高压电器, 2013( 9): 91-95.YANG Jie, ZHENG Yuqing, L譈 Xiaoyan, et al. The distribution of reasonable application grid layout of 500 kV line lightning arrester[J]. High Voltage Electric Equipment,2013( 9): 91-95( in Chinese).

[5] 吴小辰, 赵勇, 苏寅生, 等. 南方电网受端系统动态无功综合调用技术[J]. 南方电网技术, 2015, 9( 2): 25-29.WU Xiaochen, ZHAO Yong, SU Yinsheng, et al. By the end of the southern power grid system dynamic reactive power integrated call technology[J]. Journal of Southern Power Grid Technology, 2015,9( 2): 25-29( in Chinese).

[6] 吴小辰, 樊纪元. 电网客户关系数据调度中心统一数据平台的设计[J]. 电力系统自动化, 2006, 30( 22): 89-92.WU Xiaochen, FAN Jiyuan. Customer relationship data grid dispatching center unified data platform design[J].Automation of Electric Power Systems, 2006, 30( 22): 89-92( in Chinese).

猜你喜欢
客户关系决策树调度
润滑油行业大客户关系建立与维护策略探讨
关于客户关系管理的思考
《调度集中系统(CTC)/列车调度指挥系统(TDCS)维护手册》正式出版
基于强化学习的时间触发通信调度方法
一种针对不均衡数据集的SVM决策树算法
一种基于负载均衡的Kubernetes调度改进算法
虚拟机实时迁移调度算法
决策树和随机森林方法在管理决策中的应用
八大策略增进客户关系
基于决策树的出租车乘客出行目的识别