用电信息采集系统多业务高效协同处理关键技术

2018-09-06 08:33姜宾
中国设备工程 2018年17期
关键词:用电聚类负荷

姜宾

(国网山东省电力公司莘县供电公司,山东 聊城 252400)

作为智能电网的重要组成部分,用电信息采集系统直接关系智能电网的坚强、稳定运行。随着近年来我国用电信息采集系统正式进入深化应用阶段,围绕多业务高效协同处理关键技术开展的研究日渐受到业界关注,围绕用电信息采集系统多业务高效协同处理关键技术开展研究具备较高的现实意义。

1 用电信息采集系统中的数据处理相关技术

前置通信服务管理平台、业务应用平台、数据平台属于用电信息采集系统的具体构成,而为了在这种构成下实现业务高效处理,集群、批量数据处理等技术的支持必不可缺。

(1)集群技术。集群技术存在两种运行方式,分别为主/从方式、主/主方式,其中主/主方式的应用最为广泛,这是由于该方式在硬件资源利用方面具备明显优势,主/主方式因此具备较高可用性。围绕主/主方式构成的模型进行分析不难发现,模型中的每个节点容量均会被提前定义,节点故障时则能够实现节点任务的自动暂时移交,虽然在此情况下部分节点性能会稍有降低,但用电信息采集系统的数据处理稳定性却能够得到较好保障。值得注意的是,虽然主/从方式能够通过设置备用节点避免故障时系统性能的下降,但由此导致的投资扩大却使得该运行方式仅适用于故障状态下性能要求较高的情况。

(2)批量数据处理技术。批量处理技术同样属于用电信息采集系统中常见的数据处理技术,该技术主要用于系统过于庞大数据的处理、入库、查询、分析等工作,而为了最大化发挥批量数据处理技术效用,数据库优化必须得到高度关注,这里的优化主要包括表结构优化、数据表合理管理,前者主要负责各表间关联关系的合理设置、数据表存储量的合理控制(一般不超过2G),而后者则需要引入分区技术进行物理意义上的数据分隔,由此即可实现快速查询、磁盘I/O使用减少。

(3)并行计算技术。随着采集终端的大量接入,并行计算技术开始广泛应用于用电信息采集系统领域,其中并行计算技术主要负责采集任务并行化处理,其计算流程可大致描绘为:“终端→终端接入→终端数据采集→终端数据转发→负载均衡→并行处理集群→采集计算节点→规约适配→规约解析→指令封装”,结合这一流程可直观发现负载均衡策略在其中的应用价值,图1为负载均衡策略模型。结合图1模型不难发现,节点不过载时一般选择静态均衡,具体的均衡策略选择则需要结合实时监测流量。

图1 负载均衡策略模型

(4)网络负载均衡技术。分布式数据库存储系统大量应用于用电信息采集系统领域,而这种应用便需要得到网络负载均衡技术的支持,静态均衡算法(I/O调度策略)、动态均衡算法(负载调节措施)等则属于网络负载均衡技术的主要应用形式。其中,静态均衡算法具备原理简单、系统开销较小优点,但无法结合系统状态改变均衡策略使得其应用效果稳定性较差,静态均衡算法因此多用于负载特性相对稳定系统;而动态均衡算法则具备实时最优调节能力且对系统负载情况具备较强依赖性,这使得其多用于负载波动性大或异构系统。

2 多业务高效协同处理及其关键技术

为提升研究的实践价值,选择了日负荷曲线作为电力负荷分类特性指标,希望由此开展的不同类型用户分离探索所涉及的多业务高效协同处理关键技术能够为相关业内人士带来一定启发。

(1)电力负荷特性分析。结合《电力工业生产统计指标解释》,即可了解电力负荷特性具体划分与组成,基于行业用途可以将电力负荷划分为工业负荷、农业负荷、商业负荷、城乡居民及其他负荷,其中工业负荷可进一步细分为重工业负荷与轻工业负荷,而商业负荷则可以细分为宾馆等负荷、写字楼与大型商场等负荷。结合基于行业用途的电力负荷划分不难发现,现阶段电力负荷划分标准较为粗糙,这种粗糙分类无法较好满足用电信息采集系统的高质量应用需要。深入分析不难发现,现阶段我国基于电力用户性质、营销业务需求情况将电力用户分为六大类别,分别为大型专变用户、中小型专变用户、三相工商业用户、单相工商业用户、居民用户、公用配变考核计量点,虽然该划分较好,体现了不同客户用电习惯,但海量采集数据出现对高精度数据分类提出的挑战必须得到关注。

(2)k_means优化算法。k_means属于用电信息采集系统领域较为常见的聚类算法,该算法具备大数据处理效果较好、效率较高且具有可伸缩性的特点,但初始聚类中心的随机选择、聚类个数K需要提前设定属于该算法存在的不足,因此本文基于密度法的初始中心点进行了k_means算法的优化,这一优化需首先假定样本数据集X,其中,由此定义相异度矩阵D、领域半径MeanDist、核心点对象含有数据对象的最少数目MinPts,即可为k_means优化算法的实现提供基础支持,其中:

而密度参数的计算公式则为:

通过具体试验可以确定,基于密度法的k_means优化算法免去初始聚类中心的随机选择,这就使得k_means优化算法大大提高了聚类质量与稳定性,传统k_means算法初始聚类中心随机选择对聚类结果造成的负面影响也由此得以顺利消除。为实现更进一步的k_means算法优化,本文开展了BWP、DBI、距离代价函数、Silhouette、基于GSA的肘形判据等聚类有效指标的特点分析,并选择了合适的指标函数作为聚类结果评价性指标,而由此开展几种评价指标的简要分析,即可发现常用的评价性指标为轮廓系数,而BWP、基于GSA的肘形判据指标在应用中均存在各具特色的表现,因此对三种指标进行了实验对比。具体实验中,以轮廓系数为聚类效果评价指标的运行总时间为8.9647s,而以BWP为聚类效果评价指标的运行总时间则为6.2814s,而基于GSA的肘形判据指标运行总时间为6.1617s。开展对比分析可以直观发现,基于轮廓系数的聚类效果评价指标、基于BWP的聚类效果评价指标受到的初始聚类中心随机性影响较大,由此引发的稳定性问题将直接降低判断准确性,而基于GSA的肘形判据指标却不存在这类问题,因此肘形折角判据可较好服务于最佳聚类个数的确定。结合上述分析不难发现,k_means优化算法的应用流程可描述为:“开始→对象数据集→K=1→开展计算→K≥定值→gap>gap(2)-sd(2)→Kopt=1”,而通过这一系列流程,即可保证k_means优化算法具备聚类结果准确、质量高、无偏差等优势。

(3)电力负荷曲线聚类。对于本文研究的用户日负荷特性研究对象来说,受各类干扰因素影响、数据量较大属于其主要特点,用户日负荷特性因此天然具备较高分析难度,而这便需要应用降维技术,由此通过较低维度数据向量表示用户日负荷曲线,即可保证用电信息采集系统更高质量运行。具体来说,需采用主成分分析法进行用户电力负荷曲线聚类,这里的主成分分析法是一种典型的多元统计分析方法,将原数据样本的高维度信息转换为一组新的互不相关的低维指标进行表示属于该方法的特点,而这正是主成分分析法能够较好挖掘数据对象信息间潜在影响和关联的原因所在,而结合上文提及的k_means优化算法,即可保证改进算法更好服务于海量电力负荷的更高质量、更高效率聚类,随着我国电力用户及采集终端的不断增加、新型业务的不断出现,本文提及的用电信息采集系统多业务高效协同处理关键技术将有广阔的应用前景。

3 结语

综上所述,用电信息采集系统多业务高效协同处理关键技术具备广阔应用前景,本文提及的电力负荷特性分析、k_means优化算法、电力负荷曲线聚类等内容,提供了可行性较高的技术探索路径建议,而为了推动我国电力事业的进一步发展,业界还应围绕管理策略、云计算技术、系统功能扩展开展更深入研究。

猜你喜欢
用电聚类负荷
人造革合成革拉伸负荷测量不确定度评定
3项标准中维持热负荷要求对比分析
Opening flexible resources by integrating energy systems: A review of flexibility for the modern power system
安全用电知识多
基于K-means聚类的车-地无线通信场强研究
对输配电及用电工程的自动化运行的几点思考
为生活用电加“保险”
用电安全要注意
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现