Hadoop大数据在智能电网中的应用构想

2015-01-03 17:30
中国管理信息化 2015年20期
关键词:分布式计算玉林海量

唐 安

(玉林供电局,广西 玉林 537000)

Hadoop大数据在智能电网中的应用构想

唐 安

(玉林供电局,广西 玉林 537000)

大数据时代即将来临,如何借助大数据技术,实现高度信息化的智能电网,是一项具有实际应用价值的课题。本文介绍了国内领先的大数据技术——Hadoop分布式计算平台,并引用百度迁徙的成功案例阐述大数据在未来智能电网中的应用构想。

Hadoop;大数据;分布式计算;HDFS;MapReduce

1 大数据

大数据需要新处理模式才具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。大数据的核心是预测,它把数学算法应用到海量数据上来预测事件发生的可能性。大数据同时意味着思维的变革:①小数据分析的是随机样本,而大数据分析的是全体数据,全面展示样本无法表达的细节信息;②小数据分析追求精确性,而大数据分析具有混杂性,这意味着大数据的简单算法比采样数据的复杂算法更有效;③小数据分析关注因果关系,而大数据分析更关注相关关系,通过分析事物之间的关联性,来预测事件的发展趋势。

2 Hadoop大数据平台

Hadoop是Apache发布的开源分布式计算平台。受Google大数据论文的启发,Doug Cutting用JAVA实现了以MapReduce和HDFS为核心的Hadoop,并将源代码完全贡献出来。Hadoop充分发挥集群的计算和存储能力,快速完成海量数据的处理。Hadoop采用分布式存储来提高读写速度和扩大存储容量;采用MapReduce整合分布式文件系统上的数据,实现数据高速处理;采用存储冗余数据来保证数据的安全性。

2.1HDFS

HDFS是基于流模式访问和处理超大文件的需求而开发的,它可以运行于廉价的商用服务器上,HDFS的主要特点有以下3个方面。①处理超大文件:在实际应用中,HDFS已经能够用来存储管理PB级的数据了。②流式访问数据:请求读取整个数据集要比读取一条记录更加高效。③运行于廉价的商用机器集群上:HDFS对硬件要求较低,无需昂贵的高可用性机器。

HDFS体系结构中有两类节点:NameNode和DataNode,NameNode负责管理集群中的执行调度,DataNode是具体任务的执行节点。当执行任务时,客户端访问NameNode获取文件数据信息,与DataNode进行交互以访问整个文件系统。HDFS向用户提供类似POSIX的文件接口,开发者在编程时无需考虑NameNode和DataNode的实现细节。

2.2MapReduce

MapReduce是Google公司的核心计算模型。在Hadoop中,用于执行MapReduce任务的机器有两种角色:JobTracker和TaskTracker,一个Hadoop集群中只有一个JobTracker,用于任务管理和调度。一般来说,为了减轻网络传输的压力,数据存储在哪个节点上,就由哪个节点进行这部分数据的计算。JobTracker监控任务运行情况,当一个TaskTracker出现故障时,JobTracker会将其承担的任务转交到另一个空闲的TaskTracker重新运行。TaskTracker用于执行具体的工作。

3 大数据在智能电网中的应用构想

通过Hadoop大数据平台,技术人员可实时观察到全网范围内的电能流动状态、电能负载热区、设备故障高发区和客户集中区等数据,实现更加智能化的电网。具体包括以下4个方面。

3.1电网数据可视化

在未来智能电网中,通过大数据分析融合调度、配电、输电、发电和用电客户数据,实现实时和非实时数据的高度信息化集成,通过实时可视化运算分析,全面展示完整和精细的电网运行状态图,为管理层提供辅助决策支持和依据。

3.2电网负载趋势预测

在未来智能电网中,通过大数据分析电网负载的历史数据和实时数据,展示全网实时负载状态,预测电网负载变化趋势,通过现代化管理技术的综合应用,提高设备的使用效率,降低电能损耗,使电网运行更加经济和高效。

3.3设备故障趋势预测

在未来智能电网中,通过大数据分析电网中部分故障设备的故障类型、历史状态和运行参数之间的相关性,预测电网故障发生的规律,评估电网运行风险,开展实时预警,提前做好设备巡检和消缺工作,为电网安全稳定运行保驾护航。

3.4客户电力需求预测

在未来智能电网中,通过大数据分析电网客户的用电数据,预测区域用电和大客户用电需求变化趋势,针对客户需求提前制订高质量的服务计划,提升社会满意度。

4 结 语

Hadoop充分发挥集群的计算和存储能力,完成海量数据的实时处理。在未来的智能电网中,大数据分析可以应用到电网运行全景可视化、电网负载预测、设备故障趋势预测和客户需求趋势预测等需求,充分挖掘海量数据的价值,为智能电网提供技术参考。

主要参考文献

[1][英]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2012.

10.3969/j.issn.1673 - 0194.2015.20.032

TP308;TP311.13

A

1673-0194(2015)20-0041-01

2015-09-07

猜你喜欢
分布式计算玉林海量
王玉林作品
一种傅里叶域海量数据高速谱聚类方法
海量快递垃圾正在“围城”——“绿色快递”势在必行
邱玉林艺术作品欣赏
Unit 6 Travelling around Asia Listening and speaking
赵玉林藏石欣赏
基于云计算的移动学习平台设计与实现
云计算中MapReduce分布式并行处理框架的研究与搭建
面向异构分布式计算环境的并行任务调度优化方法
基于文件系统的分布式海量空间数据高效存储与组织研究