大数据时代下的电网信息化

2018-06-26 02:37付继承
现代企业文化·理论版 2018年2期
关键词:三集五大智能电网数据安全

付继承

中图分类号:G203 文献标识:A 文章编号:1674-1145(2018)2-000-02

摘 要 本文描述了大数据的概念和特征,分析了电网大数据的来源。在电网信息化工作中,电网大数据的应用、面临的安全风险,以及应采取的安全应对措施

关键词 大数据 智能电网 三集五大 数据安全

大数据时代,数据已成为企业的核心竞争力,是企业智商的最重要载体。随着三集五大体系建立、智能电网建设和一体化运维检修等,电网企业势必产生更多的数据,这些庞大的数据多种多样、杂乱无章、相互关联。如何处理好这些数据,从中提取有用信息用于指导电网企业的生产运营和管理,已成为电网信息化工作的重要任务。

一、大数据的概念

大数据与信息技术的发展如影随形,人类的工作、学习和生活等各种行为都可以以数据的形式存在于网络,这些庞大的数据绝大多数是“非结构化数据”,通常不能为传统的数据库所用,具有显著的4V特征。

一是数据体量庞大(Volume)。当前个人计算机硬盘的容量为TB量级,1T大约能存储12万张1800万像素的JPG格式照片。权威机构预测到2020年,全球数字宇宙将会膨胀到40ZB(1ZB=2^30TB),这些数据均产生于我们的日常行为当中,多数显得没有那么重要,却又有着千丝万缕的关联。

二是数据类型多样(Variety)。相对于以往便于存储的以文本为主的数据,现在更多的是图片、视频、音频、地理位置信息等多类型、个性化数据。

三是数据处理速度快(Velocity)。这是大数据区别于传统数据挖掘的最显著特征。数据处理是从大量的、杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据;数据处理的效率就是企业的生命,在如此海量的数据面前快速获得高价值的信息,必须具有更快的数据处理速度。

四是数据价值密度低(Value)。数据价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一两秒。

基于此,大数据可以定义为“无法用现有软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的、无规律的数据集合”。

二、电网大数据的来源

随着电力工业与信息化的深度融合,智能电网建设、“三集五大两中心”体系建设的推进,产生了大量的数据,电网信息化对电网企业的决策、运营、销售的作用不断增强。这种作用的提升,使电网企业具有大数据的时代特征,电网信息化势将突破传统运维,被赋予更多的职能,比如强大的数据挖掘、数据分析和决策能力,产生更多的增值服务,甚至催生管理模式的创新。

电网企业数据主要来源于生产运营业务数据和管理业务数据。生产运营业务数据既包括通过传感器、智能化设备、视频监控设备、音频通信设备和移动终端等各种数据采集设备收集到的电网运行状态实时数据,也包括交易电价、售电量、用电客户等企业营业数据,以及物联网、云计算、新能源并网等技术带来的新业务数据,《中国电力大数据发展白皮书》指出,电力行业的数据由以往类型较为单一、增长较为缓慢的情况发生转变,正逐渐步入由结构化、半结构化和非结构化的海量业务数据源广泛存在和驱动的大数据时代;管理业务数据则包括电网的规划、建设、运行等管理工作中产生的数据,也包括 ERP、一体化平台、协同办公等应用系统产生的数据,三集五大体系的建设,实现了人、财、物的集约化管理,构建了大规划、大建设、大运行、大检修、大营销体系,将使数据更加集中、更加庞大。

三、电网大数据的应用

信息技术的推进和发展,使电网企业的数据成爆炸式增长,如何使用好大数据,充分活化企业数据资产,更好地服务电力事业发展和广大用电客户,已成为摆在电网企业面前值得思考的课题。

目前,电网大数据应用场景主要在以下方面:

1、规划—提升电网布局能力。通过对大数据的分析,利用數据挖掘技术,更准确地掌握用电负荷的分布和变化规律,提高中长期负荷的预测准确度;利用大数据的数据挖掘技术提供给规划人员支撑电站建设布局的决策数据,实现项目建设的科学调配。

2、建设—提升现场安全管理能力。对现场照片进行批量比对分析,利用分布式存储、并行计算、模式识别等技术,掌握施工现场的安全隐患,或者核查安全整改措施的落实情况。

3、运行—提升调度管理能力。利用机器学习、模式识别等多维分析预测技术,通过关联降水、风速、光照、温度等气象因素,分析水电、火电、以及风电、光电等新能源的发电运行情况,更准确地对电网调度进行预测和管理。

4、检修—提升状态检修管理能力。研究消缺、检修、运行工况、气候条件等因素对设备状态的影响,以及设备运行的风险水平,利用并行计算等技术实现检修策略优化,指导状态检修的深入开展。

5、营销—提升对用电行为的分析能力。扩展用电采集的范围和频次,开展对用电行为特征的深入分析,实施区别化的用户管理策略,可以使客户更有效地用电和合理管理用电成本,收集到的数据也有助于电网企业为客户定制电力管理程序和提供个性化定制服务。

6、运监—提升业务关联分析能力。利用流式计算、可视化和并行处理等技术,实现全方位在线监测、分析、计算,通过聚类和模式识别技术,解决对跨业务的关联分析、数据因子分析、数据诊断规则和算法,提高数据质量监控和治理。

7、客服—提升服务效率。对客服录音进行实时监管,利用模式识别、机器学习等技术,对热点问题的服务资源进行优化分配,提升交互水平。

四、电网大数据的安全风险

人们的生活正在被数字化,大量数据产生的背后隐藏着巨大的经济利益和政治利益。大数据不仅为电网企业带来了更多的机遇,同时也带来了新的安全风险。

一是大数据成为网络攻击的显著目标。在网络空间,大数据是更容易被“发现”的大目标。一方面,大数据意味着海量的数据,这些数据会吸引更多的潜在攻击者;另一方面,数据的大量汇集,使得黑客成功攻击一次就能获得更多数据,增加了“收益率”。

二是大数据加大隐私泄露风险。大量数据的汇集不可避免地加大了用户隐私泄露的风险。一方面,数据集中存储增加了泄露风险,这些数据不被滥用,也成为信息安全的一部分;另一方面,一些敏感数据的所有权和使用权并没有明确界定,很多基于大数据的分析都未考虑到其中涉及的个体隐私问题。

三是大数据威胁现有的存储和安防措施。数据大集中的后果是复杂多样的数据存储在一起,很可能会出现将某些生产数据放在经营数据存储位置的情况,致使企业安全管理不合规。安全防护手段的更新升级速度无法跟上数据量非线性增长的步伐,就会暴露大数据安全防护的漏洞。

四是大数据成为高级可持续攻击(APT)的载体。APT攻击是一个实施过程,无法被实时检测,大数据的价值低密度性,使得安全分析工具很难聚焦在价值点上,黑客可以将攻击隐藏在大数据中,给安全服务提供商的分析制造很大困难。

五、电网大数据安全措施

信息安全在任何信息发展阶段都占有不可忽视的地位,在对大数据发展规划的同时,必须确保数据的安全和规范使用。为此,保证大数据安全采取的措施有以下几种:

一是重视大数据及其信息安全体系建设。建议加大对大数据信息安全形势的宣传力度,明确大数据的重点保障对象,加强对敏感和要害数据的监管,加快面向大数据的信息安全技術的研究,培养大数据安全的专业人才,建立并完善大数据信息安全体系。

二是加强对重点领域敏感数据的监管。海量数据的汇集加大了敏感数据暴露的可能性,对大数据的无序使用也增加了要害信息泄露的危险。在企业层面,建议加强企业内部管理,制定设备特别是移动设备安全使用规程,规范大数据的使用方法和流程。

三是对数据进行标记。大数据类型繁多、数量庞大直接导致了大数据较低的价值密度。从海量数据中筛选出有价值的数据,既能保证其安全性,又能实现大数据的快速运算,其实现方法是对大数据进行分类标识。

四是设置用户权限。分布式系统架构适用于具有超大数据集的应用程序,可以对用户访问权限进行设置,为不同的用户赋予不同的访问权限,不允许任何用户超过为其设定的最大权限。

五是增强加密系统。为了保证大数据传输的安全性,需要对数据进行加密处理。通过加密系统对要上传的数据流进行加密,对要下载的数据同样要经过对应的解密系统才能查看。因此需要在客户端和服务端分别设置一个统一的文件加/解密系统对传输数据进行处理。同时,为了增强其安全性,应该将密钥与加密数据分开存放。

六是发现潜在的数据联系。大数据的信息安全更加注重的是安全技术而不是对数据本身的保护,目前已有对数据的安全性保护措施,但这些技术对于大数据来说是否可以同样使用还需要验证。

猜你喜欢
三集五大智能电网数据安全
云计算中基于用户隐私的数据安全保护方法
建立激励相容机制保护数据安全
大数据云计算环境下的数据安全
论“三集五大”下县供电企业的精神文明建设
智能电网中光纤通信系统的可靠性分析
智能电网现状与发展分析
大数据安全搜索与共享