国网吴忠供电公司 蔡 娜
在网络信息技术高速发展的背景之下,伴随着物联网和社交网络等各种技术的快速发展,全世界的数据和信息量得到了前所未有的过程,毫无疑问,那么这种生活在一个信息和数据爆炸的时代。有统计显示,在最近几年当中人类所产生的数字信息和数据量几乎达到了人类历史上所有数据的九成,在计算机技术当中所采用的GB、TB 等单位已经不能够满足现代社会生产领域对数据量的计量需求需求,数据量单位的量级已经上升到了PB、EB,这种数据量的极速扩充证标志的大数据技术的形式和大数据时代的来临。
我国现阶段已建设起了发达的电力网络,对于电力企业来说在电力生产管理与监控当中,所需要处理的数据量相较于从前也有极大程度的提升,大数据的发展是未来必然的一个趋势,本文将进一步结合大数据技术和数据分析,在电力企业当中的应用现状简要的探讨这些技术,对于电力信息和监控信息产生的影响,并对这些技术在电力行业中未来的发展进行展望。
目前来说学术界对于大数据还没有一个确切的定义,但是对于大数据的特征,在学术和应用领域基本上达成了共识。通常来说,大数据指的是在一定时间内无法运用传统数据软件进行分析处理的大量数据,关于大数据的特征,当前业界主流且具有代表性的观点是“4V”特征,也就是Volume、Variety、Velocity、Value,分别代表着数据量、数据种类、传输速度和数据价值,所谓大数据也就是数据量大、数据种类多、传输速度快、数据价值高这几样特征的集合体。从以上几个特征不难发现,大数据的应用依赖于数据处理网络建设高速发达的网络才能更好的应用大数据,同时要充分挖掘大数据当中的价值,需要一个更高效的“数据处理器”。而关于数据分析则主要指的是在大数据处理的基础上数据的实际应用价值进行进一步的挖掘,换句话来说数据处理可以算作是初步的数据分析。对于电力的生产和管理而言,数据分析对整个电力的调配具有重要的意义。
数据分析是大数据技术应用的重要组成部分,因此大数据的关键技术也包括数据分析。此外数据的处理管理和展现也同样是大数据技术应用的关键。在数据分析方面,现阶段数据分析的主要类型有统计分析、关联分析、聚类分析和分类分析。
统计分析主要指的就是利用统计学方法对数据进行技术的收集整理和分析,是在数据分析当中一种较为直接的方法,可以比较直观的发现数据之间的内在规律,是将统计所得的数据,利用统计学原理进行筛选并结合统计学的公式来进行计算,将所获得的结果结合生产中的实际情况进行分析;关联分析则主要指的是结合实际情况把握不同数据之间的内在联系,例如早期数据挖掘的典型案例:在超市的顾客当中,购买啤酒的顾客群体里有67%也会同时购买尿布,由此可以推断出大多数购买啤酒的顾客为有孩子的中青年。利用这条信息就可以对超市内尿布和啤酒两者的货架位置进行调整以达到促销的目的。
聚类分析则主要应用于机器学习领域,在不明确分类标准的前提下,运用数据之间相似或共同的特征将不同的数据进行联系,自然的将不同的数据分成若干个数据簇,之后以数据的特征为脉络进行分析;分类分析技术和聚类分析的主要区别在于分类分析是有明确的分类标准的,分类分析的过程当中发现并预测新的数据类型。
在数据处理方面,现阶段主要运用技术,有分布式计算、内存计算和流处理技术。具体来说是结合云端该实现硬件设备的虚拟化,该降低硬件设备的维护成本和能量的消耗,提高有限的硬件资源利用率,保障数据处理和存储的稳定性避免由于硬件设备的损坏造成不可估量的损失;在数据管理方面,这主要包括关系型与非关系型的数据库建设,数据融合与数据集成技术等,在数据展现方面主要是数据可视化,历史流展示技术,空间信息流展示技术,利用图形学原理借助各类图形图表,对数据的分布、特征等级展现,从而快速直观的获取部分信息,有利于促进分析工作的开展。
“电力大数据”这个概念是在智能电网建设的背景下大数据技术和电力生产管理的一次有机的融合。与大数据的概念类似,目前业界对于电力大数据也没有一个较为明确的概念,但具有一些共识。一般来讲,所谓电力档的数据指的是通过传感器、智能设备、视频监控设备、音频通讯设备、移动终端等各种数据采集渠道收集到的结构化、半结构化、非结构化的海量业务数据集合。电力大数据对于电网建设的整体质量和电力配送以及电网的整体监控具有重要的价值。在掌握了这些大数据挖掘大数据信息的基础上可以对整个社会的用电情况有一个大概了解,为电力企业后续的计划与决策提供参考,同时,这些信息为电力企业进一步攻克电力工业和电力供应方面的难关指明了方向。
数据分析在电力企业当中的应用包括诸多方面,本文会分别从电力信息挖掘和监控信息两个方面进行简要的阐述。在电力信息的挖掘和运行层面,数据分析主要是建立在整个电力信息系统积累的日志信息数据的基础上,依照认识信息数据的来源,可将其大致分为两类:
第一是系统的运行信息,智能化信息系统自身的运作状态监测因此可以通过运行信息获取系统正常运行,异常运行和预警等三个种类的信息。通过对这一类信息的分析就可以刻画出整个电力信息系统,在某段时间内的运行状态并在此基础上对系统未来的运行进行预测,从而依据自身的需求,对系统进行及时的维护和调整;第二是系统的访问日志信息,对于这些信息数据进行分析就可以对系统用户的行为进行刻画,包括用户的访问喜好以及不同类型用户对于系统的使用频次。当中就可以得到关于不同类型用户对于电力信息系统的依赖程度以及各类用户对于电力信息系统的应用场景。在对这些信息进行统计和处理的基础上,进行关联性分析就可以得出,各类业务在公司内部的表现状况从而得出不同客户对于电力企业的业务需求,辅助电力企业在业务发展方向和资源分配方面作出合理决策。
在监控信息方面,则主要是辅助对一些监测出的异常信息和异动进行及时的处理,在业务领域的异动信息,主要是指业务规则的变化及业务发展后期计划的调整。及时发现业务数据当中发生异常变动,有助于工作人员和管理者及时察觉到业务领域的指标和规则的变化,从而对电力企业内部相关业务的规划做出调整,做到时刻以最好的状态面对业务工作。另外,对监测数据的分析也有利于及时发现数据质量不稳定的情况,如果发现没有及时接入数据或者收集到的数据不完整,就表明可能是监控系统的状态出现了问题,让相关的工作人员进行检修。
对于电力信息运行来说,电力大数据产生的影响,首先是关于电力企业的数据中心建设方面,与大数据的数据量庞大,对于硬件设施的要求也相对较高,需要大量的网络交换机和硬件设备,也就是说电力大数据背景下的数据中心建设。
首先就要有一个充足的机房空间,同时还需要散热等方面的问题,以保障数据中心的硬件设施能够长时间的正常运作。与之相对应的,数据中心的维护和使用需要更多的专业人员,所以对于电力企业来说,加强关于员工的大数据专业技能培训也是十分有必要的,一方面,需要有充足的运维人员,另一方面,需要更多的员工来掌握大数据技术的核心知识体系,从而能够更好地对大数据进行应用。
其次是对于信息网络的影响。大数据的一个特点就是传说速度快,这对于电力企业的信息网络建设也有一定要求:信息网络的传输带宽要高,大数据网络的一个特点就是持续的大宽带通信;由于大数据技术,更多地应用分布式计算的方式来提高整体的运行效率,因此在信息化网络构建的过程当中,也要体现出分布式的特点,保障据资源的安全性,避免因为一部分网络出现故障,而导致整个信息网络无法正常运作;关于网络的基础设施也需要进行升级,处于数据安全性考虑网络交换设备需要有相应的缓存设置,避免重要数据的丢失。由于大数据背景下带宽的提升,信息网络基础设施也需要能够承受这种大带宽传输,就目前的发展趋势而言,建设高性能的光缆传输网络是大势所趋。
而大数据对于监控信息产生的影响,则主要是实际工作层面的,大数据背景下的监控信息,同样具有着信息量大的一个特点,因此对于相关工作人员来说,数据分析技术就显得尤为关键,要能够从大量的监控信息当中及时发现智能电网当中的异常,科学合理的措施进行处理。另外对于监控设备数据采集功能也有一定的要求,监控数据数据要具有实时性,准确性。
最后无论是电力信息还是监控信息,在大数据时代的背景之下,关于信息资源的安全和网络安全问题都是重中之重。由于大数据的数据量大,种类繁多,因此在传输过程的安全稳定就显得尤为重要,确保重要信息不能丢失、电力信息网络和电力监控网络的安全防止恶意入侵都是信息资源安全和网络安全工作的核心内容。目前来说,在这一领域,国内已有了不少的研究,如朱海鹏等基于D-S 证据理论,计算安全事件的偏离度,来确定安全事件权重,构建了建立在证据分类基础上的复合攻击检测防护策略,这种策略和算法能够针对多类型的网络攻击。
就现阶段的状况来说,电力大数据的应用主要是服务于整个电力生产和使用的,通过发现大量数据之间存在的规律,把握数据之间的内在联系,未来业务服务的发展走向进行分析和预测。从而进一步提高电力企业的客户服务质量,具体来说,通过对电力信息的分析,可以对客户用电的行为倾向以及具体的用电量作出预测,并以此作为脉络,将客户进行初步的分类,通过对公司内部业务状况数据的分析预测出未来一段时间内,客户业务需求的大体走向,从而进一步优化业务流程,使得客户感到企业的服务更加便捷舒心。对于监控信息的分析,就可以及时发现电网在运行的过程当中遇到或产生的技术上或设备上的问题,便于相关工作人员进行及时的维护修理,同时也方便管理者对企业内部的资源进行调配合调整,优化资源分配。总的来说,大数据和数据分析的应用是智能化电网建设的必然要求。
第一是关于数据质量方面的挑战,大数据时代的一大特点就是数据量大的数据价值密度相对较低,电力大数据来自于输送、变压、调配、用度等各个环节,其中难免存在着许多无用、无价值的信息,如何进一步提升大数据的价值密度、高校的挖掘电力大数据当中的有效信息,会议是未来行业研究电力大数据领域的一个热点议题。
第二是关于数据集成方面的挑战,由于电力大数据在实际应用的过程当中,大多采用分布式存储集中化处理的方式,确保信息资源的安全性和处理的稳定性,当然是这样的方式也存在着许多的问题,例如部分数据库和数据系统的业务功能和具体的数据内容可能存在重复,这样就很容易导致硬件资源的占用和浪费。另外,各类采集设备在具体工作时所采用的数据采集方法可能存在差异,这也就使得数据在采集和测量的过程当中存在着各种各样的误差,影响数据分析的准确性和实际效率。
第三是关于数据存储方面的挑战,正如前文所提到的那样,大数据时代必然会对数据中心的建设产生影响,各种类型的数据对硬件存储设施包括存储的算法提出了新的要求。对于视频和图片这一类半结构化和非结构化的数据存储在未来将会成为一个新的研究热点。如何在数据库中实现高效的查询统计,从而更有效率的辅助数据分析,体现出多样化数据类型的优势,也会成为一个重要的研究课题。
总之,大数据时代的降临,对于智能电网的建设及电力企业的信息化进程推进是一个关键的机遇,作为电力行业的从业者,需要对大数据和数据分析给电力信息和监控信息乃至整个电力生产与管理所带来的影响有明确的认识,了解到大数据时代下,电力行业未来发展所需要面临的挑战,才能以更加积极的心态获取相对客观、科学的认知。让大数据技术和数据分析在电力行业当中更好的发挥作用,发挥出其作为智能化技术应当具有的价值,让电力企业更好的为广大人民提供高质量的服务。