毛 敬 玉
(兰州职业技术学院,甘肃 兰州 730070)
SCADA(Supervisory Control And Data Acquisition)系统即数据采集与监控系统,它主要应用于电力系统、网络服务、化学工业等领域的数据的收集与监控和设备流程控制等相关行业。通过对运行设备在不同环境下的数据值进行收集和分析,根据分析值按照事先预定好的控制逻辑对运行的设备进行控制和操作,以实现操作设备、检测程序、收集数据、调整参数以及系统报警等相关功能。显然,SCADA系统的应用需要对大量的数据进行收集和整理,并从中提取可用的知识,这里就需要用到数据挖掘技术。数据挖掘技术是从数据库中挖掘出有用知识的重要技术,从大量的不完整的并且相互之间没有明显关系的数据中提取出人们事先无法预测和想象的但又潜在隐藏着的有意义的信息和数据的过程。将数据挖掘技术应用于物联网SCADA系统中,有利于改进现有SCADA系统存在的不足,提高SCADA系统的总体性能,对物联网技术的发展起着很大的作用。
数据挖掘即根据某一原则从大量数据中提取有意义的信息。一般来说数据挖掘是从存放数据的数据源中挖掘出有价值知识的过程,即从特定的数据源中根据限定要求对数据进行选取、分析和处理,从中提取关键数据和分析出有意义的信息[1]。数据挖掘其实是数据分析方法的一种深入层次,过去数据分析的目的是用于科学研究,而随着计算机应用和网络技术的高速发展,数据挖掘技术已广泛应用于各行各业。它能代替数据分析专家从包含大量数据的数据源中挖掘出隐藏于其中的相关知识,找出数据之间的内在联系和数据本身固有的规律。数据挖掘是一门综合性的技术,它集数量统计学、数据结构、概率论、算法分析与设计、人工智能、数据库、机器学习、计算机支持的协同工作以及高性能并行计算等技术于一体。以前人们对数据的使用只是停留在最简单的查询功能上,通过对数据挖掘技术的使用,我们可以从数据中提取出有用的人们感兴趣的信息,为软件管理者和使用者提供快速而科学的决策支持依据。
数据挖掘过程分为三个阶段: 数据准备、数据挖掘和解释评估。其中第一阶段数据准备阶段包括从存储数据的数据源中集成数据,从集成的数据中有目的地选择数据,将选择的数据组合成目标数据,对目标数据进行筛选整合等预处理,最后将预处理的数据进行数据转换以供第二步使用。第二阶段数据挖掘阶段是对准备好的数据根据特定的逻辑进行分析和整理得出特定的模式。最后第三阶段解释评估阶段通过对挖掘出的模式进行解释给出最后所需要的知识。其中在解释评估的过程中如对模式中的数据不满可重新对数据源进行收集,再次挖掘,直到得出所需的知识[2]。图1所示为数据挖掘过程。
SCADA系统主要应用于电力系统、预测系统以及其他一些需要对数据进行收集以及监控的系统。要对数据进行监视首先需要对数据进行分析和整理并最终给出决策依据所需的数据,数据挖掘技术在SCADA系统中的使用具有非常重要的意义。以下举例说明数据挖掘技术在电力系统、电力营销系统和高速铁路SCADA系统中的使用。
电力系统是一个庞大而复杂的互联网系统,随着电力系统的广泛应用,在运行过程中产生和堆积的数据也不断增加,而这些数据对电力系统今后的运行有很重要的作用,这就需要数据挖掘系统来对这些历史数据进行分析得出知识。在电力系统中,应用理论研究的方法已经解决了许多问题,但理论研究的方法只能解决电力系统中已存在的且被发现的问题,而系统中日积月累的历史数据并没有得到很好的应用,如果能应用数据挖掘技术,则可以充分地利用这些历史数据,分析出电力系统日积月累的数据背后隐藏的规律与原理,找到解决潜在问题的更加高效的办法[3]。例如利用数据挖掘系统通过对电力系统日积月累的大量数据的归纳总结,建立起一个预测系统,然后根据当前收集到的实时数据来预测未来可能发生的情况,对未来可能发生的情况作提前准备。其中数据挖掘技术可以对历史数据进行整理分析, 提取出电量的使用情况、各地电存量、突然事故时的电量以及与其相关的一些条件关系,以此来保证电力系统的正常运行以及对可预知问题的预防。
电力营销系统的核心业务是电量记录、用电控制与管理、营业计费和线路铺设与维护等,电力营销系统的核心是通过对营销数据进行收集整理使系统更高效。而目前电力营销系统面临的主要问题是如何利用这些大量的营销数据提取出有参考价值的知识,进而快速地为管理者提供准确且有科学依据的决策数据和指标,提高电力经营管理水平, 指导电网顺利且高效地运行工作。数据挖掘技术的出现,无疑给电力营销系统带来了一场革命性的发展。目前数据挖掘技术在电力营销系统中已有广泛的研究与应用,侯雪波等将数据挖掘技术引入电力市场的营销分析中, 利用相关算法对收集到的数据应用关联规则技术进行整理分析,描述各种外部因素和售电量之间的关联关系,分析出外部因素对售电量的影响,从而对电量的使用作出科学的分析与预测,保证电量的供应。牛东晓等通过对电力负荷的数据挖掘得出其规律并通过对电力负荷预测上进行分析研究,使电力预测精度得到提高。
高速铁路SCADA系统产生的数据一般应用于制作报表、事故统计等。但大量的数据仅仅用于记录太过于浪费。若从大量的数据中提取可用数据并对SCADA系统设备的潜在故障进行预测,那无疑将大大提高SCADA系统的综合分析性能。高速铁路调度中心保存了大量的历史信息,包括火车运行正常、运行中故障、火车到达终点晚点等相关数据,如将这些数据进行综合深入分析,可得到更加有用的分析预测结果。
数据挖掘技术包括关联规则、分类、时间序列挖掘和序列挖掘、聚类、Web挖掘以及空间挖掘。其中关联规则是从大量表面上看上去毫无联系的数据中挖掘出数据项之间具有关联的有参考价值的知识,关联规则主要用于在具有大量数据的数据库中发现数据项目之间存在的有意义的关联关系,从而对这些关联关系进行有效解释评估,分析出用户真正感兴趣且有价值的关联规律,通过这些规律做出预测或对其他事物作进一步分析。分类是将存在于数据库中的数据根据一定的规律分类归纳到给定类别中的一个特定的类别,分类一般用于预测,预测的目的是利用通过对历史数据的分析得出的结果推论出对当前给定数据的预测分析,从而根据当前收集到的数据对未来可能发生的情况进行预测。时间序列挖掘和序列挖掘指的是从大量的时间序列数据中提取出与时间属性相关联的有用的信息和数据,其中这些信息是人们事先无法知道的但又潜在存在的有用的,并用于短中长期各个不同时期的预测,指导人们在教育、经济、军事和娱乐等各方面的行为活动。序列挖掘是指在已经相对于时间具有固定序列的队列中再相对于其他因素作排序,即序列中又有序。聚类就是将数据库中的数据项根据一定的原则分组成多个集合,划分的依据是在同一个集合中的数据之间按照某一原则具有较高的相似度,这个相似度的确定是事先规定的,而存在于不同集合中的数据具有较低的相似度。Web挖掘可简单地理解为针对包括页面内容、页与页之间的结构以及页与页之间的关联关系等在内的各种与Web相关的数据,应用数据挖掘技术以帮助人们从网页内容中提取所需的信息,如信息检索等。空间挖掘就是从空间数据库中提取隐藏的信息、数据关系等,用于对空间数据做分析解释、发现空间数据之间的关联关系。
关联规则技术是数据挖掘技术中最常用的研究方法之一,最早是通过对购物篮模式的分析提出来的,从海量的数据中根据逻辑要求提取出数据项之间具有相互联系的有意义的信息。随着计算机的普遍使用,数据库中存在的数据越来越庞大,通过对数据挖掘技术的理解和使用,人们对从这些数据中挖掘出相应的关联知识越来越有兴趣。其中关联规则技术通过对数据分析产生规则,根据分析出的规则确定哪些事情应该分在一起。关联规则最典型应用是零售商店根据以往商品销售记录和商品摆放位置之间的关联关系,利用关联规则技术分析出它们之间的规律,以便将其他经常被一起购买的物品和畅销商品摆放在一起,同时提高其他商品的销售量。关联规则在电力系统的电力使用情况的分析、高速铁路运行过程中路况与车速的统计、电力营销系统中当前数据和历史数据的对比分析等SCADA系统中都有广泛的使用。SCADA是物联网知识中的一部分,SCADA中通过对数据挖掘的使用不仅提高了本身系统的功能性,并且对物联网技术的发展与改进也有很大的作用。
随着物联网技术的高速发展以及计算机的广泛使用,不论是企业管理软件、网上购物系统还是网络游戏系统中随着时间的积累以及使用,其数据库中存在着大量的数据,有些人觉得这些数据毫无用途,但通过数据挖掘技术的使用这些数据将变得非常有意义,它能提取出我们无法想象的但是却有潜在用途的数据。各行各业随着信息高速化的发展都积累了大量的数据,面对如此庞大的数据是弃而舍之还是加以利用,随着数据挖掘技术的出现变得越来越明朗,利用数据挖掘技术不仅可以利用这些数据对以往信息作分析,也能给我们将来的决策给出科学的依据。比如在网上购物系统中,我们可以根据分析购买者每次购买衣服的价位以及衣服的款式,在其下次再购买或者上新货时将适合该客户的衣服推荐给该客户,这样不仅让购买者感觉到购物的愉悦,同时也提高网上商店的销售量,但这需要数据挖掘系统通过对该客户的信息进行分析整理最后给出有意义的信息。同时随着物联网的快速发展,作为物联网知识之一的SCADA系统也在不断地发展,但SCADA系统的发展离不开数据挖掘技术。
本文对数据挖掘技术和SCADA系统做了简要介绍,通过对SCADA系统功能的分析,阐述数据挖掘技术在SCADA系统中的作用。目前随着SCADA系统的广泛使用,数据挖掘技术也受到越来越多的关注,这也更突显出数据挖掘技术在SCADA系统中重要的地位。
参考文献:
[1]于春香.数据挖掘技术简介[J].福建信息技术教育,2005,(1).
[2]毛国君,段立娟,王实.数据挖掘原理与算法[M].北京:清华大学出版社,2005.
[3]SFORNA M. Data Mining in a Power Company Customer Database[J].Electric Power System Research,2000,(8).
[4]张新程.物联网关键技术[M].北京:人民邮电出版社,2011.
[5]高飞,薛艳明,王爱华,等.物联网核心技术:RFID原理与应用[M].北京:人民邮电出版社,2010.
[6]周洪波.物联网:技术、应用、标准和商业模式[M].北京:电子工业出版社,2011.
[7]任宗伟.物联网基础技术[M].北京:中国物资出版社,2011.
[8]张春红,等.物联网技术与应用[M].北京:人民邮电出版社,2011.