李品磊 胡日鹏 葛馨远 陈剑 王照
摘要:随着低压配电网的应用和拓展,这使得配电网台区识别服务平台的压力不断提升,而传统的配电网台区识别服务平台存在运算和匹配速度过慢的问题,因此提出基于多模式匹配的配电网台区识别服务平台研究。通过多模式匹配算法对数据进行预处理,经由配电网台区数组识别匹配,建立识别服务平台的搜索树算法。通过实验验证,传统的识别方法与此识别方法在运算速度上的差异。证明了多模式匹配算法,具有效率高的特点,满足识别服务平台的需求
关键词:运算;识别;准确性;运算效率
中图分类号;TM72文献标识码:A
0引言
低压配电网是连接着大部分的普通用电户的方法,而为了方便管理者进行管理,建立起了配电网台区识别服务平台[1]。目前的配电网服务平台所采用的算法多为AC算法或者WM算法。不过目前用户不断增加,传统的运算方法难以满足用户需求。多模式匹配一次匹配过程中就可以完成对于多种模式下的匹配,可以满足配电网台区识别服务平台的要求。配电网台区识别服务平台可以帮助低压配电网管理中促进主动抢修和推进故障,可以远程对用户的异常用电进行检测,也避免了窃电现象的出现。
1多模式匹配识别服务平台
1.1用户数据预处理
多模式匹配技术是依靠树状的数据链,并将其构成一个搜索树状图,在此平台的运算过程中,树的高度取决于模式串的数量,在拥有大量数据集的情况下,算法的效率会变得低下[2]。对此情况,对于数据集首先进行排列,并将其排序成字典性的模式串,使用Leaf-Attaching算法对模式串使用变量记录进行压缩,可以使得多余的内存空间得到释放。重复该过程直到使全部的模式串完成识别和遍历。在预处理运算中,会生成一个有限状态自动机FSM,可以表示为:
1.2配电网台区数组识别匹配
对于识别方法的改进,建立一个完全二叉搜索树算法。用运算的数组搜索来实现搜索数组的目的[3]。使用完全二叉搜索树算法,可以让搜索运行中所占用的内存得到降低。因为有缓存数据,也可以让运算变得更快。搜索过程中,使用哈策分组法预处理阶段将一棵较大的完全二叉搜索树按照模式串前k个字符的哈希值拆分成不同的组。在模式匹配阶段,每次进行精确匹配时,先计算文本串中待匹配子串的前k个字符的哈希值,再根据哈希值遍历对应分组中的完全二叉搜索树实现模式串匹配过程[4]。使用完全二叉搜索树算法让平台对于配电台数组进行识别匹配。
1.3识别用户词频及意见
在多模式匹配的场景下,将数组实现的完全二叉搜索树算法运用于 ELSM 算法构造完全二叉搜索树的过程中[5]。该算法在使用中需要考虑到在多模式匹配算法中由于的模式串信息在进行模式匹配的同时,对该存储的地址容器就已经进行识别,在完全二叉搜索树中,对于特定的数组实现其数组的完全二叉搜索树,该情况是对于数组中存储的不同模式串搜索容器中的不同数值以及其索引值,并且在该数组的下标范围为到,这里的表示着二叉树中节点的数量。假设目前节点在数组中的下标为,則当前节点的左孩子节点的下标为,当前节点的右孩子节点下标为。
此算法在使用递归的运算结构的同时又在构造上融合二叉搜索树,并且该算法具有如下特性:在该算法进行运算时,对一个二叉搜索树进行中序遍历,则输出的是一个有序序列,而且有序序列的第一个元素一定是二叉搜索树最左孩子节点,当第一元素确认为最左孩子节点时,则第二个元素肯定是最左孩子节点的父节点,因此可以在对数组形式的树进行中序遍历的过程中将元素添加到数组中。同时为了方便使用者收集用户的意见,系统将会提供相关的对于收集词频的方法,即(2)
2 实验设计分析
2.1实验准备
设计实验,对比本文设计的识别方法和传统常见的AC算法识别平台以及WM算法的识别服务平台的情况,测试在多模式匹配算法与传统算法的性能关系。实验的设备条件为,单核 Xeon 2.2Ghz 处理器,4GB 内存,Ubuntu 14.04 64 位操作系统环境下,使用C++编程语言实现。设计程序随机生成模式集,使用这三种识别算法对模拟集进行识别,并且根据识别速度,来评估这三个识别系统的优劣性。
2.2实验结果分析
实验结果表1所示。
如图1所示,AC算法在运算超过的模拟集时,因为运算时占用的内存过高,使得实验设备无法支撑,后续的实验运算无法支撑。同时也说明了AC算法在运算中占用内存过高的情况,而本文算法的运算速度均优于AC和WM识别方法。并且本算法步骤清晰,较为简洁,能够很好的满足高效性和准确性,能够很好的完成服务发现与识别的功能需求。本算法为基础实现的服务发现与识别模块,能够为配电网台区识别服务平台,提供稳定且准确的识别服务来源,可以为后续服务接入与用户捜索提供支持。
3结束语
本文对基于多模式匹配的配电网台区识别服务平台的算法进行重新改良,针对多模式匹配算法预处理阶段的模式串的压缩进行改良,对于配电网台区数组的识别匹配建立二叉搜索树算法,改善识别服务平台的搜索树算法,设计实验进行分析,实验结果显示,本文所改良的方法在运算速度上优于传统方法。
参考文献
[1] 伊力亚尔·达吾提.维吾尔文本处理中多模式匹配的应用[J].电脑知识与技术,2019,15(16):210-211.
[2] 曹为政,葛蒙蒙.多模式匹配算法研究和优化[J].智能计算机与应用,2018,8(02):129-133.
[3] 王守相,张卫涛,葛磊蛟.智能配电网统一模型云与应用服务技术系统[J].电力自动化设备,2015,35(02):49-54. [4] 宣菊琴.配电网全过程网格化管理实践研究[J].中国管理信息化,2019,22(24):73-75.
[5] 陈洪涛,王法玉,靳彩园,等.多模式匹配算法的应用与改进[J].中国科技信息,2019(23):78-80.
第一作者简介:李品磊(Li PinLei),1989年6月5日,男,汉族,湖南邵阳,研究生,中级工程师,电力信息系统研究