基于自然语言处理的电力调控智能搜索引擎关键技术研究

2021-06-29 14:51李卓颜少伟符树雄余加喜黎值源
粘接 2021年5期
关键词:电力调控自然语言处理关键技术

李卓 颜少伟 符树雄 余加喜 黎值源

摘 要:针对传统搜索引擎在电力专业领域中对查询条件搜索耗时较长的问题,开展对电力调控智能搜索引擎关键技术研究。通过基于自然语言处理的电力调控语言处理和智能搜索引擎推理控制策略,设计一种基于自然语言处理的电力调控智能搜索引擎。通过实验证明,该引擎与传统引擎相比可有效缩短搜索耗时,进一步提高搜索引擎的效率。

关键词:自然语言处理;电力调控;智能搜索引擎;关键技术

中图分类号:TP391.3 文献标识码:A 文章编号:1001-5922(2021)05-0085-03

Research on Key Technologies of Power Control Intelligent Search Engine Based on Natural Language Processing

Li Zhuo,Yan Shaowei,Fu Shuxiong,Yu Jiaxi,Li Zhiyuan

(Power Dispatching Control Center of Hainan Power Grid Co., Ltd., Haikou 570000, China)

Abstract:Aiming at the problem that traditional search engines take a long time to search for query conditions in the field of electric power, the research on key technologies of electric search and control intelligent search engines is conducted. Through the power control language processing based on natural language processing and intelligent search engine reasoning control strategy, a power control intelligent search engine based on natural language processing is designed. Experiments have proved that this engine can effectively reduce the search time and improve the efficiency of search engines compared with traditional engines.

Key words:natural language processing; power control; intelligent search engine; key technologies;

0 引言

现代化科技的快速发展促进着搜索引擎技术的不断进步,针对各种问题类型的搜索引擎层出不穷,但目前针对电力企业中的相关专业性质更强的搜索引擎较少,造成了电力知识的利用率被严重制约。目前传统搜索引擎的构成主要包括上位机中的人机交互界面、全球广域网服务器以及网络浏览器[1]。当用户在人机交互界面中,通过浏览器输入相应的检索内容,再通过全球广域网服务器在数据库中搜索相应的内容,最后将搜索结果返回给用户。这种搜索引擎应用到电力领域中,一方面会造成搜索结果与用户所需存在较大差异,主要原因是由于搜索结果的数量过多,且结果精准度不高,冗余结果信息过多;另一方面,会出现电力知识量少、效率低等问题。当前,自然语言的处理是人工智能领域研究学者们重点研究的内容之一,利用自然语言处理可以有效地实现人与计算机之间利用自然语言进行通信。自然语言处理涉及计算机科学领域、人工智能领域、语言学领域等多个学科领域的综合处理方法。对此,本文利用自然语言处理的优势,开展基于自然语言处理的电力调控智能搜索引擎关键技术研究。

1 基于自然语言处理的电力调控智能搜索引擎

1.1 自然语言处理

在文章中提出的电力调控智能搜索引擎总体框架结构中,对电力调控语言的处理主要包括查询内容概念提取、查询扩展以及自动文摘。概念提取主要是利用自然语言处理技术中的汉语分词实现,查询扩展主要利用自然语言处理技术中的短语识别及同义词处理实现。

汉语分词是将由用户端发送的初始查询条件划分为多个不同的关键词,对于英文而言,一个单独的词语即可作为一个关键词。而对于汉语而言大量电力调控语言存在着不同的含义,对于某些特殊的汉字,分词可能存在较多的结果差异。例如,用户端发送的初始查询为“电力系统”,则通过分词处理后,可能产生“电力系统”、“电力”、“系统”三种不同的关键词分词结果。因此在用户搜索时会产生与上述三种关键词相关的大量与用户主观搜索内容不相关冗余结果。对于上述这一问题的产生,可通过在知识库中对上述类似汉字进行总结、分析,并计算出每个汉字组成出现的概率以及相关词语之间的关联信息,从而在最大程度上排除容易产生歧义的搜索结果,准确地表达出用户所需的查询请求及相应的文档信息。

查询扩展中的短语识别是将用户输入的初始查询内容概念提取后,根据相应的语法结构从知识库中搜索相应的知识。由于汉语语法存在一定的复杂性,因此当用户使用汉语在电力调控智能搜索引擎中查询时,需要对汉语短语中的语法结构进行适当的分组。例如,当查询内容为“电力的运营”时,短语中的“电力”与“运营”是存在一定的关联性的,因此,若不将二者联系在一起则会出现分别与“电力”和“运营”相关的冗余知识,降低搜索结果的精准度。

查询扩展中的同义词处理是将用户输入的初始查询内容概念提取后,电力调控智能搜索引擎自动根据概念中的内容去查询同义词典,并加入新的概念。扩展出的概念是整个概念集中各个概念的同义词,因此,用户端发出的最终的查询请求是由概念集中各个概念以及其相互之间的同义词构成。假设概念集为A={a1,a2,a3,…,an},经过同义词处理后将得到:B={A(a1),A(a2),A(a3),…,A(an)},其中A(a1)表示為同义词典中与a1有相同语义的概念集。同义词处理的一种方法是通过人工构造同义词表。由于本文设计的电力调控智能搜索引擎是针对电力企业这一专业领域而提出的,因此利用人工构造的方式可以有效提高构建同义词表的效率。

自动文摘是在搜索引擎将搜索知识返回到文档中的简要概述,是语言理解和语言生成的综合结果。语言理解是对文档中的每个语句进行语义及语法上的分析,当完成对全篇所有内容分析后,准确地将文章所要表达的意思理解。语言生成则是利用符合文章语义的恰当词汇及语句表达文章的总体内容。本文提出一种更加有效的文摘构建方法,将被提取出的搜索结果文档中权值最高的概念作为返回到用户端的文摘,用户可通过各个独立的概念推理出文章的中心现象,以及找出自己所需的知识。

1.2 电力调控智能搜索引擎及引擎推理控制策略

基于自然语言处理的优势,该搜索引擎的总体框架结构是由知识库、用户端、自然语言处理以及相关的推理控制策略构成,如图1所示。

由于在电力调控智能搜索引擎中用户端的用户具备一定的语言知识以及对现实世界的认知,因此选用自然语言处理实现人机交互对于用户端而言十分简单,而智能搜索引擎内部的知识库结构应当根据自然语言习惯,将电力调控语言进行相应的推理组成[2]。下面将针对本文提出的智能搜索引擎中基于自然语言处理的电力调控语言处理及智能搜索引擎推理控制策略进行详细的设计说明。

智能搜索引擎推理控制策略主要可分为冲突消除策略和推理方向策略。冲突消除策略主要针对,在推理过程中,智能搜索引擎会根据当前用户端所有的搜索内容,对知识[3]库中的知识进行检索。从而找到与实际内容匹配的知识。当找到的匹配知识为多条时,需要根据冲突消除策略从众多知识中进行推理,从而将最贴近初始查询的知识返回到用户端。将冲突消除策略中的排序方式分为:优先度排序、详细度排序以及电力专业领域特点排序3种。优先度排序是将存储在知识库中的每项知识设定对应的优先度参数,优先度更高的知识首先进行执行;详细度排序是针对初始查询内容中条件较多、较为详细的搜索内容制定的排序規则,将与用户搜索的内容更接近、更详细的结果返回到用户端;电力专业领域特点排序是根据电力专业的特点,在这众多检索结果中挑选出与电力专业相关的内容返回到用户端。

推理方向策略可分为正向推理控制策略和反向推理控制策略。正向推理控制策略的具体流程为:用户端发出初始查询;电力调控智能搜索引擎根据搜索内容在知识库中找到相应匹配可用的知识;利用冲突消除策略选出最优化的搜索目标;在对应数据库中检索;获取检索结果;判断结果是否符合查询要求,符合则将查询结果显示在用户端界面中。反省推理控制策略的具体流程为:用户端发出初始查询;电力调控智能搜索引擎根据搜索内容在知识库中找到较多匹配可用的信息;再次检索可用信息当中的相关知识,并判断相关知识中所包含的条件是否完全满足用户会话,若满足则将该知识的搜索目标发送到当前的数据库中进行检索,若不满足则将该知识作为条件,重新检索目标,直到各个子搜索目标全部出现为止,得到搜索结果;最后将搜索结果显示在用户端界面中。

2 实验论证分析

为了验证本文设计的基于自然语言处理的电力调控智能搜索引擎对电力调控语言查询的有效性,设计了如下对比实验:

为了保证实验结果的客观性,将电力专业领域的相关内容构建两种引擎统一的知识库,在用户端提出5个与电力专业相关的查询内容,并对应查询内容设置标准的5个查询结果,在查询的过程中分别利用本文设计的引擎和传统引擎对初始查询条件进行查询设置本文引擎搜索为实验组,传统引擎搜索为对照组,记录两种方法获取到最终标准搜索结果的用时,如表1所示。

根据表1中的实验结果可以看出,实验组在对5个不同的初始查询条件搜索时消耗的时间明显小于对照组的消耗时间。其主要原因是在两种引擎搜索的过程中,本文引擎可利用自然语言处理及推理控制策略,在知识库中众多的知识内容中筛选出更加符合初始查询条件的知识内容,而传统引擎则是将与初始查询条件相关的所有知识全部检索,造成了大量冗余知识产生,严重制约着其搜索速度。因此,通过对比实验证明,本文设计的基于自然语言处理的电力调控智能搜索引擎可有效提高传统搜索引擎的搜索速度,进一步提高引擎整体运行的效率。

3 结语

智能搜索引擎也将不断地完善和提高。文章在对电力调控智能搜索引擎关键技术进行研究的同时,利用自然语言处理提出了一种全新的基于自然语言处理的电力调控智能搜索引擎,将自然语言处理中的汉语分词、语句识别和同义词处理等技术应用到搜索引擎中,是实现电力专业领域信息时代对搜索引擎智能化挑战的有效手段。

参考文献

[1] 闪鑫,陆晓,翟明玉,等.人工智能应用于电网调控的关键技术分析[J].电力系统自动化,2019,43(01):49-57.

[2]薛蕾,井天军,陈义,等.基于相似搜索与多开端重组的配电网两时间尺度无功协调控制[J].电网与清洁能源,2019,35(05):10-19.

[3]苏适,李康平,严玉廷,等.基于密度空间聚类和引力搜索算法的居民负荷用电模式分类模型[J].电力自动化设备,2018,38(01):129-136.

[4]李功新.基于可拓推演方法的调控一体防误操作系统研究与应用[D].武汉:武汉大学,2014.

[5]辛耀中,米为民,蒋国栋,等.基于CIM/E的电网调度中心应用模型信息共享方案[J].电力系统自动化,2013,37(08):1-5.

[6]蒋宏图,袁越,程伟.智能变电站站控层在线防误的设计与实现[J].电力自动化设备,2013,33(08):147-151.

[7]卢君波,李小敏.基于人工智能的电网调控技术研究与分析[J].粘接,2019(11):178-181.

[8] 郝杰.智能电网调度控制系统安全技术基本框架研究[J].粘接,2020(07):104-107.

[9] 李阳,朱伯涛,胡志亮,等.物联网技术在电力智能监控系统中的应用探究[J].微型电脑应用,2020(11):154-156+167

猜你喜欢
电力调控自然语言处理关键技术
防雷关键技术在自动气象站系统中的应用探究
网络安全态势感知关键技术研究
无人机集群作战关键技术及发展趋势
加强电力调控运行系统安全运行方案分析
基于组合分类算法的源代码注释质量评估方法
面向机器人导航的汉语路径自然语言组块分析方法研究
探析电力调控运行的重要性与优化管理
汉哈机器翻译中的文字转换技术研究
HowNet在自然语言处理领域的研究现状与分析
电力调控运行系统优化的必要性与改进措施