基于融合自然语言处理的语义分析方法研究

2018-09-10 08:58上官明霞朱珊珊陈晓亮王晶华郭光
计算机与网络 2018年20期
关键词:贝叶斯自然语言处理神经网络

上官明霞 朱珊珊 陈晓亮 王晶华 郭光

摘要:面对电力复杂的数据环境下,传统单一的数据分析技术已经无法满足现实应用精准需求,需集多种策略优势为一体的模型综合处理数据信息。针对目前的发展瓶颈,采用融合性自然语言处理技术预测设备行为发展趋势,提取数据语义,通过小波分解法去除词义噪声,利用贝叶斯先验知识模型来推导后验概率,从而作为神经网络动态权值变化及语义预测分布的依据。通过实验测试证明了这种预测方法的可靠性及优越性。

关键词:大数据;自然语言处理;贝叶斯;神经网络

中图分类号:TP393文献标志码:A文章编号:1008-1739(2018)20-65-3

Research on Semantics Analysis Method Based on Fusion Natural Language Processing Technology

SHANGGUAN Mingxia1, ZHU Shanshan1, CHEN Xiaoliang1, WANG Jinghua1, GUO Guang2(1. State Grid Shanxi Electric Power Company, Taiyuan Shanxi 030001, China; 2. Beijing Zhongke Chuangyi Technology Co., Ltd, Beijing 100198, China)

0引言

电力企业生产经营活动中产生的海量数据具有实时性、易失性、突发性、无序性及无限性等特征,如何充分利用大规模高频增量数据并快速获取有价值的信息是当前发展的难点[1]。国内电力领域在大数据应用方面虽有着急迫的需求,由于数据分析算法不能达到电力现有数据处理能力的要求,因此应用仍然偏少,主要在信息化应用平台中会集成几种传统的算法,提供简单的数据处理手段,复杂的高难度算法仍在不断的研发实验阶段,后续需要对海量的数据进行深度融合分析,为电网的运行形态提供可靠的数据决策。

1分布式海量数据融合处理

自然语言处理技术随着人工智能的发展越来越受到青睐,其主要目的是为了让机器更容易理解自然语言。自然语言存在的形式广泛,包括狭义的人造语言以及广义的设备行为产生的数据语言。例如电网运行过程中采集到的设备状态参数就是一种自然语言形态,数据之间具有很强的关联性,通过自然语言处理手段寻找设备行为习惯,能够更好地指导设备规律运转。

在庞大的电网数据体系中,数据来自不同的业务系统,如何将所有分布式数据关联统一分析处理是大数据一直在探索的难题。目前采用的方式是直接去分析数字语言,寻找1与0之间出现的概率,从而预测下一阶段可能出现的数字集合,这种方法的缺陷是太过于客观,在有限的时间段是有效的,很可能造成预测结果的不准确。因为设备运行同人类行为一样,有一定的思想去主导其规律性运转,因此要通过分析人类语言一样去分析设备行为语言,将设备的主客观形态统一后分析的结果将更加可靠有效[2]。采用相似度语义分析法对系统中的海洋数据进行有效融合,具体实施架构图如图1所示。

从图3中明显看出,2为提取的有用词义向量,它的波形最接近与原始语义、2和1呈现出不规则的抖动,属于词义中夹杂的噪声语义及冲击性随机参量。通过小波分解后提取出原始语义中特征向量,有助于提高下一阶段的训练精准度。

神经网络训练学习速率设置为0.03,隐含层数设置为5,训练函数为4,把提取的语义向量2作为样本输入到建立好的贝叶斯神经网络当中,进行检测,预测结果如图4所示。

图4中,蓝色为2输入的样本,红色为贝叶斯神经网络预测结果,2条曲线相当接近,预测值总是在测试样本上下做小幅度波动,并且是在可接受范围内。因此可以证明,基于语义的贝叶斯神经网络对电力流量数据预测是真实有效并且是非常合理的,精准度也是很高的。

4结束语

认知智能是应用自然语言处理技术的主要目的,让机器更好地理解自然语言表达方式,语义分析方法是其中一种基本分析技术,分析每个词语之间的关联及相似度,从而可推理语义表示逻辑关系。目前采用的传统逻辑语义分析方法存在海量数据处理效率慢、语义表达预测不准及模型扩展能力较弱等问题,本文采用贝叶斯和神经网络方法组合的优势,既能提升语义分析模型的灵活性、精准性,也能加强网络的训练鲁棒性。通过实测分析,预测效果有一定提高,此方法在电力数据分析预测应用方面值得推广借鉴。

参考文献

[1]徐建伟,刘桂芬.基于贝叶斯正规化算法的BP神经网络泛化能力研究[J].数理医药学杂志,2007,20(3):293-295.

[2] Ivan Leudar.Parallel Distributed Processing:Explorations in the Microstructure of Cognition[J].Child Lang,1989,16(2): 467-470.

[3]王輝.用于预测的贝叶斯网络[J].东北师大学报:自然科学版,2002,34(1):9-14.

[4]韩玲.基于人工神经网络—多层感知器(MLP)的遥感影像分类模型[J].测绘通报,2004(9): 29-30.

[5]杨斌,聂在平,夏耀先,等.基于贝叶斯神经网络的非参数回归[J].电子科技大学学报,2002,31(2):159-162.

猜你喜欢
贝叶斯自然语言处理神经网络
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
MIV-PSO-BP神经网络用户热负荷预测
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
贝叶斯网络概述
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
贝叶斯公式的应用和推广
基于组合分类算法的源代码注释质量评估方法
面向机器人导航的汉语路径自然语言组块分析方法研究