基于计算机智能识别技术的自然语言处理模型设计

2014-10-27 23:09葛玮吴佳
无线互联科技 2014年9期
关键词:自然语言处理计算机

葛玮 吴佳

摘 要:自然语言处理模型主要以自然语言为对象进行语言转换与识别处理,该技术的出现极大的丰富了人们的生活,同时也拉近了人与机器之间的距离,其很可能成为未来信息技术的一大主要发展方向。本文将对自然语言处理模型工作原理进行简要阐述,并就基于计算机智能识别技术下的自然语言处理模型设计展开研究。

关键词:计算机;智能识别技术;自然语言处理

所谓的自然语言处理模型,主要用于人类的日常语言问答中,自然语言处理模型能够让计算机理解人类的日常用语并理解自然语言中所包含的文字语义,同时能够针对人类所提语言问题,以对话的形式将答案转为自然语言进行回答。自然语言处理技术的研发,是希望能够在人与机器之间建立起一种信息的传递关系,使智能机器能够更好地为人类提供信息传递功能。目前,自然语言处理技术主要运用在情报检索、专家系统、知识工程建造以及办公室自动化系统中,并实现了人机接口,极大的方便了人类的生活。

1 计算机智能识别技术在自然语言处理模型设计中的原理

自然语言处理模型设计以计算机智能识别技术为核心,其设计原理主要包括以下三个方面,一是识别人类语言时,该语言必须通过发出信号的时间序列进行排序变化,在进行信息编码转换,从而使输入语言变为智能识别机器可识别的编码。二是语言信息已完成可识别信息编码转换后,该编码已处于可供阅读的形式,而编码内容则是通过声学信号进行传达,在此基础上,一般采用与编码语音信号相对应的离散型符号进行呈示,该符号具有区别性特征。三是此类符号继续采用计算机智能识别技术进行识别认知,并识别语言内容中所包含的具体语音和语义,并运用语法和语义与语言的情境结构相结合,再进行计算机智能识别技术中的人工智能方式转换为与人类语音相似的方式进行内容输出。

2 基于计算机智能识别技术的自然语言处理模型设计

2.1 模型结构图

我国目前所使用的计算机智能识别语言系统大多数都是以统计模型方式进行技术构建的,统计的模型方式优势在于,其能够准确的识别语音和语义的相近频率,并提高语言语义的精确性,从而使计算机系统更好的进行智能识别。该模型设计结构如图1。

2.2 模块设计

2.2.1 语言信号的特征提取模块

特征提取模块的功能是对语言信号所输入的相关信号进行提取,以便声学模型做进一步处理,在该模块的运作过程中要注意环境干扰、语音识别误差等因素,可使用信号处理技术进行干扰降低。

2.2.2 统计声学模块

统计声学模块主要是保真和还原智能识别系统的语言。现有的统计声学模块在设计过程中大多数都采用一阶隐马尔科夫模型进行系统的构建,该模型能够很好的保证发音系统的还原度,使语言和语音在识别过程中能够与单元模块保持一致。

2.2.3 语言模块

该模块的功能主要是对语言系统识别中的语言进行建模。语言模块既包括语义识别、语义理解分析,还包含了语境正则语言。在语言模块中所采用的智能识别技术大多为具有统计学意义的N元文法语言识别模式。

2.2.4 解码器模块

解码器模块是智能识别语言系统中最为重要的部分,也是该系统的核心组成。解码器的主要功能是为系统提供信号词串的识别。在智能识别语言系统中所输出与输入的语言信号,通过统计声学和语言语义学的过滤与查找,再通过解码器模块进行正确识别。

计算机智能识别技术中的各模块之间都存在一定的联系,如语言处理模块就是通过既定的语言信号输入特征进行序列提取,并从中求出语言信号的符号集。在进行语音识别的统计过程中,首先输入信号或语言特征的序列,符号集,通过符号串求解可得:

再用贝叶斯公式进行计算,可得出下列公式:

在给定的语言信号输入中,输入串o,P(O)为既定数值,及时省略该部分也不会对最终处理结果产生影响,因此在自然语言的处理方面,要针对问题的性质进行显示。此外,在处理模块中,系统所出入的语言信号必须经过预处理,及通过语言信号模块对语音信号进行提取,并对语音信号(S)到特征列(O)的映射进行采集。之后即可形成声学模块单元,从而通过特定的语言信号输入特征进行P[o|uk]估计。由于在自然语言模块中提供了P(w),而解码器模块主要通过由UI和t(时间标度)所构成的搜索空间进行W寻找。

综上所述,基于计算机智能识别技术下的自然语言处理模型设计在今后必然会有着广阔的应用和发展空间,为了更好地把握该技术的发展方向,我们必须不断对自然语言处理技术进行研究,紧跟时代步伐及时革新智能识别技术,从而使自然语言处理模型能够真正投入使用,开拓计算机技术新领域。

[参考文献]

[1]蔡艳婧,程显毅,潘燕.面向自然语言处理的人工智能框架[J].微电子学与计算机,2011,28(10).

[2]王利鑫,耿焕同,孙凯,张茜.基于自然语言处理的文本泄密自动检测技术[J].计算机工程与设计,2011,32(8):2600-2603.

摘 要:自然语言处理模型主要以自然语言为对象进行语言转换与识别处理,该技术的出现极大的丰富了人们的生活,同时也拉近了人与机器之间的距离,其很可能成为未来信息技术的一大主要发展方向。本文将对自然语言处理模型工作原理进行简要阐述,并就基于计算机智能识别技术下的自然语言处理模型设计展开研究。

关键词:计算机;智能识别技术;自然语言处理

所谓的自然语言处理模型,主要用于人类的日常语言问答中,自然语言处理模型能够让计算机理解人类的日常用语并理解自然语言中所包含的文字语义,同时能够针对人类所提语言问题,以对话的形式将答案转为自然语言进行回答。自然语言处理技术的研发,是希望能够在人与机器之间建立起一种信息的传递关系,使智能机器能够更好地为人类提供信息传递功能。目前,自然语言处理技术主要运用在情报检索、专家系统、知识工程建造以及办公室自动化系统中,并实现了人机接口,极大的方便了人类的生活。

1 计算机智能识别技术在自然语言处理模型设计中的原理

自然语言处理模型设计以计算机智能识别技术为核心,其设计原理主要包括以下三个方面,一是识别人类语言时,该语言必须通过发出信号的时间序列进行排序变化,在进行信息编码转换,从而使输入语言变为智能识别机器可识别的编码。二是语言信息已完成可识别信息编码转换后,该编码已处于可供阅读的形式,而编码内容则是通过声学信号进行传达,在此基础上,一般采用与编码语音信号相对应的离散型符号进行呈示,该符号具有区别性特征。三是此类符号继续采用计算机智能识别技术进行识别认知,并识别语言内容中所包含的具体语音和语义,并运用语法和语义与语言的情境结构相结合,再进行计算机智能识别技术中的人工智能方式转换为与人类语音相似的方式进行内容输出。

2 基于计算机智能识别技术的自然语言处理模型设计

2.1 模型结构图

我国目前所使用的计算机智能识别语言系统大多数都是以统计模型方式进行技术构建的,统计的模型方式优势在于,其能够准确的识别语音和语义的相近频率,并提高语言语义的精确性,从而使计算机系统更好的进行智能识别。该模型设计结构如图1。

2.2 模块设计

2.2.1 语言信号的特征提取模块

特征提取模块的功能是对语言信号所输入的相关信号进行提取,以便声学模型做进一步处理,在该模块的运作过程中要注意环境干扰、语音识别误差等因素,可使用信号处理技术进行干扰降低。

2.2.2 统计声学模块

统计声学模块主要是保真和还原智能识别系统的语言。现有的统计声学模块在设计过程中大多数都采用一阶隐马尔科夫模型进行系统的构建,该模型能够很好的保证发音系统的还原度,使语言和语音在识别过程中能够与单元模块保持一致。

2.2.3 语言模块

该模块的功能主要是对语言系统识别中的语言进行建模。语言模块既包括语义识别、语义理解分析,还包含了语境正则语言。在语言模块中所采用的智能识别技术大多为具有统计学意义的N元文法语言识别模式。

2.2.4 解码器模块

解码器模块是智能识别语言系统中最为重要的部分,也是该系统的核心组成。解码器的主要功能是为系统提供信号词串的识别。在智能识别语言系统中所输出与输入的语言信号,通过统计声学和语言语义学的过滤与查找,再通过解码器模块进行正确识别。

计算机智能识别技术中的各模块之间都存在一定的联系,如语言处理模块就是通过既定的语言信号输入特征进行序列提取,并从中求出语言信号的符号集。在进行语音识别的统计过程中,首先输入信号或语言特征的序列,符号集,通过符号串求解可得:

再用贝叶斯公式进行计算,可得出下列公式:

在给定的语言信号输入中,输入串o,P(O)为既定数值,及时省略该部分也不会对最终处理结果产生影响,因此在自然语言的处理方面,要针对问题的性质进行显示。此外,在处理模块中,系统所出入的语言信号必须经过预处理,及通过语言信号模块对语音信号进行提取,并对语音信号(S)到特征列(O)的映射进行采集。之后即可形成声学模块单元,从而通过特定的语言信号输入特征进行P[o|uk]估计。由于在自然语言模块中提供了P(w),而解码器模块主要通过由UI和t(时间标度)所构成的搜索空间进行W寻找。

综上所述,基于计算机智能识别技术下的自然语言处理模型设计在今后必然会有着广阔的应用和发展空间,为了更好地把握该技术的发展方向,我们必须不断对自然语言处理技术进行研究,紧跟时代步伐及时革新智能识别技术,从而使自然语言处理模型能够真正投入使用,开拓计算机技术新领域。

[参考文献]

[1]蔡艳婧,程显毅,潘燕.面向自然语言处理的人工智能框架[J].微电子学与计算机,2011,28(10).

[2]王利鑫,耿焕同,孙凯,张茜.基于自然语言处理的文本泄密自动检测技术[J].计算机工程与设计,2011,32(8):2600-2603.

摘 要:自然语言处理模型主要以自然语言为对象进行语言转换与识别处理,该技术的出现极大的丰富了人们的生活,同时也拉近了人与机器之间的距离,其很可能成为未来信息技术的一大主要发展方向。本文将对自然语言处理模型工作原理进行简要阐述,并就基于计算机智能识别技术下的自然语言处理模型设计展开研究。

关键词:计算机;智能识别技术;自然语言处理

所谓的自然语言处理模型,主要用于人类的日常语言问答中,自然语言处理模型能够让计算机理解人类的日常用语并理解自然语言中所包含的文字语义,同时能够针对人类所提语言问题,以对话的形式将答案转为自然语言进行回答。自然语言处理技术的研发,是希望能够在人与机器之间建立起一种信息的传递关系,使智能机器能够更好地为人类提供信息传递功能。目前,自然语言处理技术主要运用在情报检索、专家系统、知识工程建造以及办公室自动化系统中,并实现了人机接口,极大的方便了人类的生活。

1 计算机智能识别技术在自然语言处理模型设计中的原理

自然语言处理模型设计以计算机智能识别技术为核心,其设计原理主要包括以下三个方面,一是识别人类语言时,该语言必须通过发出信号的时间序列进行排序变化,在进行信息编码转换,从而使输入语言变为智能识别机器可识别的编码。二是语言信息已完成可识别信息编码转换后,该编码已处于可供阅读的形式,而编码内容则是通过声学信号进行传达,在此基础上,一般采用与编码语音信号相对应的离散型符号进行呈示,该符号具有区别性特征。三是此类符号继续采用计算机智能识别技术进行识别认知,并识别语言内容中所包含的具体语音和语义,并运用语法和语义与语言的情境结构相结合,再进行计算机智能识别技术中的人工智能方式转换为与人类语音相似的方式进行内容输出。

2 基于计算机智能识别技术的自然语言处理模型设计

2.1 模型结构图

我国目前所使用的计算机智能识别语言系统大多数都是以统计模型方式进行技术构建的,统计的模型方式优势在于,其能够准确的识别语音和语义的相近频率,并提高语言语义的精确性,从而使计算机系统更好的进行智能识别。该模型设计结构如图1。

2.2 模块设计

2.2.1 语言信号的特征提取模块

特征提取模块的功能是对语言信号所输入的相关信号进行提取,以便声学模型做进一步处理,在该模块的运作过程中要注意环境干扰、语音识别误差等因素,可使用信号处理技术进行干扰降低。

2.2.2 统计声学模块

统计声学模块主要是保真和还原智能识别系统的语言。现有的统计声学模块在设计过程中大多数都采用一阶隐马尔科夫模型进行系统的构建,该模型能够很好的保证发音系统的还原度,使语言和语音在识别过程中能够与单元模块保持一致。

2.2.3 语言模块

该模块的功能主要是对语言系统识别中的语言进行建模。语言模块既包括语义识别、语义理解分析,还包含了语境正则语言。在语言模块中所采用的智能识别技术大多为具有统计学意义的N元文法语言识别模式。

2.2.4 解码器模块

解码器模块是智能识别语言系统中最为重要的部分,也是该系统的核心组成。解码器的主要功能是为系统提供信号词串的识别。在智能识别语言系统中所输出与输入的语言信号,通过统计声学和语言语义学的过滤与查找,再通过解码器模块进行正确识别。

计算机智能识别技术中的各模块之间都存在一定的联系,如语言处理模块就是通过既定的语言信号输入特征进行序列提取,并从中求出语言信号的符号集。在进行语音识别的统计过程中,首先输入信号或语言特征的序列,符号集,通过符号串求解可得:

再用贝叶斯公式进行计算,可得出下列公式:

在给定的语言信号输入中,输入串o,P(O)为既定数值,及时省略该部分也不会对最终处理结果产生影响,因此在自然语言的处理方面,要针对问题的性质进行显示。此外,在处理模块中,系统所出入的语言信号必须经过预处理,及通过语言信号模块对语音信号进行提取,并对语音信号(S)到特征列(O)的映射进行采集。之后即可形成声学模块单元,从而通过特定的语言信号输入特征进行P[o|uk]估计。由于在自然语言模块中提供了P(w),而解码器模块主要通过由UI和t(时间标度)所构成的搜索空间进行W寻找。

综上所述,基于计算机智能识别技术下的自然语言处理模型设计在今后必然会有着广阔的应用和发展空间,为了更好地把握该技术的发展方向,我们必须不断对自然语言处理技术进行研究,紧跟时代步伐及时革新智能识别技术,从而使自然语言处理模型能够真正投入使用,开拓计算机技术新领域。

[参考文献]

[1]蔡艳婧,程显毅,潘燕.面向自然语言处理的人工智能框架[J].微电子学与计算机,2011,28(10).

[2]王利鑫,耿焕同,孙凯,张茜.基于自然语言处理的文本泄密自动检测技术[J].计算机工程与设计,2011,32(8):2600-2603.

猜你喜欢
自然语言处理计算机
计算机操作系统
穿裙子的“计算机”
基于计算机自然语言处理的机器翻译技术应用与简介
计算机多媒体技术应用初探
信息系统审计中计算机审计的应用
基于组合分类算法的源代码注释质量评估方法
面向机器人导航的汉语路径自然语言组块分析方法研究
词向量的语义学规范化
汉哈机器翻译中的文字转换技术研究
HowNet在自然语言处理领域的研究现状与分析