基于智能语音识别的机器人分析

2020-02-02 06:46赵志军

电子技术与软件工程 2020年15期

赵志军

（东莞市经济贸易学校广东省东莞市 523000）

在时代不断发展的过程中，语言和声音识别功能已经引起了社会各界的广泛关注。语言和声音识别是在传统的线性系统理论上，例如隐马尔可夫模型和动态的时间规整技术创造出来的一种新型的技术。在对语言和声音识别功能进行深度研究的过程中可以发现，语言和声音的信号属于非常复杂的非线性过程。如果要对这项功能进行完善，就要引进更加先进的理论方法，促进技术进行更好的发展。例如将人工神经的网络和混沌的分型应用到语言和声音识别的过程中，使得这项功能在使用时更加的智能。从而满足人类发展的各项需求，提高机器人的应用水平[1]。

1 基于一般语言和声音系统的机器人分析

1.1 语言和声音系统的应用原理

一般来说在进行语言和声音智能系统建设的过程中，是由两个主要成分组成的，一方面是对语言和声音进行识别，另一方面实现语言和声音的合成。在进行语言和声音智能系统处理的过程中，首先要建立一个语言和声音数据库，然后对相应的特征进行提取，通过开展声学模型的训练，建设一个完整的声学模型。然后对语言和声音进行解码，还要搜索算法，从而进行文字的输出。或者建立一个文本的数据库，开展语言的模型训练，从而建设一个完整的语言模型，对语言和声音进行解码和算法的搜索之后进行文本的输出。也可以通过字典进行语言和声音的解码和算法的搜索，进而进行文本的输出。或者可以通过语言和声音的输入进行特征的提取，然后进行语言和声音的解码和算法的搜索，进而实现文本的输出。在对语言和声音进行识别时，是对输入的物理性语言和声音进行特征的提取，并且转化为一个特定的信号。从物理学的角度进行分析，可以得知声和音的发出属于一种波，被称为声波。例如压缩格式下的文件内容展开之后，就可以转化为不属于压缩形式的各种纯波性质的文件，可以通过这种性质的文件对各种声和音进行处理。在对文件内容进行展开之后，形成的波状图案内部存在很多点，每个点就是一个具体的象征，可以通过剪切对这些声音和信息进行截取[2]。

在进行语言和声音的合成时，属于文字和语言的一种转换技术。能够将一些不同类型的正确文字，随时随地的转化为标准的流畅语言进行表达，这就相当于让机器设备具备了人类的表达能力。虽然这种表达能力是按照计算机设备的程序规则进行设计的，难以对语言和声音及信息进行选择性的回答，自主性特征也比较差。实际上在对文字、语言进行转化时，建立的系统需要通过两个步骤实现具体的转换。第1 步需要将文字分开，形成一个独立的音韵特征，这样每个文字就属于一组单独的音韵部分。第2 步是根据已有音韵组成的序列生成一个语言和声音的波形，实际上这种波形的形成与语言和声音的识别存在较大的差异。因为语言和声音处理属于系统的核心环节，主要是根据人类自身对所有语言文字的理解，让计算机设备对其存在特定的理解。并且对特定韵律和声学进行处理，通过韵律的处理形成一种语言文字的音段特征，然后进行声学的处理。得出最终的结果，将语言和信息进行输出。这样就实现了语言文字的识别和处理功能，并且建设了一个完整的语言和声音模型系统[3]。

图1：语言和声音合成技术

1.2 语言和声音识别技术的具体应用

语言和声音识别技术也被称为自动的语言和声音识别技术，这项技术的应用范围比较广泛，典型的技术应用形式就是进行拨号和登录，实现设备的控制、语言和声音文档的检索等。与人类自身的识别功能存在较大的差异。这项系统在应用的过程中，可以对不同人类说话的声音进行准确的识别，还可以对所表达的内容进行改变，这项技术应用的最终目的是将人类所表达出来的内容转化为设备中的二进制编码或者代码以及字符序列。语言和声音识别技术在应用的过程中属于典型的交叉型内容，是一种典型的信息类技术。借助这项功能人类可以与机器设备进行直接的交流，并与人类交流存在一定的相似之处。可以直接向机器人设备询问相应的信息，机器人设备可以根据问题选择性的提取相应的内容，并且给予特殊的回答。机器设备的系统可以通过识别技术的应用，对说话的对象和展现的内容进行自动的分辨，并且生成特定的指令。在接收到这些指令之后，需要自主的完成相应的要求。识别系统不需要通过记住固定的口令也可以分辩出来，系统也不会被录音等设备所欺骗。例如微信软件就具备语言和声音的登录功能，可以根据音韵序列生成声音的波形对其进行分辩，与机器人设备进行相应的交流。让机器人设备明白自身所表达的内容，然后识别指令完成相应的动作，是语言和声音分析领域所寻找的一项技术。这项技术是将说出来的语言转化为声波的特征进行分析，然后提取到相应信息之后进行储存，最终转化为文本类型的信息[4]。

1.3 语言和声音合成技术的应用分析

如图1所示，在对智能机器人的语言和声音转化过程进行分析时，可以得知合成技术也被称之为文字语言转换技术。就是将计算机设备程序生成的或者从外部输入的类似文字的语言信息，例如文本和文档内容中的文字类信息，按照语言和声音处理的方式将其转化为语言，输出到外部环境中。所以在进行机器设备表达时与传统的声音回放存在较大的区别，传统的声音回放是通过语言和声音的录制然后进行回放，例如录音机等设备。传统的语言和声音回放技术在应用的过程中不够先进，无法实现技术应用的方便性和及时性，在进行信息储存和传输的过程中会受到各种因素的限制。在进行语言和声音合成技术应用时，操作形式更加的简单灵活。但在进行文语转换系统建设时，各项内容比较复杂，需要促进技术的成熟应用才能降低错误率[5]。

2 基于智能语言和声音识别的机器人分析

2.1 智能语言和声音识别技术的应用形式

当前在进行机器人研发的过程中已经制作出来了智能型的机器人，这种机器人拥有世界较大的智能机器人云服务平台，而且服务范围非常的广，用户也在逐渐的增多。例如在进行相应机器人用的过程中，可以实现智能客服和政务以及语言和声音等领域的操作。在进行智能型机器人设备研发的过程中所使用的识别技术，需要采用一种特殊的算法。要对信息进行自动的处理和调节，也就是说要对所有信息数据进行直接的处理，不需要中间比较复杂的改变形式。所以处理的速度非常的快，这样可以给使用者带来更加优异的体验。在进行识别技术应用的过程中，可以对人类的声音特征进行分析。在提取到声音特征的样本之后，可以对其进行有效的分析和处理，所以这项技术在应用的过程中更加的准确，可以提高声音识别的正确率。在进行这项技术应用的过程中提高了识别的速度，可以将这项技术应用到大规模的商业化建设中。这项技术在应用时可以轻松的完成电子设备的控制和搜索。现阶段在进行一些智能手机研发的过程中，也可以实现语言和声音的控制[6]。

2.2 智能语言和声音合成技术的具体应用

智能机器人中的语言和声音合成技术在应用时就是将文本状态的文字信息转化为语言和声音信息处理技术，这项技术涉及到的内容比较多，融合了数字信号处理技术和语言学等技术。特别是在进行机器人设备制作的过程中，采用了极限元语言和声音合成引擎，通过精心设计的数据库进行了声音的模拟和文本处理模型的训练。这样建设出来的模型可以对各种语言和声音的特征进行深度的挖掘，从而合成一段更加清晰自然的模拟语言和声音，这种语言和声音接近人类的发音。在进行系统应用的过程中可以将其看作为一个智能的系统。为了合成更加准确的语言和声音，除了要对各种词语意义、词汇和语言和声音进行设计融合之外，还必须对相应的文字内容进行更好的理解。这项系统的建设涉及到语言理解等方面的问题，所以要对现有的技术应用形式进行改造，才能充分发挥技术的应用效果[7]。

2.3 智能机器人关键技术的应用要点

在进行智能机器人设备应用的过程中，因为这个机器人设备自身就是一个比较完整的系统，系统中的关键技术包含了比较先进的自然语言意义的认知和深度语言意义的交互以及语言和声音的识别、智能的知识模型、图像信息的识别、人类和机器设备协作的学习体系、机器设备的学习和大数据等技术内容。这样创作出来的设备进行直接的对话，甚至可以与其他智能设备进行交流。因此这种智能机器人的应用范围特别的广，例如可以将其称作为人工的智能客服和在线的电话客服以及智能的语言和声音导航等[8]。

3 结语

综上所述，智能型语言和声音技术的应用为机器设备的交互带来了新的发展前景。将相关技术应用在语言信息的处理上，不仅为正常的生产生活提供了更多的便利，还可以通过这项技术的应用进行语言和声音的控制。可以让机器设备按照特定的要求完成相应的任务，通过合成技术将文字转化成语言和声音形式。在进行语言和声音识别系统选择的过程中，不同的人群可以根据自身的需要选择相应的识别系统，但是在短时期内实现智能机器人的自我意识存在较大的难度。需要对语言和声音识别系统进行持续的改进，才能推动整个行业的发展。