一种基于MATLAB的智能语音识别系统设计

2020-08-12 06:48陈后全

科学技术创新 2020年21期

陈后全

（西北民族大学电气工程学院，甘肃兰州730030）

本文设计的目的是使得机械可以进行语音识别，从而帮助人们方便快捷又安全有效的生活。人机之间的语言识别系统在现今社会要求会更高，对其准确性和及时性的规定也更严苛，对语言信号的识别进行相关仿真实验，从实验中的结果得出正确结论[1]，使其能根据语音信息接收人的思想意图，执行相关的操作步骤。本文采用MATLAB 来进行语音信号的识别过程，利用MATLAB 强大的数学运算能力，分析语音信号，提取语音信号的特征参数，再对参数进行DTW 算法的匹配，从而具有规定模板的数据库对比，完成数据的相似度呈现。在MATLAB 的仿真界面上显示声音的具体波形图，通过录入和输出的波形图差异对比，就可以完成语音识别系统的智能设计。

1 语音信号分析

语音信号的接收是人们口中说出的词语，包括孤立词语，连接词语和连续语音等，这些词语需要进行特定的分门别类，得到它们相关的特征参数然后进行对应识别。自然界中，不管是人类的声音还是其他的声音，声音的传出都具有音色，音调和响度这3 个特性，根据声音的这3 个特点和人们说话的行为方式来判断系统提取的特征因素，从而再更进一步地进行准确的语音识别。声音的普遍四声图如图1：

图1 声音的普遍四声图

由图分析，声音有阴阳上去（1234）四个声，系统通过采集声音信号进行语音识别。在系统的识别过程中，对采集的语音信号进行预处理，包括采样，量化和滤波等。其次是对声音的特征提取，声音的特征参数必须有效地反应该声音的语言特性，使之能够区分出其他的语音信号。同时特征参数要具备相互独立性和便于计算这两种特点，这样才能保证系统在语音识别的过程丽准确且高效，实时且流畅。

这里提出的两点是口音和噪音的干扰，这些我们都可以视作噪声来对待，由于我国的地域和文化风俗性差异，普通话的普及还有所欠缺，人们的语言特点也不尽相同，因此噪声是本文系统所要克服的一个难点。采用语音数据库的对比方法，可以改善口音的识别问题，进一步在系统内建立声学模型机制同样可以提高语音识别的成功率，对系统发展有益。噪音的干扰会使得语音信号收集受到影响，信号的收集很有可能会掺杂进扰动因素，形成无法消除的噪声，造成语音识别成功率的下降。对系统的降噪处理需要更深一步的语音模型构造，更好的数学建模方法和更强的噪声抑制功能。对这些改进方法同样可以借鉴声音的四种模式，声音简单四模式图如图2：

图2 声音简单四模式图

根据声音的音长和频率，我们可以分析出一二三四声的大致区别，图中的声调曲线是声音信号辨别的关键[2-4]。通过对曲线走势的判断，我们可以得到声音的波形幅度和顺延周期，这些参数为系统的语音识别提供了可靠的数据支持。

2 系统模型和算法实现

根据声音信号的特点，对声音信号的捕捉作出一个框架模型，其中包括基本音频，干扰噪声，声道控制和特征分析等模型，系统模型图如图3：

图3 系统模型图

基本音频通过输入基本的语音信号，提取声音的频率等特征，将收集的语音信号经过周期性处理，得到周期性的波形信号传输到声道模型中。声道模型中同时会接收到系统判定的干扰噪声，不可避免，在对声道模型中的语音信号进行采样，量化等预处理后，对语音信号的识别操作开始进行，通过算法和数据库的对比，最后成功完成人们与机器之间的语音识别功能。

DTW 算法针对孤立词语进行计算，从而得到简单高效的正确结果。DTW 算法基于DP 的思想进行相应建构，匹配语音的相关模板，计算量不是特别庞大，所有DTW 算法在现今社会中仍然具有很广泛的运用。

算法初始确定语音的开始点和结束点，对模板库的各个词条进行相关划分，将划分出来的模板作为参考依据，一个参考的划分区域可以表示为A 或B 的行组，如A={A(1),A(2),A(3),A(4),A(5),……},A(1)是开始点的语音特征矢量，A 组的最后一个元素为结束点的语音特征矢量。同理可以设置测试的划分区域，并定义相关的语音特征矢量，算法将参考和测试两方面因素进行MFCC 系数、帧变换和窗函数的对应计算，最终得到语音信号数据的正确结果。

3 MATLAB 的仿真及结论

本文使用MATLAB 进行系统的仿真实验，经过采集志愿者的声音，录入音频信号“A-Z”26 个英文字母的语言发音，并为这26 个英文字母的实验对象分别命名，命名表如表1：

表1 命名表

通过对声音信号进行分析处理后，提取相关特征参数以及选取模板，将模板存入数据库中，建立相关的数据库模型，为实验的仿真奠定数据支持。将语音信号随机选取进行MATLAB 仿真可以看到相应的波形图，单字母波形图如图4：

图4 单字母波形图

经过录入相关字母的波形显示对比，可以对比出26 个字母的相同波形，因此语音识别系统可以正确应用。简单字母“A-Z”的26 个比较完全成功，拓展到孤立词语，连接词语和连续语音等的数据库比较，从而完成更好的语音识别系统[5]。

本文利用MATLAB 软件作为仿真工具，运用其强大的数学运算能力以及其庞大的数据库构造能力，成功建构出基于MATLAB 的智能语音识别系统，帮助人们更好的生活。语音识别技术过程中，运用到了DTW 算法和仿真中的各种函数，在不断试错中也不断改进和完善，进而使得语言的处理能够在统计学和模式识别等相关学科中相融合，起到理论联系实际的一大奠基。人们需要不断地探索，不断地创新和不断的进步，才能在科技快速发展的同时也充实自己。