语音识别技术在软件工程中的应用

2021-11-22 00:14胡新月

电子技术与软件工程 2021年4期

胡新月

（江苏师范大学科文学院江苏省徐州市 221116）

软件工程是一门研究工程化方法构建和维护有效的实用的的软件学科，语音识别是很重要的技术之一，在1950年，才开始了语音识别技术的发展。1952年著名的AT&T Bell 实验室就开始了这么面的研究，其中 K．H．DaVis 等人则是采用带通滤波器的方式进行对语音信号进行检测分析，同时获取了一定数量的字母。在语音识别技术领域，音频信息隐藏技术不仅仅被应用在个人隐私的保护和国防信息保护中，而作为关键技术的信息隐藏技术逐渐成为了一个重要的技术领域，因此，软件工程中关键技术之一的语音识别技术也引起了国家和各大公司关注，这项技术不仅对国家至关重要，也时刻影响着每一个人。到目前为止，人们一直在针对语音识别技术进行深入探索，同时也在考虑如何保证信息的安全性，如何可以把这项技术投入到每一个人的日常生活中去，这样才能充分体现出技术本身的价值。

1 软件工程中语音识别技术的相关介绍

1.1 语音识别技术的应用和诞生

国内的软件工程领域研究起步比较晚，从1980年开始，国家在开启一系列计划推动下，软件工程领域发展的相当迅猛，研究人员也逐渐将研究对象变得公众化，不再局限于实验中，其中最为突出的清华大学中的一些院校，比如电子工程系在和其他研究所针对模式识别技术研发的国家重点实验室。其中清华大学在历时三年的时间内研发出5000 词，与语音识别的相似度达到96.27%，三个字母的容错率达98.99%；同时该技术可以不仅可以识别普通话，还可以识别地方方言，同时还达到基本实用要求。还有一些实验室研究出中文的语音识别产品，自此结束了中文语音识别产品的空缺，自上世纪九十年代以来，这项技术一直被国外垄断。

但是到目前为止，仍存在几大问题需要解决：

（1）噪声环境干扰问题；

（2）非特定人的鲁棒性问题；

（3）学习语料的缺乏。

因此，只有在彻底解决上述问题的基础上语音识别技术才能够更加广泛的应用于各个领域，创造社会会经济价值。而目前音频的信息隐藏主要应用场合仍然在水印认证方面和秘密通信的隐写方面，也是造成软件工程发展缓慢的原因。

1.2 软件工程中语音识别技术的相关原理

语音识别就是将人的声音信号转换为文字或指令的过程是人工智能的知识，而且还涉及微机操作，信号处理，分析模式识别声学等多个领域，语音识别系统，按照不同的限制条件可以分为孤立词，连接词和连续语音识别等多种方式，对语言产生对象的依赖程度能够划分为特定人以及非特定人两个方面。从本质上来看，语音识别系统最重要的内容就是以统计模型为代表，融合了语音学和语言学的大量信息，将语音输入对象作为一系列的转化，特定量续，最终形成的声学模型。在声学模型建立完毕后，需要对语音特征进行提取建模，简单而言就是对获取的语音信息进行模块化处理，结合声纹参数，最终识别。利用下达指令后才能够进行下一步操作。

语音识别的基本步骤包括信号获取，信号预处理，特征提取，相似度分析，模块匹配等多个步骤，因为语音信号本质上属于非平稳信号，目前对语音信号的识别是建立在短时平稳假设基础上的，而与声学模型作为整个系统中最重要的构成部分。主要存在于建模阶段，状态聚类和参数选择等多个方面。语音识别作为电气感之模式识别的重要分支，帮助机器听懂人类口述的语言。这里的听懂有两方面含义，一是逐字逐句弄懂，而不是转化成书面文字语言。二是对口述语言所包含的要求或询问进行快速理解，做出正确响应。语音识别系统主要有四个性能指标。词汇范围：这是指机器能识别的单词或短语的范围。限制发言者：无论是只承认指定发言者的声音，还是承认任何发言者的声音。三个训练要求：使用前是否要训练，即是否让机器“听”给定的声音和训练多少次。正确的识别率，语音识别系统的性能受到多种因素的影响，包括不同的扬声器，语音模式，环境噪声等，需要提高系统的鲁棒性和适应性，确保对各种语音指令准确识别。

2 语音识别在信息安全中的应用

2.1 音频信息隐藏的研究

在人类的听觉系统中。HAS 系统能感知的最大和最小的功率比远大于115，能感知的最大和最小频率比远大于106。HAS 系统对于噪声的敏感度很高，对于周围80dB 的噪声都可以接收到。因为人体结构决定了人在听觉方面独特的特性。人自身的听觉系统HAS 拥有很好的掩蔽特性；经过调查发现，耳朵对于声音的感觉是非线性关系；但是HAS 系统对声音就比较敏感相，但是不能感知它的方位。正是人的耳朵有这些缺陷，造成了我们可以在音频中进行一些数据的藏匿。

目前为止，针对语音识别在信息安全中的研究，主要还是为了以信息数据的保护为主，首先考虑如何改进信息保护的技术，而因为保护对象不同，所采用的技术也有所差异。目前为止语音识别对象由其储存方式的不同可以分为三类：

（1）通过波表合成的识别音频以及PCM 类识别音频；

（2）实用类语音识别音频；

（3）复合人类听觉系统的语音识别音频。

2.2 软件工程中信息隐藏技术

目前，语音的传输方式大概可以分为三大类，其中的一种是通过有线网络通信通道，就像如家用电话那种形式，一种是通过无线技术的通信信道，比如卫星，广播等，第三种是voip 通道。研究通过在效性、安全性、可靠性的基础上针对现有的通信系统进行优化，目的就是为了优化数量和质量方面的技术问题。其中有效性指的是占用最少的空间和资源发送更多信息。但是这个在无线通信中的要求特别高，这是因为无线信道所占的资源是有限的，而提高无线通信的有效性，则需要通过语音编码完成。

2.3 软件工程中感知编码的应用

对于软件工程中的感知编码，就是利用人体自身在听觉方面的特点，选取音频中人类需要的信号，将无效的听觉信号进行删除。对于一般的感知编码以及绝对听觉门限、临界带宽、掩蔽效应、感知熵等概念，需通过心理声学的方式对其进行编码。依据MPEG系列标准，通过适应感知的压缩方法，从而制作出音频文件，文件主要形式有mp3 形式的音频和AAC 形式的音频。就是因为Mp3作为现如今互联网中主流的音频格式，所以现在采用的是MPEGl的layer3 压缩规则。从C 是MPEG 一2 和MPEG 一4 中定义的压缩音频，因此不难看出，DVD 和mp3 就是通过这种方式实现的。

3 音频信息隐藏在信息安全中的应用方法

软件工程中的语音识别在市场中的应用比越来越重要如下为音频信息隐藏在信息安全中的应用：

3.1 利用汉语语音端点后冗余的信息隐藏

汉语的结构相对比较复杂，是由声母和韵母拼音构成的。而在在音节的表达中，每个音节最多只能拥有有四个因素，但是也至少会拥有1 个音素，但是汉语有很大的区别，汉语音节音素基本都是浊音，特别是在末尾中的音节．在对浊音的处理之中，在声学学科领域，通常可以理解为准周期的脉冲串对声道激励所产生信号的输出。而信息研究很大程度就是通过这方面的特性展开的，凭借语音的端点检测，从而来辨别“有声和无声”。作为语音的特性之一的能量，通过比较可以得出，一般情况下清音的能量会相对较小，而浊音的能量相对较大。对语音能量的分布研究，现阶段主要集中在短时能量和短时平均幅度上，可以利用语音端点的检测方法。

3.2 MFCC在语音识别中的应用

目前一些学者已经把美尔频率倒谱系数MFCC 用于语音识别的领域。将语音信号总体打包然后产生哈希摘要，作为水印的一部分，但是要针对不同文档不能进行复制，以此来防止水印；在音乐中，可以将帧分出是话语言信号帧还是音乐信号，分别用不同的参数进行水印嵌入，而在水印抽取时话语帧和乐音帧的区分就使用MFCC 做对比参数，利用美尔频率倒谱系数MFCC 的一种信息隐藏方法，它能有效地将信息隐藏在语音的MFCC 中，但是语音并不会收到影响。所以可以把该方法带入Internet 的文件形式的服务信道或流信道。

4 语音识别技术在信息安全中的应用现状以及展望

信息隐藏是20 世纪90年代逐渐兴起的一门新的技术。从音频的信息隐藏流程与语言交流的流程对照来看，语音识别过程与信息隐藏的信息提取过程有着相似性，因而对音频特别是语音的信息隐藏可以尝试使用语音识别的手段和方法。

随着软件工程的大力推广与普及，机器人的运行控制方式也发生了显著变化，比如直接操控机器人查询设备状态的问题，为了有效发挥无人值班电力系统的优势，实现机器人自动巡检与自动查询，必须要增强语音识别控制系统，根据值班人员的口令和操作，能够为整个无人值班系统的巡检提供重要的参考，利用无线话筒能够发布口令。值班机器人可以根据拾音器获得的语音信号进行提取，完成数据模块对比验证，最终根据识别到的指令进行操作。诸如此类应用在未来将会遍布各个领域，如教育、家居、工厂等。

在未来，随着智能家居、智能园区、电动汽车充电桩等部分共同构成智慧领域，拓宽软件工程的发展空间，必须要充分发挥智能语音控制技术的优势，智能语音控制，在智能家电领域中的应用可以实现“1+1＞2”的效果，语音控制技术也是智能家居设计的重要组成部分，随着语音控制技术不断发展成熟，能够为未来智能领域的发展打下坚实基础。而软件工程在智能感知，识别与运算方面能够充分发挥语音控制技术的优势。

5 结束语

随着社会主义现代化的加快进行，ics 在国家的关键基础建设中有着举足轻重的地位. 同时, 通过把信息化和工业化俩个不同的领域进行一定的融合和软件工程领域的大面积使用推广，IT 系统的网络安全威胁，一部分因素就是工业的控制系统防护效果不好，但是在21 世纪的工业控制系统中，ICS 与IT 系统之间也有着相对很大的差别，因此不能轻易将传统IT 安全技术应用于ICS 中，通过实际需求的研究适用的安全技术，但是这将是我国起步较晚的工业控制系统信息安全面临第一个严峻的挑战。文章通过对 2018年 ICS-CSR 会议涉及一部分有关ICS 信息安全方面的内容做出分析，并根据现在国家和市场的实际需求对研究方向提出针对性建议。总之，软件工程在信息安全行业刚刚步入初始阶段，自身的成长空间将会非常大，但是仍需要研究人员对工业控制系统信息安全技术不断地做出新的研究，而作为软件工程关键技术之一的语音识别，则成为了需要攻克的首要技术壁垒。