韩大伟 熊欣
摘 要:语音是人类传递信息的一种最主要、最有效、最方便的交流形式。语言是人类特有的交流方式,而声音又是人类比较常用的交流工具,是传递信息的主要手段,所以,语音信号是人们感情交流以及思想沟通的主要途径。目前,人们已经进入到了信息时代,利用一些现代先进的技术方法分析语音信号,加强对语音信号采集与处理的研究,使人们可以更加方便的传输、获取、存储以及使用相关的语音信号,对于加快社会的发展与进步有着非常重要的现实意义。
关键词:语音信号;采集;处理
对于语音信号的采集与处理一直就没有断过研究,不仅仅是因为其具有一定的实用性,还有一个非常重要的原因就是,其始终与信息科学中最前沿的学科有着紧密的联系,并且能够共同发展。语音信号的采集与处理是一门涉及范围比较广的综合性学科,其是以语音语言学以及数字信号处理为基础,并且与计算机技术、信息技术以及通信技术等均有紧密的联系。所以,加强对语音信号采集与处理方法的分析与研究,有助于促进社会的不断发展以及科学技术的不断进步。
1 语音信号具有的特点
通过对大量实际语音信号的分析,我们可以明显发现语音信号具有两大特点:一是从时域方面而言,语音信号具备“短时性”特点,也就是说,从总体上而言,语音信号的特点是随着时间的延续而发生不断改变的,但是在一段比较短的时间范围之内,语音信号还是可以保持不变的。通常情况下,在清音段表现出来的特点就是随机噪声,在浊音段表现出来的特点就是周期信号。二是从频域方面而言,语音信号频率主要集中的范围就是300-3400赫兹之间。通常情况下,就可以利用这一特点,采用带通滤波器将这一区间的语音信号频率提取出来,之后根据8千赫兹的采样频率对提取出来的语音信号开展相应的采样工作,这样就可以得到相对比较离散的语音信号。
2 语音信号的采集
将语音信号转变为数字信号,就一定要采集到语音信号,也就是要进行语音信号的采样与量化,进而得到在幅度以及时间上都是离散的数字信号。采样可以称之为抽样,是语音信号在时间上的离散过程,采样的时候一定要满足奈奎斯特定理,才可以对语音信号进行有效的采样。在语音信号采样的时候,一定要重视采样间隔的设定以及相关语音信号的混淆,也就是说,对语音信号的采集首先就要明确采样间隔。通常情况下,采样的频率越高,采样的点数就会越加密集,所得到的离散信号也就越加接近于原始的语音信号。但是采样的频率也不要太高,对于一些固定长度的语音信号,采集到太多的语音数据,可能会给计算机系统带来许多不必要的分析工作量以及占据过大的存储空间;如果限定了数据量,而采样的时间又太少,就会致使一些数据被排斥在外。采样的频率太低,采样点的间隔距离又太远,就会导致离散信号不足,无法反映原有语音信号的特征,进而无法复原语音信号,导致出现信号混乱的情况。根据相关的采样定理,可以将采样的频率设置为大于语音信号的2倍带宽,这样在采样的过程中就不会出现丢失信息的情况。量化就是对幅度进行离散,也就是将振动幅度用二进制量化的方式予以表现,其量化电平主要是根据级数进行改变的,实际振动的值是一种比较连续的物理量。完成语音信号的采集之后,就可以对其进行相关的处理。
3 语音信号的处理
语音信号处理可以简单称之为语音处理,是在数字信号处理以及语音学的基础之上建立的一门综合性比较强的学科,对其进行处理的目的就是获取一些语音参数,进而完成语音的传输或者存储,通过某种计算的处理,以此来实现某种用途的具体要求,比如:辨识说话人、人工合成语音、识别讲话内容等。其包含了四大部分,语音编码、语音识别、语音合成以及说话人识别。语音是由人类发音器官发出来的声音,并且具有一定的现实意义与社交作用,可以表达一部分特定的含义,这就是语音与自然界其它声音的根本区别所在。语音与其所表达的现实意义是互相依赖的统一体,从一方面而言,发音器官发出来的声音一定要带有一定的现实意义,并且与现实意义紧密的联系在一起,这样的声音表达才可以称之为语音;从另外一方面而言,现实意义的表达一定要借助声音的形式,才可以被人们感知以及接受,没有声音的表达,就不会有相应现实意义的体现。
4 语音信号采集与处理的方法
4.1 计算机系统中录音机程序
计算机系统的附件中有一个录音机程序,其可以驱动声卡进行语音信号的采集、播放以及处理。对于语音信号的采集可以直接用麦克风录制人的语音,也可以利用人工输入数据线或者音频线将磁带或者电视中的语音信号采集输入到计算机当中,这样就可以根据输入文件的属性进行文件格式、位数以及采样频率等方面的设置,同时也可以根据实际需要对语音信号进行简单的处理,比如:加大或者减小音量、添加回音效果、加快或者减慢语音的速度以及声音反转等,其中加速或者减速完全可以实现变音的效果,反转可以实现声音文件加密的目的。利用录音机程序采集与处理语音信号的优点就是不需要进行相应的编程就可以实现语音的录制与播放,并且对录音材料的编辑与处理也比较方便、灵活,比如:复制、插入、剪切、回音、混响以及反转等,同时还可以转换声音文件的格式,选择相应的压缩方式以及采样频率等。其缺点就是一次录制语音的时间不可以多于1分钟,除此之外,对采集的语音信号处理一定要进行另外的编辑工作或者利用其它相关软件予以处理。
4.2 PRAAT语音学软件程序
PRAAT语音软件程序是由阿姆斯特丹大学大卫·威宁克和保罗·博尔斯马这两位语音学教授一起研发出来的,可以对语音进行分析、合成以及转换。利用PRAAT语音学软件程序可以直接将语音录制下来,可以从磁盘上直接读取声音文件或者使用算式的方法创建声音,可以对一段声音开展频谱特征分析、音强曲线分析、共振峰曲线分析以及音高曲线分析等工作,同时对语音的参数进行变换与调整,对声音进行标注。大部分的语音分析均可以在PRAAT语音学软件程序中完成,并且不需要进行编程,因此,受到许多语音处理人员的喜爱。
4.3 计算机系统中MATLAB软件程序
MATLAB软件程序是由美国Math Works公司推出的一种交互式计算机软件,应用的范围非常广泛,主要包括通讯、测量与测试、计算生物学、财务建模、控制系统设计以及信号与图像的处理等众多方面。在附加工具箱当中扩展了MATLAB环境,因此,可以在此环境当中,通过不同的编程方式驱动声卡,以此来达到采集与播放语音信号的目的,其语音信号的分析与处理工具箱可以为分析语音信号提供非常充足的功能函数,进而利用功能函数对语音信号进行相应的分析与处理,不仅非常方便,还非常的快捷。利用MATLAB软件语言编程程序可以将需要的声音文件转换成相应的离散数据文件,之后利用非常强大的矩阵计算能力对转换的数据进行一定的处理,比如:数字滤波、声音回放、时域及频域的分析、呈现各种分析图以及傅里叶变换等。
总而言之,通过对这三种方法的介绍,我们可以看出,录音机程序对于语音信号的采集非常方便,但是在处理方面就有一些欠缺,只能进行简单的操作,不能深入的进行相关的处理;PRAAT语音学软件程序对于语音信号的采集与处理不需要编程就可以实现,并且也可以通过编程完成复杂语音信号的采集与处理,深受大家的喜爱;MATLAB软件程序对于语音信号的采集与处理,可以通过控件工具箱以及相应的函数实现,同时对于复杂语音信号的处理就需要通过编程予以实现。
5 结束语
综上所述,通过对语音信号采集与处理方面的研究,使得我们更加了解语音信号,对于语音信号的一些采集与处理方法也有了一定的认识与了解,以及对语音信号的相关知识与作用也有了一定的掌握,所以,一定要加强对语音信号采集与处理方法的分析与研究,进而推动相关科学技术的发展与进步,提出更多的新处理方法,进一步应用到其它相关的领域。
[参考文献]
[1]张桂香,高爱国.语音信号采集和处理方法的研究[J].高师理科学刊,2007(02).
[2]项勇,吴谨.语音信号采集和播放的TCL 320 AD 50的实现[J].科学技术与工程,2008(12).
[3]齐子元,谢桂海,刘毅,等.一种实时语音信号采集处理系统的设计与实现[J].计算机工程与应用,2005(09).
[4]齐子元,谢桂海,刘毅,等.基于TMS 320 C 30的实时语音信号采集与处理系统[J].测控技术,2004(11).
[5]蔡莲红,黄德智,蔡锐.现代语音技术基础与应用[J].中国新技术新产品,2003(03).
[6]张明照,刘政波,刘斌.应用MATLAB实现信号的分析和处理[J].哈尔滨学院学报,2006(06).