云计算平台下的语音信号处理

2016-10-17 09:54刘润东
现代电子技术 2016年2期
关键词:单台信号处理语音

刘润东

(吉林大学通信工程学院,吉林长春130012)

云计算平台下的语音信号处理

刘润东

(吉林大学通信工程学院,吉林长春130012)

针对云计算平台下的语音信号处理模型进行研究。传统SVM语音信号处理识别模型是在单台计算机中完成所有数据的处理和运算。云计算环境的Hadoop平台下使用SVM对语音信号处理,能够发挥MapReduce并行计算优势,通过Map和Reduce操作将所需要的数据处理和运算任务分配到多个计算机中同时进行。使用中科院自动化研究所建立的CA⁃SIA汉语情感数据库中的语音信号数据作为实验数据。实验结果表明,使用云计算平台下的语音识别模型针对研究的几种情感的识别率基本在70%以上,识别率可以满足要求。使用云计算平台处理这种数据比较庞大的计算任务时,相比传统单台计算机平台,效率较高,优势比较明显。

云计算;语音信号处理;情感识别;支持向量机;Hadoop平台

人类属于智能生物的一条重要特质即人类拥有丰富的情感,在人们日常生活交流中,情感必不可少。近些年,随着人工智能的发展,人们开始对机器进行训练,一些机器已经能够懂得人们的语言,科研人员希望机器能够更加智能和人性化,希望机器能够通过人们的语言判断人们的情感变化,使得人机交互变得更加自然和谐。情感识别已然成为情感计算的重要分支,并得到了科研工作者的广泛关注[1⁃3]。

1 语音识别特征

汉语语境下,语言情感识别研究相对较晚,但得到了科研工作者的广泛关注。如神经网络、K近邻法、支持向量机、贝叶斯分类器等模式识别分类算法在语言情感识别中得到了使用。本文使用支持向量机算法建立语音情感识别模型,使用语音信号进行预处理,提取用于识别的特征参数,使用训练数据对支持向量机模型进行训练,之后使用测试数据对训练好的模型的泛化能力进行测试。通过对语音信号的分析以及参考文献,本文使用的用于语音信号识别的语音信号特征参数如表1所示[4⁃6]。本文主要针对愉悦、平静、悲伤、惊奇、恐惧以及愤怒6种情感的语音识别进行研究。这6种情感的语音波形如图1所示[7⁃8]。

2 MapReduce模型

MapReduce将庞大数据操作任务分配给多个计算机节点共同完成,并将多个计算机节点的计算结果合成得到传统单台计算机计算得到结果。MapReduce包括的过程有:Map,Partition,Shuffle,Combine、Sort以及Re⁃duce。但是可以将该过程合并为Map和Reduce两个过程。Map过程将任务分配给多个计算机节点共同完成,Reduce过程将多个计算机节点的计算结果进行合成。

表1 语音信号特征参数

图1 6种情感的语音波形

Map过程中,系统会把一个庞大的任务分划为大小固定的片段,并将各个片段分解为键值对。Ha⁃ doop平台则片段建立Map任务,可以完成用户自定义的Map函数,并输入该片段的键值对,从而输出计算结果。根据K2将计算的结果进行排序,得到元组。Reduce过程中,系统会把Map计算的结果进行排序,输入为,输出为。MapReduce模型结构如图2所示[9]。

图2 MapReduce模型结构

3 云计算环境下SVM语音信号处理模型

传统SVM语音信号处理识别模型是在单台计算机中完成所有数据的处理和运算。云计算环境的Hadoop平台下使用SVM对语音信号处理,能够发挥MapReduce并行计算优势,通过Map和Reduce操作将所需要的数据处理和运算任务分配到多个计算机中同时进行。在云计算环境的Hadoop平台下使用SVM对语音信号处理时,需要使用Map操作将分割的子计算节点中的各个训练数据的子支持向量SVs求出,之后使用Reduce操作子计算节点的子支持向量SVs进行汇总得到完整的支持向量AllSVs,即建立了云环境的SVM语音信号处理识别模型。使用SVM语音信号处理识别模型进行数据测试时,需要使用Map操作将分割的子计算节点中的各个测试数据的测试结果Rs求出,之后经过Reduce操作将子计算结果合并得到最终的语音信号处理识别结果。具体流程如图3所示[10⁃11]。

图3 云计算环境的Hadoop平台下使用SVM对语音信号处理流程

云计算环境的Hadoop平台下建立基于SVM的语音信号处理识别模型过程如下:

(1)预处理语音信号数据,将处理后的数据按照HDFS要求进行分块处理,并将分解的数据块存储到集群的各个计算机中。

(2)建立SVM语音识别模型,初始化相关参数,并选取应用广泛,性能优越的RBF核函数作为SVM的核函数。

(3)使用语音信号数据的训练样本对SVM语音识别模型进行训练,并将训练后得到的识别模型使用测试数据进行泛化能力测试[12]。

4 实验分析

通过实验对本文研究的云计算平台语音信号处理识别模型的性能进行验证。实验平台具有一台主机NameNode,CPU为Intel i5 4950,内存为8 GB DDR3 1 600 MHz,硬盘为500 GB,数据节点DataNode由三台计算机组成集群,CPU为Intel i3 4170,内存为4 GB DDR3 1 333 MHz,硬盘为500 GB。Hadoop为1.0.2版本,各个计算机集群节点实验千兆交换机进行连接。本文使用中科院自动化研究所建立的CASIA汉语情感数据库中的语音信号数据作为实验数据。在此针对愉悦、平静、悲伤、惊奇、恐惧以及愤怒这6种情感的语音进行识别,从数据库中抽取600条情感语句,其中每种情感语句有100条,80条用于对识别模型进行训练,另外20条用于对识别模型进行测试[13]。使用本文研究的云计算平台下的语音信号处理识别结果如表2所示。

表2 云计算平台语音信号处理识别结果

实验结果表明,使用云计算平台下的语音识别模型针对研究的几种情感的识别率基本在70%以上,识别率可以满足要求。定义传统单台计算机完成任务所需时间除以云计算平台完成任务所需时间为加速度比,本文使用的一台NameNode和三台DataNode组成的Hadoop集群平台在处理语音情感识别任务时的加速度比达到了3.6,说明使用云计算平台处理这种数据比较庞大的计算任务时,相比传统单台计算机平台,效率较高,优势比较明显。

5 结语

情感识别已然成为情感计算的重要分支,并得到了科研工作者的广泛关注。本文在云计算平台下使用支持向量机算法建立语音情感识别模型,使用语音信号进行预处理,提取用于识别的特征参数,使用训练数据对支持向量机模型进行训练,之后使用测试数据对训练好的模型的泛化能力进行测试。使用中科院自动化研究所建立的CASIA汉语情感数据库中的语音信号数据作为实验数据;针对愉悦、平静、悲伤、惊奇、恐惧以及愤怒6种情感的语音进行识别。实验结果表明,使用云计算平台下的语音识别模型针对研究的几种情感的识别率基本在70%以上,识别率可以满足要求。使用Hadoop集群平台在处理语音情感识别任务时的加速度比达到了3.6,说明使用云计算平台处理这种数据比较庞大的计算任务时,相比传统单台计算机平台,效率较高,优势比较明显。

[1]韩文静,李海峰,阮华斌,等.语音情感识别研究进展综述[J].软件学报,2014,25(1):37⁃50.

[2]韩一,王国胤,杨勇.基于MFCC的语音情感识别[J].重庆邮电大学学报(自然科学版),2008,20(5):597⁃602.

[3]张海燕,唐建芳.基于RBF神经网络的语音情感识别[J].四川理工学院学报(自然科学版),2011,24(5):552⁃555.

[4]陈明义,余伶俐,朱晗,等.基于特征参数融合的语音情感识别方法[J].微电子学与计算机,2006,23(12):168⁃171.

[5]付丹丹.贝叶斯网络学习算法研究[J].大庆师范学院学报,2011,31(3):36⁃38.

[6]刘豫军,夏聪.连续语音识别技术及其应用前景分析[J].网络安全技术与应用,2014(8):15⁃16.

[7]黄程韦,赵力.实用语音情感的特征分析与识别的研究[J].电子与信息学报,2011,33(1):112⁃116.

[8]尤鸣宇.语音情感识别的关键技术研究[D].杭州:浙江大学,2007.

[9]Tom White.Hadoop权威指南[M].周敏奇,王晓玲,金澈清,等译.北京:清华大学出版社,2011:45⁃76.

[10]刘鹏,黄宜华,陈卫卫.实战Hadoop[M].北京:电子工业出版社,2011:126⁃145.

[11]汪光庆.基于SVM的网页分类技术研究[D].北京:中国石油大学,2011.

[12]边肇棋,张学工.模式识别[M].2版.北京:清华大学出版社,2002:296⁃300.

[13]朱启敏.基于云计算平台的神经网络计算方法及其应用研究[D].广州:华南理工大学,2014.

Research on speech signal processing in cloud computing platform

LIU Rundong
(College of Communication Engineering,Jilin University,Changchun 130012,China)

The speech signal processing model in the cloud computing platform is studied in this paper.The processing and operation of all data is fulfilled by traditional SVM speech signal processing recognition model and in a single computer.SVM is used to process the speech signal in the Hadoop platform in cloud computing environment,which can give play to MapReduce parallel computing advantages,and assign the required data processing and computing tasksed to multiple computers at the same time through the Map and Reduce operation.The speech signal data in CASIA Chinese language sentiment database estab⁃lished by Chinese Academy of Sciences Institute of Automation is employed as the experimental data.The experimental results show that the emotional recognition rate of the speech recognition model based on the cloud computing platform is more than 70%,and the recognition rate can meet the requirements.When dealing with this kind of mass data calculation,the efficiency of the cloud computing platform is higher than that of the traditional single computer platform,and its superiority is obvious.

cloud computing;speech signal processing;emotion recognition;support vector machine;Hadoop platform

TN911.7⁃34

A

1004⁃373X(2016)02⁃0015⁃03

10.16652/j.issn.1004⁃373x.2016.02.005

刘润东(1987—),男,吉林长春人,在读硕士研究生。主要研究方向为信号与信息处理。

2015⁃07⁃23

猜你喜欢
单台信号处理语音
累计2 100秒!我国百吨级火箭发动机单台试车创下新纪录
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
《信号处理》征稿简则
《信号处理》第九届编委会
《信号处理》征稿简则
《信号处理》第九届编委会
东风汽车将获控股股东2.2亿元新能源补贴