语音学习系统设计与实现

2014-02-24 08:59:30江苏天创科技有限公司开发部江苏苏州215102
电子测试 2014年23期
关键词:吴语缓冲区方言

郁 峰(江苏天创科技有限公司开发部,江苏苏州,215102)

语音学习系统设计与实现

郁 峰
(江苏天创科技有限公司开发部,江苏苏州,215102)

通过介绍苏州话的历史和现状,结合建立苏州话学习系统可以很好地保留和发扬苏州的传统文化,最后从语言层面、技术层面描述了系统的设计、实现,具有很强的实用价值。

吴语方言;学习系统;MCI;DirectSound

1 研发背景

吴语方言的形成一般认为自泰伯奔吴,建立“句吴(勾吴)”开始,距今有3000多年。泰伯把中原发达的文化带到了江南地区,使中原的语言和当时仍然是蛮夷之地的江南越人的语言结合,形成了上古吴语。随着周朝的建立,汉语开始分化成夏、齐、楚、越四大方言,越方言就是使用上古吴语的地区大致也就是今天的江、浙、沪、皖地区。汉朝末年中国北方出现大动荡,特别在南北朝后期,北方逃难来吴县(即今苏州)的中原人很多,这时上古吴语受到中原话的影响而逐渐演变成了中古吴语,由于吴县又是南方的一座大城市,所以吴语对外的影响力是极大的。明清以后由于江南地区兴旺发达,苏州人读书成风,以致当时上层社会中的精英有很多是苏州籍人士,江南地区上层社会中大多数人以讲苏州话为荣,甚至不同地区的人在交流时同样以讲苏州话为荣,所以明清时期成为吴语发展的鼎盛期。苏州方言的发展目前正如首期“苏州话师资培训班”开班仪式上(《苏州日报》2012年2月27日报道)市语委负责人介绍的那样:苏州方言一直深受人们的喜爱,但近20年来随着人口的大流动、大迁移各种语言的混杂应用和普通话的普遍使用,现在的不少苏州人已不会讲流利的苏州话,大多数新苏州人基本上听不懂苏州话,更不会讲苏州话,苏州方言正面临削弱和消亡的危机。

近年来苏州市十分重视吴文化的遗产保护与繁荣发展,特别是苏州话的保护与发展,计划在未来几年总共培养1000名苏州话教学师资,并在各级各类学校包括高校新增苏州话必修课。随着将来苏州各级各类学校苏州话课程的开设,通过让青少年学习苏州话、学说苏州话,激发他们对苏州文化的热爱。预计本课程教材的教辅书也会陆续出版,供学习苏州话的青少年和在苏州求学、求职、经商、创业的新市民使用,如果我们把最近开发成功的“苏州话学习系统”供需要学习苏州话的人使用,将会极大地提高他们的学习效率和语言交流效果。

图2 采集的苏州话样品声波图

2 研发过程

苏州话学习系统系统包括采集单元、语音库单元和展示单元。

2.1 采集单元

采集单元是对苏州话进行录音采集,然后转换成数据,最后保持到语音库。我们知道,声音通过固体或液体、气体传播形成的震动,是一种波,因此首要的工作就是要将这些波采集下来。

采集的部分为苏州话的波如图2所示:

采集的过程就是将声音的震动变成模拟的电信号。模拟信号要存储到计算机中必须转化为数字信号,这个过程叫模数转换(ADC)。模数转换分为采样、保持、量化、编码四步。采样就是抽取某点的频率值,如果一秒中内抽取得点越多,获取的信号就越逼真,人的耳朵能够感觉到的最高频率为20kHz,要使人的耳朵听起来自然,至少需要每秒进行40k次采样,即40kHz,这个40kHz就是采样率。我们常见的CD的采样率为44.1kHz。保持是指取样的时间必须保持一定的长度,以保证取样的信号的稳定。

采样以后,必须将频率的能量并量化,用于表示信号强度。量化值为2的整数次幂,我们常见的CD位16bit的采样大小,即2的16次方。

量化结束后对其编码。编码的规则由文件格式决定,常见声音文件有wav、mp3、midi等。

声音的录制是基于DirectSound为基础,DirectSound是微软的DirectX的一个组件。DirectSound用到的主要对象包括:设备对象(Microsoft.DirectX.DirectSound.Capture),用来管理设备,创建辅助缓冲区;主缓冲区(Microsoft.DirectX. DirectSound.CaptureBuffer),操控声音捕捉缓冲区和产生混音效果的区域;辅助缓冲区(Microsoft.DirectX.DirectSound. SecondaryBuffer),用来存储要播放的声音文件,可建立多个辅助缓冲区来放多个要播放的声音文件;事件通知对象(Microsoft.DirectX.DirectSound.Notify),用于在缓冲区的特定点触发通知事件,来通知程序执行操作;音频格式(Microsoft. DirectX.DirectSound.WaveFormat)定义wav音频格式,如采样频率、量化位数、声道数等;通知的事件(System.Threading. AutoResetEvent),通知正在等待的线程已发生事件。

DirectX.DirectSound缓冲区默认记录的声音是未压缩过的wav编码的格式,采用wav格式保存的声音数据文件比较大,随着记录越来越多,会给存储空间带来很大的压力。因此需要对声音数据进行压缩,转成mp3编码格式的数据,这样保存下来的文件的大小会小很多。

记录下来的文件最终保存在语音库里面。为了保证数据的安全性,建议语音库要做备份,技术如磁盘列阵、磁带机、光盘塔等。

2.2 语音库单元

在语音采集的基础上,归类整理,构建语音库。苏州方言的词语相当丰富,本语音库分别只采集了各5个常用的名词、代词、动词、形容词和惯用语、成语、俗语、谚语、歇后语,再加5个常用句子作为研发组成实验语音库(微型)。只有经过无数的苏州话语音采集编码压缩后才能组成真正的语音库。

下面是采集的苏州话常用语音词语、句子举例:

名词:(1)霍显 (闪电) (2)老虫 (老鼠) (3) 上代头(父母以上的长辈)

代词:(1)啥体(什么事,为什么)(2)弯个|归个(那个,那)(3)我|奴(旧,郊区)(我)

动词:(1)搬场 (搬家) (2)作死 (自找绝路) (3)做舍姆 (坐月子)

形容词:(1)硬张(硬而韧)(2)马健健(过分热心(反不讨好))(3)厌气(无聊,寂寞)

惯用语:(1)做人家 (节俭) (2)嚼白蛆 (胡说八道) (3)量地皮(把人打倒在地)

成语:(1)拔脚屁股(转身(就逃))(2)墨腾出黑(乌黑)(3)杀杀辣辣(有份量,厉害)

俗语:(1)牙子作作齐 (说话要小心)(2)会捉老虫猫不叫(能干的不作声)

谚语:(1)先进山门为大 (2)外甥不出舅家门 (3)吃尽滋味盐好,走尽天边娘好

歇后语:(1)门槛浪葛鸭蛋——滚出滚进勿定 (2)六月里吃薄荷——凉勒心里

句子:(1)总算到屋里快哉。(总算快到家了。) (2)天亮快。(近天亮时,拂晓。)

2.3 展示单元

展示单元是通过图形、文字与声音的结合,通过触摸情景中的图形和文字,播放相关的苏州话的声音。本研发实验系统播放声音是基于媒体控制接口MCI ( Media Control Interface )实现的,它向基于Windows操作系统的应用程序提供了高层次的控制媒体设备接口。所有的MCI命令字符串都是通过多媒体API函数mciSendString传递给MCI的。;

3 研发结果

本系统的设计建立,实现了预期的效果,(苏州话学习系统(微型)开发成功,《学说苏州话:常用词语、熟语1200条》可以进入学习应用阶段),而且下一步还可以继续开发出常用苏州话900句、短文、课文等语音学习内容,语音采集经过编码后充实到苏州话语音库里面。要设计建立一流的苏州话学习系统,首先在软件上要优化语言采集能力,在硬件上要采用更好的设备,保证语言的清晰度和真实性。在语言库存储方面要设计出更好存储方案,保证存储数据的安全性、可靠性,建立一套更加快速的语音检索系统,提高系统的性能。同时加大对学校、企业的推广,让大家都能学到纯正的苏州话,说一口流利的苏州话。

这套系统,一旦投入应用,就可以随时随地、细嚼慢咽地学习苏州话,甚至可以在悦耳的轻音乐伴奏(音量可以调节或关闭)下学习苏州话。如果该系统再增加苏州话学习交流平台,学习者还可以随时随地交流学习苏州话的心得、体会,还可以对提升、优化该系统出谋划策, 使该系统更趋完善、更趋完美。

其他语言类学科的语音学习也可以借鉴该系统技术、模式加以开发。可以把该系统的普通话换上对应的英语词语、句子以后语、义、音一步到位,那么那些在苏州学习、工作、生活的外国人也可以随时随地学习纯正的苏州话而有可能成为地道的洋苏州人;也可以用该系统的技术、模式开发其他的外语语音学习系统,那么外语学习将更加丰富有效;还可以用该系统得技术、模式开发其他汉语方言的语音学习系统,那么我国的方言学习将更为便捷。

4 结语

通过本系统的设计建立,实现了对苏州话的采集、存储和展示,有利于苏州话的研究、学习和推广,更有利于推动社会的和谐、经济的发展。采集当代中国汉语方言之一的苏州方言等有声资料,并通过科学整理和加工,进行长期保存,便于将来深入研究和有效地开发利用,为弘扬苏州文化、加强苏州文化遗产的保护、繁荣发展苏州文化作贡献。

[1] 王国平主编.苏州史纲[M].苏州:古吴轩出版社,2009.

[2] 陈平.基于PWM技术的A/D转换电路的设计[J].微计算机信息,2007(29):267—271

[3] 钱小红,李小艳.基于DiretShow实现局域网实时视频传输[J].计算机技术与发展,2011(10):218—221,225

Design and Implementation of Dialect Learning System

Yu Feng
(Jiangsu Tianchuang Ltd. Development Section Suzhou Jiangsu,215102)

This paper introduces the history and current situations of Wu dialect,and describes the establishment of a Wu dialect learning system will contribute greatly to preserving and spreading Suzhou’s traditional culture.The paper also deals with the design and implementation of this system on both linguistic and technical levels,which is of great practical value.

Wu dialect;language learning system;MCI; DirectSound

郁峰(1980-),男,江苏苏州人,工程师,硕士,主要从事软件开发。

中国分类号:H173

猜你喜欢
吴语缓冲区方言
嵌入式系统环形缓冲区快速读写方法的设计与实现
方严的方言
东方少年(2022年28期)2022-11-23 07:09:46
浅谈吴语方言生存现状及其传承保护
——以浙江地区为例
魅力中国(2021年49期)2021-11-27 15:37:26
方言
今日农业(2021年15期)2021-11-26 03:30:27
吴语传播现状调查分析与传播手段的创新
文教资料(2021年21期)2021-11-15 12:13:09
说说方言
留住方言
吴语闲话(之四)
苏州杂志(2017年4期)2017-09-03 09:23:18
吴语闲话(之三)
苏州杂志(2017年3期)2017-07-03 14:10:22
关键链技术缓冲区的确定方法研究