一种HMM的藏语安多方言文本分析方法

2021-07-24 14:00
新一代信息技术 2021年3期
关键词:安多藏语韵母

苏 丽

(山东外事职业大学,山东 威海 264504)

0 引言

藏族是我国少数民族之一,藏语是一门古老的语言,分为安多方言、拉萨方言、康方言。其中,安多方言是保留藏语古面貌较多的方言,有其特殊的语言现象。藏族丰富的古籍著作文化仅次于汉族,汉语和藏语同属于汉藏语系,如果能够借助语言技术分析研究安多方言,可促进汉藏语言的交流,对保护藏族文化,推动藏族科技、经济、社会、文化的发展具有重要意义。

目前,安多方言主要从语言学进行研究,例如,安多语料的设计;安多方言音调习得的研究[2];安多方言农区话的研究[3];安多尖扎话的音位的研究[4]等。但是,从工程语言的角度对藏语安多方言进行建模分析的研究比较欠缺。

将目前语音合成的[5-9]发展技术运用于藏语的合成中,加快藏族的快速发展。

1 基于HMM的藏语安多方言的合成原理

将文本信息通过计算机转换成自然流畅的语音是语音合成的基本原理。语音合成包括三个系统模块,即文本分析、韵律预测和语音合成。文本分析是将文本进行预处理、规范语法信息;韵律预测是控制语音的重音、时长等信息。HMM语音合成的框架图如图1所示。

图1 HMM 语音合成的框架图Fig.1 Framework of HMM speech synthesis

基于隐马尔可夫模型(Hidden Markov Model,HMM)的语音合成系统的设计中,通过对藏语安多方言文本进行文本分析,得到安多方言文本的单因素(声韵母)标注信息和上下文标注信息;在合成阶段将单因素标注信息、上下文标注信息进行转换合成输出语音。单因素标注是提取藏语安多方言的声韵母信息;上下文标注主要标注了每个基元上下文的相关信息,主要指其位置信息。我们的研究思路是:通过对藏语安多方言文本的字丁分解和拉丁转型[10]的优化,实现其声韵母的分离(如图2所示),从而获得藏语安多方言文本的声韵母信息;再通过藏语安多方言书写的特殊分隔符,得到词、短语、句子的分割信息;最后通过设计标注信息算法生成标注信息,提供语音合成的必要参数。如图3所示,此过程主要包括训练和合成两个阶段[11-17]。

图2 SAMP A-ADT转换流程图Fig.2 Flow chart of SAMPA-ADT conversion

图3 基于HMM的统计参数语音合成原理图Fig.3 Schematic diagram of statistical parameter speech synthesis based on HMM

2 安多方言文本分析

2.1 安多方言的SAMPA分析

国际通用的机读音标 SAMPA(Speech Assessment Methods Phonetic Alphabet),可表示音标所有符号,藏语和汉语属于汉藏语系,根据汉语音标,标注安多方言音标。

根据汉语国际音标 SAMPA-SC[18](Speech Assessment Methods Phonetic Alphabet for standard-Chinese),设计安多出音标 SAMPA-ADT(Ando dialect Tibetan)汉语和藏语中部分语法相同[19]。音标一致时直接转写,不一致时利用键盘上已有的符号,设计安多方言的SAMPA-ADT进行标记。其流程图如4所示。

图4 SAMP A转写规则Fig.4 The rules of SAMPA's transliteration

2.1.1 声母的SAMPA-ADT设计

藏语安多方言中,声母有55个,包括27个单辅音与28个复辅音,其中有19个单辅音与汉语音标相同,有7个单辅音与28个复辅音与汉语国际音标不同。

声母SAMPA-ADT的设计如下:(1)汉语国际音标可直接用ASCII字符表示。安多方言声母的SAMPA-ADT机读音标与汉语国际音标一致的可直接进行表示,辅音声母 b、x、g、z、d、dz在SAMPA-ADT中与国际音标字母相同,其对应的机读音标 SAMPA-ADT 分别标记为/b/、/x/、/g/、/z/、/d/、/dz/;(2)其他藏语安多方言音标,在汉语国际音标的基础上用键盘上其它符号表示与其关联的 SAMPA-ADT;(3)送气与不送气的发音效果不同,为区别这一特征,定义了送气符号。例如,/sh/所定义的具体机读音标 SAMPA-ADT则标记为/s_h/。

2.1.2 韵母SAMPA-ADT的设计

安多方言中共有35个韵母,其中包含6个单元音韵母/a/、/o/、/i/、/u/、/ə/、/e/,3 个复元音韵母/ao/、/ai/、/eo/ 以及26个带辅音韵尾的韵母。元音中带韵尾的韵母分别为/e/、/o/、/a/、/ə/与韵尾 l、p、ŋ、m、n、r相结合所形成,而/u/、/i/这两个元音与任何韵尾都不能相结合。

安多方言中除/o/、/a/、/e/、/i/、/u/这 5 个可直接输入,/ə/SAMPA-ADT设计为“^”我们分两步设计元音和带辅音韵尾的韵母。安多方言韵母的设计方式与拉萨方言的基本一致。

综上可知,国内外学者对人力资本与企业价值关系的研究大多采用单一维度的时间序列数据或截面数据,聚焦于具体的行业或企业进行分析。由此,本文针对商业银行这一特殊金融服务行业,采用包含时间序列与截面两个维度的面板数据进行建模分析。

2.2 文本分析

文本分析模块是对输入的文本信息进行处理,使其成为计算机可理解的语言,其主要工作是对文本规范化处理。分析文本中的词边界、句子边界信息,是将文本或文字中约定俗成的书写形式,转化成标准书写形式,确定其正确读音。因此,通过语法规范知识库对文本进行规范化处理,可转换成为标准书写格式,如滤除系统不能识别的字符,全角转换成半角,检查字符的规范性等。

2.3 韵律处理

韵律处理主要是对句子的重音、时长、停顿、语调以及韵律结构的处理。对语音韵律的时长、基频、普参数等信息进行处理,可确定经文本分析后语句的轻重音、停顿以及具体发音,将每个特征参数存储形成语音库。

2.4 上下文相关标注格式设计

基于HMM的语音合成系统中,需准备训练的标注文件。文本标注是将语言环境的信息符号化处理,主要是不同位置音节的重音、时长等语境信息,利用文本分析程序自动生成标注文件,需对上下文标注格式进行设计。我们选取安多方言的所有声韵母为合成基元。设计安多方言的上下文标注格式。共6层,分别是声韵母层、音节层、字层、词层、短语层和语句层。各层描述分别如下:

声韵母层:描述当前声韵母、前一声韵母、后一声韵母的信息。

音节层:描述当前音节、前一音节、后一音节的信息及音节的位置。

字层:描述当前字、前一字、后一字的信息及字在词、词组中的位置。

词层:当前词、前一词、后一词的信息、词的个数;当前词组中词的位置。

短语层:描述当前短语、前一短语、后一短语的信息及声调信息。

将各层描述的信息用符号表示,用程序识别,如表1所示。

标注中还涉及停顿和静音的相关标注。表 2是对停顿和静音的表示。

标注的文本分析程序,自动生成单因素标注文件和上下文相关的标注文件。HTS训练合成过程中,mono.lab(单因素的标注文件)及 full.lab(上下文相关的标注文件),与wav(音频)文件是相对应的。单因素文件是文本语料所包含的所有音素信息,上下文相关的标注文件是各层级的相关语境信息。图5和图6分别是mono.lab文件和full.lab文件的部分示例。

表1 上下文的相关标注格式Tab.1 Context-r elated annotation formats

表2 停顿和静音符号表Tab.2 Symbol table of pause and mute

图5 m ono.lab(单音素标注文件)部分示例Fig.5 Some examples of mono.lab(monophone labeling file)

图6 full.lab(上下文相关的标注文件)部分示例Fig.6 Some examples of full.lab(context-related annotation labeling file)

由图5可得,单因素的标注文件中,记录了每句中的声韵母信息,其中sil为静音段,pau为句中停顿。图6得出fuii.lab文件中记录了音节、词、短语句子上下文相关信息。

3 合成语音测评

我们采用合成语音的 MOS(Mean Opinion Score)评估法对合成安多方言的自然度进行了测评,利用 DMOS(Degradation Mean Opinion Score)评估法对合成安多方言的的相似度进行测评。测评者对每个语句的语音质量按5分制打分,其评测标准及测评结果分别如表3及图7、图8所示。

图7为MOS评分的测评结果中,随着训练语句的增加得分都明显提高。30句 MOS得分 1.8分,100句MOS得分3.2分,300句是3.8分,500句是 3.9分,对比可知自然度明显提升,总的来说合成的语音自然度较高。由实验可以说明随着训练语句的增加,合成效果越来越好。

表3 MOS测评等级Tab.3 MOS evaluation level

图7 MOS评测等级Fig.7 MOS evaluation level

图8 DMOS评测等级Fig.8 DMOS evaluation level

从图8中DMOS评测结果可以看出,训练语句为30句得分是2.3分,100句时得分3.4分,300句评分4.1稍微比500评分4.0高一些。我们可以得到结论,随着训练语句的增加,语音的相似度增加,语音合成效果优良。

4 结论

本文总结了藏语安多方言的声韵母特性,设计了安多方言的机读音标(SAMPA-ADT),设计出安多方言文本分析的标注文件。进一步地,分别采用MOS和DMOS评估法对合成语音的自然度和相似度进行了测评,测评结果表明,语音合成效果优良。实现了藏语安多方言文本分析的研究,能够很好合成藏语安多方言。

猜你喜欢
安多藏语韵母
声母韵母
安多“南木特”藏戏研究文献综述
浅谈藏语中的礼仪语
一个精神行者的感知和领悟——关于梅卓散文集《走马安多》的一种解读
单韵母扛声调
浅析青海安多藏语影视译制网系统
安多藏戏表演的审美特征及其传承
《湘水韵》及其编撰原理要点
藏语拉达克话的几个语音特征
藏语地理分布格局的形成原因