项毛措 张有谊
摘要:藏文文字的排序是藏文信息处理领域的一项不可缺少的关键所在。也是一直以来有待解决的问题。目前,word成了最广泛的应用程序之一,如果word中实现符合藏文文字结构特点和语法规则的藏文排序,将会为以后藏文研究工作者带来很大方便。
关键词:藏文排序;结构;排序;word
1. 藏文字与文法规律
目前,藏文是藏文民族在日常生活中所使用的书面文字之一,它属于拼读性文字,由30个辅音字符和4个元音字母组合而成,其中,辅音字母是分为八组,每组四个字符,最后一组两个字符。四个元音中三个加在辅音字母(或上加字)上面,一个加在辅音(或下加字)下面。藏语的发音跟其他语言有所不同,发任何一个音都附带一个辅音“a”,在书写中为了方便等原因略写了后加字“a”,除了辅音和元音字母外,还有标点符号,藏文的标点符号没有汉语的那么丰富,常用的符号有“分界符()”和“分隔符(·)”两种,其中分界符是每一个完整的句子后面或者前半句和后半句连接处,一般情况下,文章的结尾会放两个分界符表示此文以结束,有些文章的结尾也有四个分界符的情况。分隔符是藏文中特别重要的符号,每一个藏文字都是以分隔符来隔开的,这个跟英文中每一个单词间用空格符隔开相似。藏文也有数字符号,用法跟阿拉数字一样,写法上有些差別。
辅音中分割10个后加字母,5个前加字母,2个又后加字母,以及3个上加字和4个下加字的情况下表1
由此不难看出,10个后加字外其余的20个辅音字母不能相互搭配,如:这种不符合后加字规律会出现错误。10个后加字中分割了5个前加字和2个又后加字。3个上加字是后加字中最后3个字母。两个又后加字字可以加的后加字共有3个,分别是。现在藏文字中一般很少写。字可以加的后加字共有4个,分别是。现在藏文字中一般很少写。3个上加字和4个下加字与辅音字母固定搭配已确定。其中,字可以加在基字之上的共有12个,字可以加在基字之上的共有10个, 字可以加在基字之上的共有11个①。
1)前加字和辅音字母之间的固定搭配规律如下:
2、藏文结构
藏文文字的结构是30个辅音字母和4个元音字符相互组合而成的。藏文文字的基本结构各不相同,至少1个辅音字母,最多的7个(6个辅音字母和1个元音字母组成,其中元音字母加在结构中基字的上方或下方)构件构成。但现在受语法影响也有双后加字或双元音的藏文文字结构。不管是怎么样的结构都以一个构件字为核心而成,称之为“基础字”简称“基字”,也是藏文字中唯一不可或缺的构件。其余的字母都以基字的前面的称(“前加字”),加在基字后面的(后加字),最后(又后加字)和元音字符组合一个完整的藏文字的结构(图1)(注:此处的元音只能出现一处)。藏文文字具备纵向结构和横向结构的非线性结构的文字,纵向结构具有前加字、基字、后加字、又后加字的先后顺序成线性结构,纵向结构具有元音、上加字、基字、下加字(元音最上面或下面)上下叠加的结构特征,所以藏文字是结构上十分复杂的文字。
完整的藏文字结构藏文字的构造序和拼写上有区别的,其中拼写序是拼写藏文字时符合从左到右、从上到下规则的书写顺序或拼读顺序。
藏文文字构造的顺序是按照基字、前加字、上加字、下加字、元音、后加字、又后加字。每一个构件是一个层次,基字居于核心层,又后加字在最外层。每一级字符按字符序循环,每次一次构件发生一次字符序变换,整个循环条件不变又从最低构件开始新的循环。总之,各个构件上的字符以基字为中心,按照循环构造序顺序变换,知道这个循环完了,基字开始更换,依次重复这种循环的同时构造排列和字符交替而形成了多个以基字为中心的循环集,所有的藏文字就在这个循环中定位。
在藏文文字排序的时候发现几个问题,第一、藏文基字判断上出现歧义性,如等藏字的第一个可以是基字也可以是前加字,所以这种情况应该在算法中加入规则来解决;第二、在藏字中有双后加字的存在,如这种情况把双后加字都放在一个排序单位当中来排序。
3、word 2007中实现藏文的排序的开发环境与步骤
Word 2007中对藏文排序的开发和系统的运行有着紧密的关系,整个word 2007中对藏文排序时采用Microsoft Visual Studio 2010平台上用Visual Basic 2010语言编程。
具体步骤如下:1)获取选定的表格;2)获取需排序的数据;3)对数据中的字分解成字符序列;4)对字符序列排序;5)排序结果存入选定的表格中。 (作者单位:青海民族大学计算机学院)
参考文献
[1]黄鹤鸣,达飞鹏. 基于排序的现代藏文音节判定[J]. 计算机应用,2009(7).
[2]黄鹤鸣,赵晨星.引入排序码实现藏文字符的排序[J]. 计算机技术与发展,2008(10).
[3]黄鹤鸣,赵晨星.基于DUCET的藏文排序方法[J]. 中文信息学报,2008(7).
[4]江荻,等.论藏文的序性及排序方法[J].中文信息学报,2000,14(1).
[5]林河水,等.一种符合ISO14651 语义的藏文排序实现方法[J].中文信息学报,2006,20(2).
[6]扎西次仁.藏文的排序规则及其计算机自动排序的实现[J].中国藏学,1999(4).
[7]珠杰,欧珠.基于藏文编码GB的藏文排序方法研究[J].西藏大学学报:自然科学版,2008,23(1).
[8]东噶洛桑赤来.东噶藏学大辞典[M].中国藏学出版社.2002.4
[9]新编藏文字典[M].青海民族出版社。1989.6
注解
①多吉杰布,藏文文法知识. 西藏人民出版社.2005年7月.