周毛先,头旦才让,才让加
(青海师范大学 藏文信息处理省部共建教育部重点实验室青海省藏文信息研究中心, 青海 西宁 810008 )
从公元前7世纪亚述帝国编纂的苏美尔—阿卡德语双语难词表开始,人们对词语的含义、性质、用法等进行了详尽的注释,词典逐渐成为人们学习生活中不可或缺的工具书,其中双语(多语)词典更为使用不同语言文字的国家和民族之间科技文化的交流发挥了巨大的作用。随着计算机网络技术的飞速发展,传统意义上的词典已经不能满足人们的需求,纸质词典、电子词典和网络(在线)词典已成为现代词典的三种不同形式,三种形式的词典相互促进、相互发展,纸质词典成熟的编纂理论为电子词典和网络词典提供了良好的数据资源和理论依据,从而促进了电子词典和网络词典的飞速发展,电子词典和网络词典又凭借计算机技术和网络技术推广了词典的应用。不同于纸质词典和电子词典,在线词典又具有操作方便、快捷、动态性好及更新快等优势,已经成为广大网络用户在学习语言、翻译语言和检索信息等过程中查询对译词汇的主要途径[1]。
目前,虽与英文在线多语词典相比,汉语在线多语词典在质量和数量上都有较大差距,但是,汉语在线多语词典通过十余年来的迅速发展,已经初见规模,形成了各具特色的在线词典资源,部分在线词典已经商品化[1]。相较之下,藏文单语及多语在线词典仍处于起步阶段,通过网络能够搜索到的藏文单语或多语在线词典很少。近年来,随着时代的发展和文化交流的深入,越来越多的国家、团体和个人对藏族文化产生了浓厚的兴趣,藏语多语词典已成为查阅资料和沟通交流的重要工具[2]。鉴于汉语是中国通用语言而英语又是最流行的国际交流语言,建立一个藏汉英三语词典就能基本保证其他语言与藏语的互译。由于纸质词典存在查阅困难、便携性低、更新周期长等困难,建立一个词汇量丰富、翻译准确的藏汉英在线词典已成为必需。
为了方便用户查询词典,藏汉英在线词典采用B/S结构,即浏览器/服务器模式,该模式容易扩展系统并实现客户端的零维护,在线词典的开发平台选用WAMP,用户查询流程如图1所示。
图1 查询流程图
WAMP即基于Windows、Apache、MySQL和PHP的开放资源网络开发平台[3],W代表Windows操作系统;A代表Apache服务器,Apache作为世界使用排名第一的Web服务器软件,几乎可以运行在所有广泛使用的计算机平台上,由于Apache是免费开源软件,所以不断有人来为它开发新的功能和特性并修改原来的缺陷。Apache具有简单、快速、性能稳定等特征,可作为在线词典的代理服务器。M代表MySQL,由瑞典MySQL AB公司开发,是一个小型关系型数据库管理系统,目前MySQL被广泛地应用在Internet上的中小型网站中,MySQL具有开源、体积小、快速、成本低等特征,为了降低网站总体成本,选择了MySQL作为在线词典的网站数据库。P代表PHP,是一个在网络程序开发方面应用范围很广的语言,一般来说PHP大多在服务器端运行,通过运行PHP的代码来产生网页提供给浏览器读取,PHP可以在许多不同种的服务器、操作系统、平台上运行,也可以和许多数据库系统结合,使用PHP不需要任何费用,官方组织PHP Group提供了完整的程序源代码,允许用户修改、编译、扩充。
本词典使用phpMyAdmin管理词典数据库。phpMyAdmin是由php写成的MySQL资料库系统管理程式,方便管理员对词典数据库进行数据的添加、编辑和删除等操作,使用phpMyAdmin可以导入已经建立好的外部数据表。
藏汉英词典数据表tbcna(表1)采用Unicode编码,共有五个字段: C为汉文词;T为藏文词;E为英文词;X为词性;A为ID,由于用户可能输入藏文、汉文、英文三种语言的单词来查询,为加快对表中记录的查找,建立了C、T、E三个字段的索引。
表1 藏汉英在线词典词条数据表结构
对应在phpMyAdmin中输入的sql代码:
CREATE TABLE ′tbcna′ (
′C′ char(70) collate utf8_unicode_ci default NULL,
′T′ char(120) collate utf8_unicode_ci default NULL,
′E′ char(80) collate utf8_unicode_ci default NULL,
′X′ char(4) collate utf8_unicode_ci default NULL,
′A′ decimal(10,0) default NULL,
KEY ′C′ (′C′),
KEY ′T′ (′T′),
KEY ′E′ (′E′)
) ENGINE=MyISAM DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci
将57 856条测试词条导入MySQL数据库,为数据安全考虑,通过phpMyAdmin对数据库进行加密处理,浏览词条示例如表2。
表2 词条数据表示例
图2 查询页面
查询页面php代码:
建立下拉列表框:
请选择查询语言种类:
当选择查询语言为藏文时:
error_reporting(0);
$mac=isset($_POST[′mac′])?trim($_POST[′mac′]):′′;
$se=$_POST[′s1′];
$str=$_GET[″A″];
$res=mysql_query(″SELECT * FROM tbcna WHERE C=′″.$mac.″′″);
$rs=mysql_fetch_array($res);
if($rs[′T′]!=′′)
{
echo $rs[′X′];
echo ″
″;
echo ′汉文: ′.$mac ;
echo ″
″;
echo ″
″ ;
echo′English: ′.$rs[′E′] ;
}
else
{
echo ′没有对应的翻译!′;
}
?>
为了更好的方便用户,丰富查询结果,提高交互能力,还需做如下工作:
2) 新词添加: 查询单词时,如果词典数据库中没有该词,系统允许添加新词,点击链接就可以创建这个单词。由于现代藏文中出现越来越多的新词,通过允许用户添加新词,可以及时更新词典数据库。
3) 编辑解释: 当用户对某个词条的解释不满意,或者发现某个单词的解释信息或例句有错误时,系统允许用户进行编辑并提交到数据库,由管理员审核提交的内容,对数据库进行必要的修改,优化词典库、语料库,为用户提供更好的翻译服务。
[1] 宋培彦,刘宁静.中英文在线词典浅析[J]. 青岛酒店管理职业技术学院学报,2009,1(2):38-41.
[2] 才藏太,李毛措.网络版班智达藏汉英电子词典的设计[J].计算机工程与应用, 2005,41(17):126-128.
[3] 张瑞,高岭,王承博.基于WAMP动态维基网站的建站方法[J].内江科技, 2008,29(4):139,174.
[4] 叶晓菡.基于.NET的网络用语在线词典软件的设计与实现[J].计算机时代,2010,(9):27-29.
[5] 才智杰,藏汉英电子词典的开发研究[J], 青海师范大学学报(自然科学版), 2005, (2):48-50.
[6] 张锦文.国外在线语料库与在线词典管窥[J].广东广播电视大学学报, 2002, 11(3):72-75.
[7] 司敬新.在线词典的特点分析[J].中国电化教育, 2005, (2):84-85.