陈雅
(广州图书馆,广东 广州 510055)
基于Delphi的日文图书著者号码查询软件的设计
陈雅
(广州图书馆,广东 广州 510055)
通过对日文编目著者号查询规则的分析,根据国内使用现状和编目工作流程给出了独立通用查询软件的可行性设计方法,利用Delphi技术设计并实现了该查询软件,并简要分析了Delphi编程的基本步骤。
Delphi 数据库 著者号码 编目工作
图书馆文献编目是指以一定的目的和使用对象,按照相应的方法及其规则将无序的众多文献转化为有序的文献集合,为文献检索提供依据的工作。日文编目中一项最基本的工作就是依据植村著者号码表来生成日文图书的著者号码,用以确定同类图书的先后次序。
目前,图书编目信息化日益增强,而日文图书著者号码——基于植村著者号码表生成著者号仍是用手工方式,市面上流行的各种编目系统(如汇文、ILAS、图创)都未集成植村著者号的自动生成功能,图书采编人员也没有做这方面研究,笔者分析主要有两方面原因:一是日文图书在图书馆收藏中只占很小一部分,属于小语种。由于数量小,很多图书馆对日文图书的处理不够重视,使日文图书取著者号码仍处于手工查找阶段。二是著者号的生成只是整个图书编目工作的一个小的环节,这一工作的自动化、智能化往往被编目员或者系统提供商忽略。
而实际上植村号码表基于日文字符的拼写需要编目员对日文有一定的了解,但是国内许多图书馆的外文图书编目人员一般是以英语为第一外语,对日文并不十分精通。且每一次查找日文字符(日文字符有很多形状大小相似的需要区分),编目员仅用肉眼识别和查找,不仅耗时也耗精力,一定程度上会降低编目速度和准确率,影响图书馆日文数据库质量。因此,编写植村表著者号码查询软件是很有必要的。
笔者讨论了一种利用Delphi技术设计的植村表著者号码查询软件。该系统只需要输入日文平假名或者片假名的名字,系统自动生成正确的著者号码,避免了编目员手误产生的字符错误及肉眼看错数字等情况,提高了取号的速度和准确率,有利于读者使用图书馆资源。
2.1 植村表著者号码查询软件编写流程
整理日文植村表的使用细则→确定基本字符库→编写查找程序语言→程序检验及使用反馈。
2.2 整理日文植村表和确定基本字符库
日文图书著者号码,国内图书馆通常采用植村长三郎编的《日本著者号码简明表》,简称“植村表”。植村表包括正表和附表(著者区分用)。下表为植村表(正表)的一部分。
表1 植村表(正表)的一部分
植村表的使用要点如下:
①著者号是取著者姓氏头两个假名,在正表上查出第二个假名的代号,再冠以第一个假名,两者组配而成。例如:植村(ウエムラ):第二个假名是エ,查正表知其代号为07,再冠以第一个假名ウ而成ウ07、即是植村一姓的著者号。
②浊音、半浊音与清音同样处理。浊音就是与清音字符形状一样,“肩膀”上有两点的字符,如:“ヴガギグゲゴザジズゼゾダヂヅデドバビブベボ”;半浊音就是与清音字符形状一样,“肩膀”上有一个圆圈的字符,如:“パピプペポ”。
③促音、拗音的处理。促音是不发音的,是在它的前后两个音间停顿一下。促音字型和清音一样,字型大小比清音小一半,编目员要避免两种字符混淆;拗音就是清音、浊音、半浊音的“い”段音和小写的“ゃ、ゅ、ょ”配合起来构成的音节。
④植村表的片假名是以发音式的读法为原则。把“ヰヱヲ”包括在“イエオ”里(“ヰヱヲ”与“イエオ”音同)。
⑤植村表只有片假名,在实际工作中,常有著者名为平假名形式需要编目员转换为片假名。
根据以上列出的5个要点,制作了“基本字符库”(表2)。
表2 “基本字符库”的一部分
3.1 植村表著者号码查询软件程序的功能
植村表著者号码查询软件程序设计目标是能够快速、简单地查配植村表号码,提高日文编目的质量和效率。它的简单工作流程如下:
输入查找数据→数据库中检索→配置成植村表号码输出
植村表著者号码查询软件要实现的是在查询框输入日文著者姓名后,在输出窗口中显示“著者姓氏的第一个字母(片假名清音)+著者姓氏的第二个字母(假名)的数字号码”的样式。如:日文著者“ウエムラ,キョウイチ”,输入查询框后,显示结果是“ウ07”。
3.2 建立数据库
3.2.1 数据库的选择
植村表著者号码查询软件是一个比较小的应用系统,它产生和处理的数据量也比较小,因此没有必要使用像SQL Server和Oracle这样的大型数据库。可以选择Access组件建立数据库,并根据“基本字符库”创建一个名为“zcdb.mdb”的数据库。
3.2.2 建立数据库连接
根据“基本字符库”创建Access数据库文件“zcdb.mdb”,然后基于ODBC来建立Delphi应用程序与数据库文件连接。因为植村表著者号码查询软件主要针对的是“基本字符库”的查询,并且不作修改添加等工作,“基本字符库”是不可更改的。为了使用安全快捷,利用ODBC访问本地机的“基本字符库”。
在Delphi应用程序中,通过数据集组件来访问数据库。一个数据集对象就代表了数据库的一张表格、对数据库的一次查询结果集或者一次数据运算后的结果。常用的数据集组件有TTable,TQuery。本程序中使用的是TQuery组件。
TQuery组件是开发数据库应用程序中最常用的组件,也是最重要的组件之一,TQuery对象对应数据库中的一次条件查询的结果集。TQuery组件最大的特点是“支持结构化查询语句(简称SQL语句)”,能够非常方便高效地实现各种条件查询。
利用TQuery组件访问数据库之前,需要确认ODBC数据源已经建立,这就需要在“控制面板”中的ODBC数据源管理器中创建“datasource.dsn”数据源,并且可以成功地链接到数据库中。
3.3 关键步骤的源代码
3.3.1 第一字符:输入日文人名,在基本字符库查找,第一个字符若为清音字符保留,非清音字符则取同横行的清音。为了避免人为输入字符的错误,在正式进行查询之前,需要进行一些容错的处理。程序语言如下:
3.3.3 两个字符结合后在设计界面显示最后结果。程序语言如下:
Edit2.Text:=Edit2.text+ADOQuery1.Fields[0].value;
3.4 界面设计
根据植村表的特点和用户使用便利的需求,植村表界面如图1。
图1
该程序界面是通过可视化设计,无需编写程序代码。考虑到用户使用需求,特别把查找后显示结果的显示框设定为浅灰色,让用户更清晰明了。该设计程序语言如下:Edit2.color:=clMenu;
4.1 优点
第一,杜绝了清音和促音字符混淆的错误:原来没有植村表著者号码查询系统的时候,如编目员并不精通日语,在取号时容易将日文字符辨认错误或者输入错误。比如说,清音和促音字符形状一样,编目员由于手误会把促音字符输入系统,造成索取号取号错误。
第二,杜绝了浊音、半浊音字符混淆的错误:由于浊音、半浊音按清音处理,部分编目员由于对规则不熟悉,把浊音、半浊音放在索取号首字符上。
第三,杜绝了编目员手工查找不准确的错误:由于编目员用肉眼对照表格的字符查找相应的数字,会出现看错数字或者手误输错数字的情况。
第四,提高了编目员取号的速度。
4.2 使用效果反馈
准确率方面:可以原来用人工取号可能产生的输错字符、找错数字的情况。使用该软件,广州图书馆编目的近600种日文数据,取索取号准确率达100%。
速度方面:原来用纸质表人工查找,速度比较慢,一天只能做15种,其中取日文索取号需要用大量时间,每取一个大约需3~5分钟。用了该软件后,取索取号时间仅为1秒,大大提高了速度。
回溯纠正错误方面:对旧数据进行回溯修改,在回溯的约1000种数据中,订正数据约18.5%。虽然植村表著者号码查询软件只是一个小小的数据库应用程序,但是大大提高了日文编目的工作效率,减少了工作失误率,提高了索取号的准确率。
[1]郑阿奇,陈瑞芬.Deliphi编程教程[M].北京:电子工业出版社,2013.
[2]北京图书馆.图书馆目录(下册)[M].北京:中华书局,1957:79-86.
[3]陈雅.如何利用在线资源进行日文编目[J].图书馆建设,2008(5):54-56.
[4]植村长三郎.日本植村长三郎著者号码表.北京图书馆东方语文编目组译.[出版地不详]:[出版者不详],1957.
陈 雅女,1980年生。本科学历,馆员。研究方向:文献编目。
G254.131
2014-01-06;责编:杨新宽。)