孙 迪
(国家图书馆,北京 100081)
《中国分类主题词表》(Web版)是通过互联网技术为《中国图书馆分类法》《汉语主题词表》《中国分类主题词表》的广大用户提供各类信息资源的知识组织、知识检索、学科导航和实时更新的一个通用的数字型知识组织系统服务平台。因该表规模庞大、编制时间较长,其在主题词编制及词表结构的设置等方面还存在着一些问题,本文从外国名称主题词入手,结合作者在国家图书馆的编目标引实践,对《中国分类主题词表》有待规范化的细节进行归纳、总结,并提出相应的解决办法。
名称主题词的规范控制是编目工作的重要内容。所谓“名称主题词”,一般指用作主题的个人、团体、会议、家族、作品题名及地理名称标目(检索点)[1]。本文重点关注外国个人与作品题名的名称标目(即外国人名与题名主题词)中存在的问题,同时对名称主题词相关的其他问题(类号、词间关系等)也一并进行探讨。
1.1.1 著录错误
《中国分类主题词表》涉及人名的著录存在一些错误,依据不列颠百科全书在线(Encyclopedia Britannica)人物类相关词条与虚拟国际规范档(VIAF)相关个人名称规范数据予以确认,如:“巴多(Bardot, Bricitte 1934-)”,Bricitte应为Brigitte;“维吉尔(Viqil 前70-前19)”,Viqil应为Virgil;“维拉-罗勃斯(Villa-Libis, Heitor 1887-1959)”,Villa-Libis应为Villa-Lobos。其中,有些人名主题词除了著录错误,还存在名称标目混淆的问题,如:“爱德华(Adward, Evans-Prichard 约1002-1066)”,Adward应为Edward;且整体与英国社会人类学家埃文斯·普里查德 (Edward Evans-Pritchard)的名称标目混淆。依据“不列颠百科全书在线”等可靠信息源,可将该主题词修改为:爱德华(Edward the Confessor 约1002-1066)(即忏悔者爱德华)。
1.1.2 人名书写问题
《中国分类主题词表》目前涉及外国人名主题词书写的问题包括字符的使用、姓名结构以及大小写等。鉴于该表的功能不仅限于标引与检索的工具,更起到知识组织与知识连接的作用,为此有必要对于相关细节进行规范化。此部分参考源为VIAF中各国国家图书馆就相关个人名称标目的处理办法以及《资源描述与检索(RDA)》的相关细则。
(2)姓名结构的书写问题。外国人名主题词中文部分一般为姓氏(或姓名直序形式)的中译名,原文部分多采用“姓,名”的排列方式,目前在姓氏的规范书写以及姓和名的排列处理等方面存在一定问题:①姓氏原文的规范书写。在处理姓名构成相对复杂的人名时,应考虑不同国家的命名规则选取姓氏进行规范书写,如:范德瓦尔斯(van der Waals, Johannes Diderik 1837-1923),按荷兰人姓名规则,van der为姓氏前缀,Waals为姓氏主体,规范书写形式应为Waals, Johannes Diderik van der;同理,凡高(Van Gogh, Vincent 1853-1890),规范书写形式应为Gogh, Vincent van(见RDA F.11.3有关包括一个冠词和/或介词的姓氏的著录规定);凯末尔(Kemal, Ataturk Mustafa 1881-1938),Ataturk是土耳其国会授予他独有的姓氏,因此规范书写形式应为Atatürk, Mustafa Kemal。②姓和名排列处理的问题。姓和名排列处理中的问题包括姓氏与名字的混淆,如:儒尔盖(Jacques, Jurquet 1922- ),属于姓与名区分有误,应为Jurquet, Jacques;丰威汉·凯山(Phomvihan, Kaysone 1920-1992),老挝人名为“名前姓后”,因此该名称主题词中文部分的姓名区分错误,规范书写形式应为凯山·丰威汉。此外,姓和名排列处理相关的其他问题还包括:一是没有进行倒序处理。例如,戈雅(Francisco José Goya y Lucientes 1746-1828),西班牙人名为“名前姓后”,可参照VIAF实体进行相应处理。二是无需进行倒序处理。西哈努克(Sihanouk, Norodom 1922-2012),柬埔寨人名为“姓前名后”,因此以直序形式书写即可,规范书写形式应为Norodom Sihanouk。三是缺少倒序处理标识符。帕侬荣(Phanomyong Pridi 1900-1983),已经进行了倒序处理,但是缺少符号标识,规范书写形式应为Phanomyong, Pridi。
(3)姓名大小写问题。主要涉及外国人名原文中姓氏前缀、姓名连接词及名称附加部分的大小写问题,在处理时应考虑不同国家的人名书写规则:①姓氏前缀的大小写。以荷兰人名为例,姓氏前缀(如Van)应视情况小写,罗伊斯达尔(Ruisdael, Jacob Van 1629-1682),规范书写形式应为Ruisdael, Jacob van(见RDA A.38.2个人名称中的前缀的著录规定)。②姓名连接词的大小写。以西班牙人名为例,某些姓名连接词(如Y)应小写。例如,委拉斯贵兹(Velazquez, Diego Rodriguez Silva Y 1599-1660),规范书写形式应为Velazquez, Diego Rodriguez Silva y。③名称附加部分的大小写。以法国人名为例,某些名称附加部分(如爵位)应小写。例如,孔多塞(Condorcet, Marie Jean Antoine Nicolas Caritat, Marquis de 1743-1794),规范书写形式应为Condorcet, Marie Jean Antoine Nicolas Caritat, marquis de。(见RDA A.40.4有关个人头衔大小写的著录规定)
1.1.3 人名主题词外文单纯参照词的问题
人名主题词的外文单纯参照词目前均采用拉丁字母书写,对于不使用拉丁字母的国家的人名,为保证信息的完整性与关联性,建议启用以母语字符书写的名称原文作为参照词,显示格式如下:
(1)托尔斯泰(Tolstoy, Leo Nikolayevich 1828-1910)
俄国作家
Толстой, Лев Николаевич
(2)夏目漱石(1867-1916)
日本小说家
ナツメ, ソウセキ
(3)梅厄(Meir, Golda 1898-1978)
以色列女总理(1969-1974)
1.1.4 人名主题词的重复性问题
个人名称重复问题,主要是中译名不一致所致,应予以识别并进行“代/用”处理,如:马林诺夫斯基与马凌诺斯基(Malinowski, Bronislaw Kaspar 1884-1942)为同一名称实体,均指向波兰裔英国社会人类学家、功能主义(即比较社会学)创始人Bronislaw Kaspar Malinowski。建议《中国分类主题词表》相关条目作如下处理:
马林诺夫斯基
Y 马凌诺斯基(Malinowski, Bronislaw Kaspar 1884-1942)
马凌诺斯基(Malinowski, Bronislaw Kaspar 1884-1942)
英籍波兰现代人类学家,功能学派的创始人之一
Malinowski,Bronislaw Kaspar(1884-1942)
C912.4;|K833/837|
D马利诺斯基(Malinowski, Bronislaw Kaspar 1884-1942)
D 马林诺夫斯基
C 比较社会学
又如:凡·雷斯达尔(Van Ruysdael, Jakob 1628-1682)与罗伊斯达尔(Ruisdael, Jacob Van 1629-1682)为同一名称实体,均指向荷兰著名风景画家Jacob van Ruisdael。可依据VIAF对《中国分类主题词表》相关条目作如下处理:
凡·雷斯达尔(Van Ruysdael, Jakob 1628-1682)
Y 罗伊斯达尔(Ruisdael, Jacob van 1629-1682)
罗伊斯达尔(Ruisdael, Jacob van 1629-1682)
荷兰著名风景画家
Ruisdel, Jacob van(1629-1682)
J211.26;|K833/837|
D 罗伊斯达尔(Ruisdel, J.1629-1682)
D 雅各布·凡·罗伊斯达尔
D凡·雷斯达尔(Van Ruysdael, Jakob 1628-1682)
1.1.5 人名主题词的实用性问题——以外国君王的名称主题词为例
主题词的最终目的是为了方便用户更好的使用与利用,在设置主题词时应充分考虑到其实用性,以下就一些特殊名称的译名问题进行探讨。《中国分类主题词表》收录了大量外国君王的名称主题词。此类主题词涉及的名称构成较为复杂,多数具有交替形式,有些名称之间还存在着一定关联性,因此选取适合的译名对于提升相关名称主题的实用性有着重要意义。
(1)带绰号的名称。例如,查理(秃头)
[Charles(the Bald) 823-877]、威廉(征服者)(William the Conqueror 1027-1087),选取或处理此类译名时应借鉴当下的通用惯例——将绰号置前,上述名称主题词的主要成分可相应变更为:秃头查理,征服者威廉。事实上《中国分类主题词表》本身也有类似的先例,如:“矮子丕平(714-768)”。(另:选取绰号而非正式称号作为某一君王的名称主题词是否合理也有待商榷,可参见VIAF各国国家图书馆的处理方式。)
(2)具有众多交替形式的名称
以“查理一世(Charles Ⅰ1500-1558)”为例。
经查证,此名称与神圣罗马帝国皇帝查理五世相对应。由于牵涉复杂的皇室历史,存在西班牙国王卡洛斯一世、西西里国王卡洛斯、那不勒斯国王卡洛斯等交替形式[3]。参照相关信息源,《中国分类主题词表》相关条目应修正为:
查理五世(Charles Ⅴ 1500-1558)
神圣罗马帝国皇帝(1519-1556)、西班牙国王(1516-1556)。
Charles Ⅴ (1500-1558)
K516.3;|K551.33|;|K833/837|
D查理一世(Charles Ⅰ 1500-1558)
(3)具有关联性的名称。如:腓特烈一世
(Friedrich Ⅰ 1122-1190)、弗里德利希二世(Friedrich Ⅱ 1194-1250)、弗里德里希一世(Friedrich Ⅰ 1657-1713)、弗里德里希·威廉一世(Friedrich Wilhelm Ⅰ 1688-1740)、弗里德里希二世(Friedrich Ⅱ1712-1786)。以上为德国史相关的五个君王名称,涉及神圣罗马帝国与普鲁士王国两个时代;在通过生卒年可以区分个体的前提下,可对译名作连贯性处理以显示名称间的关联。上述名称主题词可修改如下:
腓特烈一世(Friedrich Ⅰ 1122-1190)
腓特烈二世(Friedrich Ⅱ 1194-1250)
腓特烈一世(Friedrich Ⅰ 1657-1713)
腓特烈·威廉一世(Friedrich Wilhelm Ⅰ 1688-1740)
腓特烈二世(Friedrich Ⅱ 1712-1786)
此外,还应对词表中相关条目的注释、参照关系进行修正,如:
腓特烈二世(Friedrich Ⅱ 1194-1250)
神圣罗马帝国皇帝,德意志和西西里国王。(神圣罗马)腓特烈一世之孙。
FriedrichⅡ(1194-1250)
K516.31;|K833/837|
D弗里德利希二世(Friedrich Ⅱ 1194-1250)
C神圣罗马帝国(800-1806)
C腓特烈一世(Friedrich Ⅰ 1122-1190)
腓特烈二世(Friedrich Ⅱ1712-1786)
德国普鲁士国王。腓特烈·威廉一世之子,(普鲁士)腓特烈一世之孙。
Friedrich Ⅱ(1712-1786)
K516.33;|K833/837|
D弗里德里希二世
C普鲁士
C腓特烈一世(Friedrich Ⅰ 1657-1713)
C腓特烈·威廉一世(Friedrich Wilhelm Ⅰ 1688-1740)
《中国分类主题词表》题名主题词相关的问题主要包括国外作品题名主题词单纯参照词的选取以及个别国外作品中译名的选取。
1.2.1 国外作品题名主题词外文单纯参照词的选取
国外作品题名主题词的外文单纯参照词目前均采用原作的英文名称或译名表示,其中有个别英译名的选取不甚准确,如:“《资本论》”,其规范的英译名应为Capital,而非On Capital[4]。
另一方面,《中国分类主题词表》收录的国外作品题名主题词均为原作的中译名,从保证信息的完整性与关联性的角度出发,以母语字符书写的原作题名作为外文参照词或许更为合理。显示格式示例如下:
《红与黑》
法国小说家斯汤达(Stendhal, E.)著。
Le rouge et le noir
《神曲》
意大利诗人但丁(Dante Alighieri)著。
Divina commedia
《玩偶之家》
挪威戏剧家易卜生写的三幕话剧。
Et dukkehjem
1.2.2 国外作品中译名的选取
《中国分类主题词表》收录的国外作品题名主题词中,有个别中译名的选取值得商榷。如:《白郎·蒂朗》,原作是一部加泰罗尼亚语骑士小说,题名为Tirant lo Blanch[5];已知有英译本题名为Tales of the White Knight: Tirant Lo Blanc[6],目前唯一的中译本译作“骑士蒂朗”[7]。此外,国内学术性论著中多译作“骑士蒂朗”或“白骑士蒂朗”。综合考虑,该题名主题词选用“《骑士蒂朗》”更为合理。建议《中国分类主题词表》相关条目修改如下:
《白郎·蒂朗》
Y 《骑士蒂朗》
《骑士蒂朗》
西班牙古典文学名著。
Tirant lo Blanch
I3/7
D 《白郎·蒂朗》
C 骑士文学
《中国分类主题词表》部分名称主题词相关的分类号与词间关系即参照关系项的设置也存在一些问题。
1.3.1 类号
主要表现为分类号的错置,这对于文献分类标引及相关的规范控制都会带来一定的负面影响。如:腓特烈一世(Friedrich Ⅰ 1122-1190)对应类号为K546.31,为神圣罗马帝国皇帝,实属德国史相关人物,类号建议变更为K516.31[对应:德国农民战争以前(481-1524年)];大隈重信(Okuma Shigenobu 1838-1922)对应类号为K313.36,为明治维新时期重要的政治家,类号建议变更为K313.41[对应:资本主义发展时期(1868-1904年)]。
1.3.2 词间关系
主题词的词间关系通过主题词款目框参照关系项的设置来体现,包括:用Y、代D、属S、族Z、参C,《中国分类主题词表》部分主题词存在上下位词内容设置有误的现象。如:“厄立特里亚”的直接上位词及族首词均有误,其为一独立国家,不再属埃塞俄比亚所辖。建议删除现有S、Z关系词,增加相应C关系词:
厄立特里亚
Eriteria
K93/97;②421.9
C 厄立特里亚问题
C厄立特里亚解放阵线
《中国分类主题词表》在外国名称主题词的著录或书写方面仍存在一些问题。笔者建议:对于外国名称主题词(包括但不限于人名主题与题名主题)进行系统梳理,制定细则,以便针对性的规范化处理;依托特征抽取、自动聚类等文本信息处理的方法和技术,加强对重复性名称的识别(可从中文词形以及单纯参照词的相似性入手),从用户的角度出发来改进名称的实用性问题,并对主题词相关的类号与词间关系做相应的调整。
鉴于国内图情机构就名称主题与名称规范关系的认识存在分歧的现状,以及存在分别建库的现象,同一名称实体在不同规范库中的表现形式会出现差异,导致书目与规范控制工作产生一定程度的冲突;就外国名称而言,这些问题尤为明显(见表1、图1)。
表1 名称实体表现形式与差异说明
图1 含有同一名称实体不同表现形式的书目记录
因此,有必要统筹名称主题词与名称规范的控制工作,着力解决名称主题词与名称规范的一致性问题,避免资源重复建设进而提升资源的可用性。本研究建议名称主题词与名称规范采用合并统一建库的控制模式,如需要以名称为主题进行资源描述,可依据有关编目规则从统一库中直接选用相关的名称标目;同时应借鉴与吸纳VIAF等相关取值词表的经验,最终实现名称资源的共享与利用。
《中国分类主题词表》主题词维护工作既有赖于文献组织管理各个工作团队间的协作,又有赖于文献组织管理共同体与其他知识共同体间的合作。一方面,对《中国分类主题词表》主题词存在的问题,文献编目团队应与数据规范维护团队及时沟通,后者进行相应的规范化处理后应及时将修正结果反馈至所有编目团队,以避免可能引发的主题或标引错误,对于已经引发的主题或标引错误,数据规范维护团队在规范化处理后应结合实例通告各相关团队,以保证书目控制的质量以及《中国分类主题词表》的使用效度;另一方面,除了在文献组织管理行业内部不断加强协作外,还应促成《中国分类主题词表》相关的知识共同体之间的更为广泛与深入的合作:《中国图书馆分类法》组委会应与各学科领域的学术委员会(或类似机构)在原有基础上建立更为稳定、高效的共建机制,除从具体领域入手,就主题词的“增删改”、类目与结构的调整等方面制定详细的准则并付诸实施外,还应定期召开例会通报最新进展,缩短相关类目的修订周期,确保《中国分类主题词表》的实用性、权威性、时效性。
本文着重对《中国分类主题词表》外国名称主题词相关的问题进行了梳理,限于篇幅原因暂未涉足团体名称、地理名称及主题词组配方面的问题,留待日后进一步探讨。作为通用的数字型知识组织系统服务平台,《中国分类主题词表》的完善、发展离不开细节处理的规范化,从每一处细节入手,加强名称主题与名称规范的统筹,在信息组织的工作团队间协作层面以及各相关知识共同体间合作层面予以维护,充分利用计算机与网络技术,方能促进《中国分类主题词表》的持续与长久应用。