刘 玲
摘要本文以《新华词典》修订为实例,论述运用分类比较法,即运用计算机技术,根据各种线索或关键字词,把词典中相同类别的条目从各种排列形式中抽调出来,从释义体例、释义语言、释义元素、释义层次、配套词等多方面分别加以分析比较,找出它们之间的内部联系和异同。通过内容和形式的比较,以发现条目本身的各种问题,诸如体例不统一、释义语言不规范以及条目缺漏、重要元素缺漏、重要信息缺漏以及多余信息等问题。
关键词分类比较法配套词信息缺漏释义元素
《新华词典》是一部综合性的辞典,原来以语词为主,兼收百科,2001年修订后,增大了百科的比例,语词和百科部分篇幅基本上各占一半,成为名副其实的综合性词典。这部词典实用性很强,在同类词典中质量堪称上乘,曾获得第四届国家辞书奖一等奖,是一部很好的工具书。这次修订笔者承担了地理类条目的编辑工作。地理类在《新华词典》百科内容里条目比较多,是大地理概念,实际上它包含了天文、气象、遥感、地质、风景区、交通运输、名胜古迹、少数民族概况、中国地理、世界地理等内容。
按照传统做法,依条目排列顺序逐条审读,也就是单条孤立审读,发现的问题并不多。实际上几次修订,在百科条目方面,除了新增内容外,真正修订的幅度并不大。一方面是因为条目出自专家之手,科学性基本是有保证的;另一方面因为编辑审稿基本上采用单条孤立审读的方式,即使分类也缺乏必要的分析对比。因此,长期存在的问题往往被忽略了。
现在我们完全可以利用计算机技术,根据各种线索和关键字词作穷尽式搜索,既可把比较容易分类的条目调出来,放到一起,又可以把不容易识别的、字面特征不明显或无特征但又属于同类的条目找出来,以避免遗漏。条目之间的系统性也可以通过这种方法检索,有无缺漏一目了然,从而确定需要增删的条目;关键字词的检索,还可以帮助我们找出原来不容易找到的一些配套词,从而发现问题所在;根据一些相关概念词,发现条目释义或收词立目方面的问题。这些问题往往是隐性的,不容易被发现的。
没有比较就没有鉴别。传统方法与分类比较法的最大区别就在于前者是分而不比,单条审读;后者是在分类的前提下,重点放在比较上,让有一定内部联系的条目形成信息链,通过比较,发现这些信息链上某个环节出现的问题。比较的内容包括释义元素比较、系统缺漏比较、定位语比较、体例位置比较、层次比较、语言规范比较、多余信息比较、数字使用比较等。
比较之前,首先需要进行系统分类,传统手工分类效率低、准确性差,容易遗漏,且易受编者的知识面的局限;利用计算机技术分类,虽然也需要一定的专业知识和技巧,但基本上可以做到不遗漏、效率高,准确性有保证。我们可以利用现有信息,找出它们的共同点,进行系统分类。如:
根据条目定性语性质,抽调出包括国家名称,中国城市,中国32个省、自治区和直辖市及省会,外国城市,首都,节气,少数民族等内容的条目;
根据条目字面的显著特征抽调出包括江、河、湖、海、洋、岛、洲、山、高原、平原、沙漠、海峡、星座、盆地、宇、宙、纪、界、代、岩、石、铁路、公路、人种等字样的条目;
根据关键字词找出相关的配套词,如:全国重点文物保护单位、中国古代水利工程、中国五大淡水湖、北美五大淡水湖、中国古代四大名镇、中国佛教四大名山、比邻中国三大海域、南海中四大群岛、中国古都、八大行星(当时是九大行星)等。
这种分类检索的方法,实际上还可以起到专项检查的作用。系统是否缺漏、体例是否统一、定位语是否准确等在这里可以得到全面的检查。以下三类比较是词典修订中最为常见的问题,也是重点要解决的问题:
一、释义元素缺漏比较
释义元素缺漏的问题,在词典修订中占相当大的比例,可以说是主要问题所在。词典中有关国家、首都、城市的人口数都存在资料过老以及缺漏的问题,有的材料是1981年的,最近的也在1997年。在注释这类条目时,人口数和国家面积是重要的释义元素。但比较后发现,有的条目中,既没有人口数,也没有面积数,致使条目信息模糊。如:称德国“是欧洲人口较多、面积较大的国家”,但究竟有多少人口?面积有多大?没有交待。这就属于释义元素缺漏的情况。称美国“面积和人口居世界前列”,而没有具体数字说明,这个描述就显得没有根据。
这次抽取了20个国家名称条目,其中只有5个国家标注了人口数,分别是中国、突尼斯、新加坡、尼日利亚、俄罗斯;标注国家面积的只有两个:中国和俄罗斯。其他释义元素也有交待不全的问题,比如国家建立的时间、首都、国庆日等,这些问题必须统一解决。
江、河这类条目的释义,除注明长度外,还应交待其流域面积,在已收的21条“江”中,有14条缺漏。
介绍中国岛屿的条目,应交待具体的地理位置、面积大小、基本特点、所属省份等,外国岛屿还应交待所属国家。在介绍中国岛屿的16条中,没有介绍面积的有9条,也就是说,有一半以上的条目存在释义元素缺漏的问题。没有介绍特点的也有5条之多,占三分之一。有的介绍更加离谱,完全没有内容,已经不是释义元素缺漏的问题了。如崇明岛,是我国第三大岛,作为我国唯一的由泥沙堆积而成的冲击岛,面积约有1000余平方千米,有着独特的资源与景观,且历史悠久,唐朝时该岛已经存在,可交待的内容很多,不知何故,原作者均无考虑,只交待“在长江口,属上海市”。这样的释义显然不符合要求。类似这样的问题绝不是仅此一例。再如:“燕山,山名。在河北北部。”这里既没有海拔高度介绍,也没有走向介绍,更无特点介绍,这样的释义连基本要求都没有达到,还有什么存在的意义呢?
外国岛屿的释义同样存在类似的问题,27条中有三分之一没有交待面积,更有甚者,近三分之一没有交待所属国。外国岛屿有些介绍了其气候类型,其实这是很重要的特点,它关系到该岛屿的生存条件、经济作物的生长等,但遗憾的是,作者并没有把这一重要信息落实到每一个条目中去。
平原、高原这类条目,其海拔、面积是必不可少的释义元素,其气候类型也应在介绍之列,但原作者似乎没有注意到这些元素的重要性,仍有缺漏,中国境内的5个高原中,有3个未注明面积,外国3个高原中,1个未注明面积;11个平原中,有3个未注明面积。
介绍我国55个少数民族,宗教信仰和劳动形式应该是重点内容,原稿中只有19个民族注明了宗教信仰,13个民族注明了主要从事的劳动形式。查阅相关资料发现,几乎所有的少数民族都有自己的宗教信仰,都有自己擅长从事的劳动形式,有的甚至是我国出口某种物品的重要来源。词典学中有一种“挂一漏万”的否定规则,即具有相同属性的同类事物,放在同一背景和条件下注释,对一部分强调或肯定某属性,而其余部分未被强调或肯定,其结果就意味着对未被强调或肯定属性的这部分的否定。对作者或编者而言,上述问题可能是由于某种疏忽所致;但是读者却往往会因这种缺漏产生某种误解。以少数民族注释为例,读者就有可能认为只
有那19个民族有宗教信仰,其他少数民族没有宗教信仰;只有那13个民族从事某种劳动,其他则没有任何劳动形式的存在。因为读者的查检,往往只是针对某一条,而不是整体,这也就是词典与一般图书的不同之处。因此,释义元素的缺漏,从某种角度说,就是对读者的误导。因缺漏而造成的误导,是词典注释中最不应该出现的问题。
从上面的举例中可以看出,释义元素的缺漏在词典中大量存在,用分类比较法去检查分析,能发现很多原来不被注意的漏洞。上述问题大部分经过两次修订而未被发现,说明了传统的审读加工手段的局限。
这些释义方面缺漏的都是非常重要的信息,有,则会使词典准确性加强,实用性增大;无,则会使词典的科学性大打折扣。通过这样的对比分析,不仅能看出释义元素方面存在的问题,同时也暴露了体例上不统一的问题。发现了问题所在,就给解决问题提供了基础。
二、系统缺漏比较
系统缺漏比较,对于相对封闭固定的配套词的检查非常重要。比如24个节气,55个少数民族,32个省、自治区及直辖市,八大行星,北美五大淡水湖,中国南海四大群岛,三大海域,中国佛教四大名山等等,从收词的角度检查缺漏情况,相对较容易。因为封闭固定,缺者补其缺即可。对于那些相对松散的配套词,从实用和照应的角度检查,就显得尤为重要。不仅查缺漏,更主要的是可以提出增补的意见,弥补原来在系统收词方面的缺欠。
比如,目前词典中收录中外高原只有8条,如果从中学生使用的角度考虑,显然不够。像亚洲的中西伯利亚高原、德干高原、阿拉伯高原、小亚细亚高原;非洲的埃塞俄比亚高原、南非高原(非洲三大高原,我们只收了一个东非高原,其他两个高原也同样重要);拉丁美洲的圭亚那高原、巴塔哥尼亚高原等。这些在中学生教材中是非常重要的内容,是必须掌握的,因此,我们不能不顾及其系统性。(《新华词典》的主要读者对象是中学生及中等文化程度的读者。)如果读者对需要的内容屡查不见,就会失去查检的兴趣。这里照顾到系统性,实际上就是增强了实用性。
中国的“江”收了22条,其中“漓江”的收录显然和其他“江”不在一个层次上。从“漓江”的释义看,它是“西江”的支流;从“珠江”的释义看,“西江”是珠江的干流。可见“西江”的重要。但是,22条江却不包括西江。收漓江可能是因为它联系着桂林山水,知名度较高。但它只是西江的支流,全长仅437千米(长度在释义中还没有注出);而西江全长2074.8千米,流域面积达35.5万平方千米,是一条非常重要的河流。从收词的级别考虑,西江应属于一级条目,从词典的照应角度考虑,“漓江”、“珠江”都提到“西江”,而且是作为重要因素提到的,不收似不合适。还有一种封闭性较强的配套词比较,可以发现一些比较隐性的问题。如,根据条目注释提供的线索得知,“佛山”是中国历史上四大名镇之一,那么,其他三镇在哪里?是否收录了?带着这个问题进行检索,结果发现,其他三镇中只收了“景德镇”,但未说明是中国历史上四大名镇之一,其余两镇没有收录。这种比较分析,需要查阅一些资料,需要编辑善于捕捉线索,善于从条目释义中发现有用的信息。这是通过系统比较发现的问题,增补了这些条目,就可以基本上做到系统的相对完整和照应的相对封闭。
三、定位语比较
定位语在词典注释中常常不被重视,表述往往比较随意,这类问题也是词典修订中最需要解决的问题。分类比较法的运用,可以解决这一问题。再以“江”的释义为例:
长江:中国第一大河。
黄浦江:长江下游支流。
嘉陵江:长江主要支流。
金沙江:指长江上游青海玉树到四川宜宾一段。
岷江:长江支流。
乌江:长江支流,贵州省最大河流。
雅砻江:长江第二大支流。
在众多的“江”中,长江最重要。只说明中国大河之最,虽然不错,但不够。它还是世界第三大河,其长度、水能、流域面积、流域范围、支流情况等都位居中国众江之首。如此重要的定位语,不说明不足以显示其重要。上述诸“江”,其定位语不能算错,但从目前的释义看,严格地说,又都不符合词典注释的要求。因为,它们的体例不统一,定位语过于随意。指出雅砻江是长江第二大支流,那么,第一大支流是哪条江?没有交待。长江主要支流是不是第一大支流呢?没有说清楚,“主要”不一定就是第一。如果以黄浦江释义为基本模式的话,那么,金沙江的释义就可以这样写:“长江上游支流。”如果以乌江的释义为基本模式,金沙江的释义应该是:“长江支流,四川省大河。”孤立地看,它们的定位语还说得过去,基本上把相关属性交待了,但放到一起就反映出体例的不完善或执行体例的不彻底。这类的问题很多,无法一一列举。同类事物具有相同属性,在注释时就要考虑它们之间的内在联系,考虑在各自条目中描述这些属性的方法及口径,不能顾此失彼,更不能挂一漏万。这里恐怕要提倡举一反三、面面俱到了。
一部曾经获奖的作品,为什么还会有如些之多需要进一步完善的地方呢?其实很正常,词典就是需要不断完善,不断修订,水平才能更高,质量才能更好。我们只是用了更高的标准、更专业的眼光去衡量,去要求,所以才又看到了这些不足。所谓瑕不掩瑜,尽管《新华词典》还存在一些问题需要解决,但仍不失为一部优秀的词典。特别是在当今辞书市场比较混乱的情况下,这部词典能够长销不衰,就已经证明了它的价值。
如果分析出现上述问题的原因,我认为有三种可能:
一是对于学科性较强的类别和条目,编辑由于自身的知识缺乏而过分信赖权威作者。《新华词典》各学科的作者在所属领域都堪称权威,但学科权威不一定是词典编纂的权威,在给条目释义时,他们考虑更多的可能是每一条的准确性,却忽略词典注释的特殊性,特别是相关条目的内在联系;在体例的执行贯彻过程中,往往强调自己的主导性,弱化或忽视体例的指导性。这类问题的出现,主要责任在编辑。如果编辑工作到位,功夫做到家,是可以避免问题的出现或把问题降到最小限度的。(顺便说一下,我曾经做过《新华词典》十年的责任编辑,参与过两次大的修订,上述问题的存在,我自己也难逃其咎。)
其二,词典体例的制订不够细致完善,使作者无所适从。
第三,经过两次修订仍没有解决的问题,除去编辑水平等主观因素外,客观上说明在检查的手段和角度上也存在问题,也许这正是传统修订方法的局限性所在。
过去辞书界有一句名言:“内行人看了不错,外行人能看懂。”这就是一部好辞书的标准。我觉得,仅仅满足于不错是远远不够的,这只是一个基本标准,一个比较低的底线。作为专业的辞书编纂者,专业的辞书编辑,应该严格遵循辞书编纂的原则,合理利用现代化手段,以更高的标准要求和对待每一部词典,这样,所编纂、所编辑的词典才有可能真正成为典范,才会有旺盛而长久的生命力。