李志明
摘 要:由商务印书馆2002年出版的《古今汉语词典》是一部有着极高使用价值、适合不同文化层次人群需要、并被广泛接受的工具书。然而这样一部扛鼎之作依旧存在一些瑕疵。对此,笔者尝试以汉字“文”为例,从义项释义的准确性、全面性、序列性三方面出发,结合语料库技术及统计学相关原理,探析其在编纂中出现的若干问题,并给出相应建议。
关键词:《古今汉语词典》 义项语料库技术统计学原理建议
一、引言
由商务印书馆2002年出版的《古今汉语词典》是一部体大虑周之作。然而这部扛鼎之作依旧存在一些瑕疵,在此笔者以汉字“文”的释义为例,怀高山仰止之心情抱愧指瑕,并真诚希望此部《古今汉语词典》能尽善尽美。
二、关于义项释义的准确性
《古今汉语词典》中的单字“文”的释义如下所示:
文wén?彩色交错。 [例]五色成~而不乱。(《礼记·乐记》) [△]~绣。?纹理,花纹。仲子生而有~在其手。(《左传·隐元年》) [△]~马/~龙/~车。?刺画花纹。 [例]披发文身(《战国策·赵二》)?字,文字。 [例]于~,皿虫为蛊。(《左传·昭元年》)|谁又会识字解~地懂道理。(王统照《山雨》)|识~断字|说~解字 [△]~盲/~本/~改 [△]汉~/铭~/篆~/甲骨~。?指礼乐制度等。 [例]文王既没,~不在兹乎?(《论语·子罕》)|儒以~乱法。(《韩非子·五蠹》)|繁文缛节。?文章,作品。 [例]醉能同其乐,醒能述以~者,太守也。(宋·欧阳修《醉翁亭记》)|大伯伯还出了题目要姐夫做~。(巴金·《春》)|~不对题|奇~共赏 [△]~选/~集/~笔/~库/~风 [△]回~诗 [△]论~/议~/散~/作~/杂~/小品~。?文采,华丽。 [例]君子质而已矣,何以~为?(《论语·颜渊》)?文才。 [例]且晋公子敏而有~。(《国语·晋四》)|周勃重厚少~。(《汉书·高帝纪下》)?法令条文。 [例]有不享则修~。(《国语·周上》)|舞~弄法。10文雅,柔和。 [例]此名士之子,温文尔雅。(《聊斋志异·陈锡九》) [△]~静/~弱/~火/~绉绉/ [△]斯~。 [?]非军事的。与“武”相对。 [例]武不可觑,~不可匿。(《国语·周中》)|你这小人家,敢和我这老人家比试比试?是~是武,动手劲还是动心劲?(孙犁《风云初记》)|能~能武 [△]~职/~官。 [?]指社会科学。 [例]他在大学里是学~的。|重理轻~ [△]~科。 [?]自然界的某些现象。 [△]天~/水~/地~。 [?]文言。与“白话”想对。 [例]这本书是半~半白的风格。 [?]量词。旧时铜钱一枚称一~。 [例]可以钱二十八~埋宅四角,可以免灾。(《宋书·徐羡之传》)|一~钱|一~不值。 [△]分~。 [?](旧wèn)掩饰,粉饰。 [例]小人之过也必~。(《论语·子张》) [?](旧wèn)修饰。 [例]《小雅》之所以为《小雅》者,取是而~之也。(《荀子·儒孝》) [?]姓。春秋时越有文种。
对于上文汉字“文”的释义,笔者存疑之处有三:
(一)第?条义项其例词“文绣”似不准确。通过对相关资料的查阅,“文绣”一词至少有五种含义。
(1)《管子·小匡》所载“食必粱肉,衣必文绣,而戎士冻饥。”此处“文”确如《古今汉语词典》所引有“色彩交错”之意。
(2)《汉书·文帝纪》所载“身衣弋绨,所幸慎夫人衣不曳地,帷帐无文绣,以示敦朴,为天下先。”此处“文绣”则指汉代一种刺绣技术,当其解释为“刺绣”时,“文绣”作为例词置于第?条义项后是合理的。
(3)王国维所作《文学小言》载“故文绣的文学之不足为真文学也,与哺餟的文学同。”其“文绣”之意为“辞藻华丽”,作为例词,其置于第?条义项后亦是合理的。
(4)以“文绣”为名姓古代不乏其人,“文”作为姓氏置于第 [?]条义项之后仍是合理的。
(5)在当代,“文绣”更多的指的是一种美容技术。
综上所述,“文繡”一词意义繁多,当其作为例词解释义项时,倘若不给出具体语境,则易使读者产生误读。
(二)第?条义项“纹理,花纹”其例文似不合适。“仲子生而有文在其手”出自《左传·隐元年》,其文如下:
宋武公生仲子,仲子生而有文在其手,曰“为鲁夫人”,故仲子归于我。
对于该史料中“文”字的释义,自古以来众说纷纭。杨伯峻先生《春秋左氏传》释云:
“文”即字,而先秦书未有言字者。
《春秋左传词典》中“文”字的释义第一义项即为“字”,引用例文为闵公二年:
“有文在其手曰‘友句。”
此处虽未以“仲子”句为例文,但此彼互证,编者亦认为“文”为“文字”之意。其另一种说法即如《古今汉语词典》释为“花纹、纹理”之义。《春秋经传集解》杜注:以手理自然成字,有若天命,故嫁之于鲁;《左传正义》孔疏:以其手之纹理自然成字,有若天之所命使为鲁夫人然,故嫁之于鲁也(1)。由此可见,杜预与孔颖达均将“文”释为“纹理”,以手之“纹理”若“字”,亦有合理之处。
然而不管怎样,“仲子有文在其手”其“文”释义自古以来即存有争端。《古今汉语词典》的编纂应当秉持客观公正之原则,以众说纷纭之句做例证则有失严谨。
(三) 第 [?]条义项的例句表述似与前文不符。“春秋时越有文种”应当表述为“春秋时越有~种”,与前文保持一以贯之的表述方法似更妥帖。
三、关于义项释义的全面性
由于关于古代汉语的历史分期问题存在争议,对此我们采用当前通用的分期方式,按照上古(先秦两汉)、中古(魏晋至唐五代)、近古(宋至五四运动前期)、现当代(五四以来)四个时期进行义项的调查,笔者通过运用北京大学中国语言研究中心语料库,在中国浩如烟海的文献资料中,运用统计学相关原理:首先根据所要抽取的样本数,对每个时期的所有语料进行分层,以确定抽样距离,然后根据抽样距离对每一层内的所有语料进行抽样,最后进行字义收集整理分析。
通过上述方法,每个时期随机抽取50条语料,四个时期共抽取200条语料,通过对所收集语料的整理分析,发现总结出的义项远远多于《古今汉语词典》中所给出的18条义项。
义项调查结果如下:
表一:古今释义汇总
表二:释义汇总及其例证
运用语料库技术对大量文献资料进行整理汇总,并结合统计学原理进行数据统计,不难发现,在中国汉语言发展的历史进程中,汉字“文”的常用义项至少有28项。
四、关于义项释义的序列性
对于含有多个义项的单字,其义项排序尤为重要,合理的排序方式能够使读者在查询时一目了然,降低查询难度。
《古今汉语词典》的单字义项排序方式则稍显混乱,纵观汉字“文”的18条义项的排列顺序,主要按照上古、中古、近古、现当代的时间先后顺序,但并不严格。例如根据表格1,《古今汉语词典》中的第?条义项“字,文字”是在中古时期才被广泛使用,而第?条义项“文采,华丽”则在上古时期就已广泛存在,则第?条义项应当排在第?条义项之前。
针对此上等问题,笔者结合语料库的统计结果,尝试提出更加合理的义项排序方式,其排序方式步骤如下:
(一)对义项词性进行分类。主要可分为动词、名词、形容词三大类。以汉字“文”的义项为例,结合语料库统计结果,将28条义项首先分为三类,其中,“文”作为量词以及姓氏时可单列两类,总共五类,为词义查询创造便捷。
(二)每一词性大类下的义项依旧需要进行分类。此时义项根据统计结果按照上古、中古、近古、现当代的时间先后顺序分为四类,分类的依据是每一个义项在某一时期的使用概率大小。例如第?条义项“字,文字”,尽管在上古时期这种用法就已经出现,但是根据统计,其广泛使用是在中古时期,故将其归于中古时期的义项。
(三)对各义项结合其在各时期的使用概率进行分期以后,则需要对每一时期下的义项进行具体排序。此时可以根据每一义项的使用概率大小进行排序。例如同属于上古时期义项“色彩交错”和“花纹,纹理”,根据表格1,“花纹,纹理”的使用概率为7.0%,而“文辞才华”的使用概率为4.0%,则“花纹、纹理”的义项应当排在义项“色彩交错”之前。
综合以上三步,以表格形式呈现排序结果如下:
五、结语
在本文中,我们通过语料库技术结合统计学相关原理,以汉字“文”的释义为例,对《古今汉语词典》的编纂提出了義项的准确性、全面性、序列性三个问题,尤其是针对义项排序的问题,我们根据统计结果提出了一套行之有效的方法。这样一来,相信无论是对编者的编纂,还是对读者的阅读都能够提供更大便捷。
表三:义项排序
其中关键在于现代词典的编纂应当结合现代网络技术,例如语料库技术。对于编纂者而言,一方面,可以短时间内获得大量语料,对相关义项的总结更加全面,另一方面,可以使义项的排序更有章法,更有条理;对于阅读者而言,层次分明、一目了然的义项分类和排序能够降低人们的查询难度,同时,清晰明了的义项呈现方式更加能够满足读者的阅读享受,获得良好的阅读体验。
参考文献
[1] 薛亚军.《左传》“仲子生而有文在其手”句考辨[J].文教资料,1999-10-15.北京大学中国语言中心CCL语料库检索系统(网络版):http://ccl.pku.edu.cn:8080/ccl_corpus/.