刘善涛 王晓
[摘 要] 民国时期为我国汉语语文辞书古今转型的关键时期,《王云五大辞典》是该时期第一部采用现代汉语语法体系为字词标注词性的白话词典,本文对《王云五大辞典》的词类划分依据和词性标注特点进行了较为系统的剖析,并与其他代表性辞书的词性标注加以对比,总结《王云五大辞典》在词性标注理念的时代创新性,也指出其字词词性标注中存在的不足,供当前的辞书编纂参考借鉴。
[关键词] 汉语语文辞书 《王云五大辞典》 词性标注 词典对比
[中图分类号]H06 [文献标识码]A [文章编号]1000-3541(2020)01-0099-08
王云五在民国时期主持商务印书馆25年,为中国近代文化和汉语辞书编纂做出杰出贡献[1]。他主编的《王云五大辞典》(以下简称《大辞典》)[2]《王云五小辞典》《王云五小字汇》《中山大辞典“一”字长编》《王云五新词典》等一系列语文辞书,涵盖了字典和词典,普通语文词典和新词语词典,小型、中型、大型甚至巨型辞书的不同类别。而《大辞典》出版时间最早、最完整、最具代表性,也是我国第一本进行词性标注的现代语文词典,它处于《辞源》(1915年)之后,《国语辞典》(1937—1945年)、《新华字典》(1953年)、《现代汉语词典》(1960年)之前,处于中国语文辞书由传统到现代过渡的关键环节,为知识的普及和汉语语文辞书的现代化做出贡献,本文即以此为主要分析对象。
中国传统小学研究较多地关注汉字形音义方面的考释和训读,元代以后开始有学者关注古汉语虚字的研究,但没有形成系统的汉语语法学,也很难在辞书中进行明确的词性标注。明末传教士入华使欧洲学人得以用一种全新的域外视角重新审视汉语和汉字。1592—1593年间,多明我会传教士胡安·柯伯(Juan Cobo)《汉语语法》(Arte de la Lengua China)是迄今发现记录在案的最早汉语语法著作,惜已失传。1682年,瓦罗(Francisco Varo)西班牙文《华语官话语法》是流传至今的最早汉语语法著作,书中根据古典拉丁语法的词类范畴将汉语词分作九个词类[3]475。之后,其他传教士也编写了一些汉语语法著作,由于各种原因,当时并未引起中国学者的注意。
我国学者对汉语词类的系统研究始于《马氏文通》,但该书以古代汉语为研究对象,词类研究实为对字的语法分类。我国第一部系统完整的现代汉语语法著作为黎锦熙的《新著国语文法》,该书在总结归纳国语语法特点的基础上,形成了一套影响深远的教学语法体系[4]。
一、《大辞典》的词类划分依据
民国政府成立后,白话文运动逐步展开,古汉语语法研究已不合时用。孙中山积极倡导言文一致的白话语法研究,为推进教育、启发民智服务,“所望吾国好学深思之士,广搜各国最近文法之书,择取精义,为一中国文法,以演明今日通用之言语,而改良之也。夫有文法以规正言语,使全国习为普通知识,则由言语以知文法,由文法而进窥古人之文章,则升堂入室,有如反掌,而言文一致亦可由此而恢复也”[5]。由此,对国语语法的研究逐渐得以重视,胡适《国语文法概论》(亚东图书馆1922年版)从宏观上指出了国语文法研究的重要性,黎锦熙《新著国语文法》在参照纳斯佛尔德(Nesfield)《英语语法》的基础上创建了以“句本位”为体系的语法系统,标志着现代汉语语法研究系统的初步建立,对汉语语法研究的深入和语法知识的普及起到积极作用。
汉语本体研究只有付诸语言实践才能体现其应用价值,辞书作为语言系统中不同词汇单位的集合,能够较为全面地展现汉语词类的分布状况,对汉语语法知识的普及和语言应用能力的提高都有所助益。同时,语言实践活动对本体研究成果的采用还呈现出一定的滞后性,就汉语辞书的词性标注而言,陆尔奎在主编《新字典》之初曾欲标注词性,“近来新编字典,每字每义标举名代动静等品词,本书初稿亦循是例”(《例言》),但终因语法理论研究和辞书编纂实践的不成熟而被迫放弃,“惟东西文化有语尾变化,应用既异,则字母因而增减,我国字体一成不变,虚字实用,实字虚用,殆少不可通者,无用强为分析,故属稿及半,即行削去,非矫同立异也”,陆尔奎所谓“强为分析”“矫同立异”的缺陷在后世辞书中也有所体现。
自《马氏文通》出版近30年后,我国产生了第一部标注词性的白话学生字典《(词性分解红皮新式)中华字典》(简称《中华字典》)[6],《大辞典》则为我国第一部为字词标注词性的白话词典。两书虽然都为汉字标注词性,但所采用的词类划分系统不尽一致,前书采用马建忠的词类系统,后书基本上采用黎氏的词类系统。王云五在《编辑凡例》中对该书词类状况进行了简要介绍:
(四)本書單字均分別詞性,加以解釋,詞性略語如下:
名=名詞動=動詞 代=代名詞 形=形容詞
副=副詞接=接續詞 前=前置詞歎=感歎詞 助=語助詞
黎錦熙在《新著国语文法》中将汉语词也分为九类,九种词类之下含有不同的子类。《大辞典》在“编辑凡例”中虽然没对词类划分依据进行说明,但在附录11中专设“国语文法表”,两相对照可以看出除了在介词、连词的命名上王云五分别称作“前置词”“接续词”,在词语小类的划分上有细微差异外,王云五和黎锦熙的词类划分大体一致,可以说《大辞典》的词类标注体系以黎锦熙为基础,一方面,显示出黎锦熙语法在语言研究中的影响,另一方面,也反映出王云五辞书在词类划分中密切结合最新的研究成果,积极采用最能体现白话语法体系的词类系统,为白话文运动和国民教育服务。
二、《大辞典》词性标注的特点
我们对《大辞典》加以抽样分析,方法是《大辞典》正文共计1384页,每隔14页抽取1页,共得99页,其中所包含的字头及其所统领的词目为代表样本,为本研究建立了适量的封闭域。经统计,数据库中《大辞典》共收条目4288条,其中,单字格665条,占总数的15.51%,如“嬴、糗、丫”等;双字格数量最多,共2842条,占总数的66.28%,如“让步、谆谆、浦江”等;三字格429条,占总数的10%,如“店小二、话匣子、新西兰”等;四字格318条,占总数的7.42%,如“齐大非偶、新陈代谢、五卅惨案”等;五字格23条,占总数的0.61%,如“庐山真面目、新石器时代、启罗立脱尔”;六字格7条,占总数的0.16%,如“一不做二不休、新达尔文学说、一等有期徒刑”;七字格和八字格各有2条,各占总数的0.05%,如“一失足成千古恨、威斯特法里亚和议”。依此比例可以推断《大辞典》中收字九千左右,收词五万左右,比《现代汉语词典(试印本)》(1960年)四万余条的收词量略高。
(一)对逐字标类原则的贯彻
如《编辑凡例》所述:“本书单字均分别词性”,这包含两层意思:一是没有释义的字头都没有标注词性;二是单字不区分其意义和用法,只要有注音和释义就予以词性标注。《大辞典》中只列字头,没有释义的情况分为两种:一是异体字;二是四角号码容易检错的字。《大辞典》将使用频率不高的异体字立为副条,在副条条目之后只用“=”关联出该字的正条形式,在正体字目下予以注音和释义,并标注词性,此类副条异体字不再标注词性。经统计,数据库中共有异体字51组,包含102个单字,占单字条目总数的15.34%,如“驘=骡、箇=个”等。
《大辞典》出版之时,四角号码检字法公布不久,再加之该检字法多次修订,使用者对这种方法还不太熟练,存在检错的现象,因此王云五为了读者查检的方便,就在某些汉字易检错的号码下也将该字立为字目,后面用“见”字标明该字的正确号码,方便读者查检。这类字在《大辞典》中也没有标注词性,经统计,在数据库中该类字共36个,占单字总量的5.41%。
除了上述两类情况,所有字头均标明词性并释义。根据汉字在构词中的表义作用可将汉字分为有义汉字、无义汉字和弃义汉字[7],有义汉字一般对应汉语中的语素,包括自由语素和粘着语素,辞书对有义汉字标注词性可以展现语素的构词作用和语法意义,对于全面理解字目意思极为必要。对于一些不能独立使用、只起构词作用的弃义汉字或无义汉字来说,词性标注和对单字的释义就显得有些不妥。《大辞典》在编纂中已经注意到此类汉字不能独立成词的特点,如:
16600硇(鐃)ㄋㄠˊNau
[名]硇砂=綠化錏鑛物,易溶於水,加熱則變氣體,可作工業原料。
16600砂(沙)ㄕㄚ Sha
[名]極碎的石。
46410妲(達)ㄉㄚˊ Dar
[名]妲己=殷紂的妃名。
17717己(幾)ㄐㄧˇJii
[代]自身,(例)舍己從人。
[名]記時符號“天干”的第六位。
26211貔(皮)ㄆㄧˊPyi
[名]貔貅=猛獸,(喻)勇士。
24290貅(休)ㄒㄧㄡShiou
[名]貔貅=猛獸,(喻)勇士。
99011恍(慌)ㄏㄨㄤˇ Hoang
[副]恍惚=不清楚的样子。
97032惚(呼)ㄏㄨ Hu
[副]恍惚=看不清楚的情形。
《大辞典》在释义中往往先列出这类汉字所构成的词语,然后对词语进行整体释义,上例中“硇砂”的“硇”、“妲己”的“妲”都是无义汉字,《大辞典》的处理与有义汉字“砂”“己”有所不同。单纯词“貔貅”“恍惚”等中的汉字都不能独立使用,《大辞典》则在每个汉字下都列出所构词语,在不同字头下对同一词语进行重复释义。可以看出,《大辞典》对于无义汉字的词性和义项标注考虑到该字的构词作用,对此类字的词性标注和词义解释也即对该字所构词语的词性和义项说明。由于编者语言观和辞书编纂经验的不足,《大辞典》在处理此类汉字时还存在明显的缺陷,首先是无义字和有义字在编纂设计中的区分不够明显,如“叩”释为“[动]叩头=以头触地,系旧日的最敬礼”,这就使有义字“叩”在设计体例上与上述无义字没有形成有效的區分。《大辞典》在每个无义字下都列出所构词语,并标明词性和义项,造成了辞典编纂空间的浪费,可以利用“参见”加以关联。
(二)一字多类、一字兼类现象突出
马建忠(1898年)从意义的角度出发,认为“字无定义,固无定类”,主张“依义定类,随义转类”,字义不同,词性也不尽相同。黎锦熙(1924年)则主张“依句辨品,离句无品”,“国语的九种词类,随它们在句中的位置或职务而变更,没有严格的分业”[4],二人都主张宽泛意义上的“词无定类”。受汉语本体研究的影响,《大辞典》在编纂中“一字多类、一字兼类”的现象比较突出。除了异体字和四角号码易错字不标注词性以外,《大辞典》对剩余字目一律标明词性和义项。根据辞典对字头词性的标注类型,以及词性与义项的对应关系可分为如下四种情况:
1.一字一类,即字头下只有一个词性,这又可分为两小类:
(a)单性单义,即所立字目只标注一个词性和义项,此类字头共有279个,占字目总数的41.95%,如:
00217廬(盧)ㄌㄨˊ Lu
[名]屋舍。
27220勿(務)ㄨˋWuh
[副]不要,(例)非禮勿言=不要說非禮的話。
91547叛(判)ㄆㄢˋPann
[動]離背,(例)群臣離叛。
(b)单性多义,即所立字目只有一个词性,但词性之下对应多个义项,此类字头共有125个,占字目总数的18.8%,如:
00261店(電)ㄉㄧㄢˋDiann
[名]1出賣貨物的鋪戶。2旅館。
22947緩(歡上)ㄏㄨㄢˇHoan
[形]1舒遲,(例)緩急。2寬的。
64065嘻(西)ㄒㄧShi
[歎]1悲歎聲。2驚懼聲。
2.一字多类,即所立字目有多个词性,不同词性之下对应数量不等的义项,此类字头共有129个,占字目总数的19.4%,其中,两个词性的字头112个,三个词性的字头16个,四个词性的字头1个,如:
00217贏(盈)ㄧㄥˊYng
[形]有餘的。
[動]得勝。
00222序(緒)ㄒㄩˋShiuh
[名]1東西的房屋,(例)兩序。2古代的學校,(例)庠序。3先後的順次,(例)次序。4總括全書概要,排在書籍起首的文,(例)序文。
[参 考 文 献]
[1] 周荐.文化达人王云五对汉语辞书学的贡献[J].河北师范大学学报:哲学社会科学版,2013(6).
[2]王云五.王云五大辞典[K].上海:商务印书馆,1930.
[3]姚小平.现存最早的汉语语法著作:瓦罗著《华语官话语法》简介[J].中国语文,2001(5).
[4]黎锦熙.新著国语文法[M].上海/北京:商務印书馆,1924/1992.
[5]孙中山.建国方略之一:心理建设,1918;又见建国方略[M].中华书局,2011.
[6]黄钟瀛.词性分解红皮新式中华字典[K].上海:世界书局,1927.
[7]周荐.论词的构成、结构和地位[J].中国语文,2003(2).
[8] 孙全洲,主编.现代汉语学习词典[K]. 上海:上海外语教育出版社,1995.
[9] 李行健,主编.现代汉语规范字典[K].北京:语文出版社,1998.
[10] 郭良夫,主编.应用汉语词典[K]. 北京:商务印书馆,2000.
[11]李行健,主编.现代汉语规范词典[K].北京:外语教学与研究出版社,语文出版社,2004.
[12]中国社会科学院语言研究所词典编辑室.现代汉语词典:第5版[K].北京:商务印书馆,2009.
A Research on Part-of-Speech Tagging about Chinese Dictionaries in Republican Period ——Taking “Wang Yunwus Dictionaries” As An Example
Liu Shantao Wang Xiao
Abstract: The period of the Republic of China is a crucial phase for the transformation of Chinese language dictionaries from ancient to modern times. Wang Yunwu Dictionaries is the first vernacular dictionary in the history of modern Chinese dictionary that uses the modern Chinese grammar system to mark the part of speech.This paper analyzes the base of word-class-diving and the features of part-of-speech tagging systematically, we also compare it with other typical dictionaries, summarizing the innovation of tagging idea, and pointing out the insufficiency which could be used for reference in current lexicography.
Key words: Chinese dictionaries Wang Yunwu Dictionaries part-of-speech tagging dictionaries comparison