设立现代汉语词汇学与词典学国家级大型项目的可行性分析

2020-11-16 08:14李仕春
殷都学刊 2020年3期
关键词:辞书义项现代汉语

李仕春,王 成

(西南大学 文学院,重庆 400715)

与语言学其他学科相比,现代汉语词汇学与词典学研究的主观性很强且涉及到多门学科,所以很难;现代汉语词汇学与词典学研究的兴衰与我们国人的学习生活最是相关——关乎我们是否能够正确认知世界,所以很重要;但是,现代汉语词汇学与词典学的研究很薄弱,“从人才、理论、辞书文本以及产业规模四方面综合取出平均值,我们离辞书强国还有50年左右的距离。”[1]基于上述认识,我们建议国家语言文字管理部门应尽快为现代汉语词汇学与词典学设一大型国家级项目,项目名称可为“基于平衡语料库的现代汉语常用词义项分布研究”。

一、现代汉语词汇学与词典学研究很重要

古今学者都十分重视辞书的作用。郭璞称赞《尔雅》:“诚九流之津涉,六艺之钤键,学览者之潭奥,揔翰者之华苑。若乃可以博物不惑,多识于鸟兽草木之名者。”[2]陆尔奎说:“国无辞书,无文化之可言也。”[3]张志毅说:“辞书大业,惠及天下,功在当代,利在千秋。它是民族思想、科学、文化和语言的结晶,是国运的标志。”[4]在中国辞书史上,不仅学者重视辞书的作用,历代政府也十分重视,从秦汉政府设立“輶轩使者”采集方言词汇并由扬雄编成“悬诸日月不刊之书”的《方言》开始到《大宋重修广韵》到《康熙字典》直至新中国成立周恩来总理亲自指示编纂《现代汉语词典》为止,我们可以看出历代政府对辞书编纂都投入了大量的人力、物力、财力,因此在世界辞书史上,中国古代语文辞书编纂一直走在世界前列。这种成功的秘诀就在于:学者为辞书编纂提供新理念,政府为辞书编纂提供足量的人力、物力、财力支持,为辞书编纂保驾护航,最终保证新型辞书编纂任务的顺利完成。

我们可以从辞书的销量判断辞书在国人学习生活中的重要作用。例如:“《现代汉语词典》自问世以来,发行量大、应用面广,世所罕见,特别是进入新世纪以来《现汉》每年的发行量大概在300万至500万册之间,销售额度在2个亿至4个亿,可见其在国民学习生活中的重要作用,堪称国典,《现汉》编纂水准的高低直关国运!事关你我他!”[4]

我们还可以从国外学者的观点判断辞书在人们学习生活中的重要作用。例如,伊尔森说:“词典就像圣经。”[6]兰多说:“(词典使用者)很可能相信,无论他们在词典中读到的是什么都是绝对真实的。”[5]

二、现代汉语词汇学与词典学研究很薄弱

尽管现代汉语词汇学与词典学研究的学术价值、应用价值很高,但是,当代,特别是语料库时代到来后,我们国家在现代汉语语文辞书编纂方面几乎没有大的动作。国家社科基金重大招标项目是围绕党和国家重大工作部署和实际部门决策需求设立的,其目的是为了加快构建中国特色哲学社会科学学科体系、学术体系、话语体系,因此大都是具有重要决策参考价值和实践指导意义的应用类和跨学科类选题。由此可见,国家社科基金重大招标项目的选题是很有研究价值的,这直接关乎国家学运!为此我们搜集了2010—2019年设立的151项语言学项目,按学科分布如下表:

学科分类少数民族语言文字文字学方言学音韵学语言应用语法学汉语教育汉语史外语研究项目数量3129231076665学科分类外语翻译古汉语词汇学古汉语辞书学神经语言学认知语言学计算语言学语音学语言学史其他项目数量554333213

从上表可以看出,语言学类国家社科重大招标项目的设立具有不平衡性,而这种不平衡性在一定程度上限制了现代汉语词汇学、词典学等语言学分支学科的均衡发展。

设立以来,语言类重大项目已达151项,但是这些项目大多集中在少数民族语言文字(31项)、方言学(23项)、音韵学(10项)、语音学(2项)、语法学(6项)、语言应用(7项)、汉语教育(6项)、外语研究(5项)、外语翻译(5项)、语言理论(认知语言学3项、计算语言学3项、神经语言学3项)、古汉语词汇学(5项)、古汉语辞书学(5项)等相关语言学分支学科,唯独没有现代汉语词汇学、词典学项目。这就在很大程度上制约了现代汉语词汇学与词典学两门学科的发展,以致这两门学科的研究很薄弱,这与两门学科的地位是很不相称的。

我们十余年的研究表明,语料库时代到来后,英语词典编纂者及时抓住了这一历史机遇,他们依靠语料库技术对已有辞书释义进行了大幅度地不间断修改,以致Oxford Advanced Learner’s Dictionary(《牛津高阶英语词典》)第1版和第9版之间的释义相似度仅有7.68%,其结果是英语类中型语文词典在常用词义项划分及其释义用语运用方面更加科学合理,在词典编纂史上实现了里程碑式的跨越发展,成就了英美辞书强国的地位。相反,汉语词典编纂者并没有抓住这一历史机遇,没有及时利用语料库技术对已有辞书释义进行大幅度地修改,证据是《现代汉语词典》第1版至第7版乃至各相邻版本之间的修订幅度并不是很大,以致1978年以来的《现汉》第1版、第7版之间的释义相似度高达85%。因此章宜华(2010)指出:“词典语料库是西方上世纪70-80年代的产物,而我们直到90年代才有这方面的成果发表,而至今大多仍只限于纸上谈兵……在西方谈语料库的建设和重要性已经是个过时的话题。这些都值得学术界和出版界注意。”[6]李仕春(2016)认为:“汉语类中型语文性词典中常用多义词的义项精细度至今依然处在20世纪50、60年代靠语感确定义项的编纂水准,从而导致汉语类中型语文性词典义项的划分比较粗疏、存在义项漏收的情况。”[7]这就最终导致汉语辞书文本存在以下现象:从编纂内容来看,汉语中型语文词典在常用词释义方面漏收了数量不菲的义项、很多释义用语需要修改;从编纂体例来看,与英美辞书强国的文本相比,我国至今还没有一部标有释义提示语的词典、没有一部用释义元语言编著而成的词典、没有一部标注词频的词典、没有一部标注义频的词典、没有一部按词性排列义项的词典、没有一部按义项群排列义项的词典……上述问题的解决都需要依托语料库技术先把现代汉语常用词义项分布情况研究清楚后,再按照不同类型词典(内向型、外向型)的编写要求来收录或编排义项。

正是认识到我们国家现在是辞书大国而不是辞书强国,所以江蓝生[8]、李宇明[9]、苏培成[10]、张志毅[11]、章宜华[12]、王东海[13]等先生纷纷撰文为建设辞书强国出谋划策。

“今天的语料库已经成为能量巨大的语言样本集。它正在印证、充实、修订、改写甚至颠覆以往的辞书释语。它也正孕育出、孕育着更现代,更可信的辞书。”[14]当今,汉语词汇学词典学研究正面临着一个“千百年未有之大变局”的转型时代,其特征是一方面语料库技术的出现为辞书编纂提供了一个千百年未有的机会,另一方面我们日渐强盛的国力也为编纂出精品辞书提供了强大的物质基础。而辞书编纂又是一项公益性很强的项目,因此针对汉语辞书尚未大规模展开用语料库技术编纂的情况,我们建议国家语言文字管理部门应仿照“中华字库工程”(1)“中华字库”工程由中国出版集团牵头,著名学者裘锡圭教授担任首席专家,近30所高校、研究院所和企业参与研发工作,总投资4.4亿元人民币。这项工程以对文字学的深入研究为基础,将建成全部汉字及少数民族文字的编码和主要字体字符库,形成汉字编码体系,重点研发汉字输入、输出、存储、传输等关键技术。完成后的“中华字库”预计可编码字符数在50万左右,能对我国各种出土、传世文献和当代文字作品进行数字化处理,也能够满足社会数字化服务和数字化监管等需要。”“中国语言资源有声数据库建设工程”(2)“中国语言资源有声数据库建设工程”由国家语委在2008年启动。该工程旨在运用现代信息技术,遵循统一的工作规范,将中国各县域的语言实态(包括方言、地方普通话和少数民族语言)记录下来,归档建库,永久保存,以便全面掌握语言国情,保护我国丰富的语言资源和语言文化遗产,未来将进行深入地研究和有效地开发利用。等国家级学术工程,尽快为汉语辞书编纂设立一国家级大型项目,项目名称可为“基于平衡语料库的汉语常用词义项分布研究”,具体研究思路是:在汉语词典的视角下,在已有词典的释义的基础上,运用语料库技术的方法,描写现代汉语常用词义项分布情况,并运用相关语言学理论对常用词的义项分布情况给予解释。

我们近年的一系列研究表明:要想研究清楚“看”“跑”“黄”等现代汉语核心词(根词)的义项分布情况,就需要为每个根词建立含30000条约240万字的单字平衡语料库,进行穷尽性分析,才能得出其在现代汉语中的义项分布情况(如果低于30000条语料,就不宜发现新义项,如果高于这个数字就会做一些无用功)[15];要想研究清楚“跨”“捉”“灰”等2000个现代汉语次常用词的义项分布情况,就需要为每个次常用词建立10000条约80万字的单字平衡语料库;要想研究清楚“绣”“棋”“缝”等非现代汉语常用词的义项分布情况,就要为之建立5000条或2000条语料的单字平衡语料库(3)单字平衡语料库的建立方法参见:李仕春,张锐敏:《单字平衡语料库的建立和应用——以“阴”为例》,亢世勇主编《辞书研究与辞书发展论集》(第四辑),上海辞书出版社2019年版,第232-248页。。

过去,在靠语感编纂辞书的时代,一般通过分析在每张巴掌大的卡片上所容纳的200余字语料的形式研究常用词的义项分布情况;现在,在语料库时代,要想研究清楚常用词在现代汉语中的义项分布情况,需要分析海量语料。由此可见,我们所推荐的课题,无论是从学术价值方面看,还是从其工作量方面看,都是国家级大型项目的级别。

三、现代汉语词汇学与词典学研究的兴盛之路

20世纪中国绝大多数学术大师治学成功的秘籍都在于站在欧美人的肩膀上来审视自己所研究的专业,借以达到取欧美人研究之长补自己研究之短的目的,词汇学词典学研究也是如此。鉴于此,我们推荐课题的总体思路是在充分吸取中国传统语文辞书编纂经验的基础上,借鉴英美辞书强国先进的编纂理念,创立研究现代汉语常用词义项分布情况的学术范式,最后用该学术范式研究清楚现代汉语常用词的义项分布情况。由此可见,我们推荐的课题是一个理论方法与实践并举的综合性课题。

下文,我们按照选题的研究内容、基本思路、总体框架和研究重点难点的顺序,谈谈设立现代汉语词汇学词典学设立国家级大型项目的设想:

(一)研究内容

本课题首先分析汉语常用词义项在汉语中型语文词典编纂中存在的问题,接着探讨描写常用词义项分布情况的最优方法和解释常用词义项分布情况的最优理论,形成研究常用词义项分布情况的学术范式,最后用该学术范式研究清楚现代汉语常用词义项分布情况。

(二)研究思路

本课题按照“发现问题”“分析问题”“解决问题”的思路展开研究。

首先,运用文献考证法研读汉英中型语文词典及其相关文献,概括出英语多义词的义项分布模式和释义模式,摸清汉英词典中的编纂现状,确定汉语词典在多义词释义方面存在的主要问题。

接着,针对汉语词典编纂中遇到的问题,有针对性地阅读词汇学词典学史上的相关经典论著,在世界范围内探索描写现代汉语多义词的最优方法和解释现代汉语多义词义项分布情况的最优理论。

最后,把这些理论和方法运用到现代汉语多义词义项分布情况的描写和解释中去,解决汉语辞书编纂存在的问题。具体步骤是:(1)以个案研究的形式描写清楚每个多义词的义项分布情况。(2)以系统研究的形式总结出同类词的义项分布模式和释义模式。

(三)总体框架

本课题拟将总体框架设计为上中下三篇。上篇主要探讨多义词研究的现状,中篇探讨描写多义词义项分布情况的最优方法和解释多义词义项分布情况的最优理论,下篇运用中篇所介绍的方法和理论对现代汉语中有代表性的多义词的义项分布情况作重点研究。具体如下:

(1)常用词研究现状的探讨

因为各类现代语文词典是收录常用词义项的主要载体,所以本部分主要在汉英中型语文词典的视角下,运用比较的方法研究常用词义项在汉语中型语文词典中的编纂现状。本部分首先以量化的形式论证:“目前我国汉语类词典的编纂者乃至研究现代汉语词汇的学者还没有大规模地运用语料库技术对汉语多义词的义项进行丰富与补充,汉语类词典中常用词义项的编纂水准至今仍处在20世纪50、60年代靠语感编纂的水准。因此,相对于以往辞书中多义词靠语感编纂的情况来讲,充分利用语料库资源和计算机强大的计算功能来统计并分析每个多义词的义项在现代汉语中的分布情况,是一座非常诱人的学术富矿,有着巨大的挖掘潜力。”[16]接着,运用文献考证法研读汉英中型语文词典及其相关文献,概括出英语多义词的义项分布模式和释义模式,摸清汉英词典中的编纂现状,确定汉语词典在多义词释义方面存在的主要问题:一是漏收、误收、多收义项;二是由于在释义用语方面“以词释词”的现象比较多,以致汉语词典中某些多义词的释义存在与日常生活经验相违背的现象。

(2)常用词研究方法和研究理论的探讨

针对汉语词典编纂中存在的问题,有针对性地阅读词汇学词典学史上的相关经典论著,在世界范围内探索描写现代汉语常用词的最优方法和解释现代汉语常用词义项分布情况的最优理论。

我们拟从以下几方面探索研究常用词义项分布情况的最优方法:①探讨义项分布研究作为一种学术范式在词义研究的可行性及其具体实施方法。②探讨语料库技术与词典编纂相结合的具体方法。③探讨运用类型学研究不同语言中对应词义项分布的共性特征与个性特征的方法。④探讨按照同场同模式原则研究同类词的义项分布模式和释义模式的方法。

“语言研究的理想状态就是在描写清楚语言现象的基础上再解释清楚。”[17]当我们用语料库技术的方法描写出常用词义项分布情况后,还要用合适的理论对其义项分布情况解释清楚,因此本部分重在寻找合适的理论解释常用词义项的衍生原因。我们首先以世界性的眼光梳理了欧美、俄罗斯和中国学者的词义研究史,指出:国外无论是以菲尔墨为代表的欧美学者,还是以阿普列相为代表的俄罗斯学者,在20世纪70年代就开始从共时角度解释常用词义项分布情况。

(3)常用词义项分布情况的研究

本部分主要实践本课题所介绍的理论和方法。以个案研究和系统研究相结合的形式着重探讨现代汉语中常用词的义项分布情况,既要描写清楚现代汉语中每个常用词义项的分布情况又要解释清楚每个常用词每个义项的成因,在此基础上,再概括出每类常用词的义项分布模式和释义模式。本部分是主体,又可分为以下三部分:“基于平衡语料库的现代汉语常用动词义项分布研究”“基于平衡语料库的现代汉语常用名词义项分布研究” “基于平衡语料库的现代汉语常用形容词义项分布研究”。

根据有关字频、词频的统计材料,我们确定常用词的数目在3500个左右,这些词的特点是构词能力强、使用频率高。在“同场同模式”理论的指导下,我们把选好的词系联为3大语义场:动作、名物、性状,然后每类义场再进一步细分。具体如下:动作词的次小类包括上肢类动作、下肢类动作、视觉类动作、言语类动作、心理活动类等;名物词的次小类包括动物类、植物类、人体器官类、山川类、江河类等;性状词的次小类包括颜色类、品性类、形貌类等。

每类词的研究思路:以颜色词为例。第一步:首先比较黑(black)、白(white)、红(red)、黄(yellow)、绿(green)等汉英对应颜色词在汉英中型语文词典中的释义异同;第二步:利用语料库技术的方法以个案研究的形式分别描写出黑、白、红、黄、绿等词在现代汉语中的义项分布情况。第三步:运用框架语义学等相关理论解释清楚每个颜色词的义项分布情况的成因。第四步:以“同场同模式”理论做指导,运用系统的方法归纳出颜色类词的义项分布模式和释义模式。

按照上述研究步骤,不但可以研究清楚现代汉语常用词的义项分布情况,而且还可以研究清楚近代汉语常用词的义项分布情况、中古汉语常用词的义项分布情况、上古汉语常用词的义项分布情况,最终为编纂出汉语大中型语文辞书服务。

(四)研究重点难点

(1)释义是辞书的灵魂。黄建华先生明确指出:“现代语文词典应是句子词典。”[18]张志毅先生更是以《柯林斯COBUILD》《牛津高阶》等英语词典为例,倡导不要“以词释词”,要“使用短语或完整句子释义”[21]。但张志毅先生指出“以词释词”在汉语辞书文本中的主要表现形式是“同义对释、反义加否定、分释素义、二三词组合释义”,这种情况在“《现汉》中的占比是39.71%”[1]。因此,本课题的研究重点是参照现代英语词典中多义词的释义方式,词典学方面形成以词典用户为中心的现代释义理念,在常用词义项描写方面,本课题采用描述性话语,也即以“短语释义”或“句子释义”的形式描写出现代汉语多义词的义项。

(2)常用词义项的产生是一种很复杂的语言现象,它既有客体、主体、语言因素也有文化因素,而框架语义学理论则能够有效地把这些因素统摄在一起进行综合研究,因此本课题的研究难点是运用具有多维度特征的框架语义学理论解释清楚常用词义项的形成原因,在词汇学方面形成从共时角度研究词的义项分布的学术理念。

四、结语

总之,本课题所开创的学术范式以定量定性相结合的形式来建构可量化、可比较的指标体系,有利于研究清楚现代汉语常用词的义项分布情况。这从理论和方法方面为研究清楚现代汉语常用词的义项分布情况提供了新思路,为常用词在汉语中型语文词典中的科学释义提供了保证,为推动汉语词汇学词典学研究的现代化进程作出了一定贡献。

猜你喜欢
辞书义项现代汉语
CISHU YANJIU LEXICOGRAPHICAL STUDIES
一起来吹牛
大型辞书疑难字考释七则
“大力士”纸片人
山西省2019年专升本选拔考试 现代汉语
山西省2018年专升本选拔考试 现代汉语
两用成语中的冷义项
中国辞书学会第五届领导成员名单
中国辞书学会第四届领导成员名单
高考英语短语分类展播