中医汉语词汇大纲研制及三种词汇大纲在中医汉语教学中的比较研究

2020-06-04 12:24吕玉仙
现代语文 2020年3期

吕玉仙

摘  要:中医汉语词汇大纲以南京中医药大学国际教育学院境外班第一学期的教材为语料库,从实用性出发,针对留学生的专业需求,用人工筛选配合分词软件的方式研制而出。以大量的详实数据进行比较研究,对新HSK词汇大纲以及《实用中医汉语》系列教材的词汇表和中医汉语词汇大纲的异同进行客观细致的描写,分析了三者的各自特点。通过《实用中医汉语》和中医汉语词汇大纲的对比分析,可以发现,新HSK词汇大纲作为通用型词汇大纲偏重于普适性,中医汉语词汇大纲更具有专业性,同时更注重留学生对专业教材的书面阅读理解能力。《实用中医汉语》教材使用的文艺型语体并不适合已进入大学专业学习的留学生。

关键词:专业型词汇大纲;中医汉语词汇大纲;中医汉语教材;中医汉语教学模式

一、问题的提出

目前各个大学在招收本科生时,对中医专业留学生汉语的要求是一般要通过新HSK5级。因此,大部分来华学习中医的留学生的培养计划和课程安排分为两个部分,第一部分是语言教学,即汉语课程;第二部分是专业教学,即中医课程。可以说,作为一种工具,语言教学对留学生深入了解中医是必不可少的。没有相应的汉语基础,留学生很难掌握中医中的相关概念。然而调查发现,即使通过了新HSK5级,留学生在正式的专业学习中仍面临着一定的语言问题。

一些学者在相关研究中也探讨了造成这种局面的原因。如苏新春认为,“由于对外汉语教学的针对性很强……因此,希冀用一种对外汉语教学用词表来应用于对外汉语教学的一切方面,显然也是不现实的。因此,应该将对外汉语教学词表进行通用型与领域型的分工……”[1]。就目前状况来看,留学生专业汉语学习采用的评价参考体系是HSK词汇大纲这类通用型词汇大纲,进入中医专业学习显然更适合采用中医领域型词汇大纲。再看其他专业的汉语,如在来华留学生数量较多的经济学专业,已出现了相关的商务汉语词汇大纲、BCT(Business Chinese Test)考试,甚至还有分级阅读的相关研究[2]。尽管包括南京中医药大学汉语培训中心在内的各院校语言培训部门会为进入专业学习的留学生开设中医汉语课程,国内也相继出版了一些中医汉语教材,但是作为基石的中医汉语词汇大纲研究却少之又少。

由于没有中医汉語词汇大纲作为强力支撑,在中医汉语教学过程中,我们发现,相关教材还存在着一些较为突出的问题。

首先,整套教材的词汇设置并没有遵照循序渐进的原则。中医汉语教材的编撰往往由本专业的专家学者担任,这些教材更注重中医概念的教学顺序,导致教材中靠前的课文会出现词汇难度为新HSK6级甚至级别更高的词汇,给学生的理解造成很大困难,需要汉语教师花费大量时间予以解释。而靠后的课文中的词汇,有时又只有新HSK2级、3级的水平,学生无法进一步提高自己的阅读水平。

其次,中医汉语教材的词汇和学生专业实际使用的词汇重合比例过低。有些学生提出,在进入专业学习的第一个学期,即使学习了中医汉语,仍然有相当数量的词语不认识,以至于对老师的授课不能完全理解。

与此同时,留学生本身掌握的汉语词汇量则是相当匮乏。钱玉莲曾对92位韩国学生的中文阅读学习策略进行了调查,结果显示,有68%的学生认为,汉语学习中最困难的是词汇少[3]。作者还指出,这一调查结果与刘颂浩[4]的研究结论一致,即第二语言阅读难在语言。在专业汉语学习中,这种现象也是特别突出。可以说,词汇尤其是专业词汇已成为留学生汉语学习中的最大障碍。

总之,从目前专业汉语教学的实际状况、留学生学习的实际需求来看,都亟需一个合适的、相对精准的中医汉语词汇大纲。它不仅可以为中医专业的留学生提供很大的便利,也可以为中医汉语教材的撰写提供一定的帮助,还能为今后建立中医汉语分级制度提供有益的参考。幸运的是,在目前的大数据时代,海量文本的提取和频率统计已成为可能。本文通过对南京中医药大学中医汉语相关教材的统计分析,力图研制出一个更适合留学生的中医汉语词汇大纲;同时,将它与通用型词汇大纲、目前使用的中医汉语教材的课后词汇表进行比较,分析三者之间的异同;在这一基础上,进一步提出相应的中医汉语教学方案,并将在今后的汉语预科班的中医汉语课程中进行实践。

二、中医汉语词汇大纲的研制

(一)中医汉语词汇大纲的适用对象

南京中医药大学是全国建校最早的高等中医药院校之一,也是首批获准接受和培养留学生的中医药高等院校之一。2017年9月至2018年6月,在我校国际教育学院学习的港澳台地区的学生及外国留学生近1400人,其中,进入中医专业学习的留学生有200多人。中医汉语词汇大纲适用于即将进入中医专业学习的留学生,目的是帮助这些学生能够顺利进入中医专业,扫清他们专业学习中的语言障碍。

(二)中医汉语词汇大纲词语数目的确定

南京中医药大学国际教育学院(下简称国教院)境外生班,2016年第一学期的课程设置,具体如表1所示:

从表1可以看出,来华留学生中医专业第一个学期的教学内容主要为四门课程,四本教材的字数分别为57.1万、50.4万、59.9万、38万。笔者对上述四本教材进行了扫描,通过软件自动识别文字,并经过人工校对后,得到四本中医教材的电子文本。接着采用Python语言编写代码,利用包含12842116个词的词库对其进行分词和词频统计[5]。我们使用的分词软件由北京汉语国际推广中心和北京师范大学中文信息处理研究所共同研发。在去除标点符号和英文字符后,获得所有中文的词频统计结果,将其汇总后就得到中医教材分析材料。上述四本教材总字数共为205.4万字,共收词16873个。其中,单音节词3539个,双音节词11089个,三音节词1709个,四音节及以上共500个。四本教材中的高频词语覆盖率如表2所示:

中医汉语词汇大纲所选取的词语数目参考了《通用规范汉字表》。2013年,教育部公示《通用规范汉字表》,共收字8105个,分为三级,其中,一级字表为常用字集,收字为3500个。同时还参考了HSK的收词数量。旧版HSK共收词8822个,新HSK5级共收词2500个,新HSK6级共收词5000个。我们必须首先考虑到词汇覆盖率应比较适中,既能使留学生在阅读教材时解决词汇方面的问题[6],又不会对留学生造成过重的学习负担。因此,中医汉语词汇大纲初步定为5000个词语。这些词语分为三个部分:日常用词,主要用于留学生的日常生活;中医专业词,主要用于学习中医课程;现代生化词,主要用于学习西医及实验课程。

(三)人工干预的基本原则

我们按照词语的使用频率,从高到低列出机选5000词,接着进行适当的人工干预。在人工进行词条过滤时,基本上遵循着以下原则:

1.在处理非真实词条时,利用常用词词典进行串匹配分词,并运用统计学方法,识别一些新词。第一,对共现频度高的词语进行考察,调整分词软件自动分词时所误分的词。如“高良姜”三个字共现频率较高,“高良姜”实际上是一种中药,因此,补充新词“高良姜”,同时去除“高良”。此外,像“氨”“质”“氢”“研”等都是构词的语素,而不能作为词条,因此,也将它们过滤掉。第二,统一繁简字。有些中医教材采用的是繁体字,在处理这类词语时,增补其简体形式;如果已有简体形式,则将相关数据合并。第三,删除个别误判词。在对教材进行扫描时,个别词语由于字形相近而为软件误判,如部分“侵入”输出时为“侵人”,统计时需将这些误判词删除。

2.出现重组默认词与减字默认词时,不再列入词表。如已有“止痛”和“药”,可以推断得知“止痛药”的含义,故“止痛药”不再纳入统计。重组词的标准是该词的意义为各组成部分词义的相加,减字词的标准是多音节词与每个单音节词的含义相同。确认重组默认词和减字词的主要标准为词频,而将其他词视为重组默认词或减字默认词。如“必需”出现了64次,“需要”出现了215次,“需”出现了4416次,这时,我们保留“需”,把“必需”“需要”视为重组默认词。

3.实体名单独列出,主要包括人名、地名、书名、山名、建筑名、节日名、电影名、朝代名等。同时,将这类专有名词进行适当调整。如保留真实词条“本草纲目”“神农本草经”,删除非真实词条“本草”。

按照以上三条基本原则,我们对最初选出的5000词进行过滤,顺位补齊后仍按以上原则筛选,删除了“止”“干”“燥”“氨”“质”“氢”“研”“脂”“录”“疟” “凝”“致”“俞”“不良”“不宜”“不利”“需要”“必需”“所致”“此类”“本品”“又称”“亦可”“还有”“每次”“腹痛”“腹胀”“直刺”“出血”“核糖”等338个词。在人工干预后,最终得到包含5000个词的中医汉语词汇大纲。同时,将“四川”“江苏”“河南”“雷公”“神农”“李时珍”“清代”“宋”等43个词列为专有名词。

(四)中医专业汉语词汇大纲选词说明

我们将中医汉语词汇大纲分为日常用词、中医专业词、现代生化词三个部分,并选取部分词语举例说明,具体如表3所示:

从表3可以看出,这一大纲不仅包括汉语常用词汇,也包括相当数量的中医专业词汇,还包括一定数量的现代西医词汇。同时,我们也发现,该词汇大纲并不是传统意义上的中医词汇大纲,而是更符合实际需求的、包含中医专业核心课程词语的词汇大纲。与纯粹的中医词汇大纲相比,它还包括了一定数量的现代西医词汇。对于还要学习相关西医课程的留学生来说,这一词汇大纲的针对性、实用性更强。

三、中医汉语词汇大纲与新HSK词汇大纲的比较研究

(一)中医汉语词汇大纲与新HSK词汇大纲的重合情况

新HSK5级共收词2500个,与大纲有913个词是重合的;新HSK6级共收词5000个,与大纲有1255个词是重合的。前者重合率为36.52%,后者为25.1%。从这组数据可以得知,这两类词汇大纲差异较大。

(二)中医汉语词汇大纲与新HSK词汇大纲的差异分析

中医汉语词汇大纲与新HSK词汇大纲既有重合部分,也有一定差异。下面,我们就从中选出含有常用语素“治”“通”的两组词语来进行具体分析。

我们首先对中医汉语词汇大纲和新HSK词汇大纲中,含“治”词语的出现情况进行了统计,具体如表4所示:

在《现代汉语词典》(第7版)中,“治”主要有两个义项:“医治”“治理”,它们在两种词汇大纲中的使用情况有明显差异。“医治”这一义项,在中医汉语词汇大纲中有7个词语:“外治”“主治”“治愈”“救治”“防治”“治疗”“治病”;在新HSK6级词汇大纲中有2个词语:“防治”“治疗”;在新HSK5级中则只有1个词语:“治疗”。可以看出,中医汉语词汇大纲比新HSK6级词汇大纲多5个词语,比新HSK5级词汇大纲多6个词语。“治理”这一义项,在新HSK5级中有1个词语:“政治”;在新HSK6级共有4个词语:“统治”“治理”“政治”“治安”;在中医汉语词会大纲中则没有出现。可以看出,新HSK5级词汇大纲比大纲多1个词语,新HSK6级词汇大纲比大纲多4个词语。由此可知,作为通用型词汇大纲,新HSK词汇大纲偏重于常用词,注重收词的全面性,覆盖面更强;因此,“治”的两个义项都包括在内。而作为专业型词汇大纲,中医汉语词汇大纲更偏重于医学专业词汇,注重收词的专业性,并不具有普适性;因此,与医学有关的“医治”义出现了7个词语,而和社会学关系更密切的“治理”义则没有出现。

我们又对中医汉语词汇大纲和新HSK词汇大纲中,含“通”词语的出现情况进行了统计,具体如表5所示:

在《现代汉语词典》(第7版)中,“通”共有12个义项,其中,三个词汇大纲涉及到的义项有:①动词。没有阻塞,可以穿过。②动词。用工具疏通,使不堵塞。③动词。有路达到。④动词。连接;相来往。⑤动词。传达;使知道。⑥动词。了解;懂得。⑨形容词。普通;一般。⑩形容词。整个;全部。其余4个义项则没有涉及。将专业型词汇大纲和通用型词汇大纲进行比较,可以发现,新HSK词汇大纲中含“通”的词语有6个:“通过”“通常”“沟通”“交通”“普通话”“通知”,涵盖了其中的4个义项;中医汉语词汇大纲中含“通”的词语有21个,涵盖了其中的8个义项。由此可知,“通”是中医汉语教学中一个十分重要的词,在教材中的使用频率远高于日常生活。

(三)《实用中医汉语》词汇表存在的问题

我们注意到,《实用中医汉语》所选取的1830个生词、专业名词及术语,在词语样本数高达16873个词的四本中医专业本科教材中,有757個词竟一次也未出现,比例高达30.98%。客观地说,这些生词和留学生实际需要学习的词汇之间是存在一定偏差的。我们将比较样本进一步扩大,再加上新HSK6级的5000个词语,发现这一数据仍高达567个。也就是说,《实用中医汉语》四本教材中,有567个词既不属于HSK6级5000个词的范畴,也不属于留学生第一学期四本专业教材中16873个词的范畴。就此而言,这些词语的选取是值得商榷的。

我们对这567个词语进行了归纳,大致可分为三类。第一类是和中医有关的人名、药名、穴位名、书名。如:“杨继洲”“王叔和”“吴有性”“余化龙”“龙脑香”“没药”“涌泉穴”“风池穴”“铜人腧穴针灸图经”“针灸甲乙经”等。第二类是药膳、中药汤剂名。如:“腊八粥”“人参鱼头汤”“祛寒娇耳汤”“阿司匹林石膏汤”“普济消毒饮”等。第三类是成语、俗语、文学性较强的语言及其他不常用的和中国文化相关度较高的词。如:“囫囵吞枣”“疑神疑鬼”“争奇斗艳”“打破砂锅问到底”“凝脂”“璀璨”“参透”“陵寝”“公堂”“修炼”“冶金术”等。

从中医汉语教学的角度来看,前两类大都是中医专业所要学习的知识点,专业课教师必然会对这些专业名词和术语进行讲解,因此,它们是否有必要作为生词出现,通常并不会影响留学生的专业学习。中医汉语教材将这些词语纳入生词的范畴,实际上就会导致两个问题:首先,这些在留学生第一学期中医专业教科书中一次也没出现的专业名词和术语,会给留学生的汉语学习增添负担,并进而影响留学生的中医汉语学习体验;其次,这些名词和术语十分专业,文化底蕴较深,如果想要阐释清楚的话,无疑也会加重汉语教师的教学负担。可以说,如果将这些词语纳入到中医汉语教学中,就会远远超出普通的语言学习范围,教学重点也从偏重于汉语教学变为偏重于中医教学,从而混淆了中医汉语课程与中医基础课程的界限,这与中医汉语的教学原则和教学目的并不相符。因此,我们建议将第一、二类词语列入专有名词,在教学时应区别对待[11]。

第三类词语的大量出现应与教材编撰者的语体设定有关。从教材选文的情况来看,很多课文都是关于中医的小故事,而且是从医古文改编而来的。这类文艺语体的语体设定,也导致了描述性的文学语言被大量使用。我们知道,医学教材的科技语体与文艺语体存在着很大的风格差异,与日常语言的口语语体也是泾渭分明。考虑到来华留学生的心智已相对成熟,阅读的书目也以科技语体为主,这种偏故事性、趣味性的语体风格是否适当,值得我们进一步思考。作为使用过这套教材的汉语教师,笔者曾对留学生进行了口头访谈,许多学生反映,这套中医汉语教材的专业词汇量相对不足,对专业学习的帮助也很有限。

(四)中医汉语词汇大纲与《实用中医汉语》词汇表比较结论

从科学性来看,《实用中医汉语》系列教材在编写之前并未进行广泛的语料库研究,在没有数据支持的情况下,只是凭借主观经验筛选出相关词语,这样就会与学生的实际需求相脱节。与此同时,即使是中医专业,非中医的医学、生物学词汇也在留学生的学习中占相当大的比例,中医汉语教材往往更重视中医词汇,却相对忽视了现代医学词语,这也给留学生今后的学习造成了一定困难。中医汉语词汇大纲则是在大量数据的支撑下,通过人工筛选制定而成,在一定程度上改善了上述缺陷,更具科学性。

从专业性来看,《实用中医汉语》系列教材往往采用讲故事的形式编写课文,文艺型语体色彩较浓,这类词语对留学生中医专业的学习帮助不大,而且加重了他们的学习负担。中医汉语词汇大纲则以科技语体教材为依据,选取的词汇更贴合留学生的专业学习,更具专业性。

五、结语

从中医汉语词汇大纲的研制过程及与其他词汇大纲、词汇表的比较,可以看出,中医汉语教材的编写应从实用角度出发,将学生的语言需求放在第一位,以读懂专业教材为目标,只有这样,才能给留学生今后的专业学习提供切实有效的帮助。同时,中医汉语教材在语体风格选择上应和中医教材保持一致,最好也采用科技语体,使词汇及句型更贴近留学生的专业学习。需要指出的是,由于受条件限制,中医汉语词汇大纲是以南京中医药大学国际教育学院的教学实践为基础编制的,无论是中医专业教材的选取,还是中医汉语教材的选取,都是基于该校的实际情况,因此,它可以直接落实到该校的教学活动与教材编写中。其他高校的中医汉语教学在采用中医汉语词汇大纲时,还需要针对本校的实际状况而进行适当调整。不过,选词的总体原则是需要遵守的,要以教学的实际、学生的需求为基础,以精准的数据作支撑。同时,该词汇大纲的可靠性、科学性还需要通过实践的检验,在教学实践中得到进一步完善。我们也期待学界同道的广泛参与,以全国中医学校的专业教材为语料库,研制出更为准确、适用范围更广的中医汉语词汇大纲,以此作为全国中医汉语教材编写的依据,并运用于中医汉语教学实践中。

参考文献:

[1]苏新春.对外汉语词汇大纲与两种教材词汇状况的对比研究[J].语言文字应用,2006,(2).

[2]王鸿滨.留学生课外汉语分级阅读框架体系建设构想——以经贸类材料为例[J].语言教学与研究,2016,(4).

[3]钱玉莲.韩国学生中文阅读学习策略调查研究[J].世界汉语教学,2006,(4).

[4]刘颂浩.阅读课上的词汇训练[J].世界汉语教学, 1999,(4).

[5]傅赛香,袁鼎荣,黄柏雄,钟智.基于统计的无词典分词方法[J].广西科学院学报,2002,(4).

[6]Paul Nation.词汇教学设计[M].北京:人民教育出版社,2007.

[7]罗根海,薄彤.实用中医汉语·精读基础篇[M].北京:外语教学与研究出版社,2010.

[8]羅根海,赵熔.实用中医汉语·精读提高篇[M].北京:外语教学与研究出版社,2011.

[9]薄彤,袁哲敏.实用中医汉语·听力基础篇[M].北京:外语教学与研究出版社,2010.

[10]孙文钟.实用中医汉语·口语基础篇[M].北京:外语教学与研究出版社,2010.

[11]乔思邈.留学生中医预科班词汇教学大纲的研究[D].哈尔滨:黑龙江大学硕士学位论文,2013.

Abstract:Using the method of manual choosing and word segmentation software, this article takes the teaching materials of the first semester in the International College of Nanjing University of Chinese Medicine as the database to develop a Chinese vocabulary for Chinese students whose majority is the Chinese medicine. With a large number of detailed data comparison study, the article makes an objective and detailed description of the similarities and differences between the new HSK vocabulary and the vocabulary of the series of “Practical Chinses of Traditional Chinese Medicine”textbooks and the Chinese Vocabulary Outline of Traditional Chinese Medicine, and analyzes the characteristics of the three. Based on the comparison and analysis of professional vocabularies and general vocabularies. The new HSK vocabulary focuses on universality, in order to strengthen the ability of communicating in daily life. The Chinese vocabulary outline of Chinese medicine is aimed at the students majoring in traditional Chinese medicine. It is professional and pays more attention to the ability of foreign students to read and understand professional textbooks. The literary style used in the textbook “Practical Chinses of Traditional Chinese Medicine” is not suitable for the international students who will enter the university for professional study.  

Key words:professional vocabulary;Chinese vocabulary outline of Traditional Chinese Medicine;Chinese textbooks of Traditional Chinese Medicine;Chinese teaching mode of Traditional Chinese Medicine