冷雨航 曾毅平
[关键词] 中文词表;海峡两岸;对比
[摘 要] 大陆《国际中文教育中文水平等级标准词表》与《台湾华语文能力基准词表》共有词约73%,差异词约27%。选词的情境类属有差异。情境主题下,共有词跨等交错分布,主要为日常生活类词语;情境主题外的独有词可据其典型特征分为“双方同类”和“单方独类”两种类型。独有词差异与两岸不同收词原则相关,词频在独有词增减整合中发挥重要作用。两岸词表存在融通趋势。
[中图分类号]H195.3 [文献标识码]A [文章编号]1674-8174(2024)02-0048-11
1. 引言
本文“词表”指汉语作为第二语言教学的词汇大纲。词表是教学设计、教材编写、词典编纂和测试评估的重要参照。《国际中文教育中文水平等级标准词汇表》(简称“《标准》”)收词11092条,是《国际中文教育中文水平等级标准》体系下的新一代词表,由我国教育部国家语言文字工作委员会于2021年3月24日发布,同年7月1日正式实施。《台湾华语文能力基准词表》(简称“《基准》”)收词14470条,是我国台湾地区华语文教育八年计划(2013—2020)之“建置应用语料库及标准体系”代表性成果,于2020年随《台湾华语文能力基准》(TBCL)正式出台。本文从研制理念、收词量与等级分布等角度对比,分析其一致性和差异性。
《标准》出台后,大陆词表对比研究关注新旧词表异同,具体包括《标准》与《汉语水平词汇与汉字等级大纲》《汉语国际教育用音节汉字词汇等级划分》(简称“《等级划分》”)《新HSK词表》的比较,涵盖收词概况、等级调整、词量增减等。最新研究基于对比结果总结了《标准》改进后的特点及其教学意义,并就尚存问题提出若干修订建议(李华,2023)。两岸词表对比研究对象多为中文测试用词表,比如《新HSK词表》和基于华语能力测验(TOCFL)推出的《华语八千词词表》(简称“《八千词》”)。对比内容包括外围的研制理念、收词原则、词条设计、选词数量和等级划分;内部的词汇差异及其主要成因等。除词表间对比,杨惠媚等(2014)还借助两岸网络语料库高频词分别考察了双方词表与之对应和缺失的比例及内容,为词表修订补录提供参考依据。另有研究聚焦两岸阶段性词表异同,翟颖华(2015)选取了《等级划分》初级部分与台湾服务于初阶教学的《华语教学基础词库》对比,围绕词频、情境和对非词结构态度讨论两岸选词影响因素。大陆尚无与《基准》的比较研究,台湾相关研究(李诗敏,2020)不仅包括二语词表间对比,即《基准》与《八千词》《新HSK词表》比较;也包括二语和母语词表对比,即《基准》与《教育部学童常用词表》比较。该研究突出比较的方式和具体过程,重点呈现了数量对比结果。
综上,大陆《新HSK词表》与台湾《八千词》常作为两岸词表比较研究对象,目前还未见《标准》和《基准》对比研究成果。现有比较主要涉及选词依据、数量增减、等级变化等,词表内部共独有词梳理较为零散,较少做类型总结;从两岸国际中文教育交流合作看,两岸词表融通趋势未获较多关注。较之过往研究,本文比较对象分属两岸近年出台词表,内容较新,以期丰富相关研究成果。并以情境为切入点细致考察了两岸词表共独有词,总结其主要类型。透过词表不仅展现了两岸语言使用特色,同时还窥见词表融通趋势,为融通词表研制提供语言事实支持和参考。
2. 研制理念
2.1 选词依据
《标准》选词参考了已有等级词表、高频词表、常用词表、考试大纲和现代汉语语料库,按难度和词频将初等和中等词语细分为1-6级,高等词语未做分级处理。《基准》选词以华语文语料库(简称“COCT”)书面语语料为主,将词频、覆盖率、分布均匀度等作为选词指标,同时辅以口语语料词频、高频教材生词、常用词及已有词表来调整完善(吴鉴城等,2019)。在诸种参数中,两岸都将词频视为重要选词依据。
2.2 词条排列
《标准》词条按音序排列,由序号、词语、拼音三部分组成。《基准》词条则按笔画数量从少到多排列,大部分词条仅罗列词语,少部分附加注音符号和英文释意①。词条处理上,两岸词表同中有异:首先,都做了并词处理。《标准》将兼类词和同义词合并,前者如“分(名)”和“分(量)”合并為“分(名、量)”,后者如“弟弟|弟”“有时候|有时”;《基准》整并异体字词、同义词和用法相近且无地域方言之别的词,并用“/”区隔,如“什麼/甚麼”“维他命/维生素”“衣服/衣”。其次,都拆分了同形词。《标准》按异音、异义或异词性来拆分同形词,并在其后括注词性,比如“花”因词性和意义不同拆分为“花(名)”和“花(动)”;《基准》拆分同形多义词,后标数字区分,比如“行”拆分为“行1(读作xinɡ35)”和“行2(读作hɑnɡ35)”。再次,都用括号表可省略。比如《标准》的“有(一)些”,《基准》的“没(有)用”。此外,《标准》还用括号标注词缀例词或义项说明,前者如“家(科学家)”,后者如“称(称一称)”和“称(称为)”。
2.3 衍生产品
衍生产品辅助词表解读或补充词表内容。比如《国际中文教育中文水平等级标准(应用解读本)·第二分册:词汇》②(简称“《解读本》”)可辅助《标准》理解使用。《解读本》详述了收词原则、词语拼音、词类标注等重要信息,为各词条加注了词性③。《华语文能力基准应用参考指引》④ 详述了完整的华语文能力指标与词语、类词缀等分级标准,并提供基础词汇教学资料,区分了《基准》(1-4级)词语和类词缀难易度,便于教学操作和词典编纂。《基准》还编制了同形异义词表⑤、类词缀表⑥、情境分类词表(1~5级)⑦。
3. 选词数量差异
3.1 选词数量
《标准》共收词11092条,分3等9级:初等1~3级为普及水平,中等4~6级,高等7~9级。《基准》收词14470条,涵盖3等7级:1~3级为基础,4~5级为进阶,6~7级为精熟。两岸词表各等级词语数量及分布见表1。
由表1可知,《标准》从初等到高等词量逐级递增。三个等级词量比①约为2∶3∶5,符合国际中文教育规律(刘英林等,2022);而《基准》约为1∶3∶6,显然两者在初高等上存在差异。两个词表中等收词量都接近5500词,但到了高等,《基准》收词量远超《标准》,其词量比也突显了该阶段收词重心。各级新增词量变化趋势上,《标准》初等升级特征明显且增速较快,要求学习者快速打好词汇基础;中等增速放缓,助于词量稳步积累;高等因未细分等级暂不做讨论。《基准》基础水平新词增量变化趋于平稳,且入门词量要求低,但进阶水平新增词量迅速飙升,变化幅度随之增大。可见,两岸词表各水平收词总量及各等级新增词量变化均存在较大差异。
3.2 选词差异
进一步对比两岸词表收词情况,其共有和独有词数量分布见表2:
统计表明②,《基准》和《标准》共有词7977个,独有词6493个,分别约占词表总量55%和45%;《标准》和《基准》共有词8087个,约占总词量73%,独有词约占27%,共3005个。《基准》中独有词偏多,而《标准》中共有词占比更大。从各等级看,《基准》基础、进阶共有词数量占优势,独有词较多集中于精熟等级;《标准》各等级均以共有词居多,独有词数量随等级提升也有所增加。
为更好体现两岸词表各等级共有词交叉分布特点,现以《标准》为例,将其与《基准》对比,统计两岸词表各等级共有词数量及其分布,见表3。
从表3可知,两岸词表共有词等级与数量分布差异显著,除同等对应外,还呈跨等交错分布。比如“汉字”“认真”“中学”“知识”是《标准》1级词,但《基准》将其列为3级词;“耳朵”“鼻子”“餐厅”属《标准》5级词,《基准》定为1级词;再如《基准》中“黄瓜”“导游”“日历”“气球”为精熟7级词,而《标准》则为中等4级词。从《标准》各水平等级看,初等共有词主要对应分布在《基准》基础和进阶等级,说明大陆部分初级词在台湾词表中出现了升级现象;中高等共有词主要与《基准》进阶、精熟等级对应,但在基础等级中也占少量比例。
4. 共有词比较
《基准》将基础、进阶共5322个词做了情境分类②,处理后包括2519个核心词和2803个情境词。核心词为初学者必须首先学会或是横跨四类情境的词语;情境词涉及个人资料、日常起居、职业等17个类别。因共有词数量较多,结合实际和词表特色,现以情境分类为“抓手”比较两岸词表共有词。将《基准》情境分类词与《标准》同等水平(初、中等)词语对比,统计结果见表4。
据表4,情境分类词中共有词有3524个,其中核心词1895个,约占核心词总量75.2%,情境词1629个,约占情境词总量58.1%。两岸共有词中核心词数量略多于情境词,而《基准》独有词中情境词数量占优势。共有核心词在两岸词表中也呈交叉分布,《标准》以初级词居多,共1072个,约占共有核心词总量56.6%;而《基准》则是中级词占多数,共1176个,约占62.1%。可见,相同核心词在两岸词表中的学习顺序和分级有所不同。将共有情境词按不同主题归类有助于明确两岸词语共同聚焦的领域。两岸词表在17类情境中都有共有词,但比例存在差异,具体见表5。
統计表明,共有情境词数占比>50%的情境包括“日常起居”“职业”“休闲、娱乐”“交通、旅游”“社交、人际”“身体、医疗”“教育、学习”“购物、商店”“餐饮、烹饪”“公共服务”“安全”“社会”等12个类别。这些类别与《国际中文教育中文水平等级标准》(以下简称“《等级标准》”)各级话题相对应。以这12个情境类别为考察范围,《基准》情境与《等级标准》话题对应情况及共有情境词举例见表6。
从表6可知,情境与话题具一致性和相关性,是两岸情境词共现的基础。共有情境与话题主要属社会日常生活范畴,较少涉及政治、经济、科技等专业领域,这与情境话题所属等级和其交际属性有关。《基准》在分级基础上划分情境类别的做法值得借鉴,情境词有利于激活学习者心理词典,从便捷式记忆中提取相关词语用于交际(翟颖华,2015)。同时情境词教学能辅助构建课堂真实语境以及编写生活类中文教材。《标准》作为《等级标准》框架下的重要内容,可进一步据其话题范畴对词语做分类处理。两岸话题和情境的对照相通性以及共有情境词的存在对大陆词表情境分类也具有参考价值。
5. 独有词比较
5.1 情境主题下的独有词
从情境类别考察两岸词表独有词可以反映收词的领域差异。以17个情境类别为参照,将《标准》独有词加以归类,并将《基准》精熟等级的独有词补充到相应情境范畴中,两相对比,可从丰富性和特色性两方面来考察其差异。
5.1.1 丰富性
与《基准》相比,《标准》独用情境词更为丰富,表现为:
收词更具多样性。如“休闲、娱乐”情境的“体育”类词语,《基准》收录了“慢跑、溜冰、球赛”,《标准》则包含项目、场地、人员、赛事、奖励等分项,相关词语有:
杠铃、台球、羽毛球、举重、跳高、跳远、跳水、冲浪、滑冰、打球(项目类)
球场、赛场、体育场、体育馆、看台、起跑线(场地类)
队员、球员、运动员、球星(人员类)
大赛、联赛、半决赛、世界杯、亚运会、奥运会、竞技、单打、双打(赛事类)
奖杯、奖牌、奖品、银牌、铜牌(奖励类)
收词更具系统性。如“职业”情境的“求职”类词语,《基准》收录了“面谈、全职、薪资、绩效、职场”,同情境《标准》收词则覆盖了求职完整过程,且大多是同级词,教学时便于词语聚类和系统串讲,体现系统性和完整性(括号内为该词所属等级):
求职(6)、招聘(6)、应聘(高)、聘任(高)、雇佣(高)、试用期(高)、辞呈(高)、辞退(高)、下岗(高)、跳槽(高)
收词更具层级性。《标准》独有情境词较多体现上下位概念,比如“餐饮、烹饪”中的“酒水”和“红酒、白酒、茅台(酒)、葡萄酒”,“乳制品”和“奶粉、酸奶”;“自然、环境”中的“农作物”和“水稻、小麦、禾苗”,“家禽”和“公鸡、母鸡”等。
透过独用情境词也可反映《标准》收词特点,词语的丰富性、系统性和层级性有助于揭示情境要素,运用情境教学法构建交际语境。
5.1.2 特色性
两岸词表独有词中均存在一些特色情境词,如表7所示。
两岸特色情境词主要为“同实异名”类。《基准》按收词原则列出区域特色词语,统计显示,表7中一些台湾特色词对应的大陆用词也收录于《基准》不同等级中,比如“国小/小学(2级)”“国中/初中(4级)”“鼻水/鼻涕(4级)”“讯号/信号(5级)”“道地/地道(7级)”等。此外,特色情境词的判断主要参照《全球华语大词典》,而使用词典提供的间接语料来考查两岸特色词难免会忽略词语使用中的实际差异,因此需紧密结合常用语料来辅助考察(刁晏斌,2016)。借助两岸常用媒体新闻库①对以上特色情境词进行逐一检索后发现,仅通用于大陆或台湾地区的特色词并不多,比如词典通常将“网吧、出租车”和“幼稚园、观光客”这两组词分别视为大陆和台湾地区特色词,检索②近10年来的新闻媒体语料可知,这些词在两岸都有使用,如以下语料:
(1)与之同时电影院、剧院、游戏机中心、酒吧、网吧、夜总会等,以及澳门彩票有限公司及马会,亦采取同样措施。(【台】《联合报》2020年2月5日)
(2)安泰银行理财规划师张家邦衡量了李先生的整体状况,首先打消他们想赞助儿子买房的想法,其次是建议李先生考虑从外勤的送货工作调整为内勤工作,或者改以开出租车维持生计。(【台】《经济日报》2022年6月13日)
(3)经济持续增长、财政收入充盈后,政府大幅提高民生支出:从幼稚园到高中15年免费教育免除后顾之忧……(【陆】《人民日报》2019年12月20日)
(4)如今,越来越多的观光客来到延安,在宝塔山上、延河桥边、土窑洞里,找寻延安岁月的记忆,感受延安精神的魅力。(【陆】《人民日报》2020年10月21日)
特色词反映了两岸在相同领域不同的用语习惯,从语料检索结果看,这些词大多在两岸都有使用痕迹,虽存在频率差异,但也反映了两岸词汇融通的客观事实。
5.2 情境主题外的独有词
除情境主题下的比较外,两岸词表独有词还可做类型考察,就典型类别划分“双方同类”和“单方独类”型。
5.2.1双方同类
两岸词表独有词中都有单音节词、四字词和非词结构这几种典型类别。
5.2.1.1单音节词
独有词中,《标准》单音节词共306个,《基准》相对较少,有247个。结合语料库词频统计辅助判断单音节独有词的常用度,即检索《标准》306个单音节独有词在“国家语委现代汉语语料库词频统计表”(简称“现代汉语词频表”)②中的频序,若≤11092③则视为大陆常用词;同理,在“台湾中央研究院现代汉语语料库词频统计系统”①中分别检索《基准》247个单音节词,若频序≤14470②则视其为台湾地区常用词。检索结果显示,《标准》单音节独有词的非常用词有56个,约占总量的18.3%。其常用词数量占绝对优势,且构词能力強,比如“同(150/6561)③、力(782/1618)、厂(891/1427)、照(1343/917)、停(1488/822)、善(2476/473)”等。而《基准》非常用单音节独有词有153个,约占总量61.9%,这些词大多构词能力弱,使用范围较窄,如“窘 (27851/11)、卜 (28962/11)、硷(29065/10)、掳(29292/10)、敝(34702/8)、斟(76354/2)”等。
5.2.1.2 四字词
两岸独有四字词以成语为主。《标准》独有成语④共180个,而《基准》是其3倍多,共643个。按前述常用度检索方式,《基准》独有成语使用频次大多低于20次,常用成语仅18个,约占2.8%。《基准》独有词共6493个,但低频成语就有614个,约占独有词总量10%,且成语学习难度较大,是否有必要大规模收录有待商榷。《标准》大部分独有成语未在现代汉语词频表中出现,16个成语中有10个为常用词。其独有成语近乎全部分布在高等,是为中文专业外国留学生和水平较高学习者准备的,具有提高服务的性质(刘英林等,2020)。从内容看,《标准》有更多出自历史故事和神话寓言的成语,比如“刻舟求剑、鹤立鸡群、画蛇添足、守株待兔、亡羊补牢、愚公移山”等,文化内涵丰富。此外虽词频不高,但两岸各有源自口头俗语的成语,其内涵相对简单,能见文知意,比如:
《标准》: 一路平安、半真半假、雪上加霜、和平共处、千家万户、忍饥挨饿、酸甜苦辣、风和日丽、节衣缩食、衣食住行
《基准》: 各行各业、人山人海、十全十美、手忙脚乱、甜言蜜语、笨手笨脚、风平浪静、风吹草动、粉身碎骨、男女老幼
5.2.1.3 非词结构
两岸词表收词原则都明确指出要适当收录一部分已经词汇化且常见常用的非词结构,比如短语和固定格式,短语中的动宾式、动趋式和动结式属典型非词结构(吕文华,1999)。非词结构占一定比例表明两岸收词都具“教学词”特征(曾毅平,2013);同时体现词表的语汇意识和“用户友好”宗旨,不仅为学习者提供预制语言材料,也从源头上减少其用词偏误(王军,2022)。非词结构主要类型及举例见表8。
5.2.2 单方独类
典型类别也存在“你有我无”的情况,如《基准》历史年代词和《标准》中的词缀等。
5.2.2.1历史年代词
《基准》独有词收录了部分旧词语(历史词),包括旧称呼、旧事物、旧行为等,如表9所示。参考频序可知其在当代社会生活中已不再常见常用,这类词之所以会被收录可能与词表选词主要参考COCT书面语语料有关,而该语料的阅读对象是中文母语学习者(李诗敏,2020)。《标准》则明确表示不收录这类词语,因而该类型仅为台湾词表独有。
5.2.2.2 词缀
与台湾地区词表不同,《标准》除了收录词缀词外还将词缀单独作为一个词条列入词表,其独有词中包含14个词缀,列举如下:
前缀:第~、小~、初~、非~
后缀:~化、~性、~者、~品、~界、~力、~族、~度、~感、~业
5.3 讨论
独有词在情境主题和典型类别中的差异反映了词表收词原则和词频作用。
首先是收词原则的体现。从独有情境词看,收词原则影响其容量和丰富性。《基准》要求收录国名,因此“个人资料”中有大量国名,为该情境下的交际子话题“出生时地”服务;而《标准》为适应世界各地中文教学本土化和多样化趋势,遵循“5%原则”,即根据不同对象和实际需求灵活安排教学,替换或加减5%学习内容(刘英林,2021)。教师也可通过补充相关且必要的教学内容来实现词表与中文教学本土化语境的协调配合(李泉,2015)。国名就属这部分内容之一,故未大规模收录,因此相应情境词数量有所削减。《基准》将73项类词缀整理成表,词表主体考虑容量仅分别收录一个类词缀代表词。该原则影响了部分情境用词的丰富性,如将“~场、~员、~会、~生、~长、~节”视为类词缀,因此下列《标准》独有情境词都未收录:
“休闲、娱乐”:球场、赛场、体育场、队员、球员、运动员、亚运会、奥运会
“教育、学习”:组长、班长、院长、小学生、中学生、研究生、留学生、毕业生
“文化”:清明节、端午节、中秋节、元宵节、圣诞节、狂欢节
此外,收词原则在“单方独类”独有词中也有所体现,比如两岸对历史年代词的收录态度以及是否将词缀单列词条等都与其有关。
其次是词频在独有词整合中的作用。参考词频,两岸词表相同情境下的独有词有互相收录可能性。具体做法是分别检索两岸独有词在对方常用语料库和词频表①中的词频或频序,并参照该情境下对方独有词的当地词频或频序,初步考虑能否互相收录。必要时①还将结合两岸常用媒体新闻库辅助判断。表10列举了两岸词表可相互收录的部分独有词。
除补充收词外,以词频和常用度为依据还可做删减处理。比如《基准》可删除部分非常用且构词能力弱的单音节词,缩减词表容量;也可参考词频信息来调整两岸各自收录的成语内容和数量。
虽然词频统计标准具有相对性,但仍可辅助判断词语在两岸社会生活中的常用度,一方面使部分独有词转变为共有词,从而减少收词差异,增强词表通用性;同时删除低频非常用词,节省词表空间。
6. 结语
两岸词表都重视词频、相关词表和语料库的参考价值。词条排列和组成部分不同,编排上虽都做了拆合处理,但其原则和呈现方式各异。不同衍生产品将辅助各自词表研究解读与教学实际应用。
词表收词数量与等级分布不同,各等级词量比突出了词表初高两等收词上的不同,入门级和各级新增词量差异也较为显著。选词《基准》独有词居多,《标准》共有词占更大比例。
共有词除同等对应外,跨等交错分布特征明显。共有情境词涉及日常生活诸多领域,体现了两岸词表情境和话题的对等关联。《标准》独有情境词丰富多样,兼具系统性和层级性。特色情境词也反映出两岸用语习惯的差异。另外还可将独有词的典型差异类别划分为“双方同类”和“单方独类”两种形式。独有词差异特征与收词原则挂钩,词频在独有词增减整合中发挥重要作用。
词表具融通趋势。首先,大部分地区特色词在两岸都有使用痕迹。其次,《基准》收录地域差异词,部分与台湾特色词对应的大陆词也收进了词表,有助于扩大其适用范围;台湾华语社区词和大陆普通话词汇之间的意义对接很有必要,使其尽量向普通话靠拢,为所在地区的中文学习使用提供便利(陆俭明,2020)。再次,部分独有词可进入对方词表变为共有词,突破地域限制,增强融通性。词表融通是两岸华语文教育界合作基石之一。既顺应了台湾华语文教育发展内需,也将持续助力华语文数字资源共享平台构建、华语文教育质量评估标准制定以及华语文教育产业互惠共赢(蔡武、郑通涛,2017)。
词表相互借鉴,不断完善。如《基准》可参考《标准》调整各等级词量及难度分布;《标准》也可借鉴《基准》情境分类,根据现有话题对词语做分类处理,提高教学效率。《基准》收词还需加强严谨性,词表部分内容与收词原则相悖,如规定不收录双音节词通过部分重叠以增添描述生动性的ABB式叠字词(如“赤裸裸”),但词表中仍出现了“光秃秃”“轰隆隆”;不收录城市地名专名,但也出现了“西藏”“总统府”;原则明确仅收录一个代表性类词缀词,但往往收录了多个相关词语,如“~力”收录了“想象力、向心力、原动力”,“~工”收录了“社工、劳工、志工”,“~体”收录了“硬体、软体、固体、母体”等。
两岸词表在编制理念、收词数量、共独有词类别方面均存在共性与差异,彰显各自特色的同时也呈现出客观存在的问题。揭示差异将助力两岸融通词表的制订,增强词表的科学性和有效性。
[参考文献]
蔡 武,郑通涛 2017 21世纪以来台湾华语文教育发展现状及两岸合作展望[J]. 云南师范大学学报(对外汉语教学与研究版)(5).
刁晏斌 2016 关于海峡两岸词汇深度对比研究的思考[J]. 励耘语言学刊(1).
“国家教育研究院” 2022 华语文能力基准应用参考指引[EB/OL]. https://coct.naer.edu.tw/download/tech_report/.09-01.
——— 2022a 遣辭用“据”——台湾华语文能力第一套标准[EB/OL]. https://coct.naer.edu.tw/download/tech_report/.06-10.
——— 2022b 说情话境——华语文词语情境分类[EB/OL]. https://coct.naer.edu.tw/download/tech_report/.06-10.
教育部中外語言交流合作中心 2021a 国际中文教育中文水平等级标准[M]. 北京:北京语言大学出版社.
——— 2021b 国际中文教育中文水平等级标准(国家标准·应用解读本)第二分册:词汇[M]. 北京:北京语言大学出版社.
冷玉龙,杨 超,韦一心 2014 成语辞海[M].上海:上海辞书出版社.
李 华 2023 《国际中文教育中文水平等级标准》词表改进的分析——基于与《汉语国际教育用音节汉字词汇等级划分》词表的对比分析[J].语言教学与研究(2).
李 泉 2015 汉语教材的“国别化”问题探讨[J].世界汉语教学(4).
李诗敏 2020 国家教育研究院华语词表与其他中文词表的比较[J]. 华文世界(126).
李行健,苏新春 2021 现代汉语常用词表(第二版)[M]. 北京:商务印书馆.
李宇明 2016 全球华语大词典[M]. 北京:商务印书馆.
刘英林 2020 汉语国际教育汉语水平等级标准全球化之路[J]. 世界汉语教学(2).
——— 2021 《国际中文教育中文水平等级标准》的研制与应用[J]. 国际汉语教学研究(1).
刘英林,李佩泽,李亚男 2022 《国际中文教育中文水平等级标准》的中国特色和解读应用[J].国际汉语教学研究(2).
陆俭明 2020 以国际视野、全球眼光思考华语和华语教学——序周清海教授《语言选择与语文教育》[J]. 华文教学与研究(2).
吕文华 1999 短语词的划分在对外汉语教学中的意义[J].语言教学与研究(3).
商务印书馆辞书研究中心 2013 新华成语大词典[M].北京:商务印书馆.
王 军 2022 对接与调适:基于《国际中文教育中文水平等级标准》的词汇教学策略[J]. 国际汉语教学研究(4).
吴鉴城,白明弘,林庆隆 2019 台湾华语文语料库在华语文教育的应用[J].华语文教学研究(3).
杨惠媚,陈浩然,潘依婷 2014 两岸华语词表之比较及选词建议[J].华语文教学研究(1)
曾毅平 2013 论两岸对外汉语教学融通词表的研制[J].江汉学术(4).
翟颖华 2015 新一代两岸初级汉语词表比较及引发的思考[J]. 华文教学与研究(2).
A comparative study of Lexical Syllabus of Chinese Proficiency Grading Standards for International Chinese Language Education and Lexical Syllabus of Taiwan Benchmarks for the Chinese Language
LENG Yuhang, ZENG Yiping
(College of Chinese Language and Culture, Jinan University, Guangzhou, Guangdong 510610, China)
Key words: lexical syllabus for teaching Chinese as a foreign language; cross-strait; comparison
Abstract: At present, there are about 73% shared words and 27% different words between Lexical Syllabus of Chinese Proficiency Grading Standards for International Chinese Language Education and Lexical Syllabus of Taiwan Benchmarks for the Chinese Language. There are differences in the situation categories of vocabulary selection. Under the theme of the situation, the shared words are interlaced, involving the field of daily life; the non-shared words beyond the theme of the situation can be divided into two types according to their typical characteristics: “common type” and “unilaterally unique type”. The different characteristics of non-shared words are related to the different principles of vocabulary selection between the two sides of the Strait, and the frequency of vocabulary plays an important role in the increase, decrease and integration of the non-shared words. In addition, the lexical syllabuses of the two sides of the Strait show a certain trend of integration.
【责任编辑 匡小荣】
[收稿日期] 2023-09-03
[作者简介] 冷雨航,男,主要研究方向为国际中文教育、华文教育、语体学,807102583@qq.com;曾毅平,
男,主要研究方向为国际中文教育、华文教育、修辞学、语体学,2731946235@qq.com。
1 以台湾地区“华语文语料库与能力基准整合应用系统”词表文件为例,访问网址为https://coct.naer.edu.tw/download/tech_report/. 访问于2022年6月10日。
2 教育部中外语言交流合作中心编,北京语言大学出版社出版,2021年4月第1版。
3 离合词、成语/习用语以及为方便教学选用的常用结构和数量结构均不标注词性。
4 参见《华语文能力基准应用参考指引》(“国家教育研究院”主编)。访问网址同①。访问于2023年9月1日。
5 参见《遣辞用“据”——台湾华语文能力第一套标准》第76至82页。访问网址和时间同①。
6 参见《遣辞用“据”——台湾华语文能力第一套标准》第82至89页。访问网址和时间同①。
7 参见《说情话境——华语文词语情境分类》第35至79页。访问网址和时间同①。
1 词量比为:初等水平词量∶中等水平新增词量∶高等水平新增词量,下同。
2 两岸词表共有词条内部存在“一对多”现象,因此共有词统计数量存在差异。
1 因是《标准》与《基准》比较,故每级共有词数量以《标准》词条数为计算标准。比如“早餐/早饭”在《基准》中视为1个词,其在《标准》中视为“早饭(1级词)”和“早餐(2级词)”两个词,故统计时将“早餐/早饭”分别视为《标准》1级和2级的共有词;再如“牛”在《标准》中分别为3级词“牛(名)”和5级词“牛(形)”,而《基准》则合并为1个词,但其义项中包含了名词和形容词的意义用法,故也将其分别视为《标准》
3级和5级的共有词。以上两种情况在共有词统计时均需计算2次。
2 主要参照《基准》情境分类词表,见《说情话境——华语文词语情境分类》第35至79页。
① 即人民日报图文数据库(代表大陆地区)和全文报纸资料库(代表台湾地区)。
2 检索时间为2022年10月11日。
1 两岸特色情境词归类以台湾地区情境分类词表所划分的情境范畴为参考。范畴划分借助了“语义场关联性系统”及语料库统计,并通过了信效度分析检验。各类范畴下列多种情境主题,比如“个人资料”包括“姓名”“亲族”“语言”“习性”“宗教”“学历与就业”“出生时地”“通讯资料”等;“职业”包括“求职”“待遇”“工作”。表中特色词举例以一级情境范畴为标准,不做主题细分处理。括号内为该词在大陆或台湾地区的对应词,对应词主要参照《全球华语大词典》(李宇明主编,2016)。“*”表示无对应词,下同。
② 访问网址为:http://www.cncorpus.org/resources.aspx。访问于2022年10月15日。
③ 即选择词频表中与《标准》总词数相同的前11092个词与之对比,重合部分即为大陆常用词。
① 訪问网址为:https://elearning.ling.sinica.edu.tw/CWordfreq.html。访问于2022年10月15日。
② 即选择词频表中与《基准》总词数相同的前14470个词与之对比,重合部分即为台湾地区常用词。
③ 括号内数字左边为频序,右边为频次,下同。
④ 成语判定主要参照《新华成语大词典》(商务印书馆出版,2013年4月第2版)和《成语辞海》(上海辞书出版社出版,2014年8月第1版)。
1 大陆参考《国家语委现代汉语语料库词频表》以及《现代汉语常用词表》(第二版)(李行健、苏新春主编,2021);台湾地区参考“COCT书面语语料库2019”“COCT口语语料库2019”“中研院平衡语料库4.0”,访问网址为:https://coct.naer.edu.tw/cqpweb/。访问于2022年10月15日。
1 考虑语料库延时性,部分词语在对方语料库中检索频次较低,但在其常用媒体新闻库中检索到的有效条目较多,也考虑让其进入对方词表。