主持人:张宝林 北京语言大学汉语国际教育研究院
近年来,我国“汉语中介语语料库建设渐成高潮,‘成为语料库研究中的热点’”1,“正在跨入一个繁荣发展的重要时期”2。该时期以“精细而丰富”为特征,可以视为语料库3建设的“2.0时代”4。基于语料库的汉语二语习得研究同样得到巨大发展,仅以“HSK动态作文语料库”为例,在中国知网(CNKI)中查询,在该语料库基础上进行研究或与之存在紧密关系的论文即达6071篇。其中自2015年以来,年度发文量均在600篇上下,2021年更是达到了744篇5,见图1。
图1 2003—2021年发文量分布
与此同时,基于语料库的习得研究也还存在诸多问题。例如理论视野比较狭窄,多依据中介语理论展开研究;研究方向比较单调,多为偏误分析;对中介语理论、偏误分析理解比较片面,多从概念出发。其具体表现为偏误类型硬套遗漏、误代、误加、错序四大类,究因照搬母语负迁移、目的语知识泛化、教学环境影响、学习策略与交际策略影响、文化因素影响五大原因,使研究变成了简单化的对号入座,不但了无新意,而且难以深入。这样的研究难以对教学产生指导和参考作用,失去了研究的意义。
这种情况的产生有多方面的原因,语料库建设的不完善是其重要原因之一。语料库建设的不完善主要包括五个方面。第一,现有语料库皆为单语语料库,只有学习者产出的汉语中介语语料,而无学习者产出的其本族语母语语料,如此即无法对这两种语言进行深入细致的对比分析,而所谓“母语负迁移”却是探讨偏误原因时排位第一的致误因素,这显然是缺乏根据的,也是分析难以深入的根源。第二,收集横向语料相对容易,收集纵向语料、特别是同一批学习者的纵向语料则十分困难,以致目前的语料库基本上都是横向语料库,鲜少大规模的纵向语料库,因而习得过程研究,特别是复杂动态系统理论指导下的汉语二语发展研究无法得到大规模语料支持。第三,语料加工一般只有偏误标注,而无基础标注6,比较适合做偏误分析,而难以进行更全面的语言运用分析7。第四,语料平衡性尽管在理论上普遍受到重视,但由于语料收集渠道狭窄、课题时限要求等原因,并未得到很好的解决。第五,有些特殊研究所需要的语料库尚付阙如,例如对东干语母语者的汉语习得考察即无相应的语料库。
针对上述情况,汉语习得研究和语料库建设需要做出改变,以获得进一步发展。汉语习得研究方面需由以横向的静态研究为主转向以纵向的动态研究为主,由以中介语理论为主导转向以复杂动态系统理论为主导,开展具体、细致、深入的二语发展研究。语料库建设方面则应由单语语料库建设转向双语乃至多语平行语料库建设,由横向语料库建设转向纵向语料库建设,由静态语料库建设转向动态语料库建设。进一步加强国内外汉语教学单位的合作,扩大语料来源,收集样本更多、规模更大、类型更丰富的语料,切实解决语料的平衡性问题。在建设与完善规模庞大、设计精密、标注全面、质量优异、功能丰富的通用型语料库的同时,注重并加强特定用途语料库的建设。
本专栏所发表的四篇论文分别探讨口语语料的转写问题,扩大汉语中介语语料来源问题,汉语继承语学习者语料库建设问题,并对20年来国内外学习者语料库建设及应用情况进行较为全面的考察、概括与总结。显而易见,这些研究对解决当前语料库建设的相关问题是有所助益的。
附注
1 谭晓平,2014.近十年汉语语料库建设研究综述[C]//北京大学对外汉语教育学院.第七届北京地区对外汉语教学研究生论坛论文集. 北京:北京大学对外汉语教育学院:26-31.
2 张宝林,崔希亮,2015.谈汉语中介语语料库的建设标准[J].语言文字应用(2):125-134.
3 如无特别说明,本文所谓语料库均指汉语中介语语料库。
4 汉语中介语语料库建设2.0时代的概念与界定见:张宝林,2019.从1.0到2.0:汉语中介语语料库的建设与发展[J].国际汉语教学研究(4):84-95.
5 查询日期:2022年4月13日;检索范围:总库,中文文献;查询方式:句子检索,同一句:HSK、动态作文语料库。
6 基础标注即对正确语言现象的标注,详见:张宝林,2010.基础标注的内容与方法[C]//张普,等.数字化对外汉语教学实践与反思.北京:清华大学出版社:367-373.
7 语言运用分析又称表现分析,详见:刘珣,2000.对外汉语教育学引论[M].北京:北京语言文化大学出版社:203.