新加坡教育专用语料库的建设与应用①

2016-08-08 08:40吴福焕林进展周红霞
华文教学与研究 2016年3期
关键词:词条华语华文

吴福焕,林进展,周红霞

(1.2.3.南洋理工大学新加坡华文教研中心,新加坡 279623)



新加坡教育专用语料库的建设与应用①

吴福焕1,林进展2,周红霞3

(1.2.3.南洋理工大学新加坡华文教研中心,新加坡 279623)

教育专用语料库;书面语;口语;语料库应用

重点介绍了新加坡华文教研中心开发的两个教育专用语料库,分别是“新加坡学生日常华文书面语语料库”以及“新加坡小学生日常华语口语语料库”。这两个语料库尽可能从课程开发与语言教学的需要出发,进行语料采样和处理。同时,还介绍了为让语料库在新加坡华语文教学得到充分运用而开发的基于语料库的华文教学资源平台,以期协助华语文教师备课和出题。

1.引言

语料库语言学与语言教学一直被认为是可以相辅相成的两个学科。然而,不少语料库却往往无法起到辅助语言教学的功能。(林进展等,2015;余国良,2009)其主要原因在于这些语料库在建设时多从语言本体的研究角度出发,而忽略了课程开发和语言教学的需要。(Braun,2007;Cook,1998;Gavioli&Aston,2001;McEnery&Xiao,2010)为了让语料库更加紧密地与华语文教学配合,新加坡华文教研中心自2011年就致力于华文教育专用语料库的开发和建设。

所谓教育专用语料库,顾名思义,就是专为语言教学目的而开发的语料库,而教育的专用性主要体现在两个方面:一是在建设的过程中尽可能从课程与教学需要方面去进行采样和建构;二是在完成建库后进一步开发出实用的功能,让教育界人士能直接使用库里的信息或借助语料库的信息为教育工作者提供切实、有用的功能或应用程式。

新加坡华文教研中心在新加坡教育部资助下,建设了两个教育专用语料库,分别是“新加坡学生日常华文书面语语料库”以及“新加坡小学生日常华语口语语料库”。前者旨在找出学生应该学习的日常词汇和句型;后者则旨在探索不同年龄层学生所能基本具备的词汇与句型。这两个语料库的建设可以分为3个阶段,一是语料采集,二是语料处理,三是语料分析。本文将对这两个语料库的建设过程和特点进行介绍,并总结他们初步提供的语言信息。结合这两个语料库所提供的信息,课程开发者将能定位课程所应涵盖的汉字、词汇和句型范围,并预期不同年龄层与不同家庭背景学生所能达到的基本语言水平。

除了为课程开发者提供信息外,相关研究团队在2013年还于书面语语料库的基础上,为前线老师开发了一个教学资源平台,这个平台除了具备让教师搜索字、词、句等语言信息的功能外,还专为教师开发了一个文本分集功能,协助老师鉴定课外阅读材料与阅读测验题目的适切程度和难易程度。

2.语料库的建设流程

如上所述,上述两个语料库建设基本经历了3个阶段。在第一个阶段,两个项目都进行了学生问卷调查。书面语语料库的学生调查主要针对学生接触语料的范围和频率,以此界定采集语料的方向后才开始语料的收集;口语语料库的调查则主要针对学生的家庭语言背景以及不同年龄层学生的爱好和兴趣,以便设计访谈的话题和课堂活动。在第二个阶段,书面语语料库以“灵玖数据挖掘&语义分析智能开发平台”(Lingioin Text Mining&Semantic Parser Development Platform),对语料进行了分词和词性标注,并采用新加坡华文教研中心自行开发的句型标注系统对句子的类型进行人工标注;口语语料库的语料处理过程与书面语语料库类似,但在这之前多了一个转写环节,所有收集到的录音都转写成文字才入库进行语料处理,并反复进行人工校对。在第三个阶段,项目组对两个语料库的字、词、句的分布情况进行了总结,并产出了字表、词表和句型表。结合这两个语料库所提供的语言信息,课程开发者将能定位课程所应涵盖的词汇和句型范围,以及不同年龄层与不同家庭背景学生所应达到的基本语言水平。

在建设上述两个语料库时,语料的处理有一些共同的流程。简单来说,我们需要对收集来的语料进行处理、建库和加工。由于上述两个语料库的语料在来源和格式上有所不同,不同的语料需要采取不同的处理工序,使用不同的应用软件和语料处理平台来进行一系列的预处理工作。在语料预处理过程中所使用到的软件就包括:转写录音的专用工具Transcriber、用于处理文本的专用软件或文本整理器(如:PowerGREP、AntConc和UltraEdit)以及由新加坡华文教研中心语料库项目组自行开发的语料校对与标注系统。以下是这两个语料库所涉及语料的处理方式:

报章语料的处理:由于报章语料绝大部分直接下载自新加坡报业控股的《Newslink》档案库,在下载过程中出现了乱码、标点符号不一致以及非自然断句的现象。对这些有问题的语料,我们进行了人工校对,并将少量无法核对的语料加以删除。同时,我们也借助上述不同的应用软件,集中处理标点符号及非自然断句的问题;

儿童读物、漫画和杂志的处理:对于收集到的小说、故事、漫画、图书以及杂志,我们进行了扫描、文字识别及格式转换,并对提取出来的文字进行校对;

口语的处理:口语的处理过程基本包括:录音和转写,之后统一转换格式,并进行人工校对;

网页的处理:网页资料的处理虽然较为直观,但由于内码和编码的不同,在下载后仍需要经过格式转换及人工校对的工序。

经过预处理的语料会通过“灵玖数据挖掘&语义分析智能开发平台”进行语料加工处理。加工的程序如下:

首先是对语料进行查重分析,将重复的文本文件剔除。

其次,由于两个语料库所收集的语料包含了大量本地特色词汇及惯用搭配,这些词汇和配搭并未收入“灵玖”平台,因此需要研究人员在“灵玖”平台上识别新词,并标注其词性,以便系统之后依据确认的新词切分语料。

再者,“灵玖”平台会对语料进行自动化分词和词性标注,进而生成词表初稿,供研究人员以新加坡华文教研中心的语料校对与标注系统逐词进行校对。之后根据本课题组研制的句型与句类标注体系对库内的句子再进行标注。

最后,在完成词汇校对与句型标注后,即可使用新加坡教研中心开发的语料提取与数据分析工具,生成所需要的词表和句型表,并提取词频、词汇丰富度、词汇密集度、词汇覆盖率、句频、句长等信息。

总的来说,书面语和小学口语语料库的建库流程基本包括:语料采集、语料预处理、语料入库、语料分词和校对,以及数据产出。以下是这5个步骤的示意图,见图1。

图1:语料处理流程

3.书面语语料库的内容与初步结果

为确保所采集的语料具备代表性,语料库课题组首先展开了一个学生阅读兴趣问卷调查,以了解学生在日常生活中会接触到的文本或媒介类型,以及这些文本或媒体的具体名称。这个调查涉及大约1700名中小学生,覆盖各个年级与学校基本类型。在分析了学生的阅读兴趣后,我们展开了语料的采集工作,所采集的范围相当广:在文体方面包括了学生报、故事书、教辅材料、歌词、剧本、网络资源等;在内容和主题方面涵盖了学生专题报道、时事、体育、娱乐、旅游和休闲等。这些语料按学生们接触的比例收集,力求文本类型与生活主题的平衡,以尽可能涵盖不同书面媒体和主流文体中各种题材和领域的用词与句型。表1 (P39)是书面语语料库中语料的文本分布情况。

如表1所示,书面语语料库共2,637,990字次,覆盖报章和非报章两种语料。为了贴近学生接触报章和非报章文体的实际情况,报章文本的收集比例略少,占全库的44.38%,且以两份学生报为主,即《逗号》和《大拇指》,共占报章类语料的近乎一半(20.14%)。非报章语料部分,根据学生文本接触的比例,在收集的比例上略多,共收集了1,467,367字次,占全库的55.62%。在非报章语料中,占比例较多的是故事书与文学作品及参考书,分别占全库的15.04%和13.73%。这里值得注意的一种语料是非报章中的其它文本,它所占的比例虽然不高(仅3.23%),但却和学生的日常生活更为密切。它包括了学生平日在学校看到的壁报、街上拿到的传单,以及在一些本地名胜景点所能取得的文物介绍或历史事件说明。

上述200多万字次的语料经“灵玖”分词软件切分,以及相关课题组的人工校对后,共得词次(型符数,Token)1,695,214,词条(类符数,Type)53,230个。为便于教材编写者参考,该课题组以覆盖全库95%的覆盖率为限,将53,230个词条的前10,290个高频词视为新加坡学生最常接触的词汇。表2是这些常接触词条的分布情况。

表1:书面语语料库的语料分布 

表2:书面语语料库的词条分布

这一万余个词条分布于21个词类,分别是:普通名词、时间词、方位词、处所词、地名、机构团体名、动词、形容词、副词、量词、代词连词、介词、数词、助词、拟声词、感叹词、语气词、成语及习用语块、前缀及后缀。在这些词类中,实词类(即名词、动词、形容词、数词、量词和代词)所占的比例最大,共有9,299个词条,约占词表词条数的90.37%。虚词类的词条则最少,共991个,仅占词表词条数的9.63%。

为更具体地锁定新加坡学生应该掌握的基本词汇,课题组分别设计出该语料库中两个子库的个别词表,分别是小学子库词表和中学子库词表,并对它们之间共有的词汇进行对比,如表3(P40)所示。对比结果显示,两个子库中共有的词条为17,039个,其中94.21%是实词(共16,052个),5.79%是虚词(共987个)。这两个子库共有的词汇可以被视为学生由小学至中学间必须学会的基本词汇。

除词汇外,课题组也对书面语语料库中的句子进行了句型的标注和计算。在全库118,956个句子中,在单句方面以动词谓语句、无主句和形容词谓语句较为常见,分别占句子总数的77.33%、13.03%和7.79%。至于复句方面,较常见的3种句型包括承接复句中的“……就……”、并列复句中的“……也……”和转折复句中的“虽然……但是……”,分别占全库句数的0.06%、0.04%及0.03%。

表3:书面语语料库小学与中学子库的词条分布与共有词条

表4:口语语料库取样对象的分布

4.口语语料库的内容与初步结果

新加坡小学生日常华语口语语料库的建设工作较书面语语料库复杂。该库首先设定了3种数据收集的方法,以求全面捕捉小学生的口语情况或能力。这3种数据收集方法包括一对一访谈、课堂实录和家庭对话。一对一访谈主要采取研究员诱导学生说话的方法来采集语料。这种方法能较为直接有效地取得大量的口语语料,然而它相对不自然,属于非自然的口语语料。课堂实录则是通过老师组织口语活动的方法让学生在活动中自发地产出口语语料。这种方法能提供相对自然的语料,因为课堂上的互动原就是学生使用口语的一种情景。家庭对话则是在家长配合下录制学生于家庭活动中以华语交谈的做法。这种数据最自然,因为学生是在一种自己熟悉的氛围下,随需要产出华语的。表4是这3种数据收集方法所收集的大致数量。

如表4所示,该语料库预计收集720名学生的一对一访谈语料,然而因为学生缺席和录音设备故障,最终只收集到699名学生的一对一访谈语料。在课堂实录方面,该库收集到所预计之48堂课的语料,而在收集上数量最少且最珍贵的家庭对话也如预期的,完成了72名学生和家人的生活对话语料收集。这里必须一提的是在进行语料收集前,课题组向学生发放了两份问卷,第一份是一个有关学生家庭语言使用情况的调查,这个调查将最终为每名学生计算出他所属的家庭语言背景类型(分别为:主讲华语家庭、双语家庭和主讲英语家庭)。另一份问卷则主要调查学生们所喜爱的话题,调查的结果则用于设计一对一访谈中的诱导题目和课堂实录中所会进行的口语活动,这是为了让学生在最熟悉的话题里,最大限度地发挥自己的口语能力。

表5:儿童家庭语言背景与其词汇丰富度的关系

在完成语料的收集后,所有的语料都被转写成文字(即逐字稿)并根据先前提到的语料库进行建库。该语料库最终得词次1,285,096,词条8,371个。这8,000余词条中,普通词汇(即汉语中有的词汇)7,358个,包括成语的语块164个,人名、地名专名等849个。这些词外,课题组还发现了290个新加坡、马来西亚及港台地区才使用的特有词汇(也可视为未规范的词汇),这些词汇有些仍应保留在华语中,有些则应该有所扬弃或进行规范。

在句类与句型方面,全库共有299,394个句子。其中,绝大部分是陈述句,占全库句子数的90.46%;其次是疑问句,占全库句子数的6.91%;再者为感叹句和祈使句,分别占全库句子数的2.20%和0.41%。在单句方面以动词谓语句、简略句和独词句较为常见,分别占句子总数的28.55%、22.80%和9.73%。至于复句方面,较常见的3种句型包括因果复句中的“因为……所以……”、承接复句中的“……然后……”和假设复句中的“如果……就……”,分别占全库句数的3.15%、0.97%及 0.77%。

除分析口语语料库的分词与句型结果外,该语料库还根据上述学生家庭语言使用情况调查,给每位参与调查的学生换算出一个代表其家庭语言背景类型的“华语接触指数(Chinese Exposure Index,简称CEI)”。该指数,介于1到-1之间。指数越接近“1”代表儿童来自主讲华语的家庭,趋于“0”则代表儿童来自双语并行的家庭,而接近“-1”则代表儿童来自主讲英语的家庭。该课题组以这一指数对比了不同家庭语言背景儿童在词汇丰富度(lexical diversity)、语法复杂程度(syntactic complexity)和语码转换频率(code-switching frequency)上的表现。表5到表8为初步比较的结果。

在词汇丰富度上,课题组计算了几个丰富度指标,分别是每名儿童在一对一访谈中的总词条数、总词条数对总词次的比例(即Type-Token Ratio,TTR值)、华语词条数以及华语词条数对华语词次的比例。这些指标的数值越高就意味儿童的词汇越丰富。所以,根据表5,参与研究之儿童的家庭语言背景和几个词汇丰富度指标的相关系数虽然不高,但仍呈现一些显著的正相关趋势。CEI与总词条数的相关系数为0.152,与华语词条数的相关系数为0.231。CEI与总TTR值和华语TTR值则未呈现显著的相关性。换言之,部分词汇丰富度的指标(如:总词条数、华语词条数)显示,主讲华语家庭的儿童,其总词汇量和华语词汇量较为丰富,反之,主讲英语家庭的儿童则较低。然而,有部分词汇丰富度指标(如:TTR)则未显示出显著的相关性。

在语法复杂程度上,课题组计算了以下几个指标,分别是每名儿童在一对一访谈中的独词话轮数、短语话轮数、单句话轮数、复句话轮数、单句话轮句长、复句话轮句长以及他们使用的连词词条数。据表6显示,与儿童家庭语言背景产生显著相关性的是独词话轮数和复句话轮数,相关系数r值分别为-0.113和0.101。值得注意的是,家庭语言背景与独词话轮数呈现了负相关,这意味主讲英语家庭的儿童较常使用语法复杂度较低的独词话轮与人沟通。相反的,主讲华语家庭的儿童较常使用语法复杂度较高的复句话轮与人沟通。

表6:儿童家庭语言背景与其话轮类型的关系

此外,表7则显示,家庭语言背景与单句话轮句长和复句话轮句长皆产生显著的正相关,相关系数r值分别为0.163和0.168。这意味着主讲华语家庭的儿童能够产出较长的单句与复句话轮。相反地,主讲英语家庭的儿童则会产出较短的单句与复句话轮。在连接词的使用方面,主讲华语家庭的儿童能使用的连词较多,而主讲英语家庭的儿童所能使用的连词则较少,因此家庭背景指数CEI与连词词条数就呈现了正相关,r值为0.172。换言之,主讲华语家庭的儿童能用较多的连词产出较为复杂的话轮,而主讲英语家庭的儿童,由于较少接触华语,无法自如地使用连接词,因此只能产出语法较为简单的话语。

表7:儿童家庭语言背景与其单复句平均句长的关系

除了观察儿童家庭语言背景和词汇丰富度与语法复杂程度的关系,课题组还标注和计算了每名儿童转换语码的情况,所使用的观察指标包括英语词条数、语码转换话轮数、话际语码转换数以及话内语码转换数。表8显示,家庭语言背景与这些指标基本形成显著的负相关,相关系数r值分别为-0.179、-0.196、-0.197以及-0.147。这表示主讲英语家庭的儿童更倾向于在进行华语沟通时使用语码转换,而他们所使用的语码转换类型(即在同一个话轮内切换语码)。这种语码转换意味着说话人无法连贯地用华语表达,而需要借助英语语块完成沟通。总的来说,上述相关系数意味着较少接触华语的儿童会在需要用华语沟通时,使用其替代资源(即英语)。综合口语语料库的统计结果,预计儿童家庭背景所展现的语言使用特点,教材编写者和语言教师将能更好地把握语言学习的焦点,以及所要解决的问题。

表8:儿童家庭语言背景与其语码转换倾向

5.语料库的应用

上述两个语料库的核心产出(按照相关要求)仅是为课程编写者提供所参考的词表与句型表。然而,这类产出对教学前线未必有直接的贡献。实际上,语料库的用途并不仅限于标准词表或句型表的拟定,它在教学上有3大主要的用途或应用方式,这里简要陈述并谈谈课题组对于这3大应用方式所做出的努力。

首先,建设语料库的其中一项核心用途就是梳理和描述语言的基本使用规律,找出语言成分(如:字、词、句、篇)的基本形态、搭配、使用范围和使用方法等。这些规律既要彰显语言成分间存在的共性,也要显示个别成分的特性。上述两个语料库中的书面语语料库基本完成字、词和句的共性梳理,并已把这些共性特征以频率字典、频率词典和句型索引的形式发布(请参考《新加坡学生日常华文用语调查系列》),而对于词汇与句子的个性特征则尚在整理。

其次,语料库的另一用途是整理和了解不同学习者在学习同一语言时所产生的语言现状,尤其是学习者在学习过程中所形成的中介语(Inter-language)或所面临的问题及惯性错误等。对这些现象的整理将有助于教师开发针对性的教学。在这方面,上述所提到的小学口语语料库正在进行这方面的整理。该语料库将从学生的口语转写语料中找出新加坡不同年龄层、不同家庭语言背景学生的普遍口语特点和偏误并予以标记,同时提供相应的教学建议。这个语料库将最终开发成一个教师培训资源,让有需要的教师能在线了解学生的口语问题,并找到相应的解决方法。

图2:新加坡华文教学资源平台的六个模块

图3:新加坡华文教学资源平台的词汇查询功能模块

第三,建成的语料库还可进行后续开发,以期作为教学的资源。所能开发的资源,既可作为教师教学的素材(如进行真实语料的导读、基于数据库的词汇或语法教学),也可作为学生自学的材料,如进行数据驱动的学习(Data Driven Learning)。在这方面,上述的书面语语料库已开发出新加坡首个基于语料库的平台——新加坡华文教学资源平台。该平台共分6个功能模块(见图2),其中“单字查询”“词语查询”(见图3)和“句型查询”是一般的语料检索功能,方便老师查询字词和句型的定义,并找到合适教学的例句。“文本难度分级”(见图4)和“全文查询”则是专为教师备课而开发的核心功能模块。“文本难度分级”模块能帮助老师鉴定课外阅读材料的适用级别并标示超纲字、词,“全文查询”模块则提供经过语言加工处理过的全文材料,方便老师说明文中的字、词或句型特征。该平台还开放了教师论坛,供教师对教学课题展开讨论,教师们甚至可以为个别字、词的教学提供建议并分享教学心得。

图4:新加坡华文教学资源平台的文本难度分级功能模块

6.结语

综上所述,本文简介了新加坡华文教研中心自2011年开发的两个语料库,分别为“新加坡学生日常华文书面语语料库”以及“新加坡小学生日常华语口语语料库”。这两个语料库的诞生主要对应于新加坡华文学习者素质与要求的改变。这两个语料库的结果除了能对课程编写有所贡献外,他们的后续开发将有助于前线教师与学习者的教与学。在今后的科研工作中,教研中心将继续探索语料库的其他教学用途,如以书面语语料库为基础进行试题难易度鉴定以及以口语语料库为基础建设一个培训口语教学的资源平台。

华文课程与教学法检讨委员会2004华文课程与教学

法检讨委员会报告书[M].新加坡:华文课程与教学法检讨委员会.//CLCPRC(Chinese Language Curriculum and Pedagogy Review Committee)2004Report of the Chinese Language Curriculum and Pedagogy Review Committee[M].Singapore:Chinese Language Curriculum and Pedagogy Review Committee.

林进展,赵春生,洪瑞春,吴福焕,王志豪2015基于语料库的新加坡华文教学资源平台开发[J].华文学刊,卷13,第1期,1-15.新加坡:南大-新加坡华文教研中心出版社.//Lin,J.,C.Zhao,S.C.Ang,H.H. Goh&C.H.Wong2015Development of a corpusbased resource platform for Chinese language teaching in Singapore[J].Journal of Chinese Language Education,13(1):1-15.Singapore:NTU-SCCL Press.

母语检讨委员会2010乐学善用[M].新加坡:新加坡教育部.//MTLRC(Mother Tongue Language Review Committee)2010Nurturing Active Learners and Proficient Users[M].Singapore:Ministry of Education.

谢泽文2003教学与测试[M].新加坡:新加坡华文教师总会.//Cheah,C.M.2003Teaching and Testing[M].Singapore:Singapore Chinese Teachers'Union.

吴福焕,郭秀芬,赵春生,周红霞,高月华,杨斯琳2012新加坡小学一年级华语口语词汇表(阶段性报告)[Z].新加坡:南洋理工大学新加坡华文教研中心.//Goh,H.H.,S.H.Kwek,C.Zhao,H.Zhou,G. H.Ko&S.Yang2012Singapore Primary One Chinese Oral Wordlist(Preliminary Report)[Z].Singapore:Singapore Centre for Chinese Language,Nanyang Technological University.

吴福焕,黄雪霞,林进展,赵春生,李志贤2012新加坡小学常用词汇与句型报告(阶段性报告)[Z].新加坡:南洋理工大学新加坡华文教研中心.//Goh,H. H.,S.H.Ng,J.Lin,C.Zhao&C.H.Lee2012 Singapore Primary School Daily Vocabulary and Sentence-Types Report(Preliminary Report)[Z].Singapore:Singapore Centre for Chinese Language,Nanyang Technological University.

姚剑鹏2005语料库研究与语言教学[J].全球教育展望(12).//Yao Jianpeng2005Corpus research and language teaching[J].Global Education(12).

余国良2009语料库语言学的研究与应用[M].成都:四川大学出版社.//Yu Guoliang2009Research and Application of Corpus Linguistics[M].Chengdu:Sichuan University Press.

Braun,S.2007Integrating corpus work into secondary education:from data-driven learning to needs-driven corpora[J].ReCALL 19(3):307-328.

Cook,G.1998The uses of reality:a reply to Ronald Carter[J].ELT Journal 52(1):57-64.

Gavioli,L.&G.Aston2001Enriching reality:language corpora in language pedagogy[J].ELT Journal 55(3):238-246.

Kaplan,R.B.&R.B.Baldauf1997Language Planning:From Practice to Theory[M].Clevedon:Multilingual Matters.

Liu,Y.&S.Zhao2007Chinese language education research in Singapore:making a case for alternative research orientation[A].In V.Vaish,S.Gopinathan& Y.Liu(eds.)Language,Capital,Culture:Critical Studies of Language in Education in Singapore[C]. Amsterdam:Sense Publishers:133-153.

McEnery,T.&R.Xiao2010What corpora can offer in language teaching and learning[A].In E.Hinkel (ed.),Handbook of Research in Second Language Teaching and Learning[Z].(Vol.2:364-380).London&New York:Routledge.

Pakir,A.1991The status of English and the question of “standard”in Singapore:a sociolinguistic perspective [A].In Tickoo,M.L.(ed.),Languages&Standards:Issues,Attitudes,Case Studies[C].Singapore:SEAMEO Regional Language Centre:109-130.

Shepherd,J.2005Striking a Balance:the Management of Languages in Singapore[M].Frankfurt am Main:Peter Lang.

Silver,R.E.2005The discourse of linguistic capital:language and economic policy planning in Singapore [J].Language Policy 4(1):47-66.

Tan,C.2006Change and continuity:Chinese language policy in Singapore[J].Language Policy 5(1):41-62.

Zhao,S.&Y.Liu2007The home language shift and its implications for language planning in Singapore[J]. The Asia-Pacific Education Researcher 16(2):111-126.

Construction and Application of Education-Specific Corpora in Singapore

Goh Hock Huan1,Lin Jinzhan2,Zhou Hongxia3
(1.2.3.Singapore Centre for Chinese Language,Nanyang Technological University,279623 Singapore)

education-specific corpus;written language;oral language;corpus application;

This article will focus on introducing the development of the two education-specific corpora,namely the“Singapore Daily Written-Chinese Corpus”and the“Singapore Primary School Children Spoken-Chinese Corpus”.Being educationoriented corpora,these two corpora take into consideration the requirements of curriculum development and language teaching,especially in the sampling and processing of language materials.To fully applied corpus in language teaching,the research team also developed a corpus-based Chinese language teaching resources platform to help Chinese language teacher in preparation of lessons and assessments.

H195

A

1674-8174(2016)03-0036-10

【责任编辑刘文辉】

2015-10-15

吴福焕(1975-),男,新加坡人,新加坡南洋理工大学新加坡华文教研中心研究科学家、院长室研究参谋,香港大学教育学院荣誉副教授,博士,主要从事社会语言学、语料库语言学、双语教育学、儿童语言发展、中小学华语文课堂研究。电子邮箱:hockhuan.goh@sccl.sg。林进展(1982-),男,福建厦门人,新加坡南洋理工大学新加坡华文教研中心高级副研究员、研究组长,博士,主要从事语料库语言学、词汇语义学、词典学、语言测试研究。电子邮箱:jinzhan.lin@sccl.sg。周红霞(1969-),女,新加坡人,新加坡南洋理工大学新加坡华文教研中心高级副研究员,硕士,主要研究方向为二语习得和华语文教学。电子邮箱:hongxia.zhou@sccl.sg。

新加坡教育部课程规划与发展司资助项目:“新加坡日常华文书面语语料库建构与常用词汇语法研究”(ERC-RD-2011/01-GHH)//Singapore Ministry of Education Curriculum Planning and Development Division funded project:“An investigation of Daily Lexicon and Syntax in Singapore Written Chinese:Constructing a Specialised-Dynamic-Balanced Corpus”(ERC-RD-2011/01-GHH);新加坡教育部课程规划与发展司资助项目:“新加坡小学华语口语语料库的建构及口语词汇语法研究”(ERC-RD-2011/02-GHH)//Singapore Ministry of Education Curriculum Planning and Development Division funded project:“An Investigation of Daily Lexicon and Syntax in Spoken Chinese of Singapore Primary School Children:Constructing a Specialised-Balanced-Dynamic Corpus”(ERC-RD-2011/02-GHH);新加坡教育部课程规划与发展司资助项目:“基于语料库的新加坡华文教学资源平台开发”(ERG-2013/03-JZ)// Singapore Ministry of Education Curriculum Planning and Development Division funded project:“Building a Corpora-Based Chinese Language Teaching Resources Platform for Singapore CL Teachers”(ERG-2013/03-JZ)

①本文所采用的资料是新加坡教育部资助之“新加坡学生日常华文书面语语料库”“新加坡小学生华语口语语料库” 与“基于语料库的新加坡华文教学资源平台开发”项目的部分研究成果。本研究得到了新加坡教育部、华文教师、学生、家长和相关人士的大力支持,在此一并表示感谢。

猜你喜欢
词条华语华文
“和而不同”的华文教育
曹景行:华语新闻界里一个响当当的名字
浅议小学语文阅读指导策略
华文教育中的汉字文化教育
2016年4月中国直销网络热门词条榜
大数据相关词条
华语大片经典改造的迷失与救赎
华语电影概念探微
心灵幽暗处的悬疑风景——2013年华语惊悚片述语
杭州特产