日语专业学生产出性词汇广度知识发展的研究
张建华
(上海交通大学,上海,200240)
摘要:本研究运用文本分析方法探讨了日语专业学生产出性词汇广度的发展特征。研究对84名2年级至4年级学生的168篇作文进行分析后发现:随着年级的提升,学生作文中的低频词使用比例有所增加,词汇多样性和复杂性的指标呈上升趋势,尤其在2年级到3年级之间进步显著,但是3年级到4年级之间进步趋缓,甚至有退步的迹象,学生的产出性词汇广度知识呈非线性发展态势。由此可见,日语学习者产出性词汇的发展过程中,存在着“高原期现象”。此外,研究还发现,词汇密度不能区别不同年级学生的日语水平。
关键词:日语学习者,产出性词汇,词汇广度,高原期现象
[中图分类号]H08
doi[编码] 10.3969/j.issn.1674-8921.2015.03.006
作者简介:张建华,上海交通大学外国语学院教授、博士生导师。主要研究方向为二语习得研究。电子邮箱:zh_jianhua@sjtu.edu.cn
1. 引言
每种词汇知识都包括接受性词汇和产出性词汇,接受性词汇指在阅读或听力中学习者能理解最基本词义的词汇,而产出性词汇指在书面和口语表达中学习者能够自由运用的词汇。后者是外语教学的重要目的之一。自20世纪80年代以来,国内外学者和外语教育者从多个视角对学习者产出性词汇进行了探索和研究,取得了丰硕的成果。然而,这些研究大多是以英语学习者为研究对象,而与日语学习者相关的研究很少,采用文本分析法研究日语词汇习得的论文更是凤毛麟角。鉴于此,本文采用文本分析法,从词频分布、词汇多样性、词汇复杂性、词汇密度等4个维度,探讨日语学习者产出性词汇的发展特征,以期为日语词汇的教与学提供一些借鉴。
2. 文献回顾
研究学习者的产出性词汇,通常采用测试法和文本分析法。测试法是采用词汇知识表、词语联想测试等方式测定学习者的词汇量和词汇掌握程度,适合用于个别或少量词汇的研究。而文本分析法则测量学习者口语和书面语中词汇使用的整体情况,适合对学习者语料库的大量文本进行研究。本文目的是探讨日语学习者产出性词汇的发展特征,需要对学习者的大量作文文本进行测定,因此,本研究采用文本分析法进行考查。
在研究学习者的产出性词汇时,学者大多从词汇广度知识和深度知识两个维度展开。而词汇广度知识的发展特征又是学习者词汇能力发展的一个重要标准(张文忠、吴旭东2003),因此,本次研究主要探讨日语学习者产出性词汇广度知识的发展特征。
在英语二语习得研究领域,学习者产出性词汇的发展研究已有许多成果,与本研究相关的有以下几个。谭晓晨(2006)发现英语水平与产出性词汇广度知识发展关系密切,其发展过程存在3个阶段:1~2年级是迅猛阶段,2~3年级为过渡阶段,3~4年级为维持阶段。文秋芳(2006)对56名英语专业学生的4年跟踪口语作文语料进行考察的结果发现:学习者在词频广度和词汇多样性方面都呈上升趋势,2~3年级是指标变化的最佳时段。崔艳嫣和王同顺(2006)研究发现,随着年级的提升,高频词的使用比例逐渐下降,然而,在低频词的使用比例上,1年级与2年级、3年级与4年级之间均无显著差异。在词汇变化方面,高年级学生的词汇重复率比较低年级学生低,但在1年级和2年级、3年级与4年级之间无显著差异,出现了“高原现象”。上述研究虽然以英语学习者为研究对象,但是对于日语学习者的词汇习得研究也具有重要的参考价值。
3. 研究设计
本文借鉴以上的研究成果,采用文本分析的方法,研究日语学习者产出性词汇广度知识的发展特征,具体回答以下问题:(1)日语专业学生在产出性词汇广度的发展上呈现怎样的趋势和特点?(2)随着年级和日语水平的提升,学生的产出性词汇知识的广度是否也同步发展?(3)测量日语学习者产出性词汇广度的有效指标是什么?
3.1研究数据
本研究的作文数据来源于自建的“日语学习者书面语语料库”,包括国内两所高校84名日语专业学生的168篇作文。所有受试均为大学2~4年级的学生,每个年级各28人,日语均为零起点。本研究按照年级分成3个水平组。168篇作文来源于写作课的课堂限时作文,每个学生各抽取两篇作文,一篇是命题作文,一篇是自由拟题作文。写作时间为该年级第一学期的11月和12月之间,两篇作文的间隔时间约1个月,文体均为议论文。我们选择同一时期写作的同一文体的作文,以便于对不同水平组进行比较,增强研究的可信度。
3.2产出性词汇广度知识的测量
产出性词汇包括书面和口语表达使用的词汇,本研究中产出性词汇是指学生在日语作文中使用的词汇。本研究测量学生作文中产出性词汇广度知识的指标,是参照国内外学者常用的词频分布、词汇多样性、词汇复杂性和词汇密度(Laufer 1991)4个指标。
3.2.1词频分布及统计
词频分布指文本中不同词频等级类符的分布比例。目前,在日语二语习得研究领域还没有开发出类似英语LFP那样的词频量表,因此,本研究以日本语能力考试出题标准(旧版)的4级词汇表(国际交流基金2002)为测量词频的标准。该词汇表是在调查统计大型日语语料库的词频基础上,为测量日语学习者的词汇量而制定的。虽然年代已久,但仍具有较高的可信度,在日语二语习得领域中被广泛使用。这个词汇表包括4级词汇728个词,3级词汇1409个词,2级词汇5035个词,1级词汇8009个词。其中,4级词汇使用频率最高,学习者最易掌握。1级词汇出现频率最低,最难习得。词频统计使用川村よし子、北村達也(2013)设计开发的“チュウ太レベルチェッカー”软件。该软件可以自动生成5个词汇表,除4级词汇表之外,还有级外词汇。
3.2.2词汇多样性及统计
词汇多样性测量学习者使用词汇的范围和种类,以文本中的类符(Type)和形符(Token)的比率来测定。类符即文本中不同的词,形符是指文本总词数(文秋芳2006)。我们对某一文本中出现的一个词的所有变体,如“行く、行か(ない)、行け(ば)、行こ(う)”作为一个类符计算。类符与形符之比的传统计算方法是类符数除以形符数,但是由于该比率随着文本长度而改变,因此需要首先转化成标准化的类符形符比,才能使不同长度的作文之间具有可比性,本研究的标准化方法是计算出平均每1000词的类符形符比。类符数和形符数使用软件“チュウ太レベルチェッカー”自动生成。
3.2.3词汇复杂性及统计
词汇复杂性是测量低频词在文本中所占的比例。一般来说,低频词出现和使用的频率低,学习者难以习得。因此作文中低频词的使用比例在一定程度上能够反映出学习者产出性词汇量的大小和词汇量的发展情况(鲍贵2008)。如前所述,“日语能力考试”中的1级词汇,在4级词汇中出现和使用频率最低,此外,软件“チュウ太レベルチェッカー”生成的级外词汇也属于低频词,因此,本研究视1级词汇和级外词汇为低频词,以此测量学生作文中的词汇复杂性。具体操作方法为:利用软件“チュウ太レベルチェッカー”统计1级词汇和级外词汇的类符数,然后计算低频词在每一文本中的比例。
3.2.4词汇密度及统计
词汇密度指一篇文本中实词数量所占的比率。文本中实词越多,传递的信息也就越多,因此它是测量词汇习得的有效指标。本研究将名词、动词、形容词、副词视为实词。利用软件“チュー太レベルチェック”生成词汇表,然后,统计每一文本中实词所使用的次数(包括重复信息)和在总词数中所占的百分比。
3.3数据的处理与分析方法
本研究在统计数据之前,首先对文本进行人工处理。删除文本中的人名、地名、生造词和无法辨认的词。对能够猜测的书写有误的单词和写法不统一、不规范的单词进行纠正,把词典中查不到的复合词分成单一词,防止误导软件作出错误的判断。在使用软件对文本处理后,再次对数据进行人工校对,纠正处理过程中的个别错误,以便提高研究的可信度。本研究的数据分析方法包括描述性统计分析、单因素方差检验及多重比较检验等统计方法,所使用的统计软件为SPSS 11.0。
4. 研究结果与讨论
本节介绍和讨论3个年级组在词汇广度知识发展上的特征。词频分布、词汇多样性、词汇复杂性和词汇密度4个指标的统计数据均为百分数。
4.1词频分布的变化
表1为3组作文中词频分布的情况。4级词汇在3组中占据比例均为最高,分别为:36.0662%、33.9716%和34.6516%。这是因为4级词汇属于常用词,是日语词汇中最基础的部分。2级词汇所占比例为第二位,分别是15.5459%、17.5939%、18.5241%。3级词汇为第三位,分别为16.3102%、16.7086%、16.8984%。级外词汇为第四位,分别为4.0259%、5.4127%、和7.1207%。1级词汇所占比例最低,分别为2.4086%、4.0173%和3.5246%,比其他级别的词汇比例有很大差距。
表1 词频分布的均值对比
为检验词频分布在3组间的差异,我们首先进行了方差齐性检验,结果显示组间方差齐性(p>0.05)。然后,以年级为自变量,以4个级别和级外词汇的平均词汇量为因变量进行了单因素方差分析。从表2的数据可知,3级和4级词汇的使用比例在3组之间没有显著差异(F(2,165)=2.005,p=0.131;F(2,165)=0.527,p=0.591)。而1级、2级和级外词汇的分布比例在3组间都有显著性的差异。具体数据为:1级词汇比例的变化情况为F(2,165)=11.023,p=0.000;2级词汇为F(2,165)=8.181,p=0.000;级外词汇为F(2,165)=21.706,p=0.000。
为进一步考察哪些年级之间存在着显著的差异,我们对3组之间有显著差异的1级、2级和级别外词汇分别做了多重比较LSD检验。从表3可知,2年级组与3、4年级组之间,在1级词汇和2级词汇的使用比例上都有显著差异(p<0.05)。也就是2年级作文中的1级和2级词汇的使用比例比3、4年级组明显要低。然而,3、4年级两组之间的使用比例没有显著差异(p>0.05)。从数据上看,4年级组的2级词汇使用比例增长速度缓慢,1级词汇的使用比例甚至有小幅下降迹象。级外词汇的使用比例在3组之间有显著差异,呈现随着年级升高逐渐上升的趋势,4年级组的比例为最高。
表2 组间词频分布差异的单因素方差分析
表3 1级和2级词汇分布组间差异的多重比较
总体上来说,4级和3级词汇的分布在3组间基本稳定,级外词汇的比例随着年级升高逐渐上升,呈直线性发展。而1级和2级词汇的比例,仅在2年级和3年级组之间有显著差异,3、4年级之间无显著性差异,呈非线性发展。
4.2词汇多样性的发展
在本研究中,词汇多样性以平均每1000词的类符形符比进行统计。由表4可知,3组间的均值存在差异,2年级和3年级两组之间的差异尤为明显,与3年级组比较,4年级组的均差有小幅下降。为检验这是否属于显著差异,我们对3组数据做方差齐性检验和单因素方差分析。结果显示组间方差齐性。单因素方差分析结果(见表5)表明,3个组之间在词汇多样性上存在显著性的差异(F(2,49)=7.357,p=0.002)。
表4 3组词汇多样性的均值对比
表5 组间词汇多样性差异的单因素方差分析
为考察在哪些年级组之间在词汇多样性上存在着显著差异,我们进行了多重比较分析。结果表明(见表6):3组之间存在显著性差异。也就是说,随着学生日语水平的提升,词汇多样性有不同程度的增长,学生写作中用词的种类逐渐增加,能够尽量避免重复使用同样的词语。在2年级到3年级之间,词汇多样性增长速度迅速,而在3年级到4年级之间出现了退步的迹象。
4.3词汇复杂性的发展
对3组作文中的词汇复杂性进行统计发现,均值分别为:6.4345%、9.43%、10.6454%,说明3组学生的词汇复杂性呈总体上升态势。
为考察3组之间的词汇复杂性有无显著差异,我们进行了方差齐性检验和单因素方差分析。结果显示组间方差齐性。单因素方差分析结果表明:3个年级组的词汇复杂性具有非常显著的差异:F(2.165)=11.023。
多重比较LSD检验的结果表明(见表7):2年级组与其他两组之间的差异非常显著(p<0.05),而3年级和4年级组之间的差异不具有统计意义(p=0.162)。总体上说,2年级到3年级之间词汇复杂性的进步最为显著,而3年级到4年级进步缓慢。
表7 组间词汇复杂性差异的多重比较
从以上考察结果可知,词汇多样性和词汇复杂性随着学习者年级的升高而提升。2年级至3年级之间,词汇迅速增加,属于上升阶段,但是在3年级至4年级之间,速度明显放缓,甚至出现后退的迹象。这说明学习者产出性词汇发展到一定水平就很难进步,出现“高原期现象”(陈亚平1997)。即在学习初期,学习者词汇迅速增加,但到了某一阶段往往会停滞不前,甚至出现某种程度的下降。本研究结果与吴旭东和陈晓庆(2000)、崔艳嫣和王同顺(2006)以及文秋芳(2006)的结论相似,这可能是二语学习者词汇能力发展中普遍存在的一个问题。
4.4词汇密度的发展
3个组作文中词汇密度的统计结果分别为:35.7837%、34.6839%、34.07732%。
表8 3组词汇密度的均值对比
表8说明,3组作文中的词汇密度呈逐渐下降的趋势。2年级组的最高,4年级组的最低。单因素方差分析和多重比较分析的结果(见表9)表明了3组之间存在显著性差异。这个结果印证了Engber(转引自万丽芳2010)的结论,即词汇密度不能有效区分学习者词汇广度的发展,且词汇密度是按照实词在作文中出现的频率测定,如果一个单词在作文中多次使用,词汇密度自然会上升,但这未必能够说明词汇广度有了进步。
5. 结论
本研究对84名2~4年级学生的168篇作文进行分析后发现:随着年级的升高,学生作文中的低频词有不同程度的增加,词汇变化性和复杂性的指标呈现上升趋势。因此说,产出性词汇广度知识的发展与学习者日语水平有着密切的关系。但是,学生的低频词增长速度非常缓慢,有依赖高频词的迹象。而且在词频分布、词汇复杂性和词汇多样性的发展过程中,都普遍存在着“高原期现象”。此外,研究还发现,词汇密度不能有效地区别不同年级学生的日语水平。
本研究样本较小,存在着一定的局限性,很难反映日语学习者产出性词汇发展的全貌,因此,本研究得出的结论需要在今后的研究中进一步验证。本研究仅从词汇广度知识的维度对日语学习者产出性词汇进行了横向研究,在今后的进一步研究中,需要从词汇深度知识的维度进行考察,还需要与本族语语者和不同母语背景学习者的产出性词汇进行对比研究,更需要对日语学习者的产出性词汇开展纵向研究,只有这样才能得出具有普遍意义的结论,为外语教学提供有益的建议。
参考文献
Laufer, B. 1991. The development of L2 lexis in the expression of the advanced learner [J].TheModernLanguageJournal75: 440-48.
川村よし子、北村達也.2013.日本語学習者のための文章の難易度判定システムの構築と運用実験[J].JournalCAJLE(14): 18-30.
鲍贵.2008.二语学习者作文词汇丰富性发展多维度研究[J].外语电化教学(5):38-44.
陈亚平.1997.“二年级现象”的心理学解释及对策[J].外语教学与研究(4):56-60
崔艳嫣、王同顺.2006.接受性词汇量、产出性词汇量与词汇深度知识的发展路径及其相关性研究[J].现代外语(4):392-400.
国际交流基金.2002.日本語能力試験出題基準[M].にほんごの凡人社.
谭晓晨.2006.中国英语学习者产出性词汇发展研究[J].外语教学与研究(3):202-207.
万丽芳.2010.中国英语专业大学生二语写作中的词汇丰富性研究[J].外语界(1):40-46.
文秋芳.2006.英语专业学生口语词汇变化的趋势与特点[J].外语教学与研究(3):189-95.
吴旭东、陈晓庆.2000.中国英语学生课堂环境下词汇能力的发展[J].现代外语(4):349-60.
张文忠、吴旭东.2003.课堂环境下二语词汇能力发展的认知心理模式[J].现代外语(4):373-84.
朱慧敏、王俊菊.2013.英语写作的词汇丰富性发展特征[J].外语界(6):77-86.
(责任编辑甄凤超)