陈为捷 林韵蔚
英语写作是体现英语掌握能力的重要项目,并且在各种升学考试中,英语写作都是必不可少的,但是学生对英语写作充满困惑,而教师对英语写作的指导又不能满足英语学习者对英语写作的需求。随着计算机辅助教学技术的发展,写作自动评价系统出现并在教学中投入使用,系统的效度为学界所认可。通过对系统使用的调查研究发现,系统使用者的态度以及使用方法都会影响它的效果,但是系统对英语写作的辅助作用被证实是确实有效的。但是迄今为止却鲜有人去调查根据系统反馈进行的修改中哪些语言特征对习作分数的提升有积极的预测作用。因此本研究想探寻在自动评价系统的帮助下,那些写作成绩获得显著提高的学习者,在作文修改方面存在哪些共性特征?旨在为英语写作教学提供指导依据。
1. 多维分析方法
Biber的多维分析法:Biber(1988)从LLC(LondonLund Corpus)英语口语语料库和LOB(Lancaster-Oslo-Bergen)英语书面语语料库中选取了覆盖23种口笔语语体的文本。根据以往的研究,Biber总结出67个常用于分析语体变异的语言特征,它们包括过去时态、完成时态、现在时态、地点状语、时间状语等(具体67个语言特征见附录)。Biber对文本中的 67种语言特征进行了调查:他提取了每个文本的所有语言特征频率,通过对频率值的因子分析发现语言特征的共现情况,总结出描述语体特征的7个因子或7个功能性维度。它们包括维度1“交互性与信息性表达”(involved versus informational production)、维度2“叙事性与非叙事性描述”(narrative versus non-narrative concerns)等。每一维度由因子负荷为正、负值的两组“共现”性语言特征组成。这两组语言特征在一个维向上呈互补分布,表达相反的交际功能。比如说,第一维度上呈互补关系的是交互性功能和信息性功能。交互性功能由负荷值为正值的语言特征来体现,包括第一二人称代词、特殊疑问句、动词的现在时态以及私人性动词 (private verbs) 、强调式词语 (emphatics) 等,而信息性功能由因子负荷为负值的语言特征来体现,包括名词、介词、词长 (这里指复杂的词汇) 、类符与形符比 (type-token ratio,即语篇中的词汇密度) 等。所谓互补分布是说当带有负负荷值的语言特征频繁出现在一个语篇中,那带有正负荷值的语言特征就会出现的较少。 Biber(1989)在其多维分析框架的基础上,通过5个维度上词汇和句法特征的共现规律将481篇文本聚类为8种不同文本类型,包括亲密人际互动型(intimate interpersonal interaction)、信息互動型(informational interaction)等。在多维分析出现之前,以往的语体对比研究大多集中于分析语篇在某一参数上的差异 (如正式性与非正式性) ,难以充分揭示语体间的差异。多维分析这种基于统计分析的研究方法显然大大提高了分析的客观性和准确性。
2. 研究设计
2.1 研究问题
本文拟回答以下研究问题:
2.1.1分数得到显著提升的习作的初稿和定稿分别具有何种语体特征和具体语言特征?
2.1.2初稿和定稿在语体特征和具体语言特征上有何差异?
2.2 研究语料
下载某次批改网举办的“百万同题”写作活动中某学校参与的1448位学生的初稿和终稿共2896份习作,筛选出终稿与初稿相比提分达到10分以上的习作,得到81位同学的初稿和终稿,共162份习作,建立起一个小型语料库。
2.3 研究工具
Biber的多维分析严重依赖统计技术, 给研究者带来了巨大的技术困扰。 Nini (2015)根据Biber的研究框架设计了一个多维标注与分析工具MAT 1.3(Multidimensional Analysis Tagger 1.3)。通过实验对比发现用MAT按照 Biber1984年的分析流程处理文本后的结果与Biber的研究结果相符。实验证明MAT可以复制Biber的多维分析方法。江进林、许家金进一步认定了MAT多维语体分析的信度与效度。
MAT的使用使一系列繁琐的工作得以自动化完成,例如文本标注、特征提取和数据分析。 软件处理完文本就能生成每篇文章中每种语言特征的频数、每篇文章的维度值,在每个维度里参照其他8种文本类型,报告被研究文本最接近的文本类型等。
3. 结果与讨论
3.1 总体维度差异
3.1.1 体裁与文本类型
从MAT的报告的数据总体来看,提分10分以上的习作的初稿和定稿的文本类型相同,都是属于交互劝说型(involved persuasion)。初稿和定稿在单一维度之间的体裁类型只在维度六有变化——初稿在维度六“即席信息组织精细度(online information elaboration)”表现出来的体裁类型为广播稿(broadcasts),而定稿在维度六的体裁类型为官方文件(official documents),表明定稿的即席信息组织精细度略高于初稿,语篇组织紧凑度有所提升。
3.1.2 六个维度值差异
图1直观地显示初稿和定稿在维度5上的维度值有明显的差异,定稿的维度值明显高于初稿。维度5为“信息抽象与具体程度”(abstract versus non-abstract information)。维度值越高表明文章越抽象、越正式。可见,学生作文内容抽象程度与其作文成绩成正相关。
3.2 语言特征分析
从表2可以看出,将提分10分以上习作的初稿的语言特征和定稿的语言特征进行配对T检验后得出有显著差异的语言特征有8个,其中维度值升高的有名词化名词、联合短语、表语形容词和类形符比,维度值下降的有除名词化的名词外的其他名词、第二人称代词、过去时和现在完成时。
Biber和马克沃斯和Baker(1974)发现,现在完成时经常与过去时同时出现,作为叙事的标志。语料库中的习作文体是议论文,因此在定稿中,作为叙事文体标志的现在完成时和过去时的减少符合议论文文体的特点,为习作成绩的提高做出了贡献。Chafe(1985)指出,第二人称代词需要一个特定的接收信息人,并表示与该接收人的高度参与。这体现了文章中的高度互动。该语料库中定稿的第二人称代词使用频率的下降,正体现了论说类文章不需要那么强的互动性。第二人称代词使用的减少促使了习作成绩的提升。Chafe(1982,1985)和Danielewicz(1986)指出名词化的名词合能扩展思想的容量,并将信息整合到更少的单词中。名词化的名词使用频率的提升表现了相比于初稿,定稿信息的复杂度有所提升,这也促使习作成绩得到提升。由于名词化的名词使用频率的增加,比如导致其他名词使用量的减少,这与检验结果一致。类形符比的提高和联合短语的使用频率提升都体现了定稿信息密度的提高。表语形容词使用频率的增加体现了定稿中对某行为或某事件的评价,符合论说类文章中又论又评的需求,因而也促使了习作成绩的提升。
通过多维分析模型,我们发现分数提分10分以上的定稿与初稿相比,在维度5与维度6上有差异。相比初稿,该论说文的定稿表现出信息更密集、更抽象的特点,这是由语言特征使用频率的增减实现的。本研究给写作教学的启示是,引导学生形成语域意识,采用适合写作文体的语言特征。