新高考英语读后续写试题所给短文(2016—2021)的文本风格计量分析

2023-03-18 11:31:06浙江省海宁市高级中学徐使超
基础外语教育 2023年1期

浙江省海宁市高级中学 徐使超

一、引言

2014 年9 月,国务院发布的《国务院关于深化考试招生制度改革的实施意见》,将深化高考内容改革确立为一项主要任务与措施,对高考内容改革提出了新的要求。此后,14 个省及直辖市分三批开始实施高考综合改革,即“新高考”。2015 年8 月教育部考试中心颁布《普通高等学校招生全国统一考试英语科考试说明(高考综合改革实验省份试用)(第一版)》(以下简称《考试说明》)。高考改革率先在上海、浙江两地实施。自2016年11 月始,浙江省高考英语科考试由原先的一年一考调整为一年两考,在试卷第二部分增加了“读后续写”与“短文概要”两种写作题型;2020 年山东省高考英语科考试增加“读后续写”题型。2021 年高考英语全国I卷(山东、广东、福建、江苏、湖南、湖北、河北七省使用)使用读后续写题型。读后续写题型五年来共在新高考中出现10 次(见表1)。

表1 新高考英语科使用读后续写题型的省份

读后续写题型要求学生在阅读语篇后按照任务要求进行短文续写,充分体现高考评价体系的综合性、应用性和创新性,能够有效考查学生综合语言运用能力、思维能力和学习能力(教育部考试中心,2020)。陈康和张洁(2020)组织16 名具有高考英语评卷经验的人员进行评卷,评卷人员对读后续写题型普遍表示认可,认为该题型需要学生具备良好的读写能力、逻辑思维能力和创新能力,很好地考查了综合语言运用能力。杨学为(2020)认为,读后续写题型的出现体现了高考从“考知识”到“考能力”的理念转化,但同时也对考生的语用能力提出了新的要求。

根据《考试说明》(教育部考试中心,2015),“与所给短文的衔接程度”是读后续写评分的重要标准。《考试说明》就五个档次的给分范围相应提出了五条要求(见表2)。

表2 读后续写各档次的给分范围和要求

续写的关键在于“协同”:若要完成续写,先要理解原文,构建情境模式,而后创造续写内容。在创作过程中,学习者需确保续写的内容和语言与原文连贯(王敏、王初明,2014)。按照浙江省高考评分标准,评分员应首先考虑续写部分与短文和段落开头语的融洽程度(汪飞洋、张春青,2017)。山东省高考则将考生续写部分与所给短文及段落开头语的衔接程度作为重点之一(张贵福等,2021)。读后续写的给分与“融洽度”密切相关,此类要求在传统写作的评价中未曾出现,是考生需要克服的新困难。

文本风格,即为文本的语言风格,因作者的不同、内容的差异,往往是文本的重要特征。“风格”一词意义丰富,可以指某一类著作中比较普遍的语言特点,也可以指一个作家或诗人使用语言的习惯,还可以指一部或一篇作品的语言特色(王佐良、丁往道,1987)。例如福克纳与海明威,前者行文繁复,多用长词大句,句法错综复杂;后者写作简洁直接,多用小词短句,语义言简意赅(蓝仁哲,2004)。张贵福等(2021)认为,为使续写部分与所给短文合理衔接,续写时语言要尽量与原文的语言风格保持一致。乌圣杰和许立新(2021)认为,学生续写时应分析原文的行文风格,在写作时有意模仿、创造使用,使续写内容延承前文的语言风格。姜发兵(2020)认为,续文作者在写作时既要发挥创造性,又要模仿、学习原文作者运用语言的方法和思维特点,以达到两部分文章总体形式和风貌的一致或协同。以上研究均强调了文本风格对于续写语篇融洽度的重要影响,但对于续写文本风格特征具体、定量的分析有待深入。

历年读后续写所给短文文本风格的差异,左右着续写融洽度实现的难易,继而影响读后续写的难度。文本风格之间的差异性越大,学生在续写学习中需要应付的文本风格就越多,续写融洽度的实现就越难;反之,学生需要适应的文本风格就越少,续写融洽度的实现就越容易。

围绕“历年读后续写所给短文文本风格是否存在明显的差异性或相似性?”这一疑问,本文运用量化分析技术,对2016 年以后的新高考读后续写试题所给短文进行语篇文本风格特征的计量分析,将新高考中的10 个读后续写试题作为一个整体,探究其语言用词、主题、活动度、动词间距等文本风格特征,并计算相关数据的差异度(variation),讨论所给短文文本风格多个方面所存在的异同,并在此基础上分析其对于教学的启示。

二、文本风格的计量分析

本文统计的语料为2016—2021 年间多个省市高考使用的10 份读后续写试题材料文本,即试题所给短文;统计内容为其文本风格。

文本风格的计量分析的理论基础是计量风格学(stylometrics,又称计算文体学、文体统计学)。作为一种应用于语言学研究的定量方法,计量风格学基于文本的可量化特征和结构,通过提取分析语言特征(主要包括词长、句长、词汇频率等),描述文体和作者的写作风格,被广泛应用于文学批评、作者辨别、作品来源考证、司法鉴定和数据挖掘等研究(胡显耀,2021)。计量语言学(Quantitative Linguistics,QL)以语言的属性量化作为研究语言系统和成分的重点,采用统计/概率模型对研究对象进行精确的量化,以此实现语言特征的描述与理解,通过公式化的定律解释语言现象(刘海涛,2017)。计量语言学提供的一些文本计量方法,将定量研究与定性分析相结合,能够科学地统计、分析文本的风格计量差异。

本文文本风格计量统计工具为QUITA(Quantitative Index Text Analyzer)与Coh-Metrix 软件。QUITA 由捷克语言学家Kubát等(2014)设计,根据计量语言学相关理论,能够对文本的词长、h 点、主题集中度、文本Lamenda 值、文本熵值、文本活动度、动词间距等文本风格相关特征进行量化处理。Coh-Metrix 由孟菲斯大学McNamara 等(2014)研发,能够对文本的108 项特征进行量化分析。

本文统计对象为文本的词汇特征、主题特征、活动度、动词间距以及句长与可读性。

(一)词汇特征

1. 词汇量

词汇量包括单词的词符数与词类(型)数。计量语言学中,词符(token)类似于日常所说的“单词”,词符数类似日常所说的“词数”。如一篇150 词的作文,其词符数为150。词类(type)指文本中的一个独特的词形,在一个文本中词符即使重复出现,其所属词类的数量并不改变。以“Fear nothing but fear itself.”为例,该句词符数为5,词类数为4。

2. 类符比

语篇中的类符比能够有效体现语篇的语言丰富性(Schmitt & McCarthy,2002)。类符比(又称型符比)的计算方法为将语篇的词类总数与词符总数相除,即类符比=词类总数/词符总数。

3. 词长

词长(word length)即单词的长度,本文所述词长分别统计单词所含的平均字母数量与平均音节数量。一般而言,词长与单词使用的生僻度成正比,记忆的难度与表达的理性程度成正比。

(二)主题特征

主题是围绕某一话语实体展开的话题类别,在语言学习中,是学习内容的范畴化,包括主题语境、语言知识、文化知识和价值取向,是口头语言与书面语言的中心思想(梅德明、王蔷,2018)。主题特征是语篇特征的重要组成部分。

h 点(h-point)是计算语篇主题及主题集中度的关键,将文本中每个词(型符)按照其频次降序排列(刘海涛,2017),并按照从1 到V(V指语篇词类总数)的顺序依次编号,每个频序r所对应着一个频次值fr。h 点是词序与词频相等或最接近的分界阈值。

计量语言学概念中的主题词为频次大于h的实词,次主题词为频次大于2h的实词。主题集中度(thematic concentration)反映文本专注于某个主题的程度,能够从内容上反映文本风格。设h 点之前的任意实词的频序为r’,其频次为f(r),该词的主题性T,等于其频次与权重h-r’之积除以h 点之前所有词的权重之和与最大频次[f(1)]之积,对h与2h之前的全部主题词的主题性求和,可得到文本的主题集中度与次主题集中度(如下面公式所示)。该值越高,文本就越可能专注于某个主题。

(三)活动度与动词间距

1. 活动度

文本活动度与描写度主要用于心理学和语言学中文本特征、文体风格和人物特征的研究,并描述文本中描述与叙事之间的相互作用(刘海涛,2017),统计文本在描述与叙述之间的均势。活动度(activity)为文本中的动词总数占动词与形容词总数的比例,描写度(descriptivity)则是文本中形容词总数占动词与形容词总数的比例。显然,活动度+描写度=1。

2.动词间距

动词间距(verb distance)指文本相邻动词对(其间没有其他动词,可跨句)之间的平均间距,通过统计每对相邻动词之间的距离,并求均值获得(刘海涛,2017)。动词间距与语篇的语言风格有关。

(四)句长与可读性

1. 句长

句长是指一个完整句子中所含单词的总个数。句长被视为文体学研究的一个重要方面,它同时与语篇阅读的难易度有关,是语篇可读性的重要影响因素。

2. 可读性

根据Flesch-Kincaid 可读性公式(Kincaid& McDaniel,1974)的相关算法,语篇的可读性通过下式计算:

Efk=0.39 ×SL+11.8×SW-15.59

其中Efk指可读指数,而SL指语篇平均每句的词符数,SW指语篇平均每词的音节数,结果指向美国相应的年级学段阅读水平。例如,若语篇的Efk值为5,则文本阅读难度为美国学校五年级水平。

三、新高考读后续写所给短文的文本风格计量分析结果

根据上文所述的数值项目,针对2016—2021 年10 月份新高考读后续写试题进行语篇文本风格的计量分析,计算其平均值、标准差、差异度,探究历年读后续写所给短文文本风格是否存在明显的差异性或相似性。

(一)词汇特征

2016—2021 年,新高考读后续写所给短文的词汇特征如表3 所示。

表3 历年新高考读后续写所给短文的词汇特征

(续表)

历年新高考读后续写语篇的平均词符数量为330.30,去除重复,平均词类总数为180.6;词汇量的差异度为0.0452 与0.0864,均小于0.1,差异不显著。

历年文本的类符比组内平均值为0.55,组内标准差为0.03,差异度约为0.07,差异较小。类符比越高,词汇丰富度越大,但文本的词汇丰富度并不是越高越好。历年新高考读后续写选材的语言丰富度较为接近,类符比平均值在0.5—0.6 之间,命题选材没有一味追求用词多样。

在词的诸多特征中,词长是最易观察和量化的特征。历年新高考读后续写语篇单词的平均长度为4 个字母,平均含1.22 个音节。分析新高考实施以来读后续写语篇的词长变化情况可知,无论是计算字母还是计算音节,其组内差异度均较小(0.0335 与0.0574)。历年新高考读后续写文本的单词特征变化较小,无论是词数还是词长都存在一定的相似性。

(二)主题特征

如表4、表5 所示,依据计量分析,历年新高考读后续写语篇的主题词以人称代词及Jane, Mac, Paul 等表示人名的专有名词为主,少数情况下为pumpkin, polar bear 等与故事内容相关的名词。

表4 历年新高考读后读写所给短文的主题词与次主题词

表5 历年新高考读后读写所给短文的高频主题词

(续表)

历年新高考读后续写考题所给短文中,主题词出现频率最高的为I,其次为my,可见读后续写文本存在“以我为主”的特点,即以“人与自我”为主要语境主题。而次主题词以人称代词为主,说明读后续写文本多以“人际关系”为叙事主题,话题围绕“人与社会”展开。

由图1 可知,历次考试主题集中度存在一定的波动。通过计算可知,主题集中度的平均值为0.26,标准差为0.19,差异度为0.7439;次主题集中度的平均值为0.27,标准差为0.09,差异度为0.3449。可见,历次考试读后续写试题的主题词和次主题词的密集程度均有明显差异。综上所述,历年新高考读后续写的主题密集程度存在明显差异,与主题相关的文本风格规律性不强,存在一定的差异性。

图1 历年新高考读后续写所给短文的主题集中度变化

(三)活动度与动词间距

如表6 所示,就文本活动度与动词间距而言,历年新高考读后续写文本特征波动幅度较小,差异度均较小。

表6 历年新高考读后续写所给短文的活动度与动词间距

文本的活动度越高,语篇内容越易于理解,原因在于文本越少使用复杂形容词修饰语(刘海涛,2017)。新高考读后续写文本活动度平均为0.76,可知语篇动词总量与形容词总量保持在3:1 左右,历年来所给短文存在一定的相似性,动词间距平均值为5.837,说明文本明显重叙事,轻描写,写作内容具体、易于理解,且动词使用上风格相似。

(四)句长与语篇可读性

历年新高考读后续写试题句长与可读性的特点如图2 与图3 所示,变化较为明显。

图2 历年新高考读后续写所给短文的平均句长

图3 历年新高考读后续写所给短文的可读性

历年新高考读后续写所给短文的平均句长为14.32,标准差为2.48,差异度为0.1735,差异较明显。2016 年11 月浙江省高考试卷与2021 年6 月新高考全国I 卷中所给短文的平均句长较短,平均每句使用不到11词;而2021 年浙江两次高考中所给短文的平均句长达到了17 词以上。随着时间的推移,命题者有选择长句、复杂语句的趋势。

在文本风格研究中,文本的可读性是衡量文本阅读难度、读者接受度的计量指标。在语篇可读性方面,历年新高考读后续写所给短文的平均可读性为4.56,即语篇适合美国五、六年级学生阅读。浙江省历年新高考读后续写所给短文的可读性多在3—7 之间,近两次考试中所给短文的难度较大。新高考读后续写易读性的标准差为1.58,差异度为0.3456,历年数据间的差异较明显,存在一定的变化。2021 年新高考全国I 卷所给短文可读性为2.68,阅读难度仅为美国二至三年级水平,与多数省份首次采用该题型有一定关系。2021 年浙江省高考所给短文的可读性均较高,分别为6.78 和6.73,阅读难度接近美国学校七年级水平。可读性的明显差异说明,新高考读后续写语篇的阅读难易度及相关的文本风格存在相当的差异。

四、对于读后续写教学的启示

分析对比历年新高考读后续写语篇的文本风格,笔者认为,新高考读后续写语篇文本的语言风格存在一定的规律性,多个维度的横向对比差异都不足够显著,但各部分内容的量化特征存在差异。整体的规律性与部分的波动性二者之间的辩证统一为高中英语读后续写教学提供了相应的启示:一是要了解整体规律,以点带面,利用读后续写的相似性;二是要分析个体差异,因势利导,重视读后续写的差异性。

(一)以点带面:利用读后续写的相似性

通过对于历年新高考读后续写语篇文本的计量分析可以发现,新高考读后续写所给短文在词符数、词汇数、型符比等方面具有相似性(见表7)。读后续写作为一种特定的写作模式,其语篇的选材存在一定的特殊性、整体性。读后续写备考教学应当引导学生感悟读后续写语篇的共性特点。

表7 历年新高考读后续写文体风格的相似性

1. 大巧若拙,控制长词、难词使用

10 段文本的平均词长为4 个字母,平均词长最长4.19(浙江2017 年10 月),最短3.77(浙江2018 年6 月),并且以1—2 个音节构成的词汇为主,类符比在55%左右。总结题型用词的形态特征可以发现,新高考读后续写语篇用词朴素,口语性强,生活化特征明显。语篇中长词、难词、生词出现的频率不高,词汇表达的多样性特点不明显。然而,就目前的新高考读后续写写作而言,部分学生存在“好长喜难”的情况,偏好使用长词、多音节词,一味追求词汇的多样表达,甚至教师教学也同样存在此类倾向。历年新高考读后续写所给短文的用词形态整体特征与学生、教师的上述倾向形成了鲜明对比。因此,在读后续写教学中,教师应提醒学生注意控制长词、难词的使用。

2. 强化主题,熟悉常见话题写作

历年新高考读后续写主题词紧密围绕课程标准提出的“人与自我”“人与社会”“人与自然”三大主题。文本主题词以人称代词及人名专有名词为主,体现了人与自我、人与社会的主题语境特点。所给短文主题词出现频次最高的是I,读后续写的首要主题是“人与自我”;多次涉及家庭关系、人际关系,“父亲”“母亲”内容均曾出现;主题词中多次出现与动物相关的词汇,以哺乳动物为主,体现了人与自然的主题语境特点。其他的主题词包括湖泊、农场、篱笆、营地、南瓜、桌子、粥、面包等,均为室内外常见名词实体。可见,新高考读后续写所给短文的话题以人为中心,关注自然、关注生活。因此,读后续写教学应当强化学生的相关主题写作能力,培养“描写自我体验”“描写人际互动”“描写生活环境”的能力。

3. 以动制境,突出动词运用能力

前述研究表明,历年新高考读后续写文本的叙事特点,尤其是对于动词的使用较为相似。动词与形容词以3:1 的比例运用于语篇之内。动词使用频率亦较为接近,动词间距多在5—6 词之间,即每5—6 个词中就含有1个动词。读后续写文本的叙事性较强,在教学中应重视学生叙事表达能力的培养,重视动词词汇的积累和动词写作微技能的训练。

(二)审时度势:重视读后续写的差异性

反复认真阅读原文,紧扣读物续写(王初明,2015),是提高读后续写水平的关键,而针对历年新高考的特点(见表8),在“紧扣读物续写”过程中,写作者应格外重视文本主题性与可读性之间的差异。

表8 历年新高考读后续写文体风格的差异性

1. 松散有据,注意主题密度差异

历年考题在词汇主题集中度方面曾出现过较为明显的波动。主题较为集中的文本中的句子约79%与语篇主题词有关,学生提炼主题的难度较小。主题性相对较弱的文本来自2020 年7 月山东新高考试卷,主题词不明确,文本中没有满足主题词筛选条件的实词,因此对学生写作的主题协同性要求较高。

纵观历年新高考读后续写所给短文,文本的主题集中度差异较大。在日常的语篇阅读教学中,教学应重视对于文本主题特点的感知与提炼训练,尝试各种主题特点的续写训练,强调注意续写部分与原文主题特点的照应,安排主题相关描写时做到“松散有据”。

2. 张弛有度,注意句式长短差异

新高考读后续写所给短文的文本句式长短存在差异,平均句长最长达到了17 词以上,而最短的平均句长还不到11 词。初次采用读后续写写作考题的试卷,更偏向采用句型简单的语篇,而浙江省2021 年两次高考更偏向采用句式复杂、长句略多的语篇。

根据历年新高考读后续写句式长度的差异性,笔者建议教师在进行读后续写教学时,应提醒学生根据原文的句型特点审时度势:原文长句较多时,则有意识地使用长句;原文短句较多时,则适当控制句长。通过合理控制句式长短,长短结合,遣词造句“张弛有度”,最终实现续写句式风格的协同。

五、结语

文本分析表明,历年新高考读后续写所给短文的文本风格整体存在一定的相似性,但在个别特征上存在差异。续写教学应引导学生关注续写材料的文本风格共性特点,训练主题写作表达技能,培养主题意识、风格意识、续写意识。同时,注意材料文本风格的个性特点,续写应张弛有度、松散有据,培养学生挖掘文本风格特征,并依据不同的风格进行接续写作的能力。此外,就后期高考命题而言,命题中所给短文的选择应更为多样,类型更为丰富,从而进一步考查学生的综合语言运用能力、逻辑思维能力,避免读后续写写作的机械化与公式化。