PETS-2（2008—2022）英语阅读理解文本句法复杂度研究

2023-11-13 02:18陈晓红丁二莉

英语教师 2023年15期

陈晓红丁二莉

引言

句法复杂度、句法准确度和句法流利度作为研究语言发展的三大维度，已经得到广泛研究。句法复杂度指语言产出中句法结构的多样性及复杂性（Lu，Xiaofei 2010）。拉森—弗里曼（Larsen-Freeman 1997）提出语言复杂理论后，引起语言学界广泛关注。已有研究探讨句法复杂度与二语水平及二语写作质量的关系，句法复杂度被认为是影响并度量语言水平及描述语言发展轨迹的一项重要指标（陆小飞、许琪 2016）。例如，句法复杂度是“三段式线性”式的，也就是沿着由并列从句到从属结构，到复杂从句，再到短语式的发展道路（Norris&Lourdes 2009）。二语习得作为二语习得与教学中的重要组成部分，其句法复杂度与二语习得者学习水平及发展紧密相关，是衡量文本难度的一项重要指标。

全国英语等级考试（Public English Test System，简称PETS）面向社会所有公民，是非学历性英语证书水平考试，考查应试者的英语交际能力及英语运用能力。其考试等级按难度从低到高划分为一级（一级B级是全国英语等级考试的附属级）、二级、三级、四级和五级。一级为初始级，对学生的测试要求与初中毕业生英语水平相当；二级为中下级，与普通高中优秀毕业生英语水平相当；三级为中间级，相当于学生中学毕业后，再到大专院校学习公共英语两年，或者自学相同程度的英语课程；四级为中上级，相当于学生中学毕业后，在大学里再学公共英语至少三到四年，或者自学相同程度的英语课程；五级为最高级，相当于大学英语专业二年级学生学完后的程度，是专门为报考公派出国留学的学生开设的英语水平考试项目。这5个等级的考试标准以相同的能力量表为基础，它们之间既存在明显差异，又存在内在联系。

在过去的几十年里，有很多关于PETS英语阅读理解的研究。例如，韵晓玲（2013）进行了全国英语等级考试三级阅读理解测试内容效度研究；段辛（2017）从文本复杂度的角度对CET-4/6和PETS-3/4阅读文本进行对比分析。虽然这些研究聚焦PETS英语阅读理解的不同方面，但是目前鲜有研究从英语阅读理解材料的句法复杂度入手。因此，从全国英语等级考试二级（PETS-2）英语阅读理解材料的句法复杂度入手，运用语料库数据驱动的方法，借助文本在线分析工具英语文本指难针和二语句法复杂度分析器，分析2008年至2022年PETS-2英语阅读理解文本，探究句法复杂度变化规律，以及同一份试卷中阅读理解材料句法复杂度变化和分布趋势，从而希望对以后英语阅读理解材料选择、难度确定、教学大纲编写及教育者研究和实际教学起到一定的参考作用。

一、研究设计

（一）研究问题

1.PETS-2英语阅读理解材料句法复杂度有何变化，有怎样的变化趋势？

2.每年的试卷中不同句法复杂度的阅读理解文本如何分布？

（二）研究工具

测试仪是一种在线自动分析仪，是在METS、PETS、CET-4、CET-6和NEEP等考试中基于大量测试材料的语料库设计的，旨在为英语教师提供数据，帮助他们撰写新的测试论文。它有7个功能：分级复杂性、设置基准、检查实例句子、生成单词列表、解释复杂单词、反馈结果和导出结果。测试人员根据单词覆盖率、句子平均长度、句子最大长度、文章长度和LD值等5个指标对句法复杂性进行分析。在本研究中，LD的指数值被用于分析阅读材料的句法复杂性。

第二语言句法复杂度分析仪L2SCA是由陆小飞教授设计的自动分析仪。它使用14个索引分析第二语言写作的句法复杂性。这14个指数是平均句子长度（meanlengthofsentenceMLS）、平均T单位长度（meanlengthofT-unitMLT）、平均子句长度（meanlength of clause MLC）、平均句子中的子句数量（clauses per sentence C/S）、平均T单位中的子句数量（clauses per T-unit C/T）、平均T单位中的复杂T单位数量（complex T-unit ratio CT/T）、平均子句中的从属子句数量（dependent clauses per clause DC/C）、平均T单位中的从属子句数量（dependent clauses per T-unit DC/T）、平均子句中并列短语数量（coordinate phrases per clause CP/C）、平均T单位中的并列短语数量（coordinatephrasesper T-unit CP/T）、平均句子中的T单位数量（T-units per sentence T/S）、平均子句中并列短语数量（coordinate phrases per clause CN/C）、平均T单位中的复杂名词结构数量（complex nominals per T-unit CN/T）和平均T单位中的动词结构数量（verb phrases per T-unit VP/T）。下面采用C/S、C/T、CT/T和T/S分析句法复杂性。

（三）研究语料

本研究的语料为2008年至2022年PETS-2英语阅读理解文本。文本的平均长度约为345词。从2008年到2012年，每半年一次的考试中有5个阅读测试；从2013年到2022年，每半年一次的考试中有4个阅读测试。阅读测试总数为65个。所有阅读测试都是通过网上下载真题进行OCR识别的。

（四）数据处理与分析步骤

第一步，整理文本，将文本全部转换成纯文本格式，每篇阅读理解材料为一个文本。

第二步，分别上传语料至英语文本指难针和二语句法复杂度分析器，汇总保存分析数据。

第三步，根据数据，选取LD值、C/S、C/T、CT/T和T/S等5个指标绘折线图。为了比较不同指数的数据变化，形成了具有一对指数的折线图。它们是囊括C/S指数和LD、C/T值，以及LD、C/S和C/T值的折线图。因此，本研究中的折线图总数为23。这些折线图由MATLAB制作。

二、结果和讨论

（一）LD值变化

从2008年至2022年的LD值的变化图（见下页图1）可以看出，试卷中阅读理解文本的LD值的总体趋势越来越高。在2009年和2015年，阅读测试的LD值逐渐变高。在2013年，阅读测试的价值逐渐降低。因此，在每年的试卷中安排阅读材料没有特别的顺序和规定。但在每年的测试中，至少有1种易读材料和1种复杂材料。LD值每年都在逐步稳定地增长，最大值和最小值之间的差异时小时大。例如，2014年的最高和最低之间的差异是1.82，但2009年只有0.39。这意味着虽然阅读理解文本没有按照句法复杂程度的顺序排列，但是它们的句法复杂程度变得更高，而且每年的变化不同。在2008年和2009年，LD的最大值和最小值之间的差异约为0.5；在2014年、2015年、2018年、2020年和2022年，最大值和最小值之间的差异约为2.0；在其他年份，最大值和最小值之间的差异约为1.0。可以看出，每年阅读测试的差异是不同的，这意味着不同测试中阅读材料的选择不够仔细。在PETS-2试卷中没有严格的基准或标准控制阅读理解文本的句法复杂性。

图1：2008年至2022年LD值的变化

为了使每年的测试文章的变化趋势更清晰，该折线图基于65个阅读理解文本的LD值绘制，显示了2008年到2022年十五年间的变化：LD的最低值从低于1.5变为高于2.0；最高值也发生了变化，接近4.0。LD值有大幅的增长，意味着阅读理解文本的句法复杂度越来越高。然而，该折线图显示15年间测试文章中的LD值不规律地变化，最大值和最小值之间的差异非常大。因此，可以得出结论，在选择阅读材料时，并没有仔细评估句法复杂度。阅读材料的采编应兼顾句法复杂度的持续稳定性。

（二）第二语言句法复杂度分析器四个指标的变化

为了使这项研究更科学和具体，本研究运用另一种自动分析仪分析PETS-2阅读理解材料。在本研究中，选择了14个L2SCA指数中的4个指数，分别是C/S（每个句子中的子句数量）、C/T（每个T单位中的子句数量）、CT/T（复数T单位比率）、T/S（每个T单位中的子句数量句子协调率），评估PETS-2阅读理解文本中句法复杂度的变化（见图2—图5）。

图2：C/S的变化

图3：C/T的变化

图4：CT/T的变化

图5：T/S的变化

（三）每句子句和每个T单位的子句之间的联系和区别

C/S和C/T都是L2SCA的子句，它们都关注子句的数量。然而，它们把子句放在不同的单位，因为C/S表示一个句子中的子句数量C/T表示一个T单元中的子句数量，因此，在测量句法复杂度方面呈现出不同的方面。C/S包括句法复杂度比率，而C/T是反映从属量的一个比率。图6折线图显示，这两个指数分析的阅读材料数据有很多重叠。这两条线的趋势是相似的，并无显著差异。然而，C/S和C/T值的变化是无序的，并且最大值和最小值之间存在很大差异。

图6：C/S值与C/T值之间的差异

本研究选择5个指标评价PETS-2试卷中阅读理解文本的句法复杂度。LD值是句法复杂度的量化，数值越大代表阅读理解文本越复杂。图1清楚地显示，至少有1个简易阅读理解文本和1个复杂阅读理解文本。出现这种现象是因为命题教师应遵守一些规则。其中一条规则是应考虑具有良好阅读能力和阅读能力差的学生。因此，教师必须选择至少1个简易阅读理解文本，以确保学生能够获得基本分，还必须选择复杂阅读理解文本以满足擅长英语阅读的学生获得更高的分数。然而，在同一年的测试中，4个阅读理解文本并没有按照句法复杂度来安排。图1显示LD值在十五年内变化很大，并且最大值和最小值之间的差异很大。除此之外，与测试仪给出的LD值的标准1.7—2.4相比，最大数量接近4.0，远远大于2.4。测试仪给PETS-3和CET-4的基准是2.4—3.5和3.5—4.5，而LD的某些值已经达到了这两个基准。根据测试人员给出的基准，PETS试卷中的一些阅读材料并不适合高职医护专业的学生。过高复杂度会给学生在阅读测试中带来很多负担，现在为他们提供具有CET句法复杂度的阅读理解文本为时过早。图2—图5使用了4个指数，数据略有稳定变化。C/S从句子的子句数量评估句法复杂度，而C/T和CT/T以句法密度的方式评估从属的句法复杂度。T/S评估协调的句法复杂度。可以看出，4个指数在不同年份的阅读测试中都有所变化。第四和第五个数字用于比较，以找出Tester和L2SCA之间的差异，以及L2SCA的不同指数。从图4可以看出，LD、C/S和C/T三个指数的值具有差异和相似性，它们都用于评估阅读材料的句法复杂度，但在不同方面，它们有类似的增长趋势。语法复杂度不能仅由其中1个指数描述。例如，当LD值低时，C/S或C/T值可能很高，而当LD值高时，C/S或C/T值可能很低。5项指标使研究更科学、合理。变化表明，PETS-2的英语阅读理解材料在被选为阅读文本之前，未经过仔细研究或分析，从2008年到2022年，PETS-2试卷中的阅读材料选择缺乏有效性。

三、总结和启示

为了考查历年英语阅读理解文本句法复杂度变化规律，以及同一份试卷中阅读理解文本句法复杂度的变化和分布趋势，以2008年至2022年的PETS-2试卷共130篇阅读理解文本为研究材料，使用语料库的方法，借助英语文本指难针和二语句法复杂度分析器这两个文本分析工具，选取5个不同指标对PETS-2阅读理解文本加以分析，通过分析每篇阅读理解的句法复杂度，最终得出如下结果：（1）从 2008年至2022年，PETS-2英语阅读理解文本句法复杂度呈稳定升高趋势，但难度最高值3.77与最低值1.30差异明显，即句法复杂度上升幅度较大；（2）阅读理解文本的句法复杂度逐年增长，但在试卷上并不按由易到难或由难到易的顺序分布。

研究结果表明，PETS-2英语阅读理解文本选材有一定的合理性，但其句法复杂度变化较大，说明出题者对材料的选取缺乏固定、科学的衡量标准。分析PETS-2英语阅读理解文本的句法复杂度，希望能对以后PETS英语阅读理解文本材料的选择、难度的确定、教学大纲的编写及教育者的研究和实际教学起到参考作用。尤其是对于高职英语阅读理解材料的难度控制，出题人可以采用文本难度分析器分析不同文本难度，达到合理控制文本难度的目的。本研究的局限性在于只选用了2个分析工具、5个指标，未来的研究中可以增加其他工具和指标进行进一步分析。