基于核心素养的学生英语写作语言量化评价语料库应用方法

2022-04-29 03:46徐使超
中小学数字化教学 2022年10期
关键词:词表连接词语料库

徐使超

核心素养是指个人在一定时期内,实现自我、成功生活与融入社会的关键素养[1]。《普通高中英语课程标准(2017年版2020年修订)》(以下简称《课程标准》)指出,学科核心素养是学科育人价值的集中体现,是学生通过学科学习而逐步形成的正确价值观、必备品格和關键能力;英语学科核心素养主要包括语言能力、文化意识、思维品质和学习能力[2]。核心素养不仅关系学科的课程设计与教学方法创新,还是衡量教育质量的重要依据,因此与评价体系有着密切的相互作用关系[3]。为此,《课程标准》提出“教—学—评”一致的理念:教指向学科核心素养的培养,学是为了发展核心素养,评则是为了促教和促学[4]

《课程标准》还提出,普通高中英语课程应充分利用信息技术,实现大数据等新技术的有效促学功能。大数据具有变革人类教育方式与学习方式的能力[5],信息化和大数据为现代教育尤其是现代外语教育提供了新的机遇,为英语能力的量化评价提供了新途径。

写作能力评价一直是外语能力评价的重点。写作是作者建构意义、发现自我的活动,也是一种用书面语言来传递信息和表达情感的社会文化活动,它是学生学习与运用英语思维建构意义、表达概念的过程,是语言能力等技能中难度较大的一环,因此是衡量学生英语语言能力与水平的重要标志[6]。学生写作语言的量化分析是促进英语写作评价的有效方法。

本文基于写作相关核心素养目标,讨论运用信息化、数据化的语料库软件,对学生写作语言进行量化评价的方法及其在教学中的实践。

一、核心素养理念下的学生写作语言培养目标

核心素养中,写作技能素养作为语言能力的重要组成部分出现,按水平分为三级(见表1)。

围绕核心素养对学生写作能力提出的水平要求,结合《课程标准》对应核心素养设计的课程内容,笔者认为,核心素养理念下的写作能力培养,关键在于提高学生的以下能力:(1)语言应用能力,重点包括词汇、句法应用能力与语篇衔接能力,其中词汇、句法应用能力方面分为必修、选择性必修、选修提高三个水平层次;(2)信息传递能力,受学生思维品质如逻辑思维、辩证思维等影响,要能正确地表达主题意义,并根据主题意义的需要,选择合适的写作风格,表现语篇语言特点;(3)在写作语篇中,向读者表达情感、态度的能力。核心素养的写作能力培养目标同时体现了写作的修辞三角的对象目标——语言应用能力指向文本、信息传递能力指向主题、情感与态度的表达能力指向读者[7]

二、核心素养理念下的语料库辅助学生语言量化评价

培养学生的英语学科核心素养,提升学生的写作能力,教师应及时发现学生写作过程中存在的问题和困难,并给予相应指导。有效的评价可以促进学生写作并反拨教学,但是目前的英语写作教学缺乏有效的评价方式[8]

以往的英语写作教学评价以教师的主观判断为主,随着语料库技术的飞速发展,可用于语言分析的语料库技术层出不穷。语料库辅助语言教学的促学作用已被研究证实[9]。但是,针对核心素养词汇层级,能够分析学生语言衔接能力、主题信息传递能力及情感表达能力的技术应用路径并不多见。

本文运用Range/AntConc、QUITA、Coh-

Metrix软件进行上述评价(如图1)。以上软件均为开放资源,操作简便,适合高中教师教学乃至学生自主学习使用。相关软件及统计所需词表,笔者通过网络工作栈共享,方便师生下载。

(一)词表分布量化分析

Range软件是由惠灵顿维多利亚大学的内申(Nation)研发的,用于计算文本的基础词表分布,统计文本词汇在一些基础词表中的占比,是一种常用的分析文本难易度的量化数据;AntConc软件则由日本早稻田大学的劳伦斯·安东尼(Laurence Anthony)研发[10],可将文件词表分布可视化呈现。

Range软件的操作非常简单,将预处理文档以文本文档txt格式保存后,打开该软件,在“File”菜单栏点击“Open”并选择对象文档,再点击“Save”并选择输出结果的位置,之后点击“Process file”即可。

结合《课程标准》,Range软件的功能主要体现在量化分析学生的词汇应用以及情感与态度的表达能力上。

1.运用《课程标准》词表统计语篇用词分布

根据《课程标准》,高中学生的词汇包括义务教育阶段1500词、英语必修课程应学习和掌握500词、选择性必修课程应学习和掌握1000词,三个层级累计3000词。运用Range软件,可对文本在《课程标准》词表不同层级中的分布进行统计。

2.运用特殊词表统计语篇情感态度

根据教学需要设计特殊词表,如特定的立场标记语、Vader情感向量词表[11],统计学生情感、态度等特定表达内容的使用情况。同时,结合AntConc软件的词表语境查看功能,打开软件先后选择“File”“Flie View”“Advance”“Load file”,能够实现语篇情感、态度用词分布的可视化查看。

(二)主题风格量化分析

QUITA(Quantitative Index Text Analyzer)由捷克语言学家库巴特(Kubát)等人研发,用于量化文本风格的相关特征。打开该软件,选择Project—New project、Indexes to compute页面选择计算项目,Texts页面选择“Add text file”后,点击“Start”即可进行文本的风格计量计算。

结合核心素养相关概念,QUITA软件的作用在于对文本主题词、主题集中度等主题特征,以及词长、活动度、动词间距等文本风格特征的量化分析,反馈学生的信息传递能力。

1.主题词及主题集中度

h点(h-point)是词序与词频相等或最接近的分界阈值。计量语言学概念中的主题词是频次大于h的实词,次主题词为频次大于2h的实词。主题集中度反映文本专注于某个主题的程度,能够从内容上反映文本风格,该值越高,文本就越可能专注于某个主题[12]

2.词长

词长即单词的长度,文本所述词长分别统计单词所含的平均字母数量。一般而言,词汇的长度与词汇使用的生僻度、记忆的难度与表达的理性程度成正比[13]

3.类符比

词类相当于传统意义上的单词,指语篇的词汇量,又称词汇总藏。词符指的是某个词型在语篇中出现的次数总和。语篇中的词类/词符占比,能够有效体现语篇的语言丰富性[14]

4.活动度

活动度为文本中的动词总数占动词与形容词总数的比例。文本活动度主要用于心理学和语言学中文本特征、文体风格的研究,描述文本中描述与叙事之间的相互作用,统计文本在描述和叙述之间的均势[15]

5.动词间距

动词间距是指文本相邻动词(中间没有其他动词,可跨句)之间的词符个数,可计算平均值。动词间距与语篇的语言风格同样具有紧密联系。

(三)衔接特征量化分析

Coh-Metrix由孟菲斯大学的麦克纳马拉(McNamara)等人研发,能够对文本的108项特征进行量化分析。该软件提供方便使用的网页接口,输入文本即可得到计算结果。基于核心素养要求,可运用其分析语篇的指称衔接、连接词2个类目16项指数量化分析语篇的衔接与连贯性[16]

1.指称衔接

Coh-Metrix软件指算法计算3个类型的指称衔接关系:名词重叠、论点重叠、词干重叠。同时,对以上3类指称关系,按照相邻句与语篇全局2个类型,共计6项指数进行量化。

2.连接词

连接词分为所有连接词、因果连接词(如because)、逻辑连接词(如and、or)、转折连接词(如although)、时间顺序连接词(如first)、扩展时间顺序连接词(如until)、附加连接词(如and、moreover)、肯定意义连接词(如also、moreover)、否定意义连接词(如however、but)。Coh-Metrix通过计算以上9项连接词的出现频次与语篇易态动词之比,量化计算语篇的连接词衔接。

三、语料库辅助学生语言量化评价的实践

笔者以浙江省2020年7月高考读后续写语篇作为写作内容,在班级中进行写作练习(如图2),并采用语料库技术对学生作文进行量化分析。

(一)语言运用能力

1.词汇能力

运用Range软件对学生语篇的词表分布进行统计。本文共160词,根据课标词表,文本水平一,即义务教育阶段单词使用120个,占比75%;水平二单词用词9个,占比5.625%;水平三用词7个,占比4.375%;表外词汇为24个,占比15%。文本词表分布的量化统计说明,该生的作文体现了较好的词汇运用能力,课程标准中各个层级的词汇均有所运用。

2.衔接连贯

运用Coh-Metrix对学生语篇的衔接与连贯进行分析。根据Coh-Metrix的指称衔接计算(见表2),该文中相邻句之间的指称、论元、词干三类互指联系均不明显,彼此之间的衔接与连贯明显不足。从叙事方式的角度考虑,写作时建议学生采用更多的主叙位推进叙事,以使相邻句之间的语义衔接更加自然。

根据Coh-Metrix的连接词算法介绍,观察相关数据可知(见表3),该语篇使用了相当数量的连接词汇,主要表现为逻辑连接、转折连接、时间顺序连接,以及附加连接,一定程度上体现了该文作为读后续写接续原作的记叙文特点。但是由上述数据明显可知,学生的写作存在两类问题:首先,各类连接词使用有失均衡,附加连接词使用过于突出,查看原文,其原因在于使用了大量的“and”;其次,作为记叙文语篇,扩展时间顺序连接词使用存在明显的缺陷,肯定、否定意义连接词使用应有所加强。

(二)信息传递能力

运用QUITA软件对学生语篇的语言风格进行分析。

1.主题特点

该语篇没有满足条件要求的实词,主题词不够明显,根据计量语言学标准,无法突出语篇的主题意义。只有bear、I、helicopter三个次主题词,集中度相对较低,由此可知学生语篇主题表达方面的信息传递能力并不理想。

2.风格特点

该文使用160个词符,分属113个词类,类符比0.71,语言使用丰富度较高。语篇用词平均词长为4.58个、1.38个音节,使用单词以短音节的生活化用词为主。语篇活动度为0.75,即动词与形容词占比为3∶1,动词间距为5.42,大约每5个单词就使用一个动词,充分体现了语篇作为记叙文的语言特点。从上述数据可判断,该文作为接续写作,体现了读后续写的记叙文语言风格特点,能够有效传递语篇情境相关信息,弥补了主题意义不够鲜明的缺点。

(三)情感与态度的表达能力

情感与态度的量化计算运用自然语言处理技术中的情感分析较为科学,但该技术运用需要JAVA等计算机编程技术的辅助,对于普通教师难度较大。运用Range软件,结合Vader情感向量词表,能部分呈现语篇的情感表达特点。

将Vader情感向量词表按积极词与消极词分类统计语篇中两种词的占比。语篇共使用积极情感词5次,消极情感词7次,说明写作中作者对于人物情感的渲染有所关注,但消极情感词略多于积极词,作者在作文修改时应适当调整。

运用AntConc进行可视化呈现,学生在语篇中较为合理地使用了trembling、desperately、mad、death等消极情感表达词,向读者传递人物在垂死挣扎之际表现的惶恐。笔者发现,学生的情感用词均集中于首段,第二段的情感表达有待加强。

四、语料库辅助学生语言量化评价的思考

(一)量化评价的维度以促学为本

评价的出发点是评价的目的,失去明确的评价目的,评价内容与形式的选择将失去意义[17]。过多的指数反馈会降低学生语言评价反拨的有效性。本文围绕核心素养培育写作能力的三个维度设计语料库应用路径,语料库软件的使用应围绕学习目的,量化评价维度以促学为本,根据不同主题、不同语篇类型写作的需要,设计“综合而有侧重”的语言评价活动,提升学生的核心素养。

(二)量化评价的过程以学生为中心

语料库辅助语言评价的作用不仅在于辅助“教”,更在于辅助“学”。本文所述语言量化统计工具操作简易,学生在教师示范基本使用方法后可轻松掌握,如Coh-Metrix只需登录网页,Range与QUITA则需要下载安装。以笔者的教学班级为例,教室中安装了一体化电脑式的智能黑板系统,学生在课外写作练习中可自行量化分析,探究写作语言使用方面的优缺点,获得自我效能感。这既能提高教学评价的及时性,又可提升学习的趣味性,增强学生参与学习评价的积极性。

(三)量化评价的体验即提高素养

写作语言的量化评价体验,在思维方面,能够帮助学生形成透过表层数据进行分析的能力;在学习能力方面,借助语料库软件的多样化反馈提升學生的自我效能感,有助于让学生保持学习动力,精准定位最近发展区,制订、调整、优化学习计划。语料库软件、数据分析与语言评价的结合,能够服务学生未来发展,培养学生的核心素养。

(四)量化评价的形式需具体、形象

语料库软件量化评价主要通过指数、比例等数据呈现,就学生的学习反思而言,内容缺乏具体的反馈。尤其如Coh-Metrix、QUITA软件仅能反馈相应数据,基于语言内容的反馈不足。如何实现量化评价与语篇内容分析的结合,需要进一步的探索研究。

注:本文系2022年浙江省教育信息化研究专项课题“主题意义引领下的‘人工智能+单元词汇教学实践研究”(立项编号:2022ETC024)的阶段性研究成果。

参考文献

[1] 左璜.基础教育课程改革的国际趋势:走向核心素养为本[J].课程·教材·教法,2016(2):39-46.

[2] 中华人民共和国教育部.普通高中英语课程标准:2017年版2020年修订[S]. 北京:人民教育出版社,2020.

[3] 程晓堂,赵思奇.英语学科核心素养的实质内涵[J].课程·教材·教法,2016(5):79-86.

[4] 王蔷,李亮.推动核心素养背景下英语课堂教—学—评一体化:意义、理论与方法[J].课程·教材·教法,2019(5):114-120.

[5] 何克抗.21世纪以来的新兴信息技术对教育深化改革的重大影响[J].电化教育研究,2019(3):5-12.

[6][7]兰良平,韩刚.英语写作教学——课堂互动性交流视角[M].北京:外语教学与研究出版社,2014:25,241.

[8] 何亚男,应晓球.落实学科核心素养在课堂·高中英语写作教学[M].上海:上海教育出版社,2021:5,19.

[9] 张春青.语料库辅助英语教学:原理、模式与实践[J].教学月刊·中学版(外语教学),2021(4):3-7.

[10]何安平.语料库辅助英语教学入门[M].北京:外语教学与研究出版社,2010:12,144.

[11]HUTTO C J, GILBERT E. VADER: A Parsimonious Rule-Based

Model for Sentiment Analysis of Social Media Text[J]. Proceedings of the 8th International Conference on Weblogs and Social Media,2014.

[12][13]KUBáT M, MALTACH V, CECH R. Quantitative Index Text Analyser(QUITA)[M].Lüdenscheid: RAM-Verlag,2014:1-3.

[14][15]SCHMITT, MCCARTHY. Vocabulary: Description, Acquisition and Pedagogy[M].Shanghai: Shanghai Foreign Language Education Press,2002:25.

[16]MCNAMARA D S, GRAESSER A C, MCCARTHY P M, Cai Z. Automated Evaluation of Text and Discourse with Coh-Metrix[M].Cambridge: Cambridge University Press, 2014: 63-69.

[17]林敦来.中小学英语教师语言评价素养参考框架[M].北京:外语教学与研究出版社,2019:47.

(作者系浙江省海宁市高级中学教师,中学一级教师)

责任编辑:孙建辉

猜你喜欢
词表连接词语料库
连动结构“VP1来VP2”的复句化及新兴小句连接词“来”的形成
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
《语料库翻译文体学》评介
叙词表与其他词表的互操作标准
基于JAVAEE的维吾尔中介语语料库开发与实现
国外叙词表的应用与发展趋势探讨*
常用联绵词表
语料库语言学未来发展趋势
英语连接词:传统与反思
英语连接词的显功能初探