李海燕 卜 璐
(金陵图书馆,江苏南京 210019)
人们通过书面语言分享、提出和研究思想,必然绕不开阅读理解的问题,于是文本困难与文本理解的问题成了人们学习和生活的重要方面。国外关于文本可读性与难度的研究可以追溯到柏拉图和亚里士多德的古典修辞学以及古代希伯来读者对《圣经》的词汇分析[1],国内研究则可以追溯到孔子提出的修辞思想[2]。
思想起源久矣,但文本可读性与难度的客观衡量到20世纪才浮出水面。本文以应用广泛的Lexile/ATOS两种分级阅读方法为例,勾勒分级阅读的发展路径,系统论述分级阅读的特点及利弊,以期对我国分级阅读模式构建产生积极推动。
在理论研究方面,我国学者主要从分级阅读的指标与模型、标准体系与影响因素、对比与发展、实践与应用等方面进行研究。我国台湾大学、香港中文大学、华东师范大学、北京师范大学、北京语言大学等多家研究机构在分级阅读方面有专门研究。20世纪70年代,我国杨孝溁教授运用因素分析法,归纳影响中文可读性的因素,也曾以词汇数、句子数和平均笔划数等指标建置可读性公式。杨志明、吴本文认为按照思维加工的深度,把阅读水平分为基础级别、良好级别、优秀级别和杰出级别四个层次[3]。在既有的各类阅读能力分级研究中,可以看到分级标准有着不同的表现样式,主要有整体描述式、分项描述式、“标尺”式[4]。中文分级阅读研究方法主要有可读性公式法、基于认知理论法、基于单词统计的语言模型法、特征结合机器学习法[5]。
在实践发展方面,2009年南方分级阅读研究中心发布了《儿童青少年分级阅读内容选择标准》和《儿童青少年分级阅读水平评价标准》两套儿童分级阅读标准体系,此后如亲近母语、考拉阅读、柠檬悦读、掌阅科技、享阅教育等均提出分级理念,推出相关书目。中国书刊发行业协会等也在制定相关标准。2019年底,中文分级阅读学术标准在第六届北京国际儿童阅读大会发布[6]。
目前,在中文分级阅读研究与实践领域,仍处于各自为战状态,缺乏符合中文特性的较为完整的可读性指标,尚未确立起科学统一的标准,缺乏经得起推敲和验证的可读性模型。
美国心理学家约翰·华生(John Broadus Watson)在1913年发表的论文《行为主义的心理学观》被认为是行为主义运动的发轫。华生认为心理学研究的对象不是意识而是行为,主张心理学的研究方法必须抛弃内省法,而代之以自然科学常用的实验法和观察法[7],强调研究行为与环境之间关系的重要性。可读性公式即发源于这个时期。
尼·普雷西(Sidney L.Pressey)提出第一个可读性公式[8]。20世纪50年代开始,基于电脑和自动化的发展,可读性公式也随着时代得到更新。20世纪90年代以来,随着越来越多的学科与计算机和信息领域的交叉,研究者总体上对相关技术在实现准确的文本难度量化评估中的作用持审慎的乐观态度[9]。
国外分级阅读主要基于两种模式。一种为计量模式,通过参照词库,分析文本特征等方式建立可读性公式,计算影响文章难易度的类型指标,赋以分值以测评文章可读程度,包括弗莱士—金凯德阅读年级指数[10](Flesch-Kincaid Grade Level)、弗莱伊易读性评估图[11](Fry Readability Graph)、新戴尔—查尔可读性公式[12](The New Dale-Chall Readability Formula)、阅读能力等级体系[13](Degrees of Reading Power)等。另一种为考量模式,通过专家考量影响文本理解的外在和深层因素,如字词、文体、主题、图文关联度、内容可预测性等,据以建构文本适读性分析框架,再以定质研究的方法评估文本适读年级[14],包括阅读复得体系[15](Reading Recovery)、引导性分级阅读体系[16](Guided Reading Levels)等。分级阅读既包括对文本难度的分级,也包括对读者阅读水平的分级。
本文主要以应用广泛的Lexile/ATOS两种分级阅读方法为例。1997年,杰克逊·斯滕纳(Jackson Stenner)与唐纳德·伯迪克(Burdick Donald)公布了Lexile的原始公式[17],是基于Rasch模型发展的Lexile量尺,1998年开始供公众使用[18]。目前,美国有50个州逾3500万学生,全世界180个国家的学生使用Lexile读者度量标准[19]。2000年,Renaissance公司研究机构发布ATOS可读性公式[20],超过40%的美国学校[21]、超过6500所的英国和爱尔兰学校[22]使用该公司基于该公式的系列评估。
表1 Lexile/ATOS基本情况
(1)价值
分级阅读的应用体现在现实生活的方方面面:畅销小说通俗好读,而有些报纸读起来艰涩难懂;在阅读保险公司合同之类的文件时,我们总是希望条款能更简单好懂;再比如在特定知识领域的专门术语,就是典型的“难者不会、会者不难”的体现;此外在教育领域,知名国际阅读测评项目PIRLS/PISA等,以阅读素养与水平发展脉络形成测评框架,对学生的阅读级别进行考察;而TOEFL等考试的评分系统E-rater通过测评考生的文章组织、语法、用词等,给出自动等级评分。这些例子充分说明了分级阅读的应用广泛,其研究和应用价值是不言而喻的。
从总体上来说,分级阅读公式和方法所解释的文本难度系数与文本的可读性呈正向相关,可以据此预测和判断文本是否适合特定对象,如何使得文本更为匹配需求,如何生成更易被理解和接受的文本,如何产出能够被评分系统认可的文本,都能够体现分级阅读公式和方法的价值所在。从教育的角度来说,对于成长性的阅读,有一种观点,即在现实中没有差的读者,只有目标不明确的受到不恰当的挑战的读者[28],启蒙阅读的分级至关重要,如简单的童谣因其重复性和可预测性适于低龄儿童;专为婴幼儿设计的绘本则因将图画作为叙述的主角,以简单的文字辅助理解,也适于低龄儿童阅读。有了阶梯式的启蒙,儿童才能够逐渐接受书面语表达和文本起承转合等高阶话语结构。
杰西卡·尼尔森(Jessica Nelson)等选取了Lexile/ATOS/Degrees of Reading Power等7种分级测评体系,通过测试这些体系对年级水平和学生表现的预测价值,得出了所有指标均可靠且通常高度相关的结论。他们还发现,在大多数情况下,信息文本与指标的相关性要比叙事文本高;指标能够更好地预测低年级的年级水平和理解能力[29]。
(2)争议
分级阅读的理念经过近百年的发展和演变,也伴随着争议和质疑。乔治·克莱尔(George R.Klare)曾在《阅读研究指南》(Handbook of Reading Research)第1卷22章可读性(Readability)中写到1930年以来大众评论和专业学者对于可读性衡量的效用与价值的质疑[30]。在心理学领域,行为主义已被人类信息处理的认知方法取而代之[31]。在阅读实践中,有不少情形是分级阅读的公式和方法无法预测的,比如人们帮助儿童阅读时常用的重复朗读的方法,如果没有考虑到文本和句子整体的含义和结构,会大大削减可读性的应用价值;再如文本的衔接程度,衔接程度越高,文本越容易理解,包括指代关系、因果结构、衔接手段、重现方式、命题组织等[32]在内的特征都可以刻画语篇的衔接连贯程度,如果没有了这些特征,句子虽然短了,却更加难以理解;又如同样有插图的两本读物,因为清晰度和相关性的区别,带来的阅读效果也不一样,甚至连印刷质量、页面的大小和位置都会对可读性产生影响。这些例外让分级阅读充满不确定性。
读者与文本之间的相互作用也使得分级阅读产生困境。多数分级研究无法完全地考虑读者对文本的体裁熟悉度、语言成熟度、主题复杂度,读者的阅读特点、专门兴趣、语感素养等要素和特征,不能一味地将分级阅读奉为圭臬。
文本的难易程度与阅读能力相匹配,应该是交互的过程,从国外分级阅读的价值和争议来看,分级阅读具备匹配文本和读者、逐步提升阅读水平的价值,但也存在着例外因素和局限作用。
从文本方面来说,需要厘清的是,文本的级别和其自身的价值高低并没有直接的正相关性。文本分级指数只代表文本的在可读性上的指标,并不意味着文本在文学上思想上的价值,反之亦然,分级指数不高的书籍可能在文本内涵上更难把握。比如,在英文阅读语境中,海明威的名著《太阳照常升起》在AR分级中为4.4,即美国小学四年级读了四个月的学生的平均阅读水平就可以认读这本书,可要真正理解书中内容会需要很多的背景知识和生活阅历。放在中文阅读语境中,老舍先生的文学语言平实素朴,在语义上并不复杂,但真要读懂需要成熟的理解力。
从读者方面来说,必须明确的是,分级是手段,不是目的,不应该把一味追求更高的评估指数凌驾于对儿童阅读兴趣的培养上去。在一个分级指标中,兴趣级别和文本语言级别是需要相互平衡的。同样用《太阳照常升起》举例,它的句子较短,词语也比较简单,但是它的兴趣级别是中学生(Upper Grades)。好的阅读体系可以帮助读者找到适合自己的最佳阅读区间,在一个既具备可读性又兼顾文本兴趣的阅读区间内,完成对阅读者的测试,并形成评估反馈。如果为了追求更高的评估指数,忽视了兴趣和对文本内涵的理解,不仅对儿童的阅读能力起不到培养的作用,甚至会导致儿童认知能力和理解能力的失衡。
同时,需要调整当前国内以年龄为主要分级依据的分级理念。以年龄为区分标准容易陷入“一刀切”,忽视了不同儿童的个体差异,对儿童心理发展和认知水平的规律没有做深入了解。儿童阅读能力的增长不会像程序一样自动跳转,级别之间的衔接和过渡尤为重要。这对分级阅读标准的划分提出了更为具体深入的要求,亟需建立客观、可量化的评测依据。
随着科技的发展,分级阅读研究逐渐走向智能化、科学化、自动化,算法也越来越多样。中文定量因素即数量维度,包括可以通过计算机软件有效测量的词语频率以及句子长度等。定性因素包括含义结构、主题类型、语言风格和知识需求水平等。基于定量因素的衡量有更高的准确率,而在定性因素方面,一些难以量化的隐性的元素还难以捕捉。
无论是定量还是定性,都存在着需要解决的难点,尤其是确定特定书籍对特定读者可能有多困难或多容易是一项复杂的任务[33]。变量包括外部要素和内部要素,外部要素诸如文本结构是叙述性的还是说明性的,是否有隐含的意思或者意图,因果关系是明确说明的还是需要推断的,潜在主题的熟悉程度,语言的修辞形式,句子的复杂性,重复的运用,说明性插图等因素都会影响可读性;内部因素亦即读者本人的能力和素质,诸如读者的元认知知识和阅读过程中的自问能力,也会影响文本的理解。未来的可读性研究在文本之外,还应将目光更多放在阅读者身上,构建一个快速量化读者阅读能力、阅读水平、先验知识背景的模型。量化读者的模型与量化文本的模型配合使用,才更具合理性[34]。
由于中文与拼音文字在语言特征的根本差异,西方研究者在可读性研究的发现,是否适合中文文字系统有待商榷。但可以明确的是,第一,无论是定量还是定性,必须抓住决定性的核心要素;第二,要素越全面多样,关于文本的预测越为准确;第三,对于处在起步和初级水平的阅读者,文本分级的效用是最大的。因此,分级阅读是可以不断发展和更新的,它有天生的局限性,但客观上的准确度越来越高,具有参考价值。
公式可以用来估算文本可读性,但仍旧需要人工判断。分级阅读需要引导者,在基本掌握被引导者的个体认知水平和现有阅读能力的基础上,起到“脚手架”(Scaffolding)作用。这种学习模式,就好像施工时搭建的脚手架一样,随着建筑的竣工,被逐渐撤离。脚手架理论由美国儿童心理学家布鲁纳(Jerome Bruner)提出,以“最近发展区”理论为基础发展而来,恰当的“脚手架”应该考虑到儿童当前的阅读认知能力,同时构建一个略高于当前水平的学习目标[35]。
除了分级阅读的目标,分级阅读的评价也主要依靠引导者完成,引导者需要测度儿童的实际阅读行为,能不能认识字词,理解基本意义,实施分级阅读应该考虑到学生的动机、知识和背景兴趣,以及任务分配的目的和复杂性,这些最好由具备专门水准的教师和馆员等引导者完成。这正如,ATOS包括定性、定量、读者和任务几个维度,定性交给老师和AR BookFinder,定量交给ATOS,读者和任务则交给老师[36]。
此外还需明确,对于读者的分级不应成为阅读的限制,它是馆员和教师因材施教的参考数据。分级是工具而非标签,它可以让馆员和教师更好地了解读者的阅读水平,有针对性地帮助其提升阅读能力。从图书馆层面来说,对于婴幼儿,图书馆要营造一定的阅读环境以激发其阅读兴趣并吸引他们来到图书馆;对于儿童,应帮助他们获得终生学习和信息素养的能力,使他们能够参与社会并为社会做出贡献;在青少年从青春期到成年期的过渡阶段,图书馆应该有针对性地为他们提供教育、信息、文化和消遣方面的服务[37]。
《中国儿童发展纲要(2011-2020年)》中明确提出推广面向儿童的图书分级制,2020年《关于促进全民阅读工作的意见》提出,推广阶梯阅读,建立阶梯阅读体系,这对我国少儿分级阅读工作提出了更高的要求。我国分级阅读的发展需正视分级阅读存在的局限性,科学辨析影响可读性的因素,发挥分级阅读的效用,从注重文本与读者的关联,将定量与定性因素相结合,构建由馆员、教师引导的分级阅读体系三方面入手构建分级阅读模式。