阿依古丽·艾尼 买合甫来提·坎吉 刘贵雄 帕里扎·布拉提汗,3
(1 新疆心智发展与学习科学重点实验室,乌鲁木齐 830017) (2 陕西师范大学心理学院,西安 710062)(3 阜康市第一中学,阜康 831599)
词切分(word segmentation)是指读者在文本阅读中将词从句子或语篇中切分出来的过程(胡睿,肖少北, 2021),是词汇加工过程中的首要环节,在阅读认知加工过程中起着重要作用(李兴珊 等,2011)。从书写形式上看,大多数的拼音文字语言中词与词之间都存在空格。作为一种重要的词切分线索,词间空格为被试提供了明显的视觉信息,有助于读者确定词与词之间的边界(余香莲等, 2015)。以往研究表明,词间空格(于文勃 等,2021)、灰条标记(Perea et al., 2015),斜杠、闭合和开放方块(McGowan et al., 2014)等多种词切分线索均有利于阅读理解,相比于其他人为构造的线索,词间空格作为语言中真实存在的词切分依据而备受关注。
有效的词切分是成功识别词汇的重要前提。汉字既可以单独成词,又可以作为词的一部分,而且与不同的字组合会有不同的意义。然而汉语文本中没有明显的词边界信息,但是,这并没有影响正常的汉语阅读,这说明汉语读者通过特殊的方式进行词切分(李兴珊 等, 2011; Li et al.,2009)。有研究者认为,读者可以利用词在大脑中的编码方式— 词汇表征方式,自动高效地切词(Li et al., 2009)。在心理语言学研究领域中关于词汇表征有三种观点:词素分解通达模型(morpheme access model, MA)、整词通达模型(word access model, WA)和混合通达模型(combined access model,CA)。词素分解通达模型认为词以词素分解形式存储,在整词通达之前,词素先激活,才可激活整词(Taft & Forster, 1975)。如,欲识别“黑板”需先激活“黑”和“板”,才可达到“黑板”整词的激活。整词通达模型认为词以整词的形式存储,词汇识别由刺激输入直接激活整词(Manelis &Tharp, 1977)。而混合通达模型则认为词素表征和整词表征兼而有之,词汇识别中存在词素表征和整词表征(Caramazza et al., 1988)。词汇表征方式和词切分之间具有对应关系(刘志方 等, 2016; Li et al.,2009):当词汇以词素为单位表征时,基于词素进行词切分;当词汇以整词为单位表征时,基于整词直接进行词切分;当词汇以词素和整词这两种特征交互表征时,词素的激活和整词的激活等各个单元之间相互作用,共同合作来影响词切分。基于上述关系,刘志方等人记录了正确/错误提示的词切分线索(将能够/无法组成一个整词的两个词素用颜色标记)对汉语阅读效率(用句子总阅读时间来衡量)和眼动数据的影响,并探讨汉语阅读中的词切分特征,进而研究词切分特征所反映的词汇表征特征。其研究逻辑是:若读者采用词素分解方式,则在正确提示的词切分条件下出现凝视时间的延长(当词素被词切分线索组合成整词时,采用词素分解的读者还需要进行分解,因此延长词素加工环节),错误提示的词切分条件下不会出现阅读效率的降低(尽管无法组成整词的两个词素被错误地组合在一起,采用词素分解方式的被试还是会进行分解加工,为此阅读效率不会受影响);若读者采用整词加工方式,则在正确提示的词切分条件下不会出现凝视时间的延长,而错误提示的词切分条件下出现阅读效率的降低;若读者采用混合加工,正确提示条件下出现凝视时间的延长,错误提示条件下出现阅读效率的降低。结果发现,正确提示的词切分线索延长了词汇凝视时间,错误提示的词切分线索对阅读效率的影响也有延迟时间主效应,验证了汉语加工符合混合通达模型。有研究者认为,混合表征中可能存在词素分解方式较多而整词加工较少抑或词素分解方式较少而整词加工较多(杨群 等, 2019),此时词切分线索对阅读的影响截然不同。词切分线索促进汉语读者的阅读理解时,只能说明被试更加依赖于词素分解或整词通达较慢。
个体的词切分特征受到阅读经验的影响。Bai等人(2008)在汉语阅读中发现,词间空格对大学生句子阅读理解没有明显作用,甚至由半个空格变成一个空格时反而会产生干扰作用(梁菲菲, 白学军, 2010)。随着文本阅读经验的下降,词间空格对阅读理解的作用逐渐显现出来。沈德立等人(2010)发现,词间空格对小学三年级学生句子阅读的总体成绩并无促进作用,但词间空格显著地减短了注视时间(凝视时间和总注视时间)。当阅读经验丰富时,汉语读者不需要额外的词切分线索,而阅读经验较为匮乏时,词切分线索促进汉语读者的词切分过程进而促进阅读理解。为了探讨汉语阅读经验对词切分特征的影响,研究者还考察了词间空格对初级水平美国大学生汉语句子阅读的影响,结果发现了词间空格的促进作用,并将该结果归因于美国大学生相对匮乏的汉语阅读经验(白学军 等, 2009)。然而,美国大学生熟悉有空格的英文文本,而汉族大学生熟悉无空格的汉语文本,以上研究结果中难以分离有/无空格的不同文字阅读经验和汉语熟练水平对词切分特征的影响。
在新疆维吾尔自治区,从语言环境的创造、教学策略的改革等方面,学生的阅读经验仍有很大的提升空间。姚婧媛(2012)发现,维吾尔族大学生对词的阅读知觉广度大于字的阅读知觉广度,并提出维吾尔族大学生将词作为一个整体进行加工。而杨群等人(2019)认为,维吾尔族学生受维吾尔文认知的分解表征方式的影响,在汉语加工过程中也会采取分解加工。维吾尔族大学生在长期的国家通用语言文字学习过程中,或许并非采用单纯的词素分解表征方式或单纯的整词表征方式,而是词素分解和整词交互的混合通达,但其中哪一表征方式的作用更凸显取决于阅读经验和阅读水平(杨群 等, 2019)。本研究选取有维吾尔语文本阅读经验、国家通用语言文字熟练程度不同的维吾尔族大学生为研究对象,采用眼动追踪技术,记录高熟练和低熟练水平维吾尔族大学生在有空格和无空格两种句子阅读任务中的眼动特征,考察阅读经验对词切分加工的影响,进一步分析其词汇表征特征,为提升国家通用语言文字水平的有效策略提供科学依据。研究逻辑是:如果词间空格的插入对维吾尔族大学生的阅读无促进作用,则说明其在国家通用语言文字阅读中整词表征作用更凸显;如果有促进作用,则说明维吾尔族大学生在阅读中词素分解表征更凸显,且随着熟练水平的提高,词间空格的促进效应会下降,整词加工的作用更突出。
40名维吾尔族大学生(男11人)参与实验,高熟练者和低熟练者各20名。其语言熟练水平满足以下三条标准:(1)国家通用语言文字接触年龄:高熟练者从幼儿园或小学一年级开始学习,低熟练者从小学三年级开始学习(杨群 等, 2019; Luk et al.,2011),经检验发现,接触年龄上,高熟练和低熟练大学生的差异显著,t(38)=1.96,p<0.05,d=0.64;(2)国家通用语言文字接触量:采用谢枝龙(2014)的语言经历和语言水平问卷(LEAP-Q)中语言经历维度进行进一步修订来测量,高熟练者接触时间超过总数的80%,阅读文字材料数量超过总数的95%,而低熟练者接触时间低于总数的60%,阅读文字材料数量低于总数的60%。检验发现,高熟练和低熟练大学生接触时间和阅读文字材料的差异显著,ts>2.67,ps<0.05,ds>0.96;(3)MHK(中国少数民族汉语水平等级考试)成绩:高熟练者通过MHK四级甲等并且阅读理解部分的成绩为80分以上,而低熟练者未通过MHK三级甲等,阅读理解部分的成绩低于75分。被试平均年龄为21.75岁(SD=2.87岁),视力或矫正视力正常,均自愿参加本实验,实验结束后获得相应报酬。
采用2(语言熟练水平:高熟练、低熟练)×2(词间空格类型:无空格、有空格)二因素混合实验设计。其中语言熟练水平为被试间变量,词间空格类型为被试内变量。因变量为阅读理解正确率以及首次注视时间、凝视时间、第一遍注视次数和注视次数四个眼动指标。
使用EyeLink 2000眼动仪采集数据。其采样率为1000 Hz、屏幕分辨率为1024×768像素、刷新率为120 Hz。实验过程中被试的眼睛与屏幕之间保持65 cm距离。句子中每个汉字字体为宋体18号、大小为25×25像素、水平视角为0.74°。
使用白学军等人(2009)的句子材料,具有以下特点:陈述句、不包含标点符号、长度为13~16个汉字、平均通顺性为4.54(SD=0.11)、词切分合理性为4.20(SD=0.20)。
实验前,不参与正式实验的10名低熟练维吾尔族大学生对句子难度进行5级评定(1代表“句子非常容易理解”,5代表“句子非常难以理解”),剔除平均难度大于3分的句子,最终保留容易理解的40个句子,平均难度为1.40(SD=0.18)。
参照王敬欣等人(2020)的研究,词间有空格条件下的空格间隔为1磅。材料样例见表1。
表1 无空格和有空格条件下的句子示例
实验在一间安静、采光良好的实验室进行。主试讲解指导语以确保被试理解实验任务,为了使CR和Pupil调至最佳值,先进行左上、左下、右上、右下四点校准,再进行九点校准(研究中阅读理解题和选项多行出现),若达到标准水平,则进行正确度检验,达到Good级水平后进入正式实验。主试实时监视眼动仪,并在任何需要的时候重新校准。每位被试完成测试任务大约需要20分钟。
在阅读理解正确率上(见表2),语言熟练水平的主效应不显著,F(1, 19)=0.10,p>0.05。词间空格类型的主效应不显著,F(1, 19)=2.85,p>0.05。语言熟练水平和词间空格类型的交互作用不显著,F(1, 19)=0.36,p>0.05。上述结果表明,两组大学生在有无空格条件下均能理解句子含义。
表2 不同熟练水平大学生在两种词间空格条件下的句子阅读理解正确率[M(SD)]
本研究中,兴趣区以词为单元划分,每个词就是一个兴趣区,为避免阅读开始与结束时注视的干扰,删除位于句首和句尾兴趣区的数据。还有,为有效控制词长对注视的影响,基于大多数关于词汇表征(关于词素分解通达、整词通达和混合通达的研究一般以双字词作为材料),如丁国盛和彭聃龄(2006)研究的做法,分析中只保留以双字词作为兴趣区的数据。
余香莲等人(2015)认为注视时间和注视次数需要结合分析。基于此,并参照白学军等人(2009)的研究,本研究选取四个眼动指标:(1)首次注视时间:指落在词上第一个注视点的持续时间,反映对词汇视觉扫描时早期阶段的特征;(2)凝视时间:指从注视点第一次落入词上开始,到离开该词为止的时间内,被试对词的注视时间的总和,反映词汇通达早期阶段的特征;(3)第一遍注视次数:指从注视点第一次落入词上开始,到离开该词为止的时间内,落在词上的注视点个数,反映词汇形成心理表征的快慢;(4)注视次数:落在兴趣区内注视点的个数,反映对词汇的重复加工程度 (白学军 等, 2009; 沈德立 等, 2010)。其中,单个注视点的持续时间短于80 ms或长于1200 ms、在一个句子上的注视点少于3个的试次、追踪丢失和3个标准差以外的数据均被剔除,结果见表3。
表3 不同熟练水平大学生在两种词间空格条件下的眼动数据[M(SD)]
在首次注视时间上,语言熟练水平的主效应不显著,F(1, 19)=1.50,p>0.05。词间空格类型的主效应显著,F(1, 19)=4.97,p<0.05,=0.21。有空格条件下的首次注视时间显著短于无空格条件。语言熟练水平和词间空格类型的交互作用不显著,F(1, 19)=0.03,p>0.05。结果表明,在词汇加工的早期阶段,熟练水平之间差异不显著,而有空格对不同熟练水平被试的词汇加工有促进作用。
在凝视时间上,语言熟练水平的主效应显著,F(1, 19)=13.78,p<0.05,=0.42。词间空格类型的主效应显著,F(1, 19)=12.58,p<0.05,=0.40。语言熟练水平和词间空格类型的交互作用显著,F(1, 19)=6.12,p<0.05,=0.24。进一步进行简单效应检验发现,对于低熟练水平大学生而言,有空格条件下的凝视时间短于无空格条件,F(1, 19)=19.39,p<0.05,=0.51。而对于高熟练水平大学生,有空格和无空格条件下的凝视时间无显著差异,F(1, 19)=0.30,p>0.05。结果表明,在词汇加工的早期阶段,有空格对低熟练水平大学生的促进作用更大。
在第一遍注视次数上,语言熟练水平的主效应显著,F(1, 19)=19.38,p<0.05,=0.51。低熟练水平大学生的第一遍注视次数显著多于高熟练水平大学生。词间空格类型的主效应显著,F(1, 19)=4.47,p<0.05,=0.19。无空格条件下第一遍注视次数少于有空格条件。语言熟练水平和词间空格类型的交互作用不显著,F(1, 19)=0.10,p>0.05。结果表明,不同熟练水平被试词汇心理表征速度不同,而插入词间空格延缓了被试词汇心理表征的速度。
在注视次数上,语言熟练水平的主效应显著,F(1, 19)=14.38,p<0.05,=0.43。低熟练水平大学生的注视次数显著多于高熟练水平大学生。词间空格类型的主效应边缘显著,F(1, 19)=3.80,p=0.07,=0.17。在有空格条件下注视次数少于无空格条件。语言熟练水平和词间空格类型的交互作用不显著,F(1, 19)=3.23,p>0.05。结果表明,在词汇重复加工方面不同熟练水平之间存在差异,而有空格能够减少不同熟练水平被试对词汇的重复加工。
本研究选取熟悉有空格文本的维吾尔族大学生作为研究对象,发现有空格的国家通用语言文字句子阅读中不同熟练水平被试的首次注视时间、凝视时间、注视次数显著少于无空格条件,而有空格条件下第一遍注视次数显著多于无空格条件。首先,基于前三个指标,词间空格对维吾尔族大学生的国家通用语言文字句子阅读具有促进作用,表明维吾尔族大学生词汇加工过程中词素分解表征更凸显。这与前人研究结果(梁菲菲,白学军, 2010; Bai et al., 2008)不一致。在汉语认知加工过程中整词表征与分解表征共存、整词提取和分解加工并用(杨群 等, 2019)。汉族大学生利用整词表征与分解表征共存的词汇表征方式进行自动切词,因此,提供额外的词切分线索(词间空格)就显得无足轻重(Yan et al., 2010),甚至由半个空格变成一个空格时反而产生干扰(梁菲菲, 白学军, 2010)。而维吾尔族大学生可能受维吾尔语文字学习经验的影响,在有空格的国家通用语言文字句子阅读中其词汇加工不仅不受干扰,反而获益。当阅读无空格文本时,维吾尔族读者首先激活词素,再激活整词,在此过程中可能容易把语义无关的两个词素联结成一个整词进行加工,导致句子歧义和理解困难,由于这时需要重新加工与再次修正,因此出现较长的首次注视时间、凝视时间和较多的注视次数。人为插入的词间空格分割出非词的单元边界,能够给读者提供正确的词素组合,进而促进维吾尔族读者从词素水平到整词水平的词汇通达(梁菲菲 等, 2016; Bai et al.,2013; Blythe et al., 2012),从而避免重新表征与再次修正,减少首次注视时间、凝视时间、注视次数。其次,有空格条件下第一遍注视次数多于无空格条件,这一结果表明有空格条件下词汇形成心理表征更慢,原因可能是:依赖词素分解通达的维吾尔族大学生阅读有空格文本时,还需要分解整词,进而导致更多的注视次数;而无空格条件下会直接激活词素表征,这一过程会更快,而在词汇加工的后续阶段,需要更多的注视次数和更多的凝视时间来通达词汇。综合分析四个眼动指标上的数据结果,可以推测,维吾尔族学生在国家通用语言文字词汇表征中更加依赖词素分解通达,而整词加工能力较弱,使其在有空格的文本阅读中获益。
此外,本研究结果与白学军等人(2011)发现的词间空格对日-汉双语者汉语阅读没有产生作用这一结果相反,即日语读者阅读有空格和无空格的汉语文本无差异。日语文本中词与词之间没有空格,当日语读者阅读没有空格的汉语文本时,将日语文本阅读中所形成的自动切词的策略迁移到汉语阅读中,因而不需要额外的词切分提示。与日语不同的是,维吾尔语中词与词之间存在空格,且维吾尔语是典型的黏着语,词根和变词语素可以任意组合,构词法采用“前缀+词根+后缀+后缀……”的形式(姑丽加玛丽·麦麦提艾力 等, 2012),语言加工方式具有分解性。李馨等人(2010)认为,不管是以有空格的语言为研究对象,还是以无空格语言为研究对象,空格的影响会跨语言迁移。根据此观点可以推测,维吾尔族被试将维吾尔文认知的分解加工方式迁移到国家通用语言文本中的词汇识别中(杨群 等, 2019)。
还有,在凝视时间指标上,词间空格对维吾尔族大学生国家通用语言文字词汇加工的影响受到熟练水平的调节,即插入空格减少了低熟练水平被试的凝视时间,而不影响高熟练被试的凝视时间。此结果与空格减少了首次注视时间、注视次数,而增加了第一遍注视次数等结果综合分析后,可以推测,对高熟练读者而言,插入空格促进其在词汇加工最早期扫描阶段的词切分,并减少重复加工次数,即空格对高熟练读者的促进作用更多地发生在最早期视觉扫描阶段;而对低熟练被试而言,在词汇通达的整个早期阶段都出现了空格的促进作用,说明其在词汇识别的整个早期过程中更依赖于词切分线索。究其原因:本研究中低熟练大学生的国家通用语言文字接触年龄较晚,接触量不如高熟练大学生,词汇表征中整词表征比较弱,使得其在有空格文本中的词汇识别获益更大。相反,高熟练大学生的国家通用语言文字接触年龄较早,接触量相对较多,整词表征相对成熟,在词汇识别过程中对词切分线索的依赖性较弱。高熟练和低熟练大学生在国家通用语言文字阅读经验和熟练度的差异使得低熟练大学生对词切分线索具有更强的依赖性,进一步反映了词素分解和整词交互的混合通达中,哪一种表征方式的作用更凸显取决于阅读经验和熟练度。低熟练大学生词素分解通达方式的凸显性,表明了其国家通用语言文字阅读经验不足,导致整词表征能力较弱,从而影响了其阅读中快速有效的词汇加工。
本研究的结果对维吾尔族学生的国家通用语言文字教学具有重要启示。首先,在国家通用语言文字学习中要加强以词为单位的教学,这既有利于学生掌握词素的组合规律,又有利于形成更高水平的整词表征,使得维吾尔族学生既能够通过词素水平激活到整词水平的表征,又能够直接激活整词水平的表征,从而实现通过两种途径通达词汇意义,达到快速且有效的阅读理解效果。其次,针对低阅读水平者或初学者,早期可以适当提供词切分线索,帮助其形成整词表征。随着日常阅读频率和阅读量的增加以及阅读水平的提高,可以从以词素为单位的教学过渡到以整词为单位的教学,促进词切分过程的自动化。
维吾尔族大学生在国家通用语言文字阅读中,插入空格促进了其词汇加工;词汇通达早期阶段,词间空格的促进作用受其熟练水平的调节,即低熟练被试中出现了促进作用。结果表明,维吾尔族大学生在词汇加工过程中一定程度上依赖于词素分解表征,并且,此种依赖性随着其语言熟练程度的提高而逐渐减弱,而整词表征能力逐渐提升。