副中央凹低频双字词首字字频的预视效应研究 *

2022-07-18 06:53王永胜何立媛白学军
心理与行为研究 2022年3期
关键词:词频效应中央

王永胜 何立媛 李 馨 白学军

(教育部人文社会科学重点研究基地天津师范大学心理与行为研究院,天津师范大学心理学部,学生心理发展与学习天津市高校社会科学实验室,天津 300387)

1 引言

阅读过程中,读者可以通过中央凹视区(视野中心2°视角范围)和副中央凹视区(中央凹视区外2~5°的视野范围)获得完成阅读所需的信息(白学军 等, 2011; Schotter et al., 2012)。边界范式(boundary paradigm)是研究副中央凹加工的经典实验范式(Rayner, 1975),该范式具体操纵方法是:首先在句子中确定目标刺激(目标词)的位置,在目标位置的左侧设置一个隐藏的边界(边界只在实验程序中设置,并不在实验刺激屏幕上呈现),在读者的注视点越过该边界之前,目标位置上呈现预视刺激;当读者的眼睛越过边界位置时,目标刺激立即替代之前的预视刺激。这种呈现变化发生在注意被抑制的眼跳过程中,所以读者一般不会意识到这种变化。该范式通过操纵预视刺激与目标刺激的关系,可以有效地探讨读者在副中央凹预视加工中获取了哪些有效信息和可获取信息的范围。

使用边界范式的研究发现,副中央凹获取的信息在眼动控制中发挥重要作用:在副中央凹呈现有效预视与无效预视相比,副中央凹词在随后被注视时的注视时间显著变短,即副中央凹预视效应(parafoveal preview benefit effect)(白学军等, 2011; Rayner, 1998, 2009; Schotter et al., 2012)。副中央凹加工获取的信息指引读者的注视位置选择,关于拼音文字的研究发现,副中央凹加工获取的词边界信息引导着读者的注视点落点位置(Morris et al., 1990; Rayner et al., 1998),汉语研究中也发现副中央凹加工决定了眼睛的落点位置(李玉刚 等, 2017)。

拼音文字中的词间空格作为词切分线索引导读者副中央凹的注意资源分配。虽然E-Z读者模型和SWIFT模型对于注意资源的分配方式存在争议(Engbert et al., 2005; Reichle et al., 2003),但均认为词间空格作为词边界信息引导注意资源以词为单位进行分配,副中央凹以词为单位进行预视加工。Sheridan等(2016)的研究表明,当使用随机数字取代词间空格破坏词边界信息后,副中央凹预视效应减小。Drieghe等(2017)的研究同样发现,删除词间空格后目标词的预视效应显著减小。此外,研究表明词频、预测性等词汇属性均会影响词的副中央凹加工(Inhoff & Rayner, 1986;Reingold et al., 2012; Schotter et al., 2015)。这些研究表明在拼音文字的阅读中,词边界信息引导读者在副中央凹以词为单位进行注意的分配。

汉语文本由连续书写的汉字构成,虽然词汇加工在汉语阅读中具有重要的作用(Bai et al., 2008;Li et al., 2014; Yan et al., 2006),但是汉语文本中缺少外显的词边界信息,读者在副中央凹不能根据低水平的视觉线索确定词的边界,那么汉语读者在副中央凹是以字还是以词为单位进行加工?

Li等(2009)提出的汉语词汇识别与词切分模型认为,在汉语阅读中,注意资源在字水平上是平行分布的,知觉广度内的字均可得到加工,但受到字与注视点之间的距离(离心率)影响;而在词水平上注意资源是序列分布的。Li等(2014)在一项语料库的分析中发现副中央凹的字频影响当前注视词的加工,而副中央凹的词频并不产生影响。Ma等(2015)操纵了副中央凹双字词的词频与首字字频来探讨副中央凹字频与词频对当前注视词加工的影响,结果发现副中央凹双字词首字的字频影响当前注视词的加工时间,副中央凹双字词首字的字频越高,当前注视词的注视时间越短,但是副中央凹词的词频并不影响当前注视词的加工,表明读者在副中央凹是以字为单位进行加工的。

然而也有一些研究表明,副中央凹的词水平信息影响读者的眼动特征。刘志方等(2013)通过操纵注视点右侧文字的掩蔽单元和掩蔽范围探讨了汉语阅读中的词切分,结果发现汉语读者能够切分出注视点右侧词的边界,并且以词为单位进行字的识别。Shen等(2018)的研究在副中央凹呈现与目标词(如“树林”)首字语素意义相同的预视词(如“树胶”)或不相同的预视词(如“树敌”),结果发现相同首字语素意义预视条件下目标词的注视时间显著地短于不相同语素意义预视条件。在该研究中,读者只有在副中央凹预视加工中进行了词汇水平的加工才能够明确首字的语素意义,因此该研究为读者能够在副中央凹处进行词汇水平的加工提供了证据。跳入副中央凹高频词的眼跳长度显著长于跳入低频词的眼跳长度,研究者认为这是由于高频词比低频词在副中央凹加工时获取了更多的预视信息(Liu et al.,2017; Liu et al., 2019)。白学军等(2009)的研究发现副中央凹词的词频影响当前注视词的加工,副中央凹词频越高,当前注视词的注视时间越短,即存在副中央凹–中央凹效应。这些研究为汉语读者在副中央凹进行了词水平的加工提供了证据。

综上所述,在缺少词边界信息时,读者在副中央凹是以字为单位还是以词为单位进行预视加工,仍然存在争议。本研究选择低频双字词作为目标词,操纵目标词首字字频的高、低,同时采用边界范式操纵目标词首字的预视类型,直接检验组成副中央凹词的首字预视加工情况,从而对该问题进行探讨。选择低频双字词作为目标词是由于单字词的词频与字频存在高相关,不能有效分离字频与词频的作用(Ma et al., 2015);而低频词的首字影响其注视加工(赵冰洁 等, 2018; Yan et al., 2006),能够充分体现字频的作用,且不受该字作为单字词的词频影响。如果汉语读者在副中央凹以字为单位进行预视加工,那么字频的高低将影响其预视加工,因而本研究预期字频及两因素的交互作用显著,高频字的预视效应将显著大于低频字的预视效应;如果读者在副中央凹是以词为单位进行预视加工,则预期两因素交互作用不显著,高频字与低频字的预视效应没有显著差异。

2 研究方法

2.1 被试

36名天津师范大学学生参与本实验,平均年龄为20.65岁(SD=1.76岁)。所有被试的视力或矫正视力正常,无色盲色弱,母语均为汉语,对实验目的均不了解。实验结束后每人可得到一定的报酬。

2.2 实验设计

采用2(字N+1字频:高频、低频)×2(字N+1预视类型:目标预视、假字预视)的两因素被试内实验设计。

2.3 实验材料

选择80组尾字相同的双字词作为目标词,目标词首字分别为高频字和低频字(平均字频,M高=1004.90次/百万,SD=1080.05次/百万;M低=72.37次/百万,SD=57.39次/百万;t=7.72,p<0.001,d=1.23)(Cai & Brysbaert, 2010)。在目标词首字笔画数和整词词频上,首字高频和首字低频条件下均没有显著差异,|t|s<1.21,ps>0.05。将目标词插入到相似的句子框架中,目标词之前的句子部分相同,共编制80组句子作为正式实验的材料。

选择20名大学生对实验句子的通顺性进行7点评定(“1”代表“非常不通顺”,“7”代表“非常通顺”)。高频字条件的句子通顺性(M=6.70,SD=0.33)与低频字条件下句子的通顺性(M=6.71,SD=0.30)不存在显著差异,t=0.19,p>0.05。选择12名大学生对目标词的预测性进行评定。给被试呈现目标区之前的句子部分,让被试把句子填写完整。被试均不能准确地预测出目标词,即目标词的预测性为0。参与实验材料评定的大学生均不参与正式实验。使用Windows系统的专用字符编辑器编制实验材料中的假字。实验材料举例见表1。

表1 实验句子举例

2.4 实验仪器

实验采用EyeLink 1000型眼动记录仪,采样频率为1000 Hz。呈现变化的延迟时间为6~13 ms。被试机屏幕刷新频率为140 Hz,分辨率为1024×768像素。被试眼睛与屏幕之间的距离为65 cm,刺激以24号宋体形式呈现,每个汉字在屏幕上的大小为32×32像素,每个汉字约为1.10°视角。

2.5 实验程序

每名被试单独施测。被试进入实验室后,首先向被试简单介绍实验室环境。之后,被试开始阅读实验指导语。被试表示阅读完毕后,主试向被试简述指导语,确保被试准确理解实验程序。然后进行眼校准,采用三点校准,校准的平均值小于0.25°视角时表示校准成功。然后开始实验,被试阅读屏幕上呈现的实验句子,其中前8个句子为练习句,但是并不告知被试该部分为练习部分。练习完毕开始正式实验。

实验材料采用拉丁方的方法在被试间进行平衡。实验材料共分为四组,每名被试阅读其中一组实验材料。每名被试在整个实验中需要阅读108个句子,其中包括8个练习句,20个填充句,80个实验句,其中44个句子后面有简单的“是”或“否”的判断问题,以确保被试认真阅读句子。

实验过程中的句子随机呈现。实验过程中,在必要时进行重新校准,整个实验过程大约需要25~35分钟。

3 结果

被试回答问题的准确率为90.5%,各种条件下被试回答问题的正确率不存在显著的差异,Fs<1,ps>0.05,表明被试认真阅读了实验句子。

根据以往的研究,过短或过长的注视不能反映阅读的加工信息(Rayner, 1998, 2009),因此,将注视点短于80 ms或长于800 ms的注视点删除,根据以下标准将不符合要求的数据进行删除:(1)被试在句子上的注视点少于3个;(2)边界变化提前或者延迟;(3)边界变化或注视目标词时眨眼的数据;(4)3个标准差之外的数据。删除的数据占总数据的16.1%。

在数据分析中,将目标词的首字(目标字)、目标词分别作为兴趣区,分析的指标包括:首次注视时间、凝视时间、单次注视时间、总注视时间和跳读率(王永胜, 何立媛, 2022; 闫国利 等,2013)。在目标词分析中,本研究还对目标词的注视位置进行分析,分析指标包括眼跳的起跳位置、首次注视位置、单一注视位置以及多次注视中的首次注视位置。

本研究采用基于R语言(R Core Team, 2018)环境下的线性混合模型(linear mixed model, LMM)对数据进行分析,采用lme4数据处理包(Bates et al., 2015)对数据进行分析。对连续数据进行log转换,对跳读率进行logistic lme转换。本实验中的线性模型是将目标字字频、首字预视类型和两因素的交互作用作为固定因素来进行分析,将被试和项目作为交叉随机效应。

3.1 目标字注视结果

被试对目标字的注视的描述统计结果见表2。

表2 目标字眼动指标的描述统计结果

分析结果发现,在跳读率上字频的主效应不显著(b=0.13,SE=0.09,z=1.37,p>0.05);首字预视类型主效应显著(b=0.31,SE=0.10,z=3.02,p=0.002),目标预视下的跳读率显著高于假字预视下的跳读率;两因素交互作用不显著(b=0.04,SE=0.18,z=0.25,p>0.05)。

在注视时间指标上,首字预视类型主效应均显著(ts>4.4,ps<0.001),目标预视下的注视时间显著短于假字预视下的注视时间。字频的主效应以及两因素的交互作用均不显著(|t|s<1.60,ps>0.05)。

在目标字的分析上,存在典型的预视效应,但是并没有发现字频以及两因素的交互作用。这可能是由于读者在注视目标字时,注视点虽然落在该字上,但是是以整个词为单位来进行加工的,因此没有表现出字频的效应。接下来将对目标词的注视情况进行分析。

3.2 目标词注视时间结果

被试对目标词注视的描述统计结果见表3。

表3 目标词注视时间眼动指标的描述统计结果

分析结果发现,在跳读率上字频的主效应不显著(b=0.05,SE=0.21,z=0.26,p>0.05),首字预视类型主效应显著(b=0.82,SE=0.24,z=3.39,p<0.001),目标预视下的跳读率显著高于假字预视下的跳读率;两因素交互作用不显著(b=0.30,SE=0.41,z=0.72,p>0.05)。

在注视时间指标上,首字预视类型主效应均显著(ts>5.16,ps<0.001),目标预视下的注视时间显著短于假字预视下的注视时间,即存在典型的预视效应。在首次注视时间和单次注视时间上,字频主效应均不显著(|t|s<1.11,ps>0.05)。在凝视时间上,字频主效应显著(b=0.05,SE=0.02,t=2.27,p=0.002),首字低频条件下目标词的凝视时间显著长于首字高频条件。在总注视时间上,字频主效应显著(b=0.06,SE=0.02,t=2.42,p=0.015),首字低频条件下目标词的注视时间显著长于首字高频条件。两因素的交互作用在各个指标上均不显著(|t|s<0.09,ps>0.05)。

3.3 目标词注视位置结果

被试对目标词注视位置的描述统计结果见表4。

表4 目标词注视位置眼动指标的描述统计结果

分析结果发现,在跳入目标词眼跳的起跳位置上,字频的主效应、预视类型的主效应以及两因素的交互作用均不显著(ts<1.63,ps>0.05)。

在首次注视位置上,字频主效应不显著(b=0.001,SE=0.04,t=0.03,p>0.05)。首字预视类型主效应边缘显著(b=0.07,SE=0.04,t=1.84,p=0.07),目标词上的首次注视位置在目标预视条件下比假字预视条件下更靠近词的中心。两因素交互作用不显著(b=0.02,SE=0.07,t=0.21,p>0.05)。

在单一注视位置上,字频主效应不显著(b=0.03,SE=0.04,t=0.85,p>0.05)。首字预视类型主效应边缘显著(b=0.08,SE=0.04,t=1.92,p=0.06),目标词上的首次注视位置在目标预视条件下比假字预视条件下更靠近词的中心。两因素交互作用不显著(b=0.06,SE=0.09,t=0.46,p>0.05)。

在多次注视的首次注视位置上,字频主效应不显著(b=0.05,SE=0.10,t=0.50,p>0.05)。首字预视类型主效应边缘显著(b=0.19,SE=0.09,t=2.14,p=0.052),目标词上多次注视的首次注视位置在目标预视条件下比假字预视条件下更显著地靠近词的中心。两因素交互作用不显著(b=0.11,SE=0.17,t=0.66,p>0.05)。

对目标词首字字频与预视类型的交互作用进行了贝叶斯因子分析,分析结果表明所有指标上的BF值均小于1(目标字注视时间指标分析上,BFs<0.14;目标词各眼动指标分析上,BFs<0.12),支持两因素之间不存在交互作用。

4 讨论

为探讨汉语读者在副中央凹是以字还是以词为单位进行预视加工,本研究操纵副中央凹双字词首字的字频与预视类型,在目标字与目标词的分析上均发现了显著的预视效应;在目标词的凝视时间和总注视时间上发现了显著的字频效应;在目标词的注视位置上也发现了预视类型的主效应;而各眼动指标上均没有发现两因素的交互作用。

本研究旨在探讨汉语读者在副中央凹加工是以字还是以词为单位进行预视加工,而研究结果表明单纯以字为单位或以词为单位均不能完全解释本实验的结果。如果读者在副中央凹以字为单位进行预视加工,那么应该发现副中央凹首字字频与预视类型的交互作用,但是本研究结果不支持两因素之间存在显著的交互作用;如果读者在副中央凹以词为单位进行预视加工,根据Li等(2009)以及Li和Pollatsek (2020)的理论,词汇识别与词切分是同一个加工过程,在缺少低水平的视觉词切分线索的条件下,意味着读者在副中央凹已经完成了词切分,完成了词汇识别的过程,但随后目标词被注视时,本研究发现字频显著地影响整词的注视时间,又表明读者并没有完成词汇识别过程。因此,单纯认为汉语读者在副中央凹是以字或词为预视加工单位似乎都存在不恰当之处。

本研究认为在副中央凹的预视加工单位可能是一个由字到词转变的过程,或者说是以字词结合的方式进行预视加工的。由于注意资源在字水平上平行分布(Li et al., 2009),且汉语读者对构成副中央凹词的字均进行了有效的预视加工(王永胜 等, 2016; Yan et al., 2010; Yang et al., 2009);同时汉语文本具有较大的信息密度,读者获取的信息更多,比如副中央凹首字的语义信息(Tsai et al., 2012; Zhu et al., 2021),因此根据Li等的理论,读者获取了足够的预视信息后已经激活了词水平的加工,但并没有完成词汇识别的过程,在注视点转移到副中央凹词上时是以词为单位进行加工的。因此,并没有表现出字频对目标字和目标词预视效应的影响。今后的研究可以操纵副中央凹词水平的加工负荷,比如词频、预测性来探讨词水平信息在预视加工中的作用。

在汉语的副中央凹加工中,由字到词为单位的加工过程可能存在两种方式:Li等(2009)的理论认为在汉语阅读中词汇的识别与切分是同一个过程,只有当词汇识别后词才能被切分出来。根据这一假设,读者在副中央凹加工时已经开始词汇识别的过程,同时也进行了词切分的加工,但是这一加工过程尚未完成,读者的注视点转移到副中央凹的目标词上时,继续进行尚未完成的词汇识别与词切分的加工,因此表现出首字字频的作用。当然也存在另外一种可能,即在缺少词边界信息的情况下,汉语读者的词切分与词汇识别是两个加工过程而不是同一个加工过程,并且开始词切分加工的过程早于词汇识别的过程。读者根据副中央凹加工情况,首先进行词切分的加工,之后开始词汇识别过程。读者可能根据词切分加工的情况,以词为单位进行眼跳计划,在目标词的注视位置分析上没有发现字频的作用,这一结果为上述可能性提供了一定的支持,在读者的眼睛转移到副中央凹的目标词上之后,读者继续进行尚未完成的词汇识别过程,因此才表现出首字字频在对整词注视时间的影响。在今后的研究中需要进一步探讨词切分与词识别的关系。

以往研究发现读者能够获取副中央凹字频的信息,但不能获取词频的信息(Li et al., 2014; Ma et al., 2015),与本研究中字频不影响副中央凹加工的结果不同。形成这种差异的原因可能是由于本研究字体较大(约为1.1°视角),上述两项研究中字体较小(分别为0.8°和0.7°视角),而离心率是影响字词加工效率的一个重要因素(Li & Pollatsek,2020),即字体大小差异是本研究与上述两项研究结果存在差异的可能原因。

此外,本研究只操纵了副中央凹词首字的字频来探讨预视加工情况,在今后的研究中还可以继续探讨字、词加工负荷的相关变量(比如字、词的熟悉度、获得年龄等)在汉语副中央凹加工中的作用,以对本问题进行更深入的研究。

总之,读者的注视点在从中央凹注视词转移到副中央凹词上后是以词为单位进行信息加工的,但是在转移到副中央凹词之前词汇的识别并未完成。而且词汇识别的过程与词切分加工的过程之间的关系问题仍需要进一步的探讨。

5 结论

副中央凹低频双字词首字字频并不影响预视效应的大小;汉语读者在副中央凹已开始了双字词词水平的加工。

猜你喜欢
词频效应中央
2022年中央一号文件解读
死海效应
应变效应及其应用
落实中央八项规定精神(1)
防止“带病提拔”,中央放大招
词频,一部隐秘的历史
偶像效应
汉语音节累积词频对同音字听觉词汇表征的激活作用*