吴建设 常嘉宝,2 邱寅晨 Joseph Dien
汉语复合词视觉识别的时间进程:基于同形语素的行为与ERP证据
吴建设常嘉宝邱寅晨Joseph Dien
(北京第二外国语学院英语学院北京 100024) (唐山市开滦第二中学, 河北 唐山 063100) (北京第二外国语学院欧洲学院, 北京 100024) (马里兰大学帕克分校, 美国马里兰州 20742)
基于同形语素抑制效应, 本研究探讨了汉语复合词视觉识别中的形音义激活进程。结果发现:(1) 同形异音、同形同音、相同条件相对于控制条件都产生了语素启动效应; (2) 在P2、晚期N400成分上, 同形同音条件与控制条件更为接近, 但与同形异音及相同条件差别显著; (3) 在早期N400成分上, 同形同音条件与相同条件更为接近, 但与同形异音条件差别显著。研究表明, 汉语复合词的视觉识别的早期阶段可能为基于词位的形态−正字法加工, 字形匹配与音位信息是首要影响因素, 但语义是否介入仍未可知; 而晚期阶段则可能为基于词条的形态−语义加工, 主要涉及语义竞争与选择。本研究结果支持了McClelland等学者提出的“平行分布加工模型”。
复合词; 同形语素; 早期N400; 晚期N400
自Taft和Forster (1975)首先发现语素启动效应以来, 虽然相关研究林林总总, 但就以下问题目前仍存在争论:语素加工过程为双通道(如:Grainger & Ziegler, 2011)还是单通道(如:Crepaldi, Rastle, Coltheart, & Nickels, 2010)、语义加工介入时间为早期(如:Feldman, O’Connor, & Martín, 2009)还是在后词汇阶段(如:Rastle, Davis, & New, 2004)、形态分析为自动发生(如:Taft, 2004)或依赖于语境(如:Burani & Caramazza, 1987)、正字法与语义如何互动而产生语素启动效应(如:Allen & Badecker, 1999; Baayen, Milin, Durdevic, Hendrix, & Marelli, 2011; Gonnerman, Seidenberg, & Andersen, 2007)。上述问题的解决多数取决于如何将正字法加工与语义加工有效地进行分离。多数先前研究试图基于复杂单词的词缀来实现此目的, 但由于词缀分离仍存在诸多混杂因素, 近期研究开始借助不同文字系统中的特殊字词【如意大利语、西班牙语、芬兰语中的“同形词干” (Stem Homograph, 指单词词干形同而义不同的现象, 如西班牙语中“cerr-ar”/“关闭”与“cerr-o”/“小山”)、复合词中的同形语素(指字或单词形同而义不同的现象, 如汉语中的“光线/光头”或英语中“banknote / riverbank”)】来实现两者的分离。但遗憾的是, 先前研究或通过同形词干/语素实现了正字法与语义分离, 或通过多音字与同形语素实现了音位与语义分离, 但目前尚未有研究在一项实验设计中将正字法、音位与语义同时分离。因而本研究在介绍现有两类研究的基础上, 借助汉语复合词中不同类型的同形语素以实现三者的同时分离, 藉此探索汉语复合词视觉识别的时间进程。
第一类研究试图借助同形词干/同形语素分离正字法与语义, 却意外发现了与语素启动效应截然相反的同形词干抑制效应。后续研究继而在分析其机制的基础上, 讨论了单词识别过程中正字法与语义加工以及其可能时间进程。
Laudanna, Badecker和Caramazza (1989, 1992)首先报道了同形词干抑制效应。他们在长时启动范式(SOA = 200 ms)下发现, 意大利语中同形词干条件【如:port-are (携带)/port-e (门)】较正字法相似条件更难判断。他们推断, 这可能是因为相同词干同时激活了它们所对应的不同词汇表征, 由此触发了歧义冲突机制(Laudanna et al., 1992:346)。Allen & Badecker (1999)在长时启动范式(SOA = 250 ms)基于西班牙语材料进而发现, 同形词干【如:cerr-ar (关闭)/cerr-o (小山)】抑制效应并非源于正字法相似【如:cerdo (猪肉)】效应, 语素变体条件【指语素义同而形不同的现象, 如:cier-ra (关闭)】同样产生了类似的抑制效应。他们由此判断, 语素识别为基于词条(lemma)的抽象表征加工(独立于字形与音位), 而非基于词位(lexeme)的具体表征加工(依附于字形与音位) (p. 121) 【在语言心理学的研究中, “词条”专指其语义句法特征, 而“词位”专指其语素的形态音位特征, 可参考Kempen和Hoenkamp (1987)、Kempen和Huijbers (1983)、Levelt (1989)】。
但后续研究却表明, 同形词干抑制效应在掩蔽及短时启动范式下会消失。Zhou, Marslen-Wilson, Taft和Shu (1999, 实验1)发现, 同形语素(如:华侨—华贵)在长时启动范式(SOA = 200 ms)下无启动效应, 却在掩蔽、短时启动范式(SOA = 57 ms / 57 ms)下产生启动效应; 而与相同语素条件(如:华丽—华贵)相比, 同形语素条件仍然产生了同形词干抑制效应。他们由此推断, 启动时间的不同可能引发了不同强度的语义竞争(在相同汉字的不同语义表征之间) (p.539)以及互动(在组成复合词的汉字与整词之间) (pp. 560−561)。由于他们的实验材料为汉语同形语素, 与先前研究在文字系统上有所不同, Badecker和Allen (2002)进而在掩蔽启动范式(SOA = 67 ms)下重复了Allen和Badecker (1999)的实验。研究亦发现了同形词干启动效应。他们因而推断, 在掩蔽启动范式下, 同形语素所激活了多个语义表征促进了目标词的识别加工过程(p.132), 由此同形词干效应可能涉及有意识参与的语义选择机制。在后续研究中(如:Carreiras, Perdomo, & Meseguer, 2005; Laudanna, Voghera, & Gazzellini, 2002; Tsang & Chen, 2010, 2013a, 2013b), 研究者也发现了类似的同形词干/语素启动效应。
基于同形词干/语素抑制效应, 还有一些学者进而采用反应时技术(如:Dominguez, Cuetos, & Segui, 2002; Jarvikivi, Pyykkonen, & Niemi, 2009; Tsang, Wong, Huang, & Chen, 2014)、ERP/MEG神经成像技术(Dominguez, de Vega, & Barber, 2004; Simon, Lewis, & Marantz, 2012; Wu, Tsang, Wong, & Chen, 2016; Zou, Packard, Xia, Liu, & Shu, 2019)来观察单词识别的可能时间进程。Dominguez等(2002)基于西班牙语材料发现, 在掩蔽启动范式(SOA = 32 ms / 64 ms)下, 同形词干条件与相同语素条件都产生了启动效应; 而在长时启动范式(SOA = 250 ms)下仅相同语素条件、语义相似条件产生启动效应, 同形词干条件却产生了抑制效应。他们由此推断, 上述不同的SOA启动时间可能分别对应了正字法/音位、形态与语义这三类加工过程, 而单词识别早期应该是与语义无关的正字法/音位加工。Jarvikivi等(2009)基于芬兰语材料发现, 在掩蔽范式(SOA = 60 ms)下同形语素条件、语素变体条件、相同语素条件相对于控制条件都产生启动效应, 在长时启动范式(SOA = 300 ms)下仅相同语素条件产生了启动效应。结合后续实验结果他们认为, 单词早期形态加工为自下而上(Bottom-up)加工, 是基于形态(Morph-based)的快速、自动化的分解加工, 而非基于整词的自上而下(Top-down)加工。而Tsang等(2014)则发现, 在掩蔽启动范式(SOA = 40 ms)下同形语素条件与相同语素条件都产生了相对于控制条件的启动效应, 且两者间没有显著差异; 但在无掩蔽启动(SOA = 100 ms)以及长时延迟(SOA = 2000 ms或按键反应)范式中, 仅仅相同语素条件产生了相对于控制条件以及同形语素条件的促进效应, 而后两种条件间却不存在显著差异。他们因而认为, 在掩蔽启动范式下仅仅发生了形态−正字法的加工, 100 ms或以上的启动时间才会使得形态−语义加工成为可能。在此基础上, Taft和Nguyen-Hoan (2010)、Xu和Taft (2014)基于英语同形词干的研究, 提出了基于词条的形态加工模型, 认为形态加工过程可分为基于字形的形态−正字法(Morpho-orthographic)与基于词条的形态−语义(Morpho-semantic)两个阶段。
在ERP/MEG研究方面, Barber, Dominguez和de Vega (2002)、Dominguez等(2004)采用Dominguez等(2002)类似设计, 在长时启动范式(SOA = 250 ms / 300 ms)下发现, 同形词干与相同语素条件在250 ms之前的波形基本重合, 但在此后同形词干条件变得更负并在450 ms左右出现波峰, 而相同语素条件则保持为慢负波。两种条件在250~350 ms时窗没有显著差异, 但在350~650 ms时窗同形词干条件比相同语素条件更负。他们因而认为, 单词识别过程可以分为两个阶段:在250~350 ms为词位加工阶段, 而在350 ms之后则为词条加工阶段。而Wu等(2016)则在掩蔽启动范式(SOA = 53 ms)下发现, 同形语素与相同语素条件都产生了相对于控制条件的P200 (150~250 ms)增强效应, 二者间的差异不显著, 但两种条件的波形在250~300 ms左右开始出现分离; 在N400 (250~500 ms)时窗仅仅相同语素条件产生显著的启动效应, 50 ms时窗分析显示此显著效应出现在400~500 ms (脑区中后部), 而同形语素、语义条件的启动效应不显著。他们由此根据Taft和Nguyen-Hoan (2010)的词条加工模型判断150~250 ms为形态−正字法加工阶段, 而250~500 ms则为形态−语义加工阶段。此外, Simon等(2012)采用MEG研究、Zou等(2019)在听觉识别范式下也都发现在300~450 ms左右可能存在正字法加工与语义加工的分离。
第二类研究试图分离音位与语义。基于多音字的研究总体表明, 音位可能参与了单词视觉识别加工。谭力海和彭聃龄(1991)在长时启动范式(SOA = 150 ms)下发现, 音同字(如:快)、音误字(如:汇)、字形相似字(如:公)三种条件相对于首字为多音字的启动词(如:会计)都产生了启动效应。Tan和Perfetti (1999, 实验2)通过操控多音字将材料分成首字一致条件(如:形成)、首字不一致条件(如:识, 首字读音分别为jian4/xian4)、尾字一致条件(如:明净)和尾字不一致条件(如:体, 尾字读音分别为zhong4/chong4), 研究发现, 读音不一致条件相比控制条件反应时更长(首、尾字读音不一致条件分别慢22 ms、28 ms), 但两种读音不一致条件之间没有显著差异。他们由此认为, 被试在汉语复合词识别过程中对首尾汉字的音位信息都高度敏感, 但对处于首字或尾字的位置信息并不敏感。因而首尾多音字的视觉识别加工都会激活其所对应的不同的语音。而Liu, Zhang和Liu (2017)采用视听双通道句子加工范式发现, 音位相同/语义相同条件(如:校长/zhang3)较音位相同/语义不同(如:家长/chang2)、音位不同/语义相同(如:船长/yuan2)、音位不同/语义不相同(如:班长/mu4)条件都出现P200 (280~380 ms)增强效应; 此外, 上述4种条件在N400 (400~550 ms)效应上依次增强, 音位不同/语义不相同条件与其他三种条件相比在N400波幅上显著更负; 而在晚期正波(LPS)的600~700 ms时窗上, 音位相同/语义不同条件相比音位相同/语义相同条件产生增强效应。但在750~800 ms时窗上, 各条件之间无显著差异。他们由此推断P200效应可能与音位加工有关, N400效应可能与视听信息整合过程中的语义不匹配有关(且音位信息可能调节了语义的提取), 而晚期正波的第一时窗则可能表明视听信息整合过程中的冲突检测过程。而Zhang等(2017)采用Liu等(2017)相同的设计, 基于功能连接分析(采用多体素模式分析, MVPA), 发现在P200、N400、LPS不同时窗下功能分析的分类模式产生了改变, 同时它们在脑区空间分布上也明显不同, 而P200、N400有可能与音位加工有关。
然而基于汉语同形语素的研究结论并不完全一致。Zhou等(1999, 实验4)发现, 在掩蔽启动范式(SOA = 57 ms)下同形异音语素(如:重复−重量)、同音控制条件(如:崇高−重量)、无关控制条件(如:绝望−重量)之间并无显著差异, 但在长时启动范式(SOA = 200 ms)下仅同形异音语素条件相对于两种控制条件产生抑制效应。他们由此认为, 汉语复合词中汉字的音位应该不会独立影响形态语义的加工, 但它与正字法互动后, 却极有可能会抑制或促进汉语复合词的加工。而Zou, Desroches, Liu, Xia和Shu (2012)基于听觉识别加工范式(SOA = 150 ms)发现, 同形异音语素(如:长城/长官)与相同语素(如:面包/面孔)条件的波形在450 ms左右开始分离, 但在N400上没有显著差异; 此外, 音位相同(如:灯光/登门)条件的N400波峰出现时间相比音位不同(如:海带/电台)条件约延迟50 ms左右(分别为529.43 ms、475.86 ms)。上述结果总体表明, 无论是在掩蔽范式还是长时启动范式下, 关于音位是否影响形态语义的加工仍未有定论。
综合来看, 同形词干/语素的相同字形可能会激活与之对应的不同语义或音位信息, 由此它不仅可以考察正字法或音位与语义的互动, 还可以探索单词识别的时间进程。而与之同时, 不同的单词识别或形态加工模型, 如:词汇分解−词条模型(Taft, 1994, 2004; Taft & Nguyen-Hoan, 2010; Xu & Taft, 2014)、超词汇模型(Giraudo & Grainger, 2001, 2003)、字形−语义模型(Crepaldi et al., 2010; Meunier & Longtin, 2007; Rastle & Davis, 2008; Rastle et al., 2004)、形态−正字法/形态−语义混合模型(Beyersmann, Coltheart, & Castles, 2012; Beyersmann, Iakimova, Ziegler, & Colé, 2014; Diependaele, Sandra, & Grainger, 2005, 2009)或平行分布加工模型(Gonnerman et al., 2007; McClelland & Rumelhart, 1981; Plaut & Booth, 2000; Seidenberg & McClelland, 1989), 亦可得以验证。
但明显较为遗憾的是, 虽然单词识别是一个形音义统一加工的过程, 现有研究在不同的设计中仅仅区分了正字法与语义、音位与语义, 尚未有研究将音位、正字法与语义三者统一在一项研究中进行考察。而根据汉语文字系统的独特特点, 这可以基于汉语复合词的同形语素来实现。同形语素在汉语复合词中普遍存在【据Liu, Shu和Li (2007)的统计, 汉语常用汉字为2423个, 其中大约65%的汉字含有2~5个意义】, 它可以被进而区分为同形同音语素(Homophonic Homographic Morpheme)与同形异音语素(Heterophonic Homographic Morpheme)【如:“作息”、“作坊”相对于“作诗”之中“作”分别为同形同音语素、同形异音语素】。基于上述文献综述, 本研究的主要研究问题为:
(1) 音位信息是否参与了汉语复合词的视觉识别加工?如果同形语素中的音位信息未被激活, 同形同音语素条件(如:作息)与同形异音语素条件(如:作坊)都会产生类似Dominguez等(2004)研究中的同形语素抑制效应; 而如果同形语素中的音位信息被激活, 那么仅仅同形同音语素条件仍然会产生同形语素抑制效应, 而同形异音语素条件则不会产生类似抑制效应。
(2) 音位信息何时参与了单词视觉识别加工?如果P200成分表征了音位加工, 则音位不一致条件(同形异音语素条件、控制条件)相对于音位一致条件(同形同音语素条件、相同语素条件)在P200成分上将会更负。反之则无法断定音位加工出现在200 ms左右。而判断音位加工是否参与的另一个较为可靠的指标则是:同形语素抑制效应在何时产生。
(3) 形态−正字法加工与形态−语义加工是否在N400这个时窗发生分离?鉴于同形同音、同形异音、相同语素条件在正字法上完全相同, 若正字法与语义加工在N400发生分离, 三者在早期N400成分上应无显著差异, 但在晚期N400成分上会有所不同; 而如果三者未发生分离, 则它们在N400成分上应无显著差异。鉴于5种单词识别模型对正字法与语义加工激活的时间有不同的预测, 借助上述研究结论亦可同时对其进行验证。
2.1.1 被试
被试为25名在校本科生, 女生19名, 男生6名, 平均年龄22.5岁, 标准差为1.07岁。被试均为右利手, 视力或矫正视力正常, 以前未参加过类似实验。为确保被试对不同语素条件具有良好区分度, 所有被试均为北方人, 能够讲标准普通话, 无任何语言或阅读障碍。在实验前均签署知情同意书, 且获得一定报酬。
2.1.2 实验设计与材料
实验采用单因素四水平被试内设计(见表1)。启动词首字分别为同形异音语素(+O−P−S, 如:作坊)、同形同音语素(+O+P−S, 如:作息)、相同语素(+O+P+S, 如:作诗)以及控制条件(−O−P−S, 如:账本), 目标词相同(如:作画)。每种条件选取48组, 共192组, 分别在笔画、词频上进行了匹配(s > 0.05)。另有填充材料192组假词。
表1 实验材料举例及特征信息
注:括号内数值为标准差, 词频数均经Log函数转换。
为确保实验材料的语义与音位区分度, 在实验完成后被试需就启动词与目标词的首字语义相似度(1~5莱克特量表)、音位相同度(“是/否”)进行评定。在语义相似度上, 相同语素条件与其他条件皆存在显著差异,s < 0.05; 在音位相同度上, 同音与异音条件之间皆存在显著差异,s < 0.05。
实验材料按拉丁方交叉分成4个区组。每个区组包含所有实验条件, 并进行伪随机平衡, 确保每种条件不连续出现3次或以上, 且每个区组中前3组皆为填充材料。
2.1.3 实验程序
采用E-prime (2.0)编程, 通过台式计算机黑底白字呈现材料。为避免单纯物理相似性干扰实验结果, 遵循心理学惯例, 启动词与目标词采用不同字体与字号:启动词字体为微软雅黑, 字号为40磅; 目标词字体为宋体, 字号42磅。
本研究采用掩蔽范式。依据如下:(1) Zhou等(1999)、Feldman, Kostić, Gvozdenović, O’Connor和Martín (2012)、Tsang等(2014)等学者都认为, 采用非掩蔽范式且SOA大于100 ms时, 单词视觉识别的早期过程易受策略加工的影响; (2) Forster (1998)也认为, “尽管有种种不足, 它仍然可以被作为完全自动化过程的一个指标” (p.229); (3)先前相关研究都采用了掩蔽范式以分离单词识别的早期与晚期阶段。
SOA最终确定为47 ms。为确保被试无法觉察启动词, 本研究参考先前研究设置, 严格地设置了前掩蔽与后掩蔽, 并在预实验中进行过反复测试与调整。
程序(见图1)如下:首先在屏幕中央呈现注视点“+”1000 ms, 然后呈现前掩蔽(###)500 ms, 接着呈现启动词47 ms, 然后呈现后掩蔽(###)20 ms, 继而空屏30 ms, 再呈现目标词2000 ms等待被试按键反应。如果被试在2 s内没有做出反应, 此界面自动消失, 且记为错误反应。为避免每次出现刺激的时间间隔为固定值, 被试产生策略性反应, 最后呈现时间窗口抖动(jitter) 0~2 s。
实验1采用词汇判断任务, 要求被试在看到目标词时, 既快又准确地做出判断。真词按“F”键, 假词按“J”键, 左右手按键在被试间平衡。实验前有练习阶段, 使被试充分熟悉实验程序。整个实验约需40分钟。
2.1.4 数据处理与分析
在数据统计分析前, 去掉数据中3个标准差之外的极端数值(少于2%)。使用SPSS 20.0进行重复测量方差分析, 在必要时采用Greenhouse-Geisser校正, 并在成对比较时进行Bonferroni校正。
行为实验的反应时与准确率见表2。
在反应时上, 启动类型的主效应显著,(3, 72) =23.82,< 0.001, 偏η² = 0.498。按照Cohen (1988)的建议, 在η= 0.01或以上为较小的效果量, 而η= 0.06或以上则为中等程度的效果量, 而η= 0.14或以上则为较大的效果量。由此可见, 启动类型主效应的效果量较大。进一步分析显示, 与控制条件相比, 三种语素条件的启动效应皆显著,(1, 24) = 66.78 / 18.68 / 51.62;s < 0.001; 而与同形同音语素(+O+P−S)条件相比, 相同语素(+O+P+S)条件的启动效应显著,(1, 24) = 8.92,= 0.006。而同形异音语素(+O−P−S)条件虽然快8 ms, 但并不显著(> 0.1)。三种语素启动效应中, 相同条件最大, 同形同音条件最小, 同形异音条件居中。在准确率上, 启动类型主效应并不显著, 同形同音语素与相同语素条件相比亦不显著。
图1 实验1流程图
表2 不同启动类型的反应时和准确率
注:括号内为标准误差。
实验1结果明确表明:仅仅同形同音语素条件相对于相同语素条件产生抑制效应。Zhou等(1999)在掩蔽启动范式下发现类似结果(其研究中的字形条件与本研究的同形同音语素条件等同), 相同语素条件(RT = 563 ms)相对于同形同音语素条件(RT = 583 ms)启动效应要快20 ms。而Tsang等(2014)在无掩蔽启动范式(SOA = 40 ms)中亦发现相同语素条件的启动效应强于同形语素条件(但未在掩蔽范式中发现类似结果)。实验1结果不仅验证了先前研究结果, 并进而发现同形异音语素条件并未出现与同形同音语素条件类似的抑制效应。这似乎表明:两种条件在首字读音上的不同造成了上述差异, 因而音位信息参与了单词的视觉识别。
实验1结果还表明:相对于控制条件, 三种语素条件都产生了启动效应。这似乎表明:单词识别的早期阶段是基于词位水平的加工, 语义信息并未参与其中。但两种同形语素条件的启动效应明显弱于相同语素条件, 且在同形同音语素条件上出现显著效应。如果单词识别的早期阶段如Taft等学者在词汇分解−词条模型中所假设那样, 仅仅为形态−正字法/音位加工, 则上述异常结果较难解释。
鉴于行为研究对单词识别的时间进程并不敏感, 且研究一中的部分结果与现有单词加工模型冲突, 实验2将采用事件相关电位技术来进一步探索。
3.1.1 被试
25名未参加实验1或类似实验的在校本科生或研究生参加本次实验, 女生19人, 男生6人, 平均年龄24.1岁, 标准差为1.12岁。其他同实验1。
3.1.2 实验设计与实验材料
实验设计与材料同实验1。但实验2基于实验1的结果剔除了错误率较高的两个目标词, 因而仅包含46组材料(正确率 > 88%)。
3.1.3 实验程序
实验时, 被试坐在隔音效果良好的被试间内, 离计算机显示屏的距离约为80 cm。根据脑电数据记录需要, 实验2将目标词呈现时间由2000 ms改为“呈现500 ms+空屏700 ms +呈现?” (见图2)。其他同实验1。
实验任务改为人名判断任务。Zhou等(1999)曾提醒词汇判断任务中的强制性按键反应可能会影响单词视觉识别, 并可能激活语义加工。而从实验1的结果观察, 三种语素条件的加工可能受到语义加工的影响。为避免强制性按键反应的影响, 本研究参考Federmeier等学者的系列研究(如:Laszlo& Federmeier, 2007), 将任务改为真假人名判断任务。要求被试仅对人名(如:陆毅)为目标词的刺激进行按键反应, 而忽略其他词。本研究因而使用46组人名替换了假词填充材料。整个实验约需1小时。
图2 实验2流程图
3.1.4 脑电记录及处理
使用Brain Product公司生产的64导脑电记录分析系统(10-20系统), FCz电极为参考, 前额接地, 阻抗降至5 kΩ。水平眼电置于左眼外眦外2 cm, 垂直眼电在右眼眶下2 cm。采样频率500 Hz, 带通滤波0.01~100 Hz。
采用BP Analyzer (2.1)软件离线分析处理数据。参考电极转为双侧耳乳突(TP9、TP10)均值, 带通滤波0.01~30 Hz, ICA辅助剔除眼电, 自动排除波幅±80 μV的脑电伪迹, 目标刺激前100 ms为基线, 呈现后取1000 ms。然后将EEG数据按条件叠加平均, 由此获得每个被试在每种条件下的平均波幅。
3.1.5 数据处理与分析
头皮电极被分为15个区:左侧额区(F3, F5, F7)、左侧额中央区(FC3, FC5, FT7)、左侧中央区(C3, C5, T7)、左侧中顶区(CP3, CP5, TP7)、左侧顶区(P3, P5, P7); 中线额区(F1, Fz, F2)、中线额中央区(FC1, FCz, FC2)、中线中央区(C1, Cz, C2)、中线中顶区(CP1, CPz, CP2)、中线顶区(P1, Pz, P2); 右侧额区(F4, F6, F8)、右侧额中央区(FC4, FC6, FT8)、右侧中央区(C4, C6, T8)、右侧中顶区(CP4, CP6, TP8)、右侧顶区(P4, P6, P8) (见图3)。对各电极分区平均后按时窗进行4(启动类型) × 3(半球:左/中/右) ×5(分区:额/额中央/中央/中顶/顶)的重复测量方差分析。其他同实验1。
图3 统计分析中的电极分区
根据视觉观察(见图4、图5、图6)可以发现, 在120~540 ms时间窗口同形同音(+O+P−S)条件在加工中期(280~400 ms)与控制条件相比有明显的启动效应, 而在早期(120~220 ms)、晚期(430~540 ms)却几乎与控制条件重合。因而本研究按上述三个时窗来分析P2、早期N400与晚期N400。统计结果摘要见表3。
图4 不同启动类型ERP波形比较
3.2.1 P2成分
在120~220 ms时窗, 启动类型的主效应显著,(3, 72) = 3.48,= 0.026, 偏η² = 0.127; 分区×启动类型的交互作用显著,(12, 288) = 2.62,= 0.048, 偏η² = 0.098; 半球×分区×启动类型三者的交互作用显著,(24, 576) = 2.51,= 0.022, 偏η² = 0.095。以上效果量都达到中等以上。
图5 在Cz电极不同启动类型的ERP波形比较
图6 不同启动条件下的差异波地形图比较
注:参考Dominguez等(2004)等学者研究, 采用了“控制条件−启动条件”。
表3 P200、早期N400、晚期N400成分统计结果摘要表
注:*表明均值差值显著,< 0.05。
进一步分析发现, 与控制条件相比, 同形异音、相同条件分别在中线额中央区(0.704 μV,= 0.038; 0.704 μV,= 0.049)引发P200增强效应, 同形异音条件还在中线中央区(1.078 μV,< 0.001)产生类似效应, 而同形同音条件未见显著(> 0.1); 与同形同音条件相比, 同形异音、相同条件分别在中线的额中央区(0.686 μV,= 0.065, 边际效应; 0.685 μV,= 0.014)、中央区(1.041 μV,< 0.001; 0.589 μV,= 0.022)产生P200增强效应。由此可见, 在P2成分上, 同形同音条件与控制条件更为接近, 而在中线的额中央区及中央区与另外两种语素条件明显不同。
3.2.2 早期N400成分
在280~400 ms时窗, 启动类型的主效应显著,(3, 72) = 3.77,= 0.024, 偏η² = 0.136; 半球×启动类型的交互作用显著,(6, 144) = 5.0,= 0.001, 偏η² = 0.172; 分区×启动类型的交互作用显著,(12, 288) = 7.56,< 0.001, 偏η² = 0.239; 半球×分区×启动类型三者的交互作用存在边际显著效应,(24, 576) = 1.92,= 0.059, 偏η² = 0.074。以上效果量都为中等或较大。
进一步分析发现, 与控制条件相比, 同形异音、同形同音、相同条件分别在中线的前额区(0.923 μV,= 0.027; 0.973 μV,= 0.049; 1.156 μV,= 0.002)、额中央区(1.066 μV,= 0.025; 0.952 μV,= 0.05; 1.338 μV,= 0.003)、中央区(1.474 μV,= 0.002; 0.893 μV,= 0.039; 1.129 μV,= 0.013)都产生了N400启动效应; 与同形同音条件相比, 仅仅同形异音条件在中线的中央区(0.581 μV,= 0.027)、右侧的额中央区(0.588 μV,= 0.049)、右侧的中央区(0.617 μV,= 0.02)产生更大的启动效应(图4、图5), 相同条件未见显著(> 0.7)。上述结果表明, 在早期N400成分上, 三种语素条件都与控制条件不同, 而同形同音条件在右侧额中央区附近显然与相同条件更为接近, 而与同形异音条件存在不同。
3.2.3 晚期N400成分
在430~540 ms时窗, 启动类型的主效应显著,(3, 72) = 3.31,= 0.039, 偏η² = 0.121; 半球×启动类型的交互作用显著,(6, 144) = 3.91,= 0.008, 偏η² = 0.14; 分区×启动类型的交互作用不再显著,(12, 288) = 1.23,= 0.3, 偏η² = 0.049; 半球×分区×启动类型三者的交互作用显著,(24, 576) = 2.65,= 0.009, 偏η² = 0.099。除分区×启动类型的交互作用外, 以上效果量同样为中等或较大。
进一步分析发现, 与控制条件相比, 同形异音与相同条件在中线的中顶区产生N400启动效应(1.015 μV,= 0.049; 1.313 μV,= 0.014), 而同形同音条件未见显著(> 0.1); 与同形同音条件相比, 同形异音与相同条件分别在中线中央区(0.948 μV,= 0.002; 1.125 μV,< 0.001)、中线中顶区(0.712 μV,= 0.047; 1.01 μV,< 0.001)、中线顶区(1.067 μV,= 0.02; 1.178 μV,< 0.001)产生N400启动效应。此外, 同形异音条件还在右侧中央区(0.692 μV,= 0.048)、相同条件在中线额中央区(1.073 μV,= 0.003)产生类似启动效应。上述结果表明, 在晚期N400成分上, 同形同音条件与控制条件更为接近, 而与其他两种语素条件在中线中顶区附近差异明显。
实验1与实验2的研究结果均表明, 三种语素条件相对于控制条件都存在显著的语素启动效应。本研究的结果显然支持了汉语复合词存在形态分解加工的结论, 这与先前国内外众多研究的结论较为一致(如:Amenta & Crepaldi, 2012; Crepaldi et al., 2010; Ford, Davis, & Marslen-Wilson, 2010; Marslen-Wilson, Tyler, Waksler, & Older, 1994; Zhou et al., 1999; 陈宝国, 彭聃龄, 2001; 陈宝国, 王立新, 彭聃龄, 2003; 张清芳, 杨玉芳, 2004)。以下本研究就研究问题进行逐一讨论。
本研究结果总体表明:在反应时上, 同形异音与同形同音条件虽然没有显著差异, 但两者在P2 (中线额中央区/中央区)、早期N400 (中线中央区、右侧额中央区/中央区)、晚期N400 (中线中央区/中顶区/顶区、右侧中央区)上都出现显著差异。总体看来, 同形异音条件的加工过程与同形同音条件明显不同, 而与相同条件更为接近。鉴于两类同形条件与相同条件的差异仅仅在于汉语复合词的首字读音是否与目标字相同, 上述研究结果因而表明, 即使在单词的视觉识别过程中, 音位信息也同样得以激活。此外, 在早期N400(右侧额中央区), 同形同音仅与同形异音条件存在差异, 而与相同条件的差异并不显著。鉴于众多研究曾发现音位加工会激活右侧额叶区, 本研究从而为音位信息参与汉语复合词的视觉识别提供了进一步的证据。
值得深思的是, 为何仅在同形同音条件下出现同形语素抑制效应。先前研究认为, 相同的词干/语素激活了其所对应的不同词汇语义表征, 因而需要被试从中进行选择。Barber等(2002)、Dominguez等(2004)、Wu等(2016)的ERP研究以及Simon等(2012)的MEG研究都发现同形同音与相同条件的波形自250~350 ms方出现分离, 而本研究亦在早期N400 (280~400 ms)上发现类似的分离。此外, 同形同音条件与其他两种语素条件在晚期N400上确实存在差别, 似乎可以印证上述推断。而基于同样的推断也可以解释Tan和Perfetti (1999)、Liu等(2017)、Zhang等(2017)等学者所发现的汉语多音字语音干扰效应:相同字形的多音字, 或用于干扰的语音项, 激活了其所对应的多个不同词汇语义表征, 从而触发了语义竞争。但在波形分离的具体时间上, 不同研究的结论远非一致。本研究的结果表明, 同形同音与相同条件早在P200上已出现显著差异, 这虽然与Liu等(2017)、Zou等(2019)的结果相似, 但却与其他研究结论冲突, 似乎亦无法简单地以不同语义表征的激活来解释。
而本研究还发现, 同形异音与相同条件在P2、早期与晚期N400上都未出现显著差异。这同样与Zou等(2012)的结果一致, 但却与Zhou等(1999, 实验4)基于反应时的研究结论(长时启动范式)相悖。
总体来看, 一个较为合理的推断是:在音位信息介入后, 同形异音与同形同音条件在掩蔽启动范式与长时启动范式下的加工机制可能有所不同。同形同音条件的抑制效应可能源自相同词干/语素所激活的词汇语义表征之间的竞争, 因而无论在掩蔽或长时启动范式下都可以被观察到; 而同形异音条件的抑制效应则可能源自长时启动范式下被试加工策略的介入, 因而难以在掩蔽范式下观察到。但鉴于同形同音条件在P200上的结果仍不一致, 且同形异音条件的研究目前仍然偏少, 上述推断仍需将来研究的严格检验。
音位信息介入的时间与P2、N400的指标意义密切相关。先前关于P2的认知机制众说纷纭, 分别认为它可能与正字法与音位加工(Beyersmann et al., 2014; Liu et al., 2017; Liu, Perfetti, Hart, 2003; Liu, Jin, Qing, & Wang, 2011; Meng, Jian, Shu, Tian, & Zhou, 2008; Morris, Frank, Grainger, & Holcomb, 2007)、拼写/正字法与音位的匹配或规则性(Lee et al., 2007; Sereno, Rayner & Posner, 1998)、目标词的频率、规则性、词汇性(Chen, Liu, Wang, Peng, & Perfetti, 2007; Kong et al., 2010; Sereno et al., 1998; Zhang, Zhang, & Kong, 2009)、汉字部首的同音条件(Zhou, Fong, Minett, Peng, & Wang, 2014)或位置(Su, Mak, Cheung, & Law, 2012)、词汇加工(Carreiras et al., 2005; Dambacher, Kliegl, Hofmann, & Jacobs, 2006; Martin, Kaine, & Kirby, 2006; Meyler & Breznitz, 2005)、二语学习者的语义加工任务(Landi & Perfetti, 2007)等有关。本研究则在120~220 ms时窗、头皮中线位置发现了一个位于前额、额中央和中央区的P2成分。由本研究的波形图与差异波可以看出, 在P2上, 同形同音与控制条件几乎不存在差别, 且统计上亦不显著; 而与同形异音与相同条件相比, 后两者出现P2增强效应。鉴于本实验三种语素条件在字形上完全与目标词一致, 若P2仅独立表征了单词识别中的正字法加工, 则在该时窗内三者不应出现此种明显背离。
若P2表征了音位加工, 则在本研究中应该期待同形同音(而非同形异音)条件与相同条件在P2上更为接近, 而这显然并不符合本研究结果。虽然Liu等(2017)曾发现同形异音条件较相同条件在P2上更负, 由此断定P2反映了音位加工。但鉴于其研究中设计了语音干扰条件, 而Niznikiewicz和Squires (1996)曾发现语音干扰的同音词会产生更负的N2, 因而更负的P2亦可能源自语音干扰本身。Grainger, Kiyonaga和Holcomb (2006)亦认为, 音位加工应该出现于目标词呈现250 ms之后。
有鉴于此, 一个合理的解释是:P2在本研究中可能并非与音位或字形加工有关, 而更可能仅仅表征了一种普遍、抽象的心理加工进程(参见Binder, Medler, Westbury, Liebenthal, & Buchanan, 2006)。就语言加工而言, 它极有可能是在前词汇阶段大脑心理词汇网络对所输入刺激的选择性注意、匹配、归类或识别的过程(参见Hackley, Woldorff, & Hillyard, 1990; Luck & Hillyard, 1994), 而视觉刺激中所含有的异常或冲突的信息即可能导致P2或N2成分更负(参见Ziegler, Benraiss, & Besson, 1999)。本研究中同形同音条件、Liu等(2017)研究中的同形异音条件、Niznikiewicz和Squires (1996)研究中的同音词在各自设计中都含有某种冲突信息(但并非仅限于音位信息的冲突), 由此导致三项研究中P2/N2波幅都转向更负。就本研究而言, 冲突信息或源于掩蔽启动范式(启动词可能激活了目标词首字中的语义冲突信息, 参考Kiefer & Brendel, 2006), 或基于同形同音语素所具有的某种固有却未知的、基于规则的语言冲突属性。但至于大脑心理词汇网络如何可以如此迅速地识别出此种冲突信息, 由于目前并无对应机制的详细研究或理论预测, 本研究亦无法给予明确的回答, 将来研究可以对此进而探索与验证。
音位信息的介入则极有可能在晚期N400之前。本研究表明, 虽然同形异音与同形同音条件的首字与目标词首字在语义上都不相同, 但同形异音条件却未在晚期N400上产生与同形同音条件类似的抑制效应, 这表明它在晚期N400之前业已完成多重歧义的消解。综合实验1的结果(它比同形同音条件的反应时快8 ms, 但并不显著), 并考虑到以上针对P2的分析, 本研究可以较为肯定地判断:音位信息参与了汉语复合词的单词识别, 且应在晚期N400之前。正是由于音位信息在晚期N400之前的介入, 同形异音条件相对于目标词所具有的基于字形而引发的歧义信息才得以消解。
鉴于以上关于P2、晚期N400的分析, 音位信息介入的时窗最有可能在早期N400。Bentin, Mouchetant-Rostaing, Giard, Echallier和Pernier (1999)与Grainger等(2006)的研究都认为, 音位加工应出现于目标词呈现250~350 ms, 这与本研究的早期N400时窗基本重叠。而本研究也发现, 与P2及晚期N400不同, 在早期N400, 同形同音条件仅仅与同形异音条件有显著差异(位于中线中央区、右侧额中央区、右侧中央区脑区), 而与相同条件的差异不显著。综合上述分析, 一个较为合理的结论是, 音位信息的介入极有可能在早期N400 (280~400 ms), 且可能相关脑区或位于右侧额中央区附近。
上述的分析表明, 单词视觉识别可能存在与P2、早期N400与晚期N400对应的不同加工阶段, 且在早期N400后出现明显分离。基于同形词干/语素效应, Barber等(2002)、Dominguez等(2004)、Wu等(2016)的研究虽然发现波形的分离始于350 ms左右, 但鉴于其实验都基于同形同音材料, 研究者无法确定究竟是语义抑或是音位信息导致了同形词干/语素效应。而本研究通过设置同形异音条件将两者有效分离, 由此较为可信地表明:正是由于音位信息在早期N400阶段的介入, 在晚期N400上, 同形异音条件中由字形引发的歧义才得以消解, 进而避免了同形语素抑制效应的产生。
鉴于P2的不确定性, 若不考虑P2, 一个较为合理的假设则是:汉语复合词的视觉识别加工可能存在一个双阶段的过程。早期N400可能反映了形态−正字法加工, 主要涉及词位水平的加工, 字形匹配与音位信息是首要影响因素, 由此本研究中的三种语素条件在加工上较为接近, 但却与控制条件都存在显著差异; 而晚期N400则可能表征了形态−语义加工, 主要涉及词条水平上的语义选择与竞争。由于同形同音条件首字的形音均与目标词的首字相同, 因而在词条水平上产生不同意义之间相互竞争, 最终合适的语义被选择出来, 而不适当的语义则得到有效抑制。因而仅仅同形同音条件在此阶段产生相对于其他两种语素条件的抑制效应。
本研究的结果似乎支持了Taft和Nguyen-Hoan (2010)、Xu和Taft (2014)的“词汇分解−词条”加工模型(基于“字形−语义模型”发展而来)。该模型认为, 形态加工可分为基于字形的形态−正字法的早期阶段与基于词条的形态−语义的晚期阶段。前者完全无语义因素参与, 而后者才发生语义加工(如:Meunier & Longtin, 2007; Rastle & Davis, 2003; Rastle et al., 2004)。但需要注意的是, 在上述推断中本研究有意忽略了P2的“异常”表现。而本研究推测P2可能涉及大脑对语义冲突信息的监测与反馈, 如此则表明单词识别的早期阶段并非仅局限于孤立的形态−正字法加工。因而Taft的“词汇分解−词条模型”需要予以谨慎对待。
与本研究结果同样不太相容的是“超词汇模型” (Giraudo & Grainger, 2001, 2003)。其基本假设是:单词识别先进行整词加工, 后进行语素分解。鉴于汉语复合词中尾字可以有效区分本研究设计中的同形同音与同形异音条件, 如果先进行整词识别, 考虑到目标词完全相同, 三种语素条件应该出现相似的结果。而这明显与本研究的结果相违背。
“形态−正字法/形态−语义混合模型”由“词汇分解−词条”加工模型发展而来, 它承认单词识别早期阶段既存在形态−正字法加工也存在形态−语义加工(Diependaele et al., 2005)。但该模型如上述其他模型类似, 都是基于行为研究而提出, 一般根据启动词的SOA来定义“单词识别早期阶段” (如:40 ms或53 ms)。而现有ERP研究总体表明, 即使是掩蔽启动范式, 仍可能产生与语义加工紧密相关的N400效应(如本研究的晚期N400)甚或晚期正波。因而其模型的预测力则基于研究者对“单词识别早期阶段”如何定义。若将其定义为启动时间, 本研究在掩蔽范式下确实发现形态−语义加工参与了单词视觉识别, 因而本研究的结果支持了该模型; 但若将其定义为ERP研究中的实际单词加工时间进程, 则需要证实P2涉及语义信息的处理, 否则本研究结果并不支持此模型。
总体看来, 与本研究结果更为切合的模型则是“平行分布加工模型” (PDP) (McClelland & Rumelhart, 1981)。该模型认为连接强度的强弱会影响加工进程。无论同形同音条件中P2所表征的冲突信息来自掩蔽启动范式, 抑或来自材料自身, 其与大脑词汇/语义/社会网络的连接强度都将不同于其他条件。而它在晚期N400上的差异亦可基于同样道理得以解释。显然, 该模型并不关注加工对象, 而仅关注其加工对象之间的差异, 这可能是该模型更加适切的原因。
(1) 同形异音、同形同音、相同条件相对于控制条件都产生了语素启动效应;
(2) 在P2(中线额中央区)、晚期N400成分(中线中顶区)上, 同形同音条件与控制条件更为接近, 却与同形异音与相同条件差别显著;
(3) 在早期N400成分(右侧额中央区)上, 同形同音条件与相同条件更为接近, 却与同形异音条件差别显著。
本研究结果倾向支持McClelland等学者提出的“平行分布加工模型”。
Allen, M., & Badecker, W. (1999). Stem homograph Inhibition and stem allomorphy: Representing and processing inflected forms in a multilevel lexical system.(1), 105–123.
Amenta, S., & Crepaldi, D. (2012). Morphological processing as we know it: An analytical review of morphological effects in visual word identification., 232–241.
Baayen, R. H., Milin, P., Durdevic, D. F., Hendrix, P., & Marelli, M. (2011). An amorphous model for morphological processing in visual comprehension based on naive discriminative learning.(3), 438–481.
Badecker, W., & Allen, M. (2002). Morphological parsing and the perception of lexical identity: A masked priming study of stem homographs.(1), 125–144.
Barber, H., Dominguez, A., & de Vega, M. (2002). Human brain potentials indicate morphological decomposition in visual word recognition.(3), 149–152.
Bentin, S., Mouchetant-Rostaing, Y., Giard, M. H., Echallier, J. F., & Pernier, J. (1999). ERP manifestations of processing printed words at different psycholinguistic levels: Time course and scalp distribution.(3), 235–260.
Beyersmann, E., Coltheart, M., & Castles, A. (2012). Parallel processing of whole words and morphemes in visual word recognition.(9), 1798–1819.
Beyersmann, E., Iakimova, G., Ziegler, J.C., & Colé, P. (2014). Semantic processing during morphological priming: An ERP study., 45–55.
Binder, J. R., Medler, D. A., Westbury, C. F., Liebenthal, E., & Buchanan, L. (2006). Tuning of the human left fusiform gyrus to sublexical orthographic structure.(2), 739–748.
Burani, C., & Caramazza, A. (1987). Representation and processing of derived words.,(3-4), 217–227.
Carreiras, M., Perdomo, A., & Meseguer, E. (2005). Are stem homographs and orthographic neighbours processed differently during silent reading?(1-2), 317–339.
Chen, B., Liu, L., Wang, L., Peng, D., & Perfetti, C. A. (2007). The timing of graphic, phonological and semantic activation of high and low frequency Chinese characters: An ERP study.(B07), 62–70.
Chen, B. G., & Peng, D. L. (2001). The time course of graphic, phonological and semantic information processing in Chinese character recognition (I).(1), 1–6.
[陈宝国, 彭聃龄. (2001). 汉字识别中形音义激活时间进程的研究(I).(1), 1–6.]
Chen, B. G., Wang, L. X., & Peng, D. L. (2003). The time course of graphic, phonological and semantic information processing in Chinese character recognition (II).(5), 576–581.
[陈宝国, 王立新, 彭聃龄. (2003). 汉字识别中形音义激活时间进程的研究(II).(5), 576–581.]
Crepaldi, D., Rastle, K., Coltheart, M., & Nickels, L. (2010). “Fell” primes“fall”, but does “bell” prime “ball”? Masked priming with irregularly inflected primes.(1), 83–99.
Dambacher, M., Kliegl, R., Hofmann, M., & Jacobs, A. M. (2006). Frequency and predictability effects on event-related potentials during reading.(1), 89–103.
Diependaele, K., Sandra, D., & Grainger, J. (2005). Masked cross-modal morphological priming: Unravelling morpho- orthographic and morpho-semantic influences in early word recognition.(1–2), 75–114.
Diependaele, K., Sandra, D., & Grainger, J. (2009). Semantic transparency and masked morphological priming: The case of prefixed words.(6), 895–908.
Dominguez, A., Cuetos, F., & Segui, J. (2002). The time course of inflexional morphological priming.(2), 235–259.
Dominguez, A., de Vega. M., & Barber, H. (2004). Event- related brain potentials elicited by morphological, homographic, orthographic, and semantic priming.e(4), 598–608.
Feldman, L. B., Kostić, A., Gvozdenović, V., O’Connor, P. A., & Martín, F. M. P. (2012). Semantic similarity influences early morphological priming in Serbian: A challenge to form-then-meaning accounts of word recognition.(4), 668–676.
Feldman, L. B., O’Connor, P. A., & Martín, F. M. P. (2009). Early morphological processing is morphosemantic and not simply morpho-orthographic: A violation of from-then- meaning accounts of word recognition.(4), 684–691.
Ford, M. A., Davis, M. H., & Marslen-Wilson, W. D. (2010). Derivational morphology and base morpheme frequency.,(1), 117–130.
Forster, K. I. (1998). The pros and cons of masked priming.(2), 203–233.
Giraudo, H., & Grainger, J. (2001). Priming complex words: Evidence for supralexical representation of morphology.(1), 127–131.
Giraudo, H., & Grainger, J. (2003). A supralexical model for French derivational morphology. In D. Sandra & H. Assink (Eds.),(pp. 139–157). Amsterdam, The Netherlands: Kluwer.
Gonnerman, L. M., Seidenberg, M. S., & Andersen, E. S. (2007). Graded semantic and phonological similarity effects in priming: Evidence for a distributed connectionist approach to morphology.l(2), 323–345.
Grainger, J., & Ziegler, J. C. (2011). A dual-route approach to orthographic processing., 54–67.
Grainger, J., Kiyonaga, K., & Holcomb, P. J. (2006). The time course of orthographic and phonological code activation.(12), 1021–1026.
Hackley, S. A., Woldorff, M., & Hillyard, S. A. (1990). Cross-modal selective attention effects on retinal, myogenic,brainstem, and cerebral evoked potentials.(2), 195–208.
Jarvikivi, J., Pyykkonen, P., & Niemi, J. (2009). Exploiting degrees of inflectional ambiguity: stem form and the time course of morphological processing.(1), 221–237.
Kempen, G., & Hoenkamp, E. (1987). An incremental procedural grammar for sentence formulation.(2), 201–258.
Kempen, G., & Huijbers, P. (1983). The lexicalization process in sentence production and naming: Indirect election of words.(2), 185–209.
Kiefer, M., & Brendel, D. (2006). Attentional modulation of unconscious “automatic” processes: Evidence from event-related potentials in a masked priming paradigm.(2), 184–198.
Kong, L., Zhang, J. X., Kang, C., Du, Y., Zhang, B., & Wang, S. (2010). P200 and phonological processing in Chinese word recognition.(1), 37–41.
Landi, N., & Perfetti, C. A. (2007). An electrophysiological investigation of semantic and phonological processing in skilled and less skilled comprehenders.(1), 30–45.
Laszlo, S., & Federmeier, K. D. (2007). Better the dvl you know: Acronyms reveal the contribution of familiarity to single-word reading.(2), 122–126.
Laudanna, A., Badecker, W., & Caramazza, A. (1989). Priming homographic stems.(5), 531–546.
Laudanna, A., Badecker, W., & Caramazza, A. (1992). Processing inflectional and derivational morphology.(3), 333–348.
Laudanna, A., Voghera, M., & Gazzellini, S. (2002). Lexical representations of written nouns and verbs in Italian.(1-3), 250–263.
Lee, C. Y., Tsai, J. L., Chan, W. H., Hsu, C. H., Hung, D., & Tzeng, O. (2007). Temporal dynamics of the consistency effect in reading Chinese: An event-related potentials study.(2), 147–151.
Levelt, W. (1989).. Cambridge, MA: MIT Press.
Liu, B., Jin, Z., Qing, Z., & Wang, Z. (2011). The processing of phonological, orthographical, and lexical information of Chinese characters in sentence contexts: An ERP study., 81–91.
Liu, H., Zhang, G., & Liu, B. (2017). Semantic integration of audio-visual information of polyphonic characters in a sentence context: An event-related potential study.,(4), 1119–1128.
Liu, Y., Perfetti, C. A., & Hart, L. (2003). ERP evidence for the time course of graphic, phonological, and semantic information in Chinese meaning and pronunciation decisions.(6), 1231–1247.
Liu, Y., Shu, H., & Li, P. (2007). Word naming and psycholinguistic norms: Chinese.(2), 192–198.
Luck, S. J., & Hillyard, S. A. (1994). Electrophysiological correlates of feature analysis during visual search.(3), 291–308.
Marslen-Wilson, W., Tyler, L. K., Waksler, R., & Older, L. (1994). Morphology and meaning in the English mental lexicon.(1), 3–33.
Martin, F. H., Kaine, A., & Kirby, M. (2006). Event-related brain potentials elicited during word recognition by adult good and poor phonological decoders.(1), 1–13.
McClelland, J. L., & Rumelhart, D. E. (1981). An interactive activation model of context effects in letter perception, Part I: An account of basic findings.(5), 375–407.
Meng, X., Jian, J., Shu, H., Tian, X., & Zhou, X. (2008). ERP correlates of the development of orthographical and phonological processing during Chinese sentence reading., 91–102.
Meunier, F., & Longtin, C. M. (2007). Morphological decomposition and semantic integration in word processing.e(4), 457–471.
Meyler, A., & Breznitz, Z. (2005). Impaired phonological and orthographic word representations among adult dyslexic readers: Evidence from event-related potentials.(2), 215–240.
Morris, J., Frank, T., Grainger, J., & Holcomb, P. J. (2007). Semantic transparency and masked morphological priming: An ERP investigation.(4), 506–521.
Niznikiewicz, M., & Squires, N. K. (1996). Phonological processing and the role of strategy in silent reading: Behavioral and electrophysiological evidence.(2), 342–364.
Plaut, D. C., & Booth, J. R. (2000). Individual and developmental differences in semantic priming: Empirical and computational support for a single-mechanism account of lexical processing.(4), 786–823.
Rastle, K., & Davis, M. H. (2003). Reading morphologically complex words: Some thoughts from masked priming. In S. Kinoshita & S. J. Lupker (Eds.),(pp. 279–305). Hove, UK: Psychology Press.
Rastle, K., & Davis, M. H. (2008). Morphological decomposition based on the analysis of orthography.(7-8), 942–971.
Rastle, K., Davis, M. H., & New, B. (2004). The broth in my brother’s brothel: Morpho-orthographic segmentation in visual word recognition.(6), 1090–1098.
Seidenberg, M. S., & McClelland, J. L. (1989). A distributed, developmental model of word recognition and naming.(4), 523–568.
Sereno, S. C., Rayner, K., & Posner, M. I. (1998). Establishing a time-line of word recognition: Evidence from eye movements and event-related potentials.(10), 2195–2200.
Simon, D. A., Lewis, G., & Marantz, A. (2012). Disambiguating form and lexical frequency effects in MEG responses using homonyms.(2), 275–287.
Su, I.-F., Mak, S.-C. C., Cheung, L.-Y. M., & Law, S.-P. (2012). Taking a radical position: Evidence for position specific radical representations in Chinese character recognition using masked priming ERP.333–344.
Taft, M. (1994). Interactive-activation as a framework for understanding morphological processing.(3), 271–294.
Taft, M. (2004). Morphological decomposition and the reverse base frequency effect.(4), 745–765.
Taft, M., & Forster, K. I. (1975). Lexical storage and retrieval of prefixed words.(6), 638–647.
Taft, M., & Nguyen-Hoan, M. (2010). A sticky stick? The locus of morphological representation in the lexicon.(2), 277–296.
Tan, L. H., & Peng, D. L. (1991). Visual recognition processes of Chinese character: A research to the effect of grapheme and phoneme.(3), 272–278.
[谭力海, 彭聃龄. (1991). 汉字的视觉识别过程: 对形码和音码作用的考察.(3), 272–278.]
Tan, L. H., & Perfetti, C. A. (1999). Phonological activation in visual identification of Chinese two-character words.(2), 382–393.
Tsang, Y. K., & Chen, H. C. (2010). Morphemic ambiguity resolution in Chinese: Activation of the subordinate meaning with a prior dominant-biased context.(6), 875–881.
Tsang, Y. K., & Chen, H. C. (2013a). Morpho-semantic processing in word recognition: evidence from balanced and biased ambiguous morphemes.(6), 1990–2001.
Tsang, Y. K., & Chen, H. C. (2013b). Early morphological processing is sensitive to morphemic meanings: Evidence from processing ambiguous morphemes.(3), 223–239.
Tsang, Y. K., Wong, A. W. K., Huang, J., & Chen, H. C. (2014). Morpho-orthographic and morpho-semantic processing in word recognition and production: Evidence from ambiguous morphemes.(5), 543–560.
Wu, Y., Tsang, Y. K., Wong, A. W. K., & Chen, H. C. (2016). The processing of homographic morphemes in Chinese: An ERP study.(1), 102–116.
Xu, J., & Taft, M. (2014). Solely soles: Inter-lemma competition in inflected word recognition., 127–140.
Zhang, Q., Zhang, J. X., & Kong, L. (2009). An ERP study on the time course of phonological and semantic activation in Chinese word recognition.(3), 235–245.
Zhang, Q. F., & Yang, Y. F. (2004). The time course of semantic, orthographic and phonological activation in Chinese word production.(1), 1–8.
[张清芳, 杨玉芳. (2004). 汉语词汇产生中语义、字形和音韵激活的时间进程.(1), 1–8.]
Zhang, Z., Zhang, G., Zhang, Y., Liu, H., Xu, J., & Liu, B. (2017). Cross-modal integration of polyphonic characters in chinese audio-visual sentences: a mvpa study based on functional connectivity.(12), 3743–3755.
Zhou, L., Fong, C. M., Minett, J. W., Peng, G., & Wang, S. Y.. (2014). Pre-lexical phonological processing in reading Chinese characters: An ERP study., 14–26.
Zhou, X. L., Marslen-Wilson, W., Taft, M., & Shu, H. (1999). Morphology, orthography and phonology reading Chinese compound words.(5-6), 525–565.
Ziegler, J. C., Benraiss, A., & Besson, M. (1999). From print to meaning: An electrophysiological investigation of the roleof phonology in accessing word meaning.(6), 775–785.
Zou, L., Desroches, A. S., Liu, Y., Xia, Z., & Shu, H. (2012). Orthographic facilitation in Chinese spoken word recognition: An ERP study.(3), 164–173.
Zou, L., Packard, J. L., Xia, Z., Liu, Y, & Shu, H. (2019). Morphological and whole-word semantic processing are distinct: Event related potentials evidence from spoken word recognition in Chinese.133–146.
The temporal process of visual word recognition of Chinese compound: Behavioral and ERP evidences based on homographic morphemes
WU Jianshe; CHANG Jiabao; QIU Yinchen; Joseph DIEN
(English Dept., Beijing International Studies University, Beijing 100024, China) (Tangshan Kailuan No. 2 High School, Tangshan 063100) (French Dept., Beijing International Studies University, Beijing 100024, China) (Human Development and Quantitative Methodology Dept., University of Maryland, College Park, MD, U.S.A. 20742)
It is notoriously difficult to dissociate the processes of orthography, phonology, and semantics in visual word recognition. Using homographic morphemes in Chinese homographs, the present study attempts to further examine the time course of orthographic, phonological and semantic activation in a masked priming paradigm.
Two-character compounds of Chinese were divided into such four conditions: Heterophonic-homography (“+O-P-S”, e.g., “作坊” / zuo1 fang / workshop), Homophonic-homography (“+O+P-S”, e.g., “作息” / zuo4 xi1 / work-and-rest), Identity (“+O+P+S”, e.g., “作诗” zuo4 shi1 / poetry-composing) and the control (“-O-P-S”, e.g., “账本” / zhang4 ben3 / account-book). Each of them served as a prime with both forward and backward masks and an SOA of 47ms, and was followed by the same target compound (e.g., “作画 / zuo4 hua4 / painting”) with its initial character being the same as those of the first three conditions. Two experiments were conducted, adopting a lexical decision task for Experiment 1 (behavioral) and a semantic categorization task for Experiment 2 (ERP) respectively.
It was found that (1) the Heterophonic-homography, Homophonic-homography, and Identity conditions all induced morphological priming effects relative to the control condition; (2) in P200 (120~220 ms) and Late N400 (430~540 ms), the amplitude and waveform of Homophonic-homography was much more similar to that of the control condition, but was significantly different from those of the Heterophonic-homography and Identity conditions; (3) in Early-N400 (280~400 ms), the amplitude and waveform of Homophonic-homography was closer to that of the Identity condition, but was significantly different from that of Heterophonic-homography.
The result indicates that the early stage of visual word recognition might be related to morpho-orthographic processing based on lexeme, in which orthographic similarity and phonological information may play an important role; however, the late stage of visual word recognition might be concerned with morpho-semantic processing based on lemma, which may involve meaning selection and lemma competition. The above findings tend to support Parallel Distributed Processing Model as advocated by McClelland and his associates.
Chinese compound; homographic morpheme; Early-N400; Late-N400
2018-11-30
* 北京市长城学者培养计划(PXM2017_014221_000070)资助。
吴建设, E-mail: wujianshe@bisu.edu.cn; 常嘉宝, E-mail: changjiabao2016@163.com
B842
10.3724/SP.J.1041.2020.00113