陈伟英 谢 莉
(1.浙江大学 国际合作与交流处, 浙江 杭州 310058; 2.浙江大学 外国语言文化与国际交流学院, 浙江 杭州 310058)
指称是语言学研究中的一个核心概念,指称现象贯穿语言本体的许多方面,如词汇、语义、句法、语用、话语分析等领域[1]1。当语言成分所指的特定对象[注]物理世界或语境预设中所指的“对象”在认知者心理世界的语篇表征中被称为“实体”。存在于语境之中,对发话人来讲是一个特指事物,且他具有使用该语言成分指称该特定对象的意图,那么这种指称用法在语用上是有指的[1]9[2]1660。本文中“自指”为有指用法,即指向处于交际中心的发话人或作者本人。第一人称的语篇话题性强,在话语组织中具有重要作用[3],常以零形式(Ø)连续表征,构成话题链。现代汉语中第一人称单指形式还有代词(PRON)“我”,而表示人名、绰号、职务等名词性指称语使用频数不多,发话人也少用“本人”指称自己。
HSK语料库中,来自英语国家中高级汉语学习者的作文语料约有20万字[注]由于英语是英国、美国、澳大利亚、加拿大的首要或官方语言,且这些国家留学生数量较多,本文从HSK动态作文语料库中筛选以上留学生的作文为语料,参见http://202.112.195.192:8060/hsk/login.asp。,经初步统计,我们发现第一人称的出现频数和比例最高:“我”3112(61%)>第三人称“他/她/它”1789(35%)>第二人称“你”203(4%)。从主语位置使用情况看,“我”的偏误数最多,占三类代词偏误总数的80%,分为多余和缺省两类。虽然代词使用有一定的灵活性和随意性,甚至未造成严格意义上的语法错误,但为何汉语母语者会将其判定为偏误?例如:
(1)我1这次来参加中文水平考试,Ø2是得到几个朋友的鼓励和支持,我3才有勇气来。[注]例句中有个别错别字或语病的,本文不做修改。
(2)通过这五年,也通过更多的情况,Ø1学到更多的“自我了解”,因此Ø2也能更加地了解他人。
以上代词多余(例1我3)和代词缺省(例2Ø1)在语言习得过程中呈现系统性和规律性,与汉语母语者的语用习惯存在一定程度的差距。肖奚强发现将零形式误用为代词(代词多余)造成语篇结构松散,连贯性欠佳,多出现在初、中级阶段;而将代词误用为零形式(代词缺省)造成表义不畅,多出现在高级阶段[4-5]。虽说第一人称叙述语篇中,欧美学生的代词使用过度和零形式使用不足问题随其汉语水平的提高有所改善,但仍贯穿整个学习过程[6]。就偏误成因而言,学者们探讨了语篇话题、话语层次、指称距离、人(物)干扰、语义连贯性、语用经济性以及学习者母语迁移的影响[4-7],涉及语篇、认知、语义、语用、语际等多方面因素,但未深入研究学习者在选择指称语这一认知过程中的偏误成因。
即便是语用自由度高的第一人称,用零形式还是代词来指称并非是任意的,汉语母语者将其判定为一种偏误,受制于认知、语用规律以及汉语自身的语言特性。本文针对英语国家汉语学习者作文语料,以汉语母语者的使用倾向为参照,在测量实体可及度的基础上,兼顾发话人的指称意向、汉语的语法及语篇因素对指称语使用的影响,尝试更全面、深入地剖析学习者在书面叙述语篇中自指偏误的成因,以期对汉语教学及语篇研究有所启示。
语篇在发话人和受话人两个视角的互动中生成[8]30,发话人选择指称语需兼顾所指对象在语篇组织中的重要性及其对受话人的可及性。“指称重要性”关涉语篇实体作为重要话题在交际者心理表征中的激活状态,“指称可及性”是指发话人以特定语言形式引导受话人在记忆系统中搜寻当前所指[3,8],其可及度越高就越容易被提取和识别。
Ariel[9-10]在Givón[3]的基础上提出了可及度标示阶,从信息量、确定性、简略度来看,零形式是高可及度标示语(指称语),用于指称高可及度实体,代词次之,所指实体的可及度稍低。Ariel指出,实体可及度随语篇推进而呈现动态变化,需综合各项可及性参数来判定,即突显度、干扰度、指称距离和连贯度。突显度从发话人视角判定指称重要性,后三者以受话人视角判定指称可及性,两视角相互作用,从认知上制约指称语的选择。本文基于以往研究[3,8-10],完善与细化了各参数值的判定标准。
1.突显度:所指实体在认知者心理上的突显程度,体现为语篇话题的持续性,正向作用于综合可及度。判定依据:该实体(用作主语/话题)在下文被连续提及的次数;是否在前文被显性提及;是否在同层级的句法/语义结构中被提及。
2.干扰度:其他指称项对识别当前所指的干扰强度,反向制约综合可及度。判定依据:语义相近的干扰项数量;干扰项是否用作小句主语或语篇话题;是否与当前指称项在同一句法/语义层级。
3.指称距离:先行语与回指语在语篇中的间隔距离,反向制约综合可及度。判定依据是间隔小句数,以及句间停顿时长的差异:有无完句标点标示句子完结;有无逗号等标示句中停顿;无标点间隔的语段在语义上是否可划分为不同小句,如体现为不同的语义格框。
4.连贯度:先行语与回指语所在小句之间的认知或思维连贯性[注]“思维连贯性”是指一个连贯认知单位(Thought,简写Tt)范围内各小句间指称对象、时间、空间、事件、视角等认知因素具有一致性。Tt转变时,一般会出现人名、时间词等情节标记,句间连贯性会明显降低,结构上另起一段,内容上开启新主题。参见Chafe W.,″The Flow of Thought and the Flow of Language,″ in Givón T. (ed.), Syntax and Semantics, New York: Academic Press, 1979, pp.159-181。[11],正向作用于综合可及度。判定依据主要是情节标记[12]:两小句的指称语是否同指;其他认知因素如时空、视角、框架、事件等是否一致;句法/语义是否为同一层级。
可及性理论认为人们在选择指称形式时会遵循可及性原则,即倾向于用高可及度标示语指称高可及度实体,用低可及度标示语指称低可及度实体。但自然话语中,指称语并非一一对应于其所指实体的可及度,发话人有时会偏离可及性原则,使用可及度偏高或偏低的标示语,以传达特定的隐含义[9-10,13-14]。这种偏离情况很大程度上与发话人的指称意向有关。
指称意向是交际意图和言语意义的组成部分,是发话人对某特定实体的指向性[15],即通过使用指称语影响所指实体在受话人心理表征中的可识别性,指称意向越强,实体突显性或可识别性越高。指称意向与指称语使用存在以下关系:指称意向较强时,发话人倾向于用代词(或其他显性指称语)指称高可及度实体,导致正向偏离,以达到强调或突显所指的语用效果;指称意向较弱时,倾向于用零形式指称低可及度实体,削弱所指的可识别性,从而造成反向偏离,以产生主观移情、叙述生动等效果。指称意向从功能角度细化了可及度标示阶,为偏离可及性原则的指称语使用提供了语用解释。
汉语与英语的指称语使用在句法层面有一定的共性,如“我命令他吃饭”中的“他”用作兼语,“我跟他学”中的“他”用作副动词补语,都需要显现[16]。相比较,此类句法知识并非学习难点,汉语自身的语法及语篇因素对指称语使用的影响更值得关注。
一方面,汉语的主语没有完成“语法化”,整体上处于“用法包含语法”的状态,主谓结构就是话题—说明结构[17-18]。基于“零句说”[19]41-51,沈家煊指出,汉语中零句都能作为整句的主语/话题,而主语/话题是指称性的,所以零句(包括述谓性零句)都有指称性[17-18]。因此,那些主谓结构松散甚至没有名词性主语的句子是正常的,因为述谓语具有指称性,本身可用作主语/话题。所以,母语者通常不会因为句子表层缺少一个主语,而补出一个代词。
另一方面,汉语语篇中零形式使用率高与以下因素有关:(1)语篇组织上,零句是根本,小句并置成篇[17-18],无须主谓兼备,不必靠词汇、形态或句法关联手段表达语义联系。(2)使用条件上,语篇线索[注]Tao提及的“语篇线索”是个广义概念,包括前文语境、复现的词汇信息、零形式所指对象的特性、动词的语义特征以及交际者的社会、文化、认知经验。本文关注的线索词主要是与所指有语义相关性的动词。[20-21](主要指动词)具有指示作用,可通过复现提示或匹配论元来突显所指。如,“我的脚受伤了,Ø不能参加比赛了”句中“参加比赛”与“我”(而非“我的脚”)语义匹配,提升了Ø的可识别性。(3)输出结构上,话题链[22-24]结构和类型丰富,是汉语语篇构成的重要衔接手段。第一人称因施事性、话题性高,常用作主语/话题,构成T—Ø[注]“T”表示显性的代词或名词性指称语,文中指代词“我”。链接式结构(详见下文讨论)。
指称语使用受到认知、语用、语言多方面因素的影响(如图1)。认知上,实体可及度因突显度、干扰度、指称距离和连贯度的变化而产生波动,发话人一般依据可及度来选择指称语。受交际目的驱使,指称意向的变化会导致指称语使用正向或反向偏离于可及性原则。此外,指称语的输出在一定程度上受制于表层句法结构,而汉语中述谓语的指称性、话题链结构的多样性使得指称语选择更加灵活,小句的并置、语篇线索的出现促使发话人更具语境敏感性。因此,指称语的选择是认知结合交际、主观见之于客观、从心智活动到话语形式转换的过程。
图1 指称语的选择过程
据此,本文试探究语篇实体的认知可及度、发话人的语用指称意向以及汉语语法和语篇因素对指称语使用的影响,从而深入到指称语的选择过程来分析学习者自指偏误的成因。
首先,展开指称语选择实验,以母语者使用倾向为参照判断学习者偏误及类型。其次,以小句为单位,标注所指“我”在语篇中的可及度变化,考察哪一项可及性参数对指称语使用的影响较大。在此基础上,综合认知、语用、语言因素,根据指称语的选择过程分析偏误成因。
1.偏误判定
从HSK语料库已标注的偏误用例中,初步筛选出主语位自指偏误53例,并删去原有指称语(代词),以空格提示此处为自指用法。请10位本科生(非汉语专业)按照语用习惯来选择合适的指称语(代词或零形式),选择比例大于60%的判定为母语者使用倾向。若母语者倾向为零形式,而学习者使用了代词,判定为多余偏误;若母语者倾向为代词,而学习者使用了零形式,则判定为缺省偏误。
2.小句划分
汉语语篇的最小单位是“逗”,其右边界与逗号类标点基本对应[25]。陈平以标点划分小句(逗)的可操作性强[26],但同一“逗”内可能包含多个述谓语,其所述对象也可能不同。因此,本文不以标点为唯一标准,参考徐赳赳[27]、Tu[注]Tu X.H., A Discourse-oriented Approach to Automatic Chinese Zero Anaphora Resolution, Ph.D., Boston University Dissertation, 2009.的划分方法,将如下几类划为独立小句,以“/”标示:(1)独词句[注]“独词句”主要指带有完整句调、其后伴随较长停顿的感叹词或其他名词性、谓词性零句。;(2)无名词性主语的述谓性分句;(3)话题与述题兼备的整句;(4)兼语句以名2为界;(5)主谓宾语句以动1为界;(6)有标点间隔的述谓成分或连动句以标点为界;(7)动作施事不同,或可带“了”“着”“过”等体标记的无标点间隔的连动句,以动词为界。
3.可及度标注
Ariel阐释了四项可及性参数[9-10],但如何测量综合可及度没有具体说明。本文利用赋值测量的方法,对于首次引入语篇的新实体,综合可及度统一标为0。对于语篇内再次提及的实体,依据各参数的正、反向作用赋予正、负值,取各参数之和为该实体在当前语境中的综合可及度,赋值标准如表1[注]依据说明部分子条件来判断,符合某一条件的就相应赋值,符合可选项的进一步累计。所示(下文中“可及度”指“综合可及度”,简称ACC)。
表1 主语位实体可及度的标注说明
注:数值分布情况是确定可及度区间的主要依据。因语料规模及类型不同,各区间的取值范围可能有差别,即各区间无明显界限,之间存在模糊的过渡区。本文以具体数值确定边界,以便统计分析。
总体上看,母语者使用倾向明显,其中有83%的用例符合可及性原则,即可及度高时(>1.5)倾向于Ø,较低时(<1.5)倾向于PRON。相比较,学习者代词偏误也较明显,15.1%多余、22.6%缺省(见表2)。当母语者使用倾向不符合可及性原则时,学习者也存在两类偏误,比例相对较低。
以下根据可及度的标注结果,分符合可及性原则、不符合可及性原则、无明显倾向这三类情况统计指称语使用与实体可及度的关系。
表2 母语者使用倾向与学习者偏误类型
1.指称语使用符合可及性原则
经统计检验[注]数值呈非正态分布,故采用非参数秩和检验,下文讨论参数值差异时,以均值(±标准差)表示。,母语者使用倾向符合可及性原则时,各参数值在Ø倾向与PRON倾向之间均存在显著性差异:突显度z=2.278,p=0.023<0.05;干扰度z=3.111,p=0.002<0.05;指称距离z=2.408,p=0.016<0.05;连贯度z=5.756,p=0.000<0.01;综合可及度ACCz=5.490,p=0.000<0.01(参见图2)。
图2 母语者使用倾向与实体可及度的关系
相关性分析表明,除突显度[注]突显度与ACC的相关系数为0.021,p=0.892>0.05,无显著相关性。以外,其他参数均与综合可及度ACC有不同程度的相关性且差异显著:干扰度与ACC的相关系数为0.647,p=0.000<0.01;指称距离与ACC的相关系数为0.571,p=0.000<0.01;连贯度与ACC的相关系数为0.782,p=0.000<0.01。三者与ACC的相关性程度可表示为:连贯度>干扰度>指称距离,即连贯度对综合可及度的作用最大,对指称语的影响最显著。
如图2,母语者倾向为Ø和PRON时,实体可及度ACC(avg.)分别是2.46(>1.5)、0.45(<1.5),符合可及性原则。那么,学习者偏误处各项参数值[注]此参数值仅指偏误处的均值,如代词多余ACC(avg.)=代词多余ACC之和/代词多余偏误数。与母语者相比有何不同?
如表3所示,均值相差0.1(avg.)的计为一个区间,偏高和偏低一个区间记为“↑”和“↓”。母语者倾向为Ø时,ACC≈2.46,学习者代词多余处ACC≈2.50,可见该类偏误并非由实体可及度偏低所致。母语者倾向为PRON时,ACC≈0.45,学习者代词缺省处ACC≈0.33。该类偏误与实体可及度降低,尤其是句间连贯度降低有关,因为连贯度与ACC的相关性最高。
表3 符合可及性原则时各参数值比较
2.指称语使用不符合可及性原则
当实体可及度ACC>1.5时倾向于PRON,而ACC<1.5时倾向于Ø,说明指称语使用不符合可及性原则。此时,学习者仍存在代词多余和缺省偏误。
如表4所示,母语者倾向为Ø时,ACC≈0.59(<1.5),学习者代词多余处ACC同样偏低。母语者倾向为PRON时,ACC≈2.75(>1.5),学习者代词缺省处ACC同样偏高,但比母语者偏低两个区间。这是指称语使用违背认知可及性原则的特殊情况,受到发话人指称意向或汉语语法、语篇因素的影响,学习者若不熟悉该情况下如何选择指称语,很可能会造成偏误。
表4 不符合可及性原则时各参数值比较
3.指称语使用无明显倾向
当母语者使用倾向为50%左右,表示使用倾向不明显,不能判定学习者指称语使用是否为偏误。如表5所示,ACC≈0.94(<1.5),可及度居中。此时为何无明显倾向呢?应该是受制于认知、语用、语言因素的交互作用。
表5 无明显倾向时参数值
据统计分析,母语者的指称语使用多数情况符合可及性原则,此时学习者代词多余和缺省偏误较明显。显然,可及度对指称语的选择具有重要影响。认知功能上,指称语是发话人引导受话人从记忆单位中搜寻和提取所指的语言信号。当实体可及度高时,零形式所指容易提取;而可及度(较)低时,零形式所指不易提取,需使用信息量更大、确定性更高的指称语以降低认知难度。另外,母语者的指称语使用不符合可及性原则时,学习者偏误较少。该情况下,相比于认知可及度,语用上指称意向的变化及汉语自身的语法、篇章因素对指称语使用的影响较大,这是教学中应注意的。从指称语的选择过程看,学习者偏误可综合认知、语用及语言三方面因素来剖析。
代词多余主要出现在实体可及度高时,可及度较低时偏误数较少(参见表2)。高可及度实体往往是发话人的注意中心,在短期记忆中被持续激活。学习者使用了显性代词,并非当前语境中所指实体较难识别,而是在汉语语篇方面不熟悉话题链结构的输出,也没有注意到线索词的指示。
1.话题链结构的输出
话题链是汉语语篇中最基本、常用的结构之一,其主要特征是:由多个语句组成,同指一个话题,以零形式连接[22-24]。如例3,我2[注]偏误用下划线标示,我为代词多余,Ø为代词缺省;下角标指“我”被提及的线性顺序。与我1连贯度高,可及度高,应以零形式接续,构成我1—Ø2式话题链[注]若考虑下指的情况,母语者使用倾向也体现为Ø1—我2式话题链。;我3所在小句由转折连词“可”标示时间框架由“开始”到“现在”、认知状态由“不知道”到“知道”的转变,与前述内容构成对比关系,实体可及度降低,使用代词指称,与母语者倾向一致。但我4、我5都为高可及度,可用零形式,与前句构成我3—Ø4—Ø5式链首话题显现的典型话题链。该类型最为常见也最易习得,但学习者仍有困难。
(3)中国和美国的文化是完全不同的。我1开始学习汉语的时候,/我2(70%+)[注]括号内数字是按照母语者使用倾向判定为偏误的比例,数字后“+”“-”分别代表多余、缺省偏误。真的不知道/以后在我的生活中怎么用汉语,/可我3在中国的时间已经不算少,/我4(70%+)现在知道/我5(80%+)学汉语的目的是什么了。
2.动词语义的指示作用
实体可及度较低时,显现代词似乎无不妥之处。若语篇中出现相关线索词,所指可识别性得以增强,母语者则倾向使用零形式。如例4,我1所在小句的叙述框架转变,开启新的主题内容,与前文连贯度低,但认知动词“想不到”突显了感事主体“我”,所以不必显现代词。语料中出现的该类认知动词还有“没想到”“眼看着”“眼看”“记得”等,其后接续小句作宾语,整体构成主谓宾语句。主句主语的所指为感事主体,在动词语义框架中得以突显,通常可用零形式指称;而宾语句主语所指不定,与主句主语的同指倾向不明显,需要显现指称语,如该例中“我的老板”。与母语者相比,学习者对动词语义的敏感性较弱,对其指示作用认识不到位。
(4)我这份工作是在一家商店里当推销员,/因为什么都不懂,/常受顾客的投诉、同事们的排挤,/心中非常难过,/恨不得辞职不干。/我1(90%+)想不到/我的老板没有责怪我,/反而很体谅我,/他不断地教导支持我,/使我重新站起来。
代词缺省多见于实体可及度较低时,可及度高时偏误数较少(参见表2)。
1.可及度(连贯度)的判断
据前文统计结果,可及度低主要由句间连贯度降低所致。学习者缺乏语境敏感性,未能有效利用情节标记[12]做出准确判断。连贯性假设认为,人们在认知上默认当前话语与前文存在因果或时间连贯性[28]。尤其是当学习者对汉语语篇特征有所了解之后,会按照认知习惯将不同语段视作同一认知单位,造成零形式泛化。如例5中连词“总而言之”标示新的叙述情节开始,视角转变,与前文连贯度低,因此Ø1可及度低,应使用代词。例6情况类似,段首时间状语标示事件框架转变,Ø1可及度较低,需显现代词。可见,尽管指称对象相同,但表示时间、地点、视角、框架等认知因素转变的情节标记出现时,语篇连贯度降低,实体可及度也随之降低。学习者需重视情节标记,合理判断句间连贯度,避免代词缺省。
(5)如果孩子实现了父母的爱,/他可以一辈子觉得有自信,/会是个有爱心的人。/总而言之,Ø1(90%—)觉得/世界上最重要的教育就是父母作为老师的教育,/Ø2不能忽略他们的知识和关心。
(6)在二零零三和零四年的暑假,Ø1(70%—)到我国闻名的广告公司工读,/Ø2有了四个月的实习经验。
2.指称意向的辨别
指称意向是导致指称语使用偏离可及性原则的语用因素。发话人使用显性代词指称高可及度实体,有助于突显所指的某方面特性,起到强调或对比作用。如例7,Ø2所在小句与前文高度连贯,同为假设条件下的结果状态,与我1同指,可及度高。但情态副词“一定会”表示对将来事态做出承诺的言语行为。若指称意向较强,则需显现“我”,以强调言者的意愿、态度或立场。如此,在高可及度语境中构成我1—我2式显性话题链。学习者不可随意使用零形式,还需明确如何表达指称意向的变化,从而达到不同的语用效果。
(7)如果能为快乐家庭服务,/那么我1就心如所愿了,/Ø2(80%-)一定会努力工作。
使用倾向不明显的原因与汉语语法、语篇特征以及认知可及度的交互作用有关。
1.述谓语具有指称性
汉语中述谓语具有指称性,与名词性成分一样,可用作句子主语。当英语指称语受制于主谓结构的有无时,汉语指称语的显现或省略具有更大的灵活性。例8中,完句标点加大了回指距离,Ø2可及度有所降低,使用代词符合认知可及性原则,但仍有半数母语者选择了零形式,即未补出隐含的施事论元“我”,而是把“去青岛”直接用作后续句主语。因此,在可及度相对较低的语境中,述谓语的指称性增强了零形式并削弱了代词的使用倾向。
(8)我1一直把维多利亚当成自己的“家乡”。/Ø2(50%)去青岛是没办法的一次“度假”,/理所当然心情就不那么的好。
2.零句是根本
汉语句无须主谓兼备,不必靠句法关联手段便可并置成篇,语义联系可借助上下文来推导。如例8,虽无连词出现,但两句所述构成因果关系,且指称对象、时间、空间、视角等认知因素一致,连贯度高,无须用句号间隔。不必要的完句标点会削弱原有的认知连贯性,减少零形式且增加代词的使用量,造成使用倾向不明显。学习者需培养语境敏感性,根据语篇的认知连贯度而非主谓结构来断句。当连贯度高时,应避免使用“准句号”[注]“准句号”和“真句号”的区分参见王洪君、李榕《论汉语语篇的基本单位和流水句的成因》,载《语言学论丛》2014年第1期,第11-40页。,改用句中停顿号如逗号,构成我1—Ø2式话题链,以实现连贯、高效的交际。
指称语的使用受制于认知可及度、语用指称意向以及语言本身的语法、篇章因素。本文通过测量语篇实体的可及度变化,深入探讨指称语的选择过程,剖析了汉语学习者自指偏误的成因。代词多余主要出现在实体可及度高时,学习者输出话题链存在困难,而可及度较低时,对语篇线索(动词语义)的指示作用认识不到位。代词缺省则多出现于实体可及度较低时,学习者未能利用情节标记准确判断语篇连贯度,而可及度高时,未能识别指称意向增强所带来的语用效果。该发现对汉语教学及语篇研究有一定的启示意义:
其一,话题链结构丰富多样,是汉语语篇的重要衔接手段,需进一步“把话题链纳入汉语教学语法体系”[23]。尤其是中高级学习者,应系统性地练习话题链结构的输出。
其二,汉语是语用型的意合语言,学习者需置身于语篇,提升语境敏感性和语用推理能力,准确把握语篇线索的指示作用以及情节标记与语篇连贯度的认知相关性。
其三,汉语的指称语使用在一定程度上受到句法结构的制约,但与英语不同,汉语以零句为根本,述谓语具有指称性,所以指称语使用与句子界定不受制于主谓结构,而主要视认知与语用需求而定。