吴锋文
(四川外国语大学,重庆,400031)
汉语复句研究,历来是学界研究的热点问题。有关汉语复句句法分析,也受到计算语言学领域的关注,如鲁松(2001)[1]、洪鹿平(2008)[2]、杨进才(2015)[3]、胡金柱(2016)[4]等。姚亚平(1990)指出:“对现代汉语多重复句的所有模式进行详尽考察,归纳出几种模式,那无论是对一般人认识多重复句的特点和句型,掌握多重复句一般的分析方法,还是对计算机的语言处理,都有一定的帮助。”[5]
为全面揭示复句关系标记与复句层构间的互动关系,归纳复句关联模式的类型特点,吴锋文(2017)总结出汉语四句式复句标记序列模式有110种[6]。这些四句式复句标记序列模式中,包含3个关系词语的复句联结模式和复句实例又是分布最广、使用频率最高的。故本文以“三标四句式”复句为考察对象,采用邢福义复句理论体系[7]和复杂特征集思想[8],探讨“三标四句式”充盈态复句[9]的句法语义判定问题。
“三标四句式”复句是汉语有标复句的一个子类,是指由四个分句构成的、显现出三个复句关系词语的有标复句。例如:
(1)①如果你的想法正确,②你就不怕别人批评;③如果你的想法不正确,④批评正好可以帮助你纠正错误。
我们在大规模语料库的基础上,以“标记控制,语义聚类,同构分析”为策略[10],结合复句关系词语的配位、语义类别以及分句序位,从大量复句实例总结抽取出18种“三标四句式”充盈态标记序列模式,如表1。
表1 “三标四句式”充盈态复句的标记联结模式
表1中这类“三标四句式”标记序列是一种标记充盈态模式,其复句实例是充盈态有标复句。以标记序列模式M3、M9为例,请看下例:
(2)①身为魔术师,我们一定不会去揭秘和吐槽任何魔术,②因为那违背了职业信条,③但是如果一般观众能从中找到乐趣,④我们也无法阻止。(中新网2014-1-31)
(3)①就算老虎再大,②只要为非作歹,③触犯党纪,④就难逃铁笼。(人民网2014-7-29)
例(2)分句①④无标,分句②有因果标记“因为”,分句③出现标记连用“但是+如果”。例(3)分句①出现“就算”,分句②④出现标记搭配“只要……就”,分句③空标。其相应句法分析树如图1-2所示。
图1 例(3)分析结果
图2 例(4)分析结果
本文对上述“三标四句式”标记序列模式及大量实例进行了分析。考察发现,“三标四句式”充盈态复句的标记序列所能形成的复句层次结构有四种类型,如表2。
表2 “三标四句式”充盈态复句的层构类型
解决自然语言处理与理解问题,陆俭明(2006)指出,要重视加强对语言结构特征方面的研究与描写[11]。复杂特征集是细致刻画自然语言知识的一种有效方法。在表1基础上,我们借助复杂特征集思想对充盈态“三标四句”式复句模式的句序、关系标记属性[12](配位、搭配关系、语义类别)等信息进行描写,以期全面清晰地刻画和揭示复句标记、标记序列模式与复句句法语义间的互动关系,从而建立出一个有关四句式复句标记序列与复句实例间的“表-里”映射机制。18种充盈态标记序列模式的表里映射关系采用特征思想归纳如表3。
表3 “三标四句式”充盈态复句的复杂特征描写
续表
续表
充盈态标记序列和复句层次关系之间存在着“一对一”的表里映射关系,可以唯一确定充盈态复句的层次构造和语义关系[13]。利用这种映射关系,挖掘不同序位关联标记的特征,提取一系列句法语义规则,可判定“三标四句式”充盈态复句的句法语义关系。下面将“三标四句式”充盈态复句句法语义判定规则归纳如下。
规则1:若任一复句CS的Numb(CS)=4,分句C1、C3复现无标,分句C2出现标记连用形式Rib+Rjf,分句C4出现标记Rjb,且Rjf、Rjb形成搭配关系,则复句层次构造为(C1,((C2,C3),C4)),小句关联体(C2,C3)规约为并列关系[14],((C2,C3),C4)的关系均由Sem(Rjf、Rjb)确定,复句关系由Sem(Rib)确定,例如:
(4)①现在我已经知道我错了,【②所以我不但要补偿你,③还给你一只手,】④而且还要再给你一次机会。(古龙《七星龙王》)
例(4)无标分句③优先与分句②结合,(②,③)规约为并列关系,“不但-而且”标示((②,③),④)为递进关系,“所以”标示(①)与((②,③),④)为因果关系。
规则2:若任一复句CS的Numb(CS)=4,分句C2、C4无标,分句C1出现标记Rif,分句C3出现标记连用形式Rjb+Rkf,且标记Rif、Rjb、Rkf间没有搭配关系,则复句层次构造为((C1,C2),(C3,C4)),小句关联体(C1,C2)的关系由Sem(Rif)确定,(C3,C4)的关系均由Sem(Rkf)确定,复句关系由Sem(Rjb)确定,例如:
(5)①我的兄弟因为看不惯司马家的手段后,②都决定不再铸剑,③不过,如果小姐有需要的话,④我可以请他们来帮忙,重振唐门的铸剑威风。(TVB电视剧《血荐轩辕》)
例(5)分句①“因为”标示分句①②间是因果关系,分句③标记连用中“如果”标示分句③④是假设关系,分句③标记连用中“不过”标示(①,②)与(③,④)之间为转折关系。
规则3:若任一复句CS的Numb(CS)=4,分句C1、C4无标,分句C2出现标记Rif,分句C3出现标记连用形式Rjb+Rkf,且标记Rif、Rjb、Rkf间没有搭配关系,则复句层次构造为((C1,C2),(C3,C4)),小句关联体(C1,C2)的关系由Sem(Rif)确定,(C3,C4)的关系由Sem(Rkf)确定,复句关系由Sem(Rjb)确定,例如:
(6)①身为魔术师,我们一定不会去揭秘和吐槽任何魔术,②因为那违背了职业信条,③但是如果一般观众能从中找到乐趣,④我们也无法阻止。(中新网2014-1-31)
例(6)分句②出现标记“因为”,标示分句①②是递进关系,分句③中连用标记中“如果”,标示分句③④是假设关系,“但是”标示复句为因果关系。
规则4:若任一复句CS的Numb(CS)=4,分句C1、C4无标,分句C2出现标记Rib,分句C3出现标记连用形式Rjf+Rkf,且标记Rib、Rjf、Rkf间没有搭配关系,则复句层次构造为((C1,C2),(C3,C4)),小句关联体(C1,C2)的关系由Sem(Rib)确定,(C3,C4)的关系由Sem(Rkf)确定,复句关系由Sem(Rjf)确定,例如:
(7)①你故意在脸上嵌起九颗寒星,②并且始终不肯摘下那顶草帽,③只因为你的易容术虽精妙,④还是怕我认出你来。(古龙《九月鹰飞》)
例(7)分句②出现标记“并且”,标示分句①②是并列关系,分句③中连用标记中“虽”,标示分句③④是转折关系,“因为”标示复句为因果关系。
规则5:若任一复句CS的Numb(CS)=4,分句C2、C4无标,分句C1出现标记Rif,分句C3出现标记连用形式Rjb+Rif,且标记Rif、Rjb间没有搭配关系,则复句层次构造为((C1,C2),(C3,C4)),小句关联体(C1,C2)、(C3,C4)的关系由Sem(Rif)确定,复句关系由Sem(Rjb)确定,例如:
(8)①若不揭破这些人想出的鬼花样,②当真要被他吓得半死,③但若非如此天寒地冻之时,④他这花样也休想耍得出来。(古龙《武林外史》)
例(8)分句①出现标记“若”,标示(①,②)之间假设关系,分句③出现标记连用“但若非”,“若非”标示(③,④)假设关系,“但”标示复句为转折关系。
规则6:若任一复句CS的Numb(CS)=4,分句C2无标,分句C1、C3、C4分别出现标记Rif、Rif、Rib,且Pos(Rif)=f、Pos(Rib)=b、Sem(Rif)=Sem(Rib),则复句层次构造为((C1,C2),(C3,C4)),小句关联体(C1,C2)、(C3,C4)的关系由Sem(Rif、Rib)确定,复句关系规约为并列关系,例如:
(9)【①上官小仙若不想说的事,②没有人能问得出来,③她若想说,④就根本不必问。】(古龙《九月鹰飞》)
例(9)分句①中标记“若”标示(①,②)之间假设关系,分句③的标记“若”与分句④中“就”形成搭配,标示(③,④)间的假设关系,复句规约为并列关系。
规则7:若任一复句CS的Numb(CS)=4,分句C4无标,分句C1、C3、C4分别出现标记Rif、Rib、Rif,且Pos(Rif)=f、Pos(Rib)=b、Sem(Rif)=Sem(Rib),则复句层次构造为((C1,C2),(C3,C4)),小句关联体(C1,C2)、(C3,C4)的关系由Sem(Rif、Rib)确定,复句关系规约为并列关系,例如:
(10)【①虽然是不同的地方,②却是同样的明月,③虽然是不同的人,④有时也会是同样的心情。】(古龙《三少爷的剑》)
例(10)分句①②标记对“虽然-却”标示(①,②)为转折关系,分句③复现的标记“虽然”标示(③,④)为转折关系,然后(①,②)与(③,④)之间规约为并列关系。
规则8:若任一复句CS的Numb(CS)=4,分句C1无标,分句C2、C3、C4分别出现标记Rib、Rif、Rib,且Pos(Rif)=f、Pos(Rib)=b、Sem(Rif)=Sem(Rib),则复句层次构造为((C1,C2),(C3,C4)),小句关联体(C1,C2)、(C3,C4)的关系由Sem(Rif、Rib)确定,复句关系规约为并列关系,例如:
(11)【①这人走得很慢,②但却绝不停顿,③虽然听到了车铃马嘶声,④但却绝不回头!】(古龙《多情剑客无情剑》)
例(11)分句②中“但/却”标示(①,②)为转折关系,分句③④显现的标记搭配“虽然-但”标示(③,④)为转折关系,然后(①,②)与(③,④)之间规约为并列关系。
规则9:若任一复句CS的Numb(CS)=4,分句C2无标,分句C1、C3、C4分别出现标记Rib、Rib、Rib,且Pos(Rif)=f、Pos(Rib)=b、Sem(Rif)=Sem(Rib),则复句层次构造为((C1,C2),(C3,C4)),小句关联体(C1,C2)、(C3,C4)均规约为并列关系,复句关系由Sem(Rif、Rib)确定,例如:
(12)【①只有反复阅读,②反复感受和体验,】【③才能领略艺术的全部魅力,④才能品尝艺术的迷人的美。】(https://wenda.so.com/q/1364581000063126)
例(12)分句①无标,(①,②)规约为并列关系,分句③④复现标记“才”,(③,④)规约为并列关系,标记对“只有-才”标示(①,②)与(③,④)之间为条件关系。
规则10:若任一复句CS的Numb(CS)=4,分句C4无标,分句C1、C2、C3分别出现标记Rif、Rjf、Rkf,且Pos(Rif)=Pos(Rjf)=Pos(Rkf)=f、Sem(Rif)≠Sem(Rjf)≠Sem(Rkf),则复句层次构造为(C1,(C2,((C3,C4))),小句关联体(C3,C4)的关系由Sem(Rkf)确定,(C2,((C3,C4))的关系由Sem(Rjf)确定,复句关系由Sem(Rif)确定,例如:
(13)①我无论生在哪个年代,②就算是生在几百年以前,③只要是我心里想说的话,④我还是一样会说出来。(古龙《多情剑客无情剑》)
例(13)分句③的“只要”标示(③,④)为条件关系,“就算”标示(②,(③,④))之间为假设关系,分句①中“无论”标示①与(②,(③,④))间为总让关系。
规则11:若任一复句CS的Numb(CS)=4,分句C4无标,分句C1、C2、C3分别出现标记Rif、Rib、Rjf,且Pos(Rif)=f、Pos(Rib)=b、Pos(Rjf)=f、Sem(Rif)=Sem(Rib)≠Sem(Rjf),则复句层次构造为((C1,C2),(C3,C4)),小句关联体(C1,C2)的关系由Sem(Rif、Rib)确定,(C3,C4)的关系由Sem(Rjf)确定,复句关系规约为因果关系,例如:
(14)【①你只要在江湖中混三五年,②就没有别人好混的了,③以后我们若是还有机会见面,④希望还是朋友。】
例(14)分句①②出现搭配标记“只要-就”,标示小句关联体(①,②)为条件关系,分句③中“若”标示(③,④)为假设关系,(①,②)与(③,④)规约为因果关系。
规则12:若任一复句CS的Numb(CS)=4,分句C3无标,分句C1、C2、C4分别出现标记Rif、Rjf、Rjb,且Pos(Rif)=f、Pos(Rjf)=f、Pos(Rjb)=b、Sem(Rif)≠Sem(Rjf)、Sem(Rjf)=Sem(Rjb),则复句层次构造为(C1,((C2,C3),C4)),小句关联体(C2,C3)规约为并列关系,((C2,C3),C4)的关系由Sem(Rjf、Rjb)确定,复句关系由Sem(Rif)确定,例如:
(15)①即使他们个个都廉洁奉公和铁面无私,【②如果不加强教育,③不致力于提高广大党员特别是党员领导干部的整体素质,】④就会给法制和监督的实施带来难度。(《人民日报》1997-6-23)
例(15)分句③无标,(②,③)规约为并列关系,“如果-就”标示((②,③),④)为假设关系,“即使”标示(①)与((②,③),④)为虚让关系。
规则13:若任一复句CS的Numb(CS)=4,分句C1无标,分句C2、C3、C4分别出现标记Rif、Rjf、Rjb,且Pos(Rif)=f、Pos(Rjf)=f、Pos(Rjb)=b、Sem(Rif)≠Sem(Rjf)、Sem(Rjf)=Sem(Rjb),则复句层次构造为(C1,(C2,(C3,C4))),小句关联体(C3,C4)的关系由Sem(Rjf、Rjb)确定,(C2,(C3,C4))的关系由Sem(Rif)确定,复句关系规约为因果关系,例如:
(16)【①少昂是比我的生命还重要的存在,②只要有人敢对少昂不利,③就算是我的血亲朋友,④我也不会放过!】(左晴雯《还君明珠》)
例(16)搭配标记“就算-也”标示(③,④)为虚让关系,“只要”标示(②,(③,④))为条件关系,分句①无标,①与(②,(③,④))间规约为因果关系。
规则14:若任一复句CS的Numb(CS)=4,分句C1无标,分句C2、C3、C4分别出现标记Rib、Rjf、Rjb,且Pos(Rib)=b、Pos(Rjf)=f、Pos(Rjb)=b、Sem(Rib)≠Sem(Rjf)、Sem(Rjf)=Sem(Rjb),则复句层次构造为((C1,C2),(C3,C4)),小句关联体(C1,C2)的关系由Sem(Rib)确定,(C3,C4)的关系由Sem(Rjf、Rjb)确定,复句关系规约为因果关系,例如:
(17)【①雄狮堂堂主朱猛是个极不好惹的人,②而且言出必行,③如果他说他要不择手段去对付一个人,④那么无论是什么样的手段他都会用得出来。】(古龙《英雄无泪》)
例(17)分句②中“而且”标示小句关联体(①,②)为递进关系,分句③④的搭配标记“如果-那么”标示(③,④)为假设关系,(①,②)与(③,④)规约为因果关系。
规则15:若任一复句CS的Numb(CS)=4,分句C2无标,分句C1、C3、C4分别出现标记Rif、Rib、Rjb,且Pos(Rif)=f、Pos(Rib)=b、Pos(Rjb)=b、Sem(Rif)=Sem(Rib)、Sem(Rif)≠Sem(Rjb),则复句层次构造为((C1,C2),(C3,C4)),小句关联体(C1,C2)规约为并列关系,(C3,C4)的关系由Sem(Rjb)确定,复句关系由Sem(Rif、Rib)确定,例如:
(18)【①美国政府不仅停止了对新芬党的武器禁运,②取消了对新芬党在美国募捐的限制,】③而且签发了该党领导人亚当斯赴美签证,④并同他在白宫进行了会谈。(《人民日报》2000-5-25)
例(18)分句②无标,(①,②)规约为并列关系,分句④中“并”标示小句关联体(③,④)为并列关系,分句①③的“不仅-而且”标示(①,②)与(③,④)间为递进关系。
规则16:若任一复句CS的Numb(CS)=4,分句C2无标,分句C1、C3、C4分别出现标记Rif、Rib、Rjf,且Pos(Rif)=f、Pos(Rib)=b、Pos(Rjf)=f、Sem(Rif)=Sem(Rib)、Sem(Rif)≠Sem(Rjf),则复句层次构造为(((C1,C2),C3),C4),小句关联体(C1,C2)规约为并列关系,((C1,C2),C3)的关系由Sem(Rif、Rib)确定,复句关系由Sem(Rjf)确定,例如:
(19)【①你不但逼死了她,②逼死了郭庄,】③而且迟早会把我也逼死的,④因为你永远都要别人依照你安排的方式活下去。(古龙《英雄无泪》)
例(19)分句②无标,(①,②)规约为并列关系,分句①③的“不但-而且”标示((①,②),③)为递进关系,分句④中“因为”标示((①,②),③)与分句④为因果关系。
规则17:若任一复句CS的Numb(CS)=4,分句C4无标,分句C1、C2、C3分别出现标记Rif、Rjb、Rkf,且Pos(Rif)=f、Pos(Rjb)=b、Pos(Rkf)=f、Sem(Rif)≠Sem(Rjb)≠Sem(Rkf),则复句层次构造为((C1,C2),(C3,C4)),小句关联体(C1,C2)由Sem(Rjb)确定,(C3,C4)的关系由Sem(Rkf)确定,复句关系由Sem(Rif)确定,例如:
(20)①小弟的生命虽重,②神剑山庄的威信更重,③若是两者只能选择其一,④他只有牺牲小弟。(古龙《三少爷的剑》)
例(20)分句②中“更”标示(①,②)为递进关系,分句③中“若是”标示(③,④)为假设关系,分句①中“虽”标示(①,②)与(③,④)间为转折关系。
规则18:若任一复句CS的Numb(CS)=4,分句C2无标,分句C1、C3、C4分别出现标记Rif、Rjf、Rjf,且Pos(Rif)=f、Pos(Rjf)=f、Pos(Rkf)=f、Sem(Rif)≠Sem(Rjf)≠Sem(Rkf),则复句层次构造为((C1,C2),(C3,C4)),小句关联体(C1,C2)由Sem(Rif)确定,(C3,C4)规约为并列关系,复句关系由Sem(Rjf)确定,例如:
(21)①一个女人如果遇到元宝那样可爱的小伙子,②有时是什么事都做得出来的,【③不管她有多大年纪,④不管她是谁都一样。】(古龙《七星龙王》)
例(21)分句①中“如果”标示(①,②)为假设关系,分句③④中“不管”标记复现,(③,④)规约为并列关系,“不管”标示(①,②)与(③,④)间为转折关系。
本文在大规模语料统计分析基础上,以“标记控制,语义聚类,同构分析”为策略,确定了“三标四句式”复句的18种充盈态模式。针对18种标记序列模式,结合关系词语所处句序、关系标记属性信息,系统描写、刻画并揭示了复句标记、标记序列模式与复句句法语义间的互动关系,构建一个有关“三标四句式”复句标记序列与复句实例间的“表-里”映射关系表,并挖掘提取了有关“三标四句式”充盈态复句的句法语义判定规则。
笔者的研究预期是,通过全面总结分析一定分句数目的复句(分句数)与所显现的复句关系词(个数)之间的所有可能模式,去挖掘复句关系标记对分句组合及语义关联的制约,划分出两种不同类别的有标复句(充盈态有标复句、非充盈态有标复句),从而建立一个面向信息处理的复句句法语义知识库,为复句句法语义自动分析服务。
需要指出的是,每种复句标记序列模式,真实语境中其复句格式及相应语料的分布有很大差异。有些复句标记序列模式聚合了大量的复句格式及其实例,有些标记序列模式类聚的复句格式较少甚至仅有一种,因此不能武断地去制定规则。对于这些聚类复句格式较少的标记序列模式,在确定标记序列模式属于充盈态还是非充盈态时,研究中笔者是按照从严原则,将这类复句标记序列模式划归入非充盈态标记模式,以确保判定规则的有效度和准确性。
注释:
[1] 鲁松、白硕等:《汉语多重关系复句关系层次分析》,《软件学报》2001年第7期,第987~995页。
[2] 洪鹿平:《汉语复句关系自动判定研究》,南京:南京师范大学硕士学位论文,2008年。
[3] 杨进才、谢芳等:《复句关系词规则生成系统中的冲突检测与处理》,《中文信息学报》2015年第4期,第8~15页。
[4] 胡金柱、舒江波等:《复句关系词自动识别中规则的表示方法研究》,《计算机工程与应用》2016年第1期,第127~132页。
[5] 姚亚平:《多重复句的分析模型——兼谈语法分析作用与目的》,《汉语学习》1990年第3期,第8~14页。
[6] 吴锋文:《基于模式识别的四句式复句句法语义关系判定》,《汉语学报》2017年第3期,第19~28页。
[7] 邢福义:《汉语语法学》(修订本),北京:商务印书馆,2016年。
[8] 有关复杂特征集思想,最早由冯志伟先生提出,参见《汉语句子描述中的复杂特征》《功能合一语法:基于复杂特征和合一运算的语法》等。
[9] 吴锋文:《基于关系标记的汉语复句分类研究》,《汉语学报》2011年第3期,第63~73页。
[10] 吴锋文:《基于关系标记的汉语复句分类研究》,《汉语学报》2011年第3期,第63~73页。
[11] 陆俭明:《要重视特征的研究与描写》,《长江学术》2006年第1期,第80~86页。
[12] 本文将二标记连用形式表示为Ri+Rj,其他同理;将句序连续的三个分句表示为ci-1,ci,ci+1。有关复句类别及关系标记的语义类别参见邢福义:《汉语复句研究》,北京:商务印书馆,2001年,第38~47页。
[13] 吴锋文:《基于关系标记的汉语复句分类研究》,《汉语学报》2011年第3期,第63~73页。
[14] 本文将无标分句间所形成的无标小句关联体用粗体方括号【】标示,无标小句关联体之间的语义关系一般规约为并列关系或因果关系。