“A+一+X,B+一+Y”构式的分类及释义模板

2014-02-28 00:44刘洪超詹卫东
中文信息学报 2014年6期
关键词:小类组块构式

刘洪超,詹卫东, 2

(1. 北京大学 中文系,北京 100871;2. 北京大学 中国语言学研究中心/北京大学计算语言学教育部重点实验室,北京 100871 )

1 引言

构式语法(Construction Grammar)已经提出近三十年[1-2],不过,在信息处理领域,短语结构语法由于描写强类推性(递归性)结构的优势,应用较多,而构式语法受到的关注则较少。尽管短语结构语法与构式语法在一些基本问题上存在分歧,比如短语结构语法强调对语言单位采取层层二分的结构模式,而构式语法则强调语言结构的整体性,更多地关注语言结构作为一个整体在语言中的使用,但这二者在描写语言时其实是可以互补的。从这个视角出发,用于信息处理的组合规则知识将包含两部分,即短语结构规则和构式规则,前者针对通用的“常规组合”,后者针对类推性弱的“非常规组合”。两者需要分别建库。本文提出构建《现代汉语构式知识库》(以下简称《构式库》)的设想并做了初步的探索[3-4]。

这样的构式知识库要充分描写构式的内部句法语义特征,如某个构式的内部成分有哪些要求;还要描写构式的外部句法语义特征,包括句法功能和构式义。要建立能够较为自然地对构式进行释义的释义模板。从操作和应用角度说,释义模板可以简单地看作是一种句式(形式)变换。原则上,构式X的释义模板Y应是更易于用短语结构规则系统来加以分析的常规组合,对非常规组合X进行释义的过程,就是将X进行形式变换为Y的过程。

为此,本文设计了《构式库》的数据库框架,并为其中的字段值制订了填写规范。下文将以“A+一+X,B+一+Y”构式的具体知识归纳与释义为例,说明这方面的初步工作。需要注意的是,“A+一+X,B+一+Y”不是“一形一义”配对的“狭义构式”,而是“一形多义”的“格式”,或者说这个格式对应了多个同形(或可能同源)的“广义构式”。如果仅仅在格式这个层面进行句法语义信息的描写,就无法对其对应的多个构式进行判定和释义。如文献[5]将“A+一+X,B+一+Y”的“结构意义”分为“从量的角度、从空间的角度、从时间的角度”,其中从量的角度看,格式的意义可以分为“数量”和“程度量”,但在文献[5]中,这些意义都没有对应的判定条件,只有有限的几个例子。另外以往有关该格式内部意义的划分,有一定的随意性。如文献[6],先从“量”的角度考察“A+一+X,B+一+Y”的格式义,认为整个格式表示的都是“变量”和“增量”。但事实上,有的“A+一+X,B+一+Y”构式并不完全是“量”的含义,或者说强调的并不是“量”,如“走一阵,歇一阵”,构式义是“交替”;“量”只是其中组成成分的意义。

2 “A+一+X,B+一+Y”构式的分类、判定条件及释义模板

2.1 “A+一+X,B+一+Y”构式的分类

本文的研究对象主要指A、B都是谓词性结构的“A+一+X,B+一+Y”,例如,

例1青一块,紫一块

轻一下,重一下

走一阵,歇一阵

见一个,杀一个

泡一次,淡一次

省一点,是一点

本文从CCL语料库[7]中收集了1 120个符合“A一X,B一Y”模式特征的实例,其中有的是熟语,如“做一天和尚,撞一天钟”等,这类例子的凝固性高,可以直接收入词典。剩余的例子首先可以分为两类,即只有简单的逻辑关系义的和在逻辑关系义基础上产生了新的引申意义的。后者又可以细分为交错交替构式义和主观量构式义。图1是“A+一+X,B+一+Y”根据意义差别所做的层级分类。

图1 “A+一+X,B+一+Y”层级分类体系

为简化起见,图中直接将“A一X,B一Y”分为3个大类,然后每类再细分小类,共有10个小类。

下面对各小类的具体特点进行说明。

(一) 逻辑关系义“A+一+X,B+一+Y”。这一类例子前后两个语块“A一X”和“B一Y”之间有类似于复句的分句之间的逻辑关系,具体包括:

(1) 并列关系

例2左宗棠不大相信,“就这么看一眼、放一枪,就能听得出来?”

例2中“看一眼”跟“放一枪”之间是并列关系,即逻辑上的“AND”关系。

(2) 选择关系

例3早一天晚一天都行。

例3中“早一天”跟“晚一天”之间是选择关系,即逻辑上的“OR”关系。

(3) 连贯关系

例4报靶员凑着靶看一会儿,大喊一声。

例4中“看一会儿”跟“大喊一声”有时间上的先后关系,在逻辑上的“AND”关系基础上,增加了事件时间的先后顺序关系。一般把这样的情形称为事件之间有连贯关系。显然,连贯关系跟普通并列关系的区别并不大。

(4) 转折关系

例5厂长与县长打官司,赢一次,输一辈子。

例5中“赢一次”跟“输一辈子”在逻辑上的“AND”关系基础上,增加了转折的意味,即两个事件之间有“BUT”关系,相当于复句的两个分句之间可以添加转折关系标记连词“但是”。

(5) 因果倚变关系

例6这种清茶泡一次,淡一次。

例6中“泡一次”跟“淡一次”之间有逻辑上的因果(倚变)关系,“泡茶”的次数增多,造成的结果是“茶变淡”。这类构式实例有的可以添加表达倚变关系的复句连词“越……越……”,如“越泡越淡”。

值得注意的是,有的例子中“A一X”和“B一Y”之间的关系比较接近倚变关系,但却没有事理上的因果关系,因而不大能添加“越……越……”标记。例如:

例7乔家这座老宅,说不定就要顶给别人了,睡一天少一天。

例8我只好起来坐在她的身旁,拉着她的手,目不转睛地看着她……就是这样,也是看一眼少一眼,拉一会儿少一会儿了。

这些例子的共性是表达时间越来越少。而在这个时间变少的过程中,凸显的事件是A,也即用于A事件的时间越来越少。从表面形式上看,例7中的“A一X”和“B一X”之间并没有直接的因果倚变关系,即不是“睡”造成“少”,也不是“看”造成“少”,因此,例7中的“A一X,B一Y”如果变换为“越睡越少”“越看越少”,是比较别扭的。

(二) 交替交错义“A+一+X,B+一+Y”。交替交错是指两个(或两个以上)事物交错分布,并不断延伸;或者是指两个(或两个以上)事件轮流出现,并不断循环。具体包括:

(6) 事物交错义

例9“深一丛,浅一丛”,表示“(花草)一丛深的,一丛浅的……”交错分布在某个空间。

(7) 状态交替义

例10“青一阵,红一阵”,表示“青、红”两个状态在时间上不断交替出现。

(8) 动作行为交替义

例11“读一句,哭一阵”,表示“读、哭”两个动作在时间上不断交替出现。

(三) 主观量义“A+一+X,B+一+Y”。根据文献[8],主观量是指带有主观评价的量,可以分为主观大量和主观小量,主观量大小的判断在于说话人所选择的参照物的不同,而不在于量的客观值的大小。“A+一+X,B+一+Y”构式的主观量义具体包含两种情况:

(9) 周遍大量

例12……贾宝玉,几乎见一个爱一个。

“见一个爱一个”可以引申出“见两个爱两个……见N个爱N个”的意思,这里的“A一个”和“B一个”对举,其中的“一个”是遍历整个集合的操作,最终推衍出“爱所有的对象”的意思,本文将这种意义称之为“周遍大量”。大量的主观义是由周遍全集(全量)推衍出来的。

(10) 让步小量

例13经营者只能追求短期效益,赚一点,是一点。

这类构式形式上有一个特点,就是B只能是“是、算”这两个词(比如“逃走一个算一个”)。这类“A一X,B一Y”中的后半部分“B一Y”从字面上看跟前面的“一X”是重复的冗余信息,如“一个是一个”“一个算一个”,相当于逻辑上的“同语重复”,因而整体构式的语义衍生出主观量的意义,表示“一个虽然量少,但毕竟胜过没有”,本文把这种构式义概括为“让步小量”,其实这类构式还可进一步引申出要“尽量实现A事件”的意思,比如例13“赚一点是一点”意味着“要尽量去赚(钱)”,“逃走一个算一个”意味着“要尽量逃走”。因为现实是说话人认为A事件的实现量少,因而要尽量去扩大A事件的量。

值得注意的是,主观量义带有明显的主观色彩,因而容易发生界限不清的问题。如果“A一X,B一Y”中的B不是“是、算”这两个词,那么表主观量义只能是周遍大量。但当B是“是、算”时,并不总是表让步小量,也有可能表周遍大量。例如,

例14我们做出的每一个决策,定了的每一项工作,都要落实到人,限期完成,切实做到抓一项是一项,抓一项成一项。

例15虽然他发表的小小说数量不算很多,但写一篇是一篇,几乎篇篇博得读者好评。

例14中的“抓一项是一项”表达的是周遍大量义,一方面它可以引申出“抓两项是两项,抓N项是N项”的表达,另一方面它的下文有“抓一项成一项”,这是典型的周遍大量义。例15中的“写一篇是一篇”也表达的是周遍大量义,它的下文“篇篇博得读者好评”显式地表达了周遍整个集合的含义。这里的“写一篇是一篇”相当于“写一篇文章,就是一篇好文章”,所以前后两个“一篇”所指涉的外延对象是相同的,但内涵是不同的,这样的“A一X,B一Y”,尽管也符合“一个是一个”这样的形式特点,表面上看两个表量成分用“是/算”连接,是同语重复,但实际上,两个表量成分指涉的实体对象的内涵并不一样。

当构式形式为“A一X,是/算一Y”时,仅从构式内部成分看,既有可能表示让步小量,也有可能表示周遍大量,是有歧义的,具体表达哪种意思,要根据上下文语境来判定。

本文对“A+一+X,B+一+Y”格式的内部分类是在共时层面根据意义差异做出的划分,按照语言发展的一般规律,这些表达不同意义范畴而同时又选用了相同的形式范畴的构式之间应该有演化关系。上面从a—j的小类顺序,大致反映了我们对各小类之间意义引申关系的一种假设,但限于篇幅和目前的研究深度,尚未从历时角度求证,对此拟另文讨论。

2.2 “A+一+X,B+一+Y”构式的判定条件及释义模板

“A+一+X,B+一+Y”各个下位类的不同主要体现在以下几点。

(一) A、B、X、Y的句法类。前两者都是谓词或谓词性结构,但是各个下位类的A、B具体句法类并不相同;后两者都是量词,有的是专用量词,有的是借用量词,但是量词的不同对判定下位类也有作用,量词可以分为名量词、动量词和时量词。本文对A、B、X、Y句法类别的判定主要依据文献[9]。

(二) A、B的语义类。语义类包括两部分,一部分是A、B在词典中的概念语义类;此外,还指A、B在{状态|动作|变化}这3个语义类的区别上。两者不同,前者主要是根据A、B的概念义进行的分类,后者主要是根据A、B的句法表现进行的分类。前者的信息主要依据北京大学《现代汉语语义词典》[10]; 后者是根据文献[11]提出的有关动词过程结构的形式标准进行的判断。下表给出了根据过程结构对动词划分的小类以及相应的判别标准。

表1 文献[11]给出的动词过程结构类型表

文献[11]指出,从Va到Ve实际上是动词从表示状态到动作再到变化(或结果)的一个连续统,具体如图2所示。

图2 文献[11]给出的过程结构连续统和典型类

上面的形式判别标准不仅仅适用于动词,还适用于动结式等动词性结构, 据此可以对本文收集的1 000多个构式实例中的A、B的动词(或动词性结构)过程结构进行判断。

(三) “一+X”“一+Y”之间的关系。两者是否同指也是各个下位类的重要特征之一。

上文从语义角度归纳了“A+一+X,B+一+Y”构式的十个小类。其中表示逻辑关系的前4个小类(a-d)构式整体义跟其组成部分的语义比较接近,本文不再展开讨论,下面给出e—j 6个小类的释义模板及具体判定条件(表2)。

表2 “A+一+X,B+一+Y”各下位类释义模板及判定条件

3 在《构式库》中描写“A+一+X,B+一+Y”

本文设计的《构式库》包括两个部分: (1)描写抽象构式的句法语义信息及释义模板的基础信息库;(2)对收集到的例子进行详细的句法语义信息标注的实例库。

本文构建了一个构式描写体系,分为项、组块和构式整体3级。下面简要介绍。

(一) 项,构式的基本组成单位。项包括了常项和变项,前者指构式中不变的部分,如“A+一+X,B+一+Y”中的“一”;变项指构式中可被替换的部分,如“A+一+X,B+一+Y”中的A、B、X、Y,变项可以是语素、词、短语等各个句法结构。常项和变项统一排序,从左开始,序号依此为1、2、3等。构式库中对项描写主要包括“序位”、“句法范畴”、“语义范畴”、“可替换度”等。

(二) 组块,是由项与项构成的,介于构式和项之间的单位。构式分为多组块式和单组块式,单组块式的特征是组块中的各项之间要么是句法关系,要么是论元关系;多组块的特征是各组块之间有逻辑关系。如“A+一+X,B+一+Y”是一个多组块式,有前后两个组块,以逗号隔开。对组块的描写主要包括了“是否多组块式”、“组块间关系”等。

(三) 构式整体,本文取狭义上的定义,即构式是指整体义无法从部分义推导出的形式-意义配对体。对构式整体的描写包括了“构式形式”、“义项”、“句法信息”、“语义信息”、“语用信息”等。

构式库中描写构式基础信息的主要内容包括“基本信息、变项信息、常项信息、项间关系、句法信息、语义信息、语用信息、参考文献”等8个大项,具体示例可访问文献[4]提供的网址查阅,限于篇幅,这里就不展开说明了。

下面以事物交错义“A+一+X,B+一+Y”为例,说明构式库填写的情况:

构式库目前还在建设的初期,图3中列出的不少知识点目前还没有填值,比如“语用范畴”“可替换度”等信息目前还是空缺状态。

对于“A+一+X,B+一+Y”来说,实例库中包含了本文收集的表示主观量义和交错交替义的473个例子及其句法语义信息标注,这里给出部分例子的具体信息。

图3 事物交错义“A+一+X,B+一+Y”条目部分内容

IDvp1q1原形vp2q2原形vp1_semanticvp2_semanticq1q2vp1_过程vp2_过程1走一阵阵歇一阵阵身体活动,配价数=1,主体=人|动物身体活动,配价数=1,主体=个人时时双限结构⁃4双限结构⁃42走一阵阵歇一会儿会儿身体活动,配价数=1,主体=人|动物身体活动,配价数=1,主体=个人时时双限结构⁃4双限结构⁃43走一阵阵停一阵阵身体活动,配价数=1,主体=人|动物身体活动,配价数=1,主体=人时时双限结构⁃4双限结构⁃34走一阵阵跑一阵阵身体活动,配价数=1,主体=人|动物身体活动,配价数=1,主体=人|动物时时双限结构⁃4双限结构⁃45走一阵阵打一阵枪阵身体活动,配价数=1,主体=人|动物身体活动,配价数=1,主体=人时时双限结构⁃4双限结构⁃56走一会儿会儿坐一会儿会儿身体活动,配价数=1,主体=人|动物身体活动,配价数=1,主体=人时时双限结构⁃4双限结构⁃3图4 “A+一+X,B+一+Y”实例库示例

在实例库中A、B、X、Y进一步实例化,用“vp1、vp2、q1、q2”(vp表示谓词性短语,q代表量词)等对其进行指称。对每个实例,库中目前根据已有的知识库资源(如北京大学《现代汉语语义词典》、《现代汉语语法信息词典》等)标注了vp1,vp2的语义类、论元结构(配价)信息以及动词过程结构信息,q1,q2的小类(名量、动量、时量等)。以方便在更大规模数据基础上对收集到的构式进行更深入研究。

4 结语

本文简要介绍了《构式库》的初步工作。目前该库已经收集了超过1 000个构式[4],这些构式都是通过语言学研究文献和查询真实语料库获得的。针对每个具体的构式,还需要进一步广泛收集实例,分析其构成成分的特点,归纳约束条件,根据表义功能不同划分小类,总结释义模板。就语言学本体研究而言,探讨构式形成的机制也是非常值得研究的课题。

本文以“A+一+X,B+一+Y”构式的知识描述为例,给出了该构式的6个小类的判定条件和释义模板。希望通过本文的介绍,引起中文信息处理学界更多人对构式语法的研究兴趣,共同来探讨如何更有效地将汉语构式语法的理论研究成果转化为形式化的计算机可用的语言知识资源。

[1] Goldberg A. Constructions: A Construction Grammar Approach to Argument Structure[M].Chicago: University of Chicago Press, 1995.

[2] Goldberg A. Constructions at work: The Nature of Generalization in Language[M]. Oxford:Oxford University Press, 2006.

[3] 詹卫东. 现代汉语构式知识库的构建与应用——以涉量构式为例[R],日本中国語学会第63回全国大会(2013.10.26-27,东京外国语大学),东京: 东京外国语大学,2013,10:26-27.

[4] 现代汉语构式知识库[DB/OL].http://ccl.pku.edu.cn/ccgd,2013.

[5] 吴姝俐. 现代汉语“A一量B一量”对举结构及其相关问题研究[D]. 广州: 暨南大学硕士学位论文. 2007.

[6] 窦玉荣. 现代汉语“A一X,B一Y”对举格式考察[D]. 北京: 北京语言大学硕士学位论文, 2008.

[7] 北京大学中国语言学研究中心(CCL)语料库[DB/OL].http://ccl.pku.edu.cn:8080/ccl_corpus

[8] 陈小荷. 主观量问题初探-兼谈副词“就”、“才”、“都”[J]. 世界汉语教学, 1994(4):18-24.

[9] 俞士汶等. 现代汉语语法信息词典详解(第二版)[M]. 北京: 清华大学出版社, 2003.

[10] 王惠,詹卫东,俞士汶.现代汉语语义词典规格说明书[J]. Journal of Chinese Language and Computing,2003,13(02): 159-176.

[11] 郭锐. 汉语动词的过程结构[J]. 中国语文,1993(6):410-419.

[12] 詹卫东. 面向中文信息处理的现代汉语短语结构规则研究[D]. 北京: 北京大学博士学位论文, 1999.

猜你喜欢
小类组块构式
威胁构式“你敢VP”研究
单座物流车专利布局分析
汽车智能驾驶领域专利布局分析
组块理论的解读及启示
融入注意力机制的越南语组块识别方法
“不可推导性”作为标准的虚妄:兼评“修辞构式观”
顺藤摸瓜寻觅原函数追本溯源探讨单调性
荔湾3-1CEP关键建造技术研究
强化显义与突出内涵:当代流行构式“不是所有的X都叫(是)Y”研究
“就/才”进程—评价构式的认知修辞分析