亢世勇,张 晨
(鲁东大学 文学院,山东 烟台 264025)
语义角色映射为句法成分的词汇语义制约规律及特点
亢世勇,张 晨
(鲁东大学 文学院,山东 烟台 264025)
该文以联接理论、事件结构理论为指导,进行词汇语义类、语义角色、句法成分对应关系的研究。选择人教社中小学语文课文语料,标注语义角色、句法成分及中心词的词汇语义类。在标注语料库的基础上,统计分析了词汇语义类与语义角色的对应关系,重点分析各语义类语义角色映射为句法成分的规律,并进一步总结了各词汇语义类的语义角色与句法成分的对应的特点。尽管词汇语义类、语义角色、句法成分之间存在错综复杂的关系,但还是有规律的,可以为计算机句法分析提供一些依据。
词汇语义;语义角色;句法成分
汉语缺乏形态变化,词进入句子后充当何种句法成分、何种语义角色都因环境而变化。通过词类进行句法分析,进而理解语义,困难重重。联接理论或称作映射理论,即研究句法和语义的接口问题,主要是希望找出句法和语义的对应关系,并对其进行描写[1]。我们希望从词汇语义类入手,分析哪些词汇语义类词语可以充当哪些语义角色,又优先映射为哪些句法成分,由此达到分析句子,进而理解意义的目的。为此,我们构建了大规模标注语料库,总结词汇语义类与语义角色的对应关系,各词汇语义类的语义角色与句法成分的对应关系及特点。其中,前者研究已基本完成,本文介绍各词汇语义类的语义角色与句法成分的对应关系及特点。
本文研究基于两个语料库,分别是《中小学语文课本标注语料库》和《充当语义角色、句法成分的中心词义类信息库》。
2.1 《中小学语文课本标注语料库》的构建
我们收集整理了人民教育出版社的中小学语文教材课文语料。首先利用北京大学计算语言学研究所的分词与词性标注系统进行自动分词和词性标注。在人工校对后,以句为单位进行语义角色和句法成分的标注。本次标注的句法成分及标记有: 主语(S)、述语/谓语(P)、宾语(O)、定语(A)、状语(D)、补语(C)、兼语(J)和独立语(T);标注的语义角色及标记有: 施事(S)、当事(D)、领事(L)、共事(Y)、受事(O)、客事(K)、致事(Z)、结果(R)、与事(T)、系事(X)、分事(F)、同源(B)、工具(I)、材料(M)、方式(Q)、原因(C)、目的(G)、方向(A)、范围(E)、时间(H)、处所(P)、数量(N)。句法成分和语义角色标注时,以事件结构理论为指导;句法成分、语义角色独立标注,互不干扰[2]。
2.2 《充当语义角色、句法成分的中心词义类信息库》的生成
《充当语义角色、句法成分的中心词义类信息库》的生成主要经过提取中心词、标注义类和生成三个步骤。
我们设计了抽取程序,以语义角色和句法成分为经纬,在《中小学语文课本标注语料库》中抽取符合条件的所有中心词。然后按照《同义词词林》中的语义分类体系及符号给中心词打上义类标记,大类语义标记为: A[人]、B[物]、C[时间与空间]、D[抽象事物]、E[特征]、F[动作]、G[心理活动]、H[活动]、I[现象与状态]、J[关联]、K[助语][3]。最后生成包含中心词、义类信息、频度的表格(表1)。
表1 《充当语义角色、句法成分的中心词义类信息库》样表
我们对每一种义类充任的每一种语义角色映射为何种句法成分做了归纳统计,并以每种义类充任的语义角色和它映射为的句法成分为经纬列表陈述如下。
3.1 A[人]义类制约语义角色映射为句法成分的规律
表2是A[人]义类语义角色的句法配位情况。
表2 A义类语义角色的句法配位
由表2可知: (1)A[人]义类可以充当施事、当事、受事、与事、客事、领事、系事等19种语义角色,主要是上列前七个。这是A[人]义类的特点决定的。因为在一个事件结构中“人”是动作行为的发出者、接受者或协同者。(2)有些语义角色可以映射为多种句法成分,但有些比例较低,可以忽略不计,比如施事主要映射为主语,映射为状语、宾语的比例比较低,可以忽略不计;据此,当事为主语、兼语,领事为主语,客事、受事、结果为宾语,与事、比事、范围、方向、目的为状语,处所映射为主语、宾语、状语。(3)有些语义角色只能映射为一种句法成分: 系事、致事、分事为宾语,共事、方式、原因为状语,同源为主语。
3.2 B[物]义类语义角色映射为句法成分的规律
表3是B[物]义类语义角色的句法配位情况。
表3 B义类语义角色的句法配位
由表3可知: (1)B[物]义类可以充当受事、施事、当事、客事、系事、处所等21种语义角色,主要是上列六个。这是B[物]义类的特点决定的,因为在事件结构中物往往是动作行为的承受者和相关者。B[物]能够成为施事是因为在一定的事件结构中,“物”因为自身或其它的力量发出一些行为。B[物]能够成为处所,则是在一定的环境中,其意义、作用发生了转移。(2)受事、客事、结果、分事主要映射为宾语,施事、当事、领事为主语,比事、与事、方式、范围、材料、目的状语,处所为主语、宾语、状语,数量为补语。(3)只能映射为一种句法成分的有: 系事、同源、致事为宾语,共事、方向、原因为状语。
3.3 C[时间与空间]义类语义角色映射为句法成分的规律
表4是C义类语义角色的句法配位情况。
表4 C义类语义角色的句法配位
由表4可知: (1)C[时间与空间]义类可以充当处所、时间、当事、施事等20种语义角色,主要是处所、时间,这是由C[时间与空间]义类的特点决定的。(2)处所、时间主要映射为状语、补语、宾语、主语,施事、当事、领事为主语,受事、客事、数量为宾语,比事、与事、范围为状语。(3)只能映射为一种句法成分的有: 系事、结果、致事、分事为宾语,方式、共事、目的为状语,同源为主语。
3.4 D[抽象事物]义类语义角色映射为句法成分的规律
表5是D义类语义角色的句法配位情况。
表5 D义类语义角色的句法配位
由表5可知: (1)D[抽象事物]义类可以充当受事、客事、当事、施事、系事、数量、处所、范围等21种语义角色,主要是受事、客事、当事等语义角色,这是由D[抽象事物]义类的特点决定的。抽象事物往往作为事件结构涉及的对象,也是说明的对象。(2)受事、客事、结果、分事主要映射为宾语,当事、施事、领事主要映射为主语,范围、与事、方式、比事、时间、目的主要映射为状语,处所为状语、主语、宾语,数量为宾语、状语、主语。(3)只能映射为一种句法成分的有: 系事、致事为宾语,共事、原因、方向为状语,同源为主语。
3.5 E[特征]义类语义角色映射为句法成分的规律
表6是E义类语义角色的句法配位情况。
表6 E义类语义角色的句法配位
由表6可知: (1)E[特征]义类可以充当当事、受事、客事、系事、施事等19个语义角色,主要是上列语义角色。(2)当事、施事主要映射为主语,客事、受事、与事、分事主要映射为宾语,范围、比事主要映射为状语,数量为补语、宾语、主语。(3)只能映射为一种句法成分的有: 系事、致事、结果为宾语,方式、原因、目的、时间、共事为状语,领事、同源为主语。
3.6 F[动作]义类语义角色映射为句法成分的规律
表7是F义类语义角色的句法配位情况。
表7 F义类语义角色的句法配位
续表
频度句法成分语义角色主语宾语状语领事1客事221系事7与事2方式7原因8目的1数量1比事10同源3范围3
由表7可知: (1)F[动作]义类可以充当受事、施事、客事、当事等14种语义角色,主要是上列语义角色。F[动作]义类充当语义角色主要是因为在一定环境中,这些词语强化了指称作用,起到了名词的作用。(2)受事、客事主要映射为宾语。(3)只能映射为一种句法成分的有: 施事、当事、领事、同源为主语,系事为宾语,其余比事、原因、方式、范围、与事、目的、数量均为状语。
3.7 G[心理活动]义类语义角色映射为句法成分的规律
表8是G义类语义角色的句法配位情况。
表8 G义类语义角色的句法配位
续表
频度句法成分语义角色主语宾语状语方式11原因218目的3时间1比事4同源22范围9
由表8可知: (1)G[心理活动]义类可充当客事、受事、当事、系事、施事等17个语义角色。(2)客事、受事主要映射为宾语,施事为主语,原因为状语。(2)只能映射为一种句法成分的有: 当事、同源、领事、共事为主语,系事、结果、致事为宾语,方式、范围、与事、比事、目的、时间为状语。
3.8 H[活动]义类语义角色映射为句法成分的规律
表9是H义类语义角色的句法配位情况。
表9 H义类语义角色的句法配位
由表9可知: (1)H[活动]义类可充当受事、客事、当事、施事等16个语义角色,主要是上列语义角色。(2)受事、客事主要映射为宾语,当事、施事、领事主要为主语,其余范围、比事、目的、与事主要为状语。(3)只能映射为一种句法成分的有: 系事、结果、致事为宾语,同源为主语,方式、原因、共事为状语。
3.9 I[现象与状态]义类制约语义角色映射为句法成分规律
表10是I义类语义角色的句法配位情况。
表10 I义类语义角色的句法配位
由表10可知: (1)I[现象与状态]义类可以充当当事、受事、系事、施事等17种语义角色,主要是上列语义角色。(2)当事、施事、领事主要映射为主语,客事、受事主要为宾语,原因主要为状语。(3)只能映射为一种句法成分的有: 系事、数量、结果为宾语,同源、共事为主语,方式、与事、范围、比事、目的、方向为状语。
3.10 J[关联]义类语义角色映射为句法成分的规律
表11是J义类语义角色的句法配位情况。
表11 J义类语义角色的句法配位
由表11可知: (1)J[关联]义类可充当客事、受事、施事、系事等语义角色。(2)客事主要映射为宾语。(3)其它均为只能映射为一种句法成分,受事、系事、结果为宾语,施事、当事、领事、同源为主语,原因、与事、比事、方式、目的、时间、范围为状语。
3.11 K[助语]义类语义角色映射为句法成分的规律
表12是K义类语义角色的句法配位情况。
表12 K义类语义角色的句法配位
由表12可知: (1)K[助语]义类可充当方式、原因、系事、当事等九种语义角色。(2)方式主要映射为主语,时间为状语,原因为状语,受事为主语、宾语。(3)只映射为一种句法成分的有: 当事为主语,系事、客事为宾语,范围为状语。
从上文的分析中,我们可以看到词汇语义类、语义角色、句法成分之间存在着错综复杂的关系。每个词汇语义类与语义角色的对应关系上文已经做了比较详细的交代。就语义角色与句法成分的对应关系来看,本文涉及的句法成分有主语、宾语、状语、兼语、补语、独立语等六个,实际上语义角色映射为独立语、补语的很少,映射为兼语的量也极为有限。每个义类的语义角色映射为句法成分的能力不尽相同,具体如下。
(1) 语义角色映射为五个句法成分的有: A义类客事,C义类时间,D义类客事、数量、范围,E义类客事。整体来看映射为五个句法成分的语义角色有限,其中客事更活跃一些。这些角色基本上都是事件结构的外围成分。
(2) 语义角色映射为四个句法成分的有: A义类当事、与事、处所,B义类当事、客事、处所、比事、与事、范围,C义类处所、当事,D义类当事、处所、与事、时间,E义类范围,H义类客事,K义类时间。映射为四个句法成分的语义角色数量多于映射为五个的,其中当事最为活跃。
(3) 语义角色映射为三个句法成分的有: A义类施事、领事、受事、比事,B义类受事、施事、领事、数量、材料,C义类受事、施事、方向、客事、与事、数量,D义类受事、施事、领事、比事、目的,E义类当事、受事、与事、数量,F义类受事,G义类受事,H义类受事、当事、施事,I义类客事、受事,J义类客事。映射为三个句法成分的语义角色又多于映射为四个句法成分的,其中受事、施事最为活跃,每个义类的受事几乎都可以映射为三个句法成分。
(4) 语义角色映射为两个句法成分的有: A义类范围、方向、目的、结果,B义类结果、方式、分事、目的,C义类比事、领事、范围,D义类结果、方式,E义类施事、比事、分事,F义类客事,G义类客事、原因,H义类范围、比事、目的、与事、领事,I义类当事、施事、原因、领事,K义类施事、受事、原因。
(5) 语义角色只能映射为一个句法成分的有: A义类系事、共事、方式、致事、原因、同源、分事,B义类系事、同源、共事、方向、原因、致事,C义类系事、同源、方式、结果、共事、致事、分事、目的,D义类系事、共事、原因、致事、方向、同源,E义类系事、方式、领事、原因、比事、目的、结果、时间、共事、分事、致事,F义类施事、当事、比事、原因、系事、方式、范围、同源、与事、目的、数量、领事,G义类当事、系事、施事、同源、原因、方式、范围、与事、比事、目的、领事、结果、致事、共事、时间,H义类系事、范围、方式、原因、同源、共事、结果、致事,I义类系事、同源、方式、与事、范围、比事、目的、共事、数量、结果、方向,J义类受事、施事、系事、当事、原因、领事、与事、比事、方式、目的、结果、时间、同源、范围,K义类方式、系事、当事、、客事、同源、范围。只能映射为一种句法成分的语义角色最多,多数都是事件结构的外围成分。
本文在标注语料库的基础上对各类语义角色映射为句法成分进行了研究,总结了其中的一些规律。但是因为语料主要取自全日制普通高中的语文教材,数量有限,而且语料的覆盖面不足,所得数据有些稀疏,研究结果难免有其局限性。将来我们将扩大语料数量及覆盖面,进一步深入研究。
[1] 高明乐.联接理论的发展与现状[J].外语学刊,2004 (2): 61-66.
[2] 张晨.基于语义角色和句法标注的新词语语义类识别研究[J]. 安徽文学,2016 (3): 92-93.
[3] 梅家驹等.同义词词林[M].上海: 上海辞书出版社,1983.
[4] 马永腾.义类视角下施事、受事句法实现的考察[D]. 鲁东大学硕士学位论文,2008.
[5] 周明海.核心语义角色句法实现的词汇语义制约[D]. 鲁东大学硕士学位论文,2011.
[6] 田震.非核心语义角色句法实现的词汇语义制约[D]. 鲁东大学硕士学位论文,2014.
[7] 亢世勇、许小星、马永腾.施事、受事句法实现的义类制约[J].语文研究.2011(4): 36-40.
[8] 秦春秀,祝婷,赵捧未,等.自然语言语义分析研究进展[J].国家情报工作,2014,58 (22): 130-137.
[9] 陆俭明.句法语义接口问题[J].外国语,2006(3): 30-35.
[10] 潘海华.词汇映射理论在汉语句法研究中的应用[J].现代外语,1997(4): 1-16.
Lexical Semantic Constraints on the Mapping from Semantic Roles to Syntactic Elements
KANG Shiyong,ZHANG Chen
(School of Chinese Language and Literature,Ludong University,Yantai,Shandong 264025,China)
According to the linking theory and event structure theory, this paper focused on the study of correlation analysis of lexical semantic categories, semantic roles and syntactic elements. We annotate the text in the Chinese textbooks of primary and middle schools, published by People’s Education Press, to build our annotated corpus. Based on this corpus, we analyzed the correlation between lexical semantic categories and semantic roles, and summarizing the correlation characteristics of each lexical semantic category. We hope this study could benefit the study of automatic syntactic parsing and semantic analysis.
lexical semantics; semantic role; syntactic element
亢世勇(1964—),硕士,教授,主要研究领域为汉语语言学、计算语言学。E-mail:kangsy64@163.com张晨(1989—),硕士研究生,主要研究领域为中文信息处理。E-mail:zc_hebe@163.com
1003-0077(2016)06-0007-08
2016-09-27 定稿日期: 2016-10-15
国家社科规划项目(12BYY123);国家自然科学基金(61272215);国家自然科学基金(61272375)
TP391
A