基于语料库的汉语词语可重叠性的统计研究

2015-03-08 11:54韩延展
唐山师范学院学报 2015年4期
关键词:统计语料库

韩延展

(华中师范大学 文学院,湖北 武汉 430079)

基于语料库的汉语词语可重叠性的统计研究

韩延展

(华中师范大学 文学院,湖北 武汉 430079)

摘 要:以语料库《语法信息词典》为基础,运用ACCESS对各类词库进行统计,分析了汉语词语不同词性词语的可重叠结构的基本情况、不同词性词语主要的构词方式以及重叠结构的语义特点。研究发现动词和形容词的可重叠词语最多、形容词的重叠方式最多、量词的重叠方式最少以及不同词性词语有其共同的语义特点。

关键词:可重叠性;语料库;统计;语义特点

一、引言

汉语作为一种孤立语,极其缺乏词形变化[1]。而重叠就是汉语重要的构形手段之一,如许许多多、方方面面、哥哥、水灵灵和口口声声等。汉语词语中动词和形容词的重叠结构被研究得比较透彻,而其他词性的词语研究较少。本文以《语法信息词典》(以下简称语料库)为基础,通过量化分析各类词库的词语,来探究各种词性词语的可重叠情况、构造方式以及语义特点。

二、汉语词语可重叠的基本情况

通过对语料库的各类词库及分词库的观察分析发现,词库中有“重叠”属性字段的词库分别有:名词库、数词库、量词库、动词库、形容词库和副词库。本文就这六个类别词库进行语料分析与统计,来观察汉语词语重叠结构的基本情况。

根据表1,动词中可进行重叠变换的词语最多,共有705词,约占语料库动词库的33.67%。其次为形容词,共有319个词,约占形容词库的21.69%。而数词和名词可重叠词数最少。而从百分率来看,名词所占词库的百分比最低,只有0.34%,而副词约占词库的3.34%。

表1 各词库可重叠词数

名词、数词和副词的可重叠词种数都比较低,因而对名词、数词以及副词的重叠结构研究的也比较少,究其原因,还是因为可重叠词种较少导致词性的重叠结构较少,语料少自然研究的人也比较少。下面列举出可重叠名词、数词和副词以作参考:

名词:事、星、人、哥、字、月、家、毛、子孙、是非、山水、方面;

数词:双、一、大批、许多、一个、一阵、好多、很多、好久、千万;

副词:常、略、仅、独、恰、屡、快、刚、死、偏、单、渐、足、稍、好、最、白、非常、千万、时刻、日夜、反复、的确、急忙;

由上来看,名词和副词中可重叠词语偏向单音节化,而数词更多地为双音节词语。

三、汉语词语重叠结构的构造方式

汉语词语重叠结构的主要构造方式有AA式、AABB式、ABB式、ABAB式、A里AB式等。本文所依据的语料库中出现的重叠方式主要有AA式、AABB式、ABAB式、ABB式和A里AB式。统计结果详见表2、表3。

表2 各词库重叠方式种数

表3 各类重叠方式在各类词类库中数量分布表

根据表2可知,形容词可重叠词语的重叠方式最多,有五种。量词最少,只有一种。根据表2和表3,名词的重叠方式主要有AA式和AABB式。数词的重叠方式有AA式、AABB式和ABAB式。量词只有一种AA式。动词的重叠方式主要以AA式和ABAB式为主。形容词的重叠方式最多,每种都有。副词可重叠词主要以单音节为主,因此重叠方式也主要是AA式。由表3合计来看,竖栏合计可得有些词语有多种重叠方式,构成不同的重叠结构。横栏合计可得AA式和ABAB式是主要的重叠方式,采用最少的重叠方式为A里AB式。下面举例分析。

(一)AA式

可采用AA式重叠的词语有:人、哥、家、双、常、集、架、挂、米、门、称、修、陪、闯、选、运、想、尝、分、收、催、买、关、美、甜、常、仅、独、恰、最、白、足等。

由上可知,采用AA式的可重叠词语都为单音节词语。重叠后,有的词语的词性保持不变,如哥、常、修,而有些词语的词性发生变化,例如人、家等。

(二)AABB式

可采用AABB式重叠的词语有:是非、山水、方面、许多、千万、来往、吵闹、勾搭、清楚、搂抱、开心、舒服、轻松、凉快、痛快、粗糙、冒失、慌张、黯淡、蓬松、时刻、日夜、反复、的确、急忙等。

由上可知,采用AABB式的可重叠词语主要为双音节词语,而且其中一些也可以采用ABAB式,如许多、来往、开心、舒服。采用AABB式重叠方式的主要为形容词,约占全部的92.98%。

(三)ABAB式

可采用ABAB式重叠的词语有:大批、一个、很多、讲究、回想、清查、核算、交待、劝说、计划、搜查、流动、卖弄、警告、努力、松弛、热乎、清闲、自由、畅快、痛快、鲜嫩、非常、千万等。

除了名词、量词和状态词,其他四种词库都有采用ABAB式重叠的词语。根据表3可得,动词采用ABAB式占了所有采用ABAB式的极大多数,约为93.45%。可见动词常采用ABAB式构造新词来达到不同的表达效果,例如“清查”重叠后为“清查清查”,“我清查一下”和“我清查清查”的表达效果是不同的。

(四)ABB式

可采用ABB式重叠的词语有:热乎、毛糙、软和、油腻、孤单、光滑、阴森、坦荡、年轻、顺当、稳当、死板、亮堂、空旷、松散、活泼、甜蜜、蓬松、暖和、光溜等。

由表3可知,采用ABB式重叠的词语主要为形容词。

(五)A里AB式

可采用A里AB式重叠的词语有:粗糙、龌龊、糊涂、毛糙、肮脏、冒失、古怪、马虎、荒唐、慌张、浮躁、邋遢、小气。

由以上例子可得,采用A里AB式的主要为形容词,而且从语料库筛选来看只有13个词。因此,A里AB式是一种采用比较少的重叠方式。

四、汉语词语重叠结构的语义特点

以“语料库在线”网站为基础,将一些重叠结构代入到一些近现代作品的语例中来考察不同词性词语的语义特点及表达效果。

(一)名词

名词可重叠的12个词中,有的重叠后仍为名词,表达效果不变,如“星星、哥哥和毛毛”,这些词语暂不计入考虑。而其他如“人人、事事、家家、月月”具有相通性,因此以“事事”作为考察对象“方方面面、是是非非、山山水水”也具有一定的相通性,以“山山水水”作为考察对象。

(1)从认识那天起,他对这个书生气十足的医生就一直看不起,事事都认为赵万和不如他。(黄志远《痴恋》)

(2)我爱家乡的山山水水,我就想用我自己学到的知识去把它变得更美好。(路遥《你怎么也想不到》)

例(1)中“事事”强调了不满的情绪,而“山山水水”则极言作者对家乡的喜爱,增强了表达效果。重叠后的词语有泛指的功能,如“山山水水”并不特指哪一座山哪一条河,“事事”也没有指明为具体某件事。因此从语义特点来看,名词的重叠结构具有表达不同思想感情和泛指的功能[2]。

(二)数词

数词的重叠结构中有“一个一个、大批大批、一阵一阵、许久许久和千万千万”等,语感上来看,“一阵一阵”和“许久许久”的语义功能并不相同,以两词为例:

(3)周围树丛子里的麻雀一阵一阵地惊得飞起来,又落下去。(秦兆阳《大地》)

(4)可过了许久许久也没有动静,不知什么时候她竟睡过去了。(高绪仑《罗曼律师》)

例(3)中“一阵一阵”作状语,表现出麻雀飞起来的状态,暗含动态的含义。例(4)中“许久许久”增添了时间的长度,带有等待的缓慢感,使整个语句形象生动。数词的重叠可作状语,也可以增强句子的表达效果。

(三)量词

量词的重叠结构作用都比较相似,例如“阵阵、家家、户户和回回”等。以“阵阵”和“回回”为例:

(5)树叶子上,白天的雨水未干,又加上夜里的露水,阵阵微风把水点子吹得掉下来,发出轻微的滴嗒声,象是下雨。(秦兆阳《大地》)

(6)他有点慌了,慌张中用起了以往回回奏效的办法。(窦卫华《一个警察的24小时》)

例(5)中“阵阵”作修饰语,修饰微风。例(6)中“回回”带有强调的作用,强调以往的方法非常有效果。同样,量词的重叠结构也可以增强语气的表达效果,使描述更加细腻,具有持续性、密集性和反复性的特点。

(四)动词

语料库中的动词分库一共有2 094个词,而可重叠的词有705个,重叠方式主要有两类,重叠词主要有学学、跑跑、堆堆、写写、想想、用用、擦擦、核对核对、清理清理、坚持坚持、集中集中、回收回收、思考思考和研究研究等。以“想想”和“研究研究”两词为例:

(7)若是他们有了困难,我们不管,我们的眼睛却只放到那几户土地多、牲口壮、没有困难的户上,你想想,你这是什么思想?(于良志《白浪河上》)

(8)走吧,进屋研究研究去,这可是个大事,得向老郭汇报。(赵羽翔《山村新人》)

例(7)中“想想”作谓语,比单用“想”更加口语化,也表达出主人公担忧的情绪。例(8)中“研究研究”作谓语,使语气更加舒缓。因而,动词的重叠结构一般都作谓语,有舒缓语气,同时动词的重叠也赋予了动词新的语法意义[3]。

(五)形容词

语料库中收录的形容词共有1 471个,其中可重叠319个,形容词的重叠方式有五种,因而重叠结构也显得非常多样,如甜甜、暖暖、冷冷静静、亲亲热热、开开心心、热乎热乎、清闲清闲、畅快畅快、小里小气、古里古怪、冒里冒失、慌里慌张、油腻腻、光滑滑、亮堂堂、稳当当和沉闷闷等。以“亲亲热热”“清闲清闲”“古里古怪”和“油腻腻”为例:

(9)两只蛙亲亲热热地背抱在一起,爬在翠绿的树枝上。(杨岚《到西双版纳去》)

(10)退休了,该清闲清闲啦……(薛勇《能人街新事》)

(11)梦醒之后,有的人抚着伤痛爬起来,有的人饮恨终生生活下去,可也有的人摸摸这儿,摸摸那儿,发现自己并没有失去什么,伤着哪里,不过是一场虚惊,倒是增加了不少阅历,获得了很多古里古怪的经验而已。(张贤亮《男人的风格》)

(12)一直低着头在洗碗池里洗碗,汗珠子掉在洗碗池里头,侍者不停地把脏碗碟丢在他身边,有时候溅起几滴油腻腻的水星到王起明的脑门子上。(曹桂林《北京人在纽约》)

例(9)中“亲亲热热”作状语,采用拟人手法显示出青蛙亲密的状态。例(10)中“清闲清闲”作谓语,表达作者轻松愉快的心态。例(11)中“古里古怪”作修饰语,修饰经验,本来“古里古怪”具有贬义的意思,但是在此句不是贬义的含义。例(12)中“油腻腻”修饰“水星”,本词本身就含有贬义效果,表达出主人公独自在纽约的辛苦。因此,形容词的重叠结构一般充当修饰语,构成偏正结构,也可以作谓语,在感情色彩上既可以表达贬义也可以表达褒义[4]。

(六)副词

语料库中共收录副词719个,其中只有24个可以重叠,如常常、恰恰、单单、渐渐、足足、千万千万、时时刻刻、日日夜夜和反反复复等。以“足足”和“日日夜夜”为例。

(13)足足半个小时,紫貂跑累了,心头愤懑也发泄了,才停下来,望了一阵月光下的树林,把肉盆拉过来,慢慢地嚼起来。(沈钧《动物园之夜》)

(14)事过境迁了,可那些叫人消魂的日日夜夜,那些撼心动魄的遇险情景,至今还如冲腾不息的潮波一般,时时牵动我的忆念。(金同悌《太平洋上》)

例(13)中“足足”强调了时间的

持久性,具有增强语义的效果。例(14)中“日日夜夜”作主语,具有反复性、计时性的语义特点。因而,副词的重叠结构可以作主语,具有增强语义和表达效果的特点[5]。

综合六种词性词语的语义特点发现,不同词性的重叠结构都有增强语义的表达效果。而不同词性词语也有其自身的特点,如句法结构上的不同功用,感情色彩上的不同表达,渲染效果上的细腻与形象等。

五、结语

本文以语料库《语法信息词典》和语料库在线的语料为基础,探究了汉语词语的可重叠性的基本情况、不同词性词语的构词方式及语义特点。综上所述,汉语词语中动词和形容词的可重叠词语最多,形容词的重叠方式最多而量词的重叠方式最少,不同词性的重叠结构都能增强语义,表达作者或喜或忧的思想感情。

[参考文献]

[1] 朱德熙.语法讲义[M].北京:商务印书馆,2012:18.

[2] 蔡朝辉.探析汉语中名词的重叠[J].扬州大学学报,2007(3): 20-24.

[3] 李宇明.动词重叠的若干句法问题[J].中国语文,1998(2):26-30.

[4] 陈光.对现代汉语形容词重叠表轻微程度的重新审视[J].语言教学与研究,2008(1):32-36.

[5] 周孟战,张永发.汉语副词重叠研究述评[J].中南大学学报, 2012(1):56-61.

(责任编辑、校对:任翠香)

A Corpus Based Statistical Study on Chinese Words Reduplication

HAN Yan-zhan

(College of Liberal Arts, Central China of Normal University, Wuhan 430079, China)

Abstract:Based on the corpus of “Grammar Information Dictionary” and by using ACCESS, an analysis is made on all kinds of lexicons, the basic case of Chinese words reduplication, the construction mode of different part-of-speech words and semantic features of the overlapped structures. It can be summarized that the overlapped structure of Chinese verb and adjective occupied the largest percentage. The overlapped ways of Chinese adjective is the most and the classifier is the least. And different part-of-speech words have the same semantic features.

Key Words:reduplication; corpus; statistics; semantic features

作者简介:韩延展(1990-),女,江苏宿迁人,硕士研究生,研究方向为汉语语用学、中文信息处理。

收稿日期:2015-03-04

DOI:10.3969/j.issn.1009-9115.2015.04.009

中图分类号:H031

文献标识码:A

文章编号:1009-9115(2015)04-0036-03

猜你喜欢
统计语料库
平行语料库在翻译教学中的应用研究
《语料库翻译文体学》评介
2008—2015我国健美操科研论文的统计与分析
山东省交通运输投资计划管理信息系统的设计
市场经济背景下的会计统计发展探究
统计信息化在企事业单位人力资源管理中的应用研究
信息化时代如何加强统计信息化管理
基于JAVAEE的维吾尔中介语语料库开发与实现
语料库与生态化英语教学模式
语篇元功能的语料库支撑范式介入