梁滢
【摘要】 本文对《全宋词》进行字频统计,并与《全唐诗》《全元散曲》《四库全书》 《四部丛刊》等进行比较,分析了宋词的用字特点。宋词用字具有文艺语体形象性、情意性、创新性的特点。在唐诗、宋词、元曲的比较中,唐诗用字较接近书面语体;宋词和元曲则较为口语化、通俗化,用字的相似程度也较高。宋词和元曲使用的去声字都略多于唐诗。
【关键词】 字频;语体风格;宋词;唐诗;元曲
【中图分类号】I206 【文献标识码】A 【文章编号】2096-8264(2020)28-0029-02
基金项目: 2015年度河北省高层次人才资助项目(类型:博士后科研项目择优资助),项目名称:基于计量分析的宋词语体研究(编号:B2015001009)。
一、古代诗歌的语体风格和用字特点
词是古代诗歌的一种,在语体学系统中属于文艺语体。谈宋词的语体风格和用字特点,就不能不谈古代诗歌和文艺语体。因此,本文先从古代诗歌与一般古籍的比较来梳理古代诗歌的语体风格和用字特点。
唐诗、宋词、元曲(本文指元散曲)是古代文学史上作品数量较多、影响较大、流传范围较广的三种诗体,在发生和发展的次序上一脉相承。因此,在讨论宋词的用字特点时,与唐诗和元曲的比较也是不可或缺的。本文使用《全唐诗》《全宋词》和《全元散曲》的电子化文本,利用“语料库在线”网站的字频词频统计工具CorpusWordFrequencyApp,获得这三种语料的字频信息,用于探讨古代诗歌的用字特点。与诗歌相比较的一般古籍则使用《古籍字频统计》的数据。
(一)单字使用频率
将《全唐诗》《全宋词》和《全元散曲》合并为一个古代诗歌语料库,进行字频统计,获得的数据是:汉字总数4199179个,字种数(即单字数)7998个,平均单字使用频率为525次。《古籍字频统计》的数据为:《四库全书》总字数699684465个,单字29088个,平均单字使用频率为230325次;《四部丛刊》总字数90616538个,单字27606字,平均单字使用频率为3283次。诗歌使用单字的平均频率远远低于其他文献。
(二)高频字
《古籍字频统计》的最高频一百字为:之不以也而其人为有者一曰子於十大所二三中无┃年则下天上此王书是公事处在可言至五如日山四故文与又得时行州知月后南生见道亦谓东君明相然水今皆作国名使臣出百未于何诗太西官矣六用正能县夫云氏地同元士成阳非方心
古代诗歌语料库的最高频一百字为:不人风一无花山云春来日天有月时何上水中年相如生心长归是清去玉自为秋处里知得君金香江夜雨見明空此行白寒下未在千今酒青高声谁事多飞红东三落前烟新子万我家尽情流愁西南更与道客深门看闲重远似老回思开成路朝满草
(三)诗歌的文艺语体风格与其用字特点的对应
1.文艺语体的语言形象生动,使用具象鲜明的语言和修辞手段展现事物的形状,细选颜色词,展现事物的色彩形象。因此,表现自然景观的“风花山云春月水秋”、表示颜色的“白红青金”等字在诗歌中高频出现。
2.文学语言必须情感充沛,真挚感人,这是艺术性语体区别于其他语体的本质特征。文艺语体使用直接或间接的抒情词语与手段来表达作者的情感。
因此,用于表达个人印象和感受的“寒情愁闲知香”等字在诗歌中高频使用。
诗歌注重抒情而非理性的思考和计算,因此,诗歌中表示数量的字往往是约数而非确数,“一三千万多”是诗歌的高频字,“二四五六百”却不是。
3.文艺语体追求语言的创新性。文艺语体的语言不落俗套,在用字上表现为两个特点:首先,单字使用频率低,即单字重复少。诗歌是个性化的创作,语言要表现作者鲜明的个性特点,遣词造句就不会是程式化的,而是反复锤炼,斟酌用字,单字重复率自然就低。诗人为求参差错落之美,往往还要在一篇诗作中有意识地避免使用非修辞性的重复的字。格律诗中有“避同”之说,将非修辞性的重复字视为诗病。其次,实词较多,虚词较少。我国古代诗歌有着寄托象征的传统,善于借景抒情、托物咏志,写作时纵横捭阖,尽情挥洒,用字涉及自然现象景物、抽象事物、人、时间、地点、数量等范畴,比其他文体的用字范围要广泛。因此,诗歌中用于表示名词、动词、形容词等实词的字数量多,而作为虚词使用的“之乎者於也以其而则又”这类字则比一般古籍少得多。
二、宋词与唐诗、元散曲的用字情况比较
(一)宋词的书面语色彩低于唐诗而高于元曲
人们往往用“诗庄词媚曲俗”这种简明扼要的对照来说明这三种诗体的风格差异。冯胜利(2011)从诗歌的“齐整律”和“长短律”说明,齐言体与杂言体诗歌在风格上的正式、随意的差别是由它们的韵律决定的,越整齐越庄重,越参差越随意。本文的字频研究可以对这一理论作一个补充。上文的分析已经指出,单字使用频率与文体、语体相对应,一般的书面语体单字使用频率高,诗歌类的作品单字使用频率低。
那么,唐诗、宋词、元曲这三种诗体与书面语体之间的距离,也就可以从单字使用频率来观察。《全唐诗》汉字总数2469471个,字种数7427个。《全宋词》汉字总数1382445个,字种数5864个。《全元散曲》汉字总数347322个,字种数4753个。
单字使用频率为:唐诗332.5,宋词235.75,元曲73.07。从单字使用频率来看,唐诗最接近其他书面语体,其正式、典雅程度高于宋词和元曲。宋词和元曲的书面语色彩都比唐诗低,元曲的口语化、通俗化程度最高。也就是说,诗歌的单字使用频率与语体庄重程度成正比,单字使用频率越高的诗体,书面语色彩、庄重正式的色彩越浓;反之则口语化程度越高。
(二)宋词与元曲的用字相似程度较高
从渊源来说,词为诗余,宋词的产生与唐诗有着密切的关系;从语言风格来说,宋词语言有口语化的特点,与元曲语言的通俗化、生活化相近。究竟宋词的用字更靠近哪一端?这需要通过统计比较才能了解。
由于诗歌的单字使用频率低,这三个语料库都要到大约前1000个高频字才能对整个语料库累积覆盖到80%以上,前2000个高频字才能覆盖到95%左右。
为了避免芜杂,便于探讨,本文选取三个语料库的前100个高频字,能对各自的语料库覆盖到30%以上。这些字的出现情况统计为共用、独用的7种类型共148字,分布如下表:
三种诗体同用的字超过一半,说明这三种诗体使用的词汇相似程度很大。“春东风”是它们共用的高频字,可以想见,三个时代的诗人都偏爱吟咏春光。
元曲与唐诗共用的字最少,说明它们之间不但时代相距较远,文体风格也差别较大。三个语料库独用的字,宋词最少,因为它衔接着唐诗与元曲,与二者共用的字都比较多。宋词与元曲共用字略多于宋词与唐诗共用字,说明宋词与元曲的用字相似程度更高,关系更近。
三、宋词使用去声字多于唐诗
从《广韵》分卷和收字数量可以知道,汉字的四声数量分布是平声最多,去声次之,上声更少,入声最少。宋词的格律不但讲平仄,还讲四声,在四声中最强调去声,领字多用去声。“一字逗”的句子很常见。有的词调还规定词中换韵处、音律吃紧处必用去声。那么,宋词是否因此而使用了较多去声字?对三个语料库的前100个高频字进行声调标注以后,统计结果如下表:
从表2可见,宋词的去声字多于唐诗。宋词是一种重视追求音响之美的音樂文学。对音乐美的重视和对去声的强调使宋词的语言使用较多的去声字。如果落实到作品的篇幅去理解表2的数据,一首112字的长调字数等于两首56字的七律相加,按表2去声字的比例来算,长调会用17个去声字,两首七律则共用15个去声字,相当于长调的上、下片各多用一个去声字。也可以这样说:每一首56字的词,都比字数相等的七律多用一个去声字。
宋代词人发现并强调去声的特殊性,随着音律理论的传承和发展,到了元曲的时代,“音律吃紧处用去声”的观念更为深入人心,也得到了更自觉、更普遍的实践,表现为元曲的去声字略多于宋词。元曲和宋词重视使用去声字的共同倾向,使它们的关系更密切了。
参考文献:
[1]北京书同文数化技术有限公司编.古籍汉字字频统计[M].北京:商务印书馆,2008.
[2]覃勤.先秦古籍字频分析[J].语言研究,2005,(25).
[3]冯胜利.语体语法及其文学功能[J].当代修辞学,2011.
[4]俞敏.古四声平议[J].训诂研究,1981,(1).
[5](宋)陈彭年.永禄本韵镜·宋本广韵·七音略[M].南京:江苏教育出版社,2002.
[6]王景琳,徐匋.中国古代文体丛书·词[M].北京:人民文学出版社,1994.
[7]叶君远.中国古代文体丛书·诗[M].北京:人民文学出版社,1994.
[8]隋树森.全元散曲[M].北京:中华书局,1964.
[9](清)彭定求等.全唐诗[M].郑州:中州古籍出版社,2008.
[10]唐圭璋.全宋词[M].北京:中华书局,2009.
[11]袁晖,李熙宗.汉语语体概论[M].北京:商务印书馆,2005.