刘彦
内容摘要:传统的诗歌研究也可以利用人文计算方法。从字频分析角度,对作家诗歌集的全部用字进行排比分析,得出其高频字。然后对这些高频字进行分析,进一步深入探索和研究诗歌的艺术特色。这是计算机技术与人文学科相结合的一种全新的研究方法。
关键词:人文计算 字频 江山 酬赠
人文计算是伴随计算机技术的发展和当今各学科之间互相渗透的趋势而兴起的一种全新的研究方法和手段。它主要依托数据库技术对人文学科的某些信息进行统计、描写,研究者在此基础上可以进一步深入分析和研究。传统的诗歌研究,也是可以利用人文计算方法的。
本文以南宋著名文人楼钥的近体诗为研究对象,从字频分析的角度,对其全部用字进行排比分析,进而探究其近体诗的创作特色。这里有一点需要说明,本文所说的字频,是指某汉字在某一语料中使用的次数,而非使用的频率。楼钥(1137-1213),字大防,号攻媿主人,鄞县(今浙江宁波)人,南宋隆兴元年(1163)进士。一生经历高宗、孝宗、光宗、宁宗四朝,是南宋名臣之一,官至参知政事。他是南宋全能型士大夫的典型代表,在学术、文章方面也有一定的成就,有《攻媿集》传世。
一、楼钥近体诗字频数据库的制作
数据库是进行研究的基础。一个理想的文献数据库,“起码应该具备全面、准确、有目标明确的分类这样三种品格”。全面是指数据库所包含的内容广而且全,这样可以避免研究中因为资料缺漏而产生失误。准确是理想文献数据库应该具有的最重要的品格,数据的精确度决定了数据库的可用性。数据库除了要求全面、准确外,还要有科学的分类,比如要研究清代小学,研究者可以从内容、作者等角度,建立清代文字学研究数据库、清代音韵学研究数据库、清代训诂学研究数据库,王念孙小学著作数据库等等分类数据库,这种分类数据库在研究中才具有实用价值。
要制作精良、可靠的数据库,第一步必须选择一个好的文献版本。古代典籍在流传过程中往往存在许多不同版本,各种版本的质量也有好坏优劣之分。版本的优劣直接影响着数据库的使用价值。据考,《攻媿集》版本主要有宋四明楼氏家刻本、文渊阁四库本、武英殿聚珍本及丛书集成本。宋本在清时已非完帙,四库本皆以宋本为源,但被四库馆臣删削甚多,文字多有异同。本文在制作楼钥近体诗字频数据库时,采用浙江古籍出版社出版的顾大朋点校本《楼钥集》做底本。这次点校本以宋四明楼氏家刻本《攻媿先生文集》为底本,校以文渊阁四库本、武英殿聚珍本及丛书集成本《攻媿集》。凡宋本缺佚者,悉据四库诸本补全;凡四库诸本删改重编者,悉据宋本次第,对于宋本缺佚无从校补者,悉据底本目录补入篇名,以期复宋本原貌。每卷后附有校记,且辑得散佚诗文十余篇汇成补遗一卷。由此可见,此点校本要优于其他众本,可以用作制作楼钥近体诗字频数据库的底本。
在制作字频数据库时,主要利用了word、excel等工具。第一步,先将《楼钥集》中的五卷近体诗录入word。第二步,将它们整理成一字一段的形式。可以利用查找、替换命令,在查找 内容框内输入任意字符“^?”,然后全部替换为“^&^13”。第三步,将整理好的内容全部复制粘贴至excel,然后选中A列进行升序排序。经过排序之后的A列,相同的字都排列到了一起。第四步,进行统计。在B1单元格中输入“1”,在B2单元格中输入公式“=if(a2=a1,b1+1,1)”,这个公式的含义是当后一个单元格和前一个单元格内容相同时,后一个单元格对应的b列中的数字加1,若不等,则为1。第五步,把每个字所对应的最大的数字挑出。在最大数字后的C列单元格中输入“=if(b3>=b4,”保留”,”不保留”)”,该公式的含义是,B列中,如果前一个单元格的数字大于或等于后一个单元格的数字,则保留该数字,若小于,则不保留。第六步,把C列中所有的”保留“提出,然后将A列、B列的内容复制到新的excel表中,进行降序排列。
经过上述步骤的操作,就可以把五卷近体诗中所有的单字及其使用次数统计出来。使用频次排名前十的字依次是:“不”,228次;“山”,221次;“一”,201次;“人”,175次;“来”,151次;“日”,141次;“老”,135次;“无”,134次;“风”,132次;“何”,128次。
二、楼钥近体诗创作特色
(一)以江山助诗兴。
从上述字频统计可知,在五卷近体诗的2839个单字中,“山”的使用频次排在第二位,达到221次,属于高频字。从山水类字频统计可知,“江”的使用频次为72次,紧跟“山”后。另外,“水”的使用频次为66次,“湖”的使用频次为37次,“海”的使用频次为36次。“山”和“江”的高频次使用说明楼钥在创作诗歌时,喜欢从壮美的自然中寻找灵感,用江山来助诗兴。
“江山助诗兴”的观点出自刘勰《文心雕龙·物色》。“然屈平所以能洞鉴《风》、《骚》之情者,抑亦江山之助乎!”刘勰认为屈原的诗歌能以风骚动人,原因就在于自然之美的渲染。也就是说文学创作离不开自然,从壮美的自然山水中寻找创作的灵感,才能写出富有生命力的诗句来。从其律诗看,楼钥是推崇这种观点的。如《谢陆伯业通判示淮西小藁》:“江山为助多佳句,莫惜南来寄断鸿。”《代仲舅尚书赋江山得助楼》:“眼明见此高突兀,骚人当得江山助。”《送王正言守永嘉》:“改辕却向个中去,更得江山助诗好。”《送王恭甫仓部知洋州》:“江山多助笔纵横,黼藻王度扶中兴。”正是这种文学主张,使得楼钥写了大量吟咏山水的名篇。“山”、“江”等字成为高频字也就不足为奇。
用“山”、“江”入诗,使得楼钥的近体诗呈现出一种雄壮磅礴的气势。如七绝《妙峰亭》:“一峰高出白云端,俯瞰天涯千万山。试向冈头转圆石,不知何日到人间。”首联写诗人站在峰顶,放眼俯瞰,群峰入云,景致壮美。第二联发出疑问:从峰顶滚落一个圆石,不知道什么时候才能滚到人间。用这种疑问、夸张的写法,衬托出山势之高。笔力雄浑,气骨强健。
(二)喜作酬赠之诗。
在人称类字频统计中,使用频次最高的是“人”,175次;其次是“君”,107次;第三是“子”,90次;第四是“我”,82次。“君”、“子”通常用来对别人的尊称,“我”为自言。在酬赠诗中,这些称谓的使用频率是非常高的。楼钥近体诗中,出现“人”、“君”、“子”、“我”的地方多为酬赠之诗。
交游酬唱是歴代诗人生活中不可或缺的一部分。诗人通过诗歌酬唱,交往联络,宴饮娱乐,切磋诗艺,交流思想。楼钥是南宋士大夫文人的典型代表,他一生交游广泛,其律诗中有大量的酬赠之诗,这些诗歌内容丰富。有和友人出游观赏的酬唱之篇,如《次韵蒋德言游太白玉几两山》:“少日游山不要归,老来腰脚不相宜。羡君胜具了无倦,踏雪寻幽更一奇。”有宴饮集会、践行的诗篇,如《次卢国华提刑所寄韵》:“持节归来上粉闱,只今一节又何之。乐天好句追长庆,元亮高风挹义熙。我恨别多仍会多,君虽去速岂来迟。闽山荔子熏晴昼,莫惜登临剩赋诗。”有和诗的次韵,如《刘德修右史去国示所和从父东溪及杨子直诗走笔次韵》:“阁下相期久,山中把酒稀。未能容我去,又复送君归。柱史宁终隐,威颜暂咫违。壮心谁与语,看剑一灯微。”还有赠诗,如《赠蜀二史》:“老我挂冠惭复弹,羡君登第遽休官。幸哉有子事尤美,专以为亲人更难。旧说三贤皆特操,今看二士倍荣观。同归犹及襄阳老,一舸清风廿四滩。”上所举四例诗歌中都出现了“君”字。
楼钥的酬赠诗贴近生活,情感饱满,情趣盎然。通过这些酬赠诗,我们可以窥见楼钥的日常生活和当时的社会风俗,能够使我们更好地了解楼钥其人。
本文利用人文计算的方法,制作了楼钥近体诗字频数据库,并通过分析考察字频表,对楼钥近体诗的创作特色进行了初探。通过对“山”、“水”、“君”、“我”等高频字的分析,得出了楼钥近体诗的两大特色,一是以江山助诗兴,二是喜作酬赠之诗。
参考文献
[1]李波.史记字频研究[M].北京:商务印书馆,2006年.
[2]王宁.计算机古籍字库的建立与汉字的理论研究[J].语言文字应用,1994,(1).
[3]覃勤.先秦古籍字频分析[J].语言研究,2005,(4).
[4]徐伯卿.从字频及其文化内涵看晚唐五代浙江词的创作特色[J].语言研究,2
010,(3).
[5]楼钥.楼钥集[M].浙江:浙江古籍出版社,2010年.
[6]周振甫.文心雕龙今译[M].北京:中华书局.2013年.
(作者单位:武汉大学文学院古籍研究所)