基于主成分分析的文言虚词对文风的影响

2014-04-29 15:45刘桐辛
课程教育研究 2014年4期
关键词:文风主成分分析影响

【摘要】本文结合唐宋八大家的散文名篇,在18个常用文言虚词中选取其中最为显著的8个虚词,通过主成分分析的相关方法,运用SPSS软件进行分析,以定量分析思想为手段,讨论文言虚词对不同作者之间文章风格的影响,从而提出一种研究古文词类与文风关系的新方法。

【关键词】文言虚词 主成分分析 文风 影响

【中图分类号】G633.3 【文献标识码】A 【文章编号】2095-3089(2014)04-0043-02

0.引言

文言文的一大特点就是虚词繁多,对作者的行文风格有很大影响。而作者对虚词的使用也侧面反映了作者的写作习惯。所谓虚词,是指那些词汇意义比较抽象,但却能组织实词完成句子结构的词类[1]。虚词是不能独立成句的,只有配合实词使用才能完成语法结构。虚词对实词有协助作用,主要的作用是组合语言单位。虚词一般包含代、介、连、助、副、语气六大类。

现有文献对虚词的研究主要停留在其词性辨析、语法作用、断句作用[2][3],很少有研究虚词对文风影响的。本文即从主成分分析方法出发,运用多元统计数据的定量分析手段,选取唐宋八大家韩、柳、欧、洵、轼、辙、曾、王的散文名篇,统计虚词出现的次数,运用SPSS分析软件,对数据进行处理和分析,并从数据处理结果中分析虚词对文风的影响程度。

1.数据收集

定量分析是建立在数据基础之上的。只有获取了大量数据,才有分析的对象,并应用定量分析方法加以处理,再结合定性研究得出结论。本文的数据筛选较为困难,具体操作如下。

首先,选取18个常用虚词:而、乎、其、且、然、所、为、焉、也、以、矣、因、于、与、哉、则、者、之[4]。

其次,选取唐宋八大家各两篇散文。选取的文章分别是:韩愈《师说》《圬者王承福传》[5],柳宗元《捕蛇者说》《种树郭橐驼传》[6],欧阳修《醉翁亭记》《朋党论》[7],苏洵《仲兄字文甫说》《六国论》[8],苏轼《石钟山记》《超然台记》[9],苏辙《黄州快哉亭记》《上枢密韩太尉书》[10],曾巩《筠州学记》《醒心亭记》[11],王安石《游褒禅山记》《桂州新城记》[12]。

再次,统计所选定的虚词出现的次数,以及每篇的字数。按照每1000字出现的虚词次数进行统计,所得原始数据见表1。

接着,选取出现频数最高的8个虚词:所、为、之、其、而、以、者、也,作为研究、分析的最终对象。同时,也进一步分析了所选八个虚词的词性,词性示意图如下图1。从中可以看出,所选虚词对应的词性种类是较为均衡的。

收集好所需数据后,就可以运用主成分分析法,并借助SPSS软件进行数据处理。但是,在此之前有必要对主成分分析法做简单的介绍。

2.主成分分析法(Principal Component Analysis, PCA)

主成分分析法也称主分量分析或矩阵数据分析,主要通过变量变换的方法把相关的变量转化为若干不相关的综合性指标变量[13]。

若某研究对象有两项指标ζ1和ζ2,从总体ζ(ζ1,ζ2)中抽取了N个样品,它们散布在椭圆平面内,如图2所示,指标ζ1与ζ2具有相关性。η1和η2分别是椭圆的长轴和短轴,显然η1⊥η2。因此η1与η2互不相关。其中η1是点ζ(ζ1,ζ2)在长轴上的投影坐标,η2是该点在短轴上的投影坐标。

从图2可以看出点的N个观测值的波动大部分可以归结为η1轴上投影点的波动,而η2轴上投影点的波动较小。若η1作为一个综合指标,则η1可较好地反映出N个观测值的变化情况,η2的作用次要。综合指标η1称为主成分,找出主成分的工作称为主成份分析[14]。

可见,主成分分析即选择恰当的投影方向,将高维空间的点投影到低维空间上,且使低维空间上的投影尽可能多的保存原空间的信息,就是要使低维空间上投影的方差尽可能的大[15]。

主成分分析法是一种实用的多元统计分析方法,能够将大量、繁杂的原始指标、数据简化为少量的综合指标,同时使这少量指标尽可能地包含原指标群中的信息资料。这些综合指标能够在简化分析难度的同时,也能较好地反映各样本之间的主要差别,而且在统计意义上是相互独立[16]的。正是基于此,本文在众多定量分析方法中选用了主成分分析法对文言虚词的使用对文章风格的影响。

3.数据处理与分析

在做好上述准备后,便可以通过SPSS软件进行分析,本文所得结果,均运用的是SPSS21.0版本。

首先,需要对八个虚词的原始数据进行标准化,使得各虚词之间具有可比性,样本数据也能够满足主成分分析要求。然后,用SPSS21.0开始主成分分析,得到了各虚词间的相关系数矩阵,如下表2。

表2虚词相关系数矩阵

由表2可以看出,各虚词之间的相关系数都比较大,是适合采用主成分分析法来研究各个虚词之间的关系的。因此,可进一步求得相关系数矩阵的特征值和主成分的方差贡献率,详见表3。

其次,通过方差贡献率选择主成分个数。主成分分析规定主成分的特征值大于1,表中共有3个,分别用F1、F2和F3表示。三个主成分的累计贡献率已达82.817%,能够较好地综合各个虚词的信息,并准确地反映各虚词对文风的影响。

然后,通过成分矩阵建立线性组合方程,从而求得三个主成分的得分计算表达式,各虚词的系数见下表4所示。如果以符号X1、X2、X3、X4、X5、X6、X7、X8分别表示“所、为、之、其、而、以、者、也”八個虚词,则主成分得分表达式记为:

F1=-0.807X1+0.300X2-0.725X3-0.268X4+0.868X5-0.565X6+0.711X7+0.646X8

F2=0.327X1+0.740X2+0.519X3+0.506X4-0.286X5-0.106X6+0.547X7+0.547X8

F3=-0.362X1-0.512X2+0.015X3+0.778X4+0.152X5+0.540X6+0.323X7+0.037X8

上述方程组又称变量回归方程组,是各个变量对主成分的线性回归。根据回归方程组,并结合图3,可以明显地看出,第一主成分F1在而、者、也三个虚词上有较大的载荷系数,即有相关性;第二主成分F2在为、之、其、者、也上有较大的载荷系数;第三主成分F3在其、以、者上具有较大的载荷系数。将八个虚词标准化后的数据带入回归方程,可以求出每个主成分的得分,见表4。

最后,根据求得的主成分的变量回归方程组,及三个主成分所占的贡献率,可以建立综合得分方程,以此来反映虚词对文章的影响大小,方程如下:

F=0.4691F1+0.23395F2+0.17732F3

建立上述方程后,将各个主成分的得分代入,即可求得虚词对唐宋八大家文风影响的综合得分,从而反映出虚词对八大家文风影响的不同程度,并进行了排序。最终结果见表4。

表4成分矩阵及虚词影响得分表

4.结论

在文言文中,虚词的作用十分重要,用以构成文句,工整文意。文言虚词在承担起词性辨析、语法作用、断句作用的同时,还具有调节语言节奏、延音加力的作用[17]。但是每个虚词在发挥作用时,都有不同侧重。文言虚词的作用总和对文风产生了重要影响,从而反映了作者的写作风格,而研究文言虚词对文风的影响也才有了意义。

在本文对唐宋八大家的作品进行虚词影响排名,其和他们的座次排名也有相关性。虚词排名中,韩、柳、欧为第一梯次,洵、轼、王为第二梯次,辙、曾为第三梯次。而在座次排名中,以茅坤排定的“韩柳欧洵轼辙曾王”最为稳定,但稳定中有变化,除了欧阳修坐稳了第三把交椅外,其余七人的座次都有一定变化,王、辙、曾都被选排在末位[18]。从座次稳定性而言,虚词影响排名越高,其座次排名就越稳定。两种排名的第一梯次是完全相同的,第二梯次与第三梯次仅只有王安石与苏辙有所变动。而排座次是轩轾八家的一种手段,因此就可以从虚词影响排名中分析八人的文风高低了。

唐宋八大家与古文运动紧密相连。古文运动是一场持续的文体解放运动,即以“文从字顺”、平易晓畅的新体散文来替代魏晋以来浮华艳丽的骈体文[19]。但是,韩柳却失之“词必己出”“唯陈言之务去”,文风不免雄奇深峻了,而体现在虚词上就使用较少。因为虚词的作用在于舒缓语气、调节语音。正好,苏洵、王安石的文风与之类似,都是雄力峻健、文风峭厉,所以虚词影响排名紧跟韩柳之后。欧阳修为北宋文宗,使得散文趋于平易,不喜“险怪奇涩”“一反怪僻古奥而代之以平易畅达”,文风优游不尽、平易晓畅,既有阳刚的风格,又有阴柔的风格[20]。这正是欧阳修使用虚词较多的原因,故而在文中虚词影响最大,排名第一。也难怪祝允明在《罪知录》中说,欧文“助词累倍,乎、而亹亹,之、也纷纷”。至于苏轼、苏辙、曾巩的文风与其虚词影响也可以同样分析,这里就不一一赘述。

综上可见,虚词的使用,不尽反映了作者的用词习惯,同时也对文章风格产生了重要影响。如何度量虚词对文风的影响及其程度,就可以通过本文所述方法,收集数据,运用主成分分析法,量化各个因素影响度,结合因素的定性分析,建立起对文风的综合评价体系。本文所提方法,流程清楚,简便易行,并且便于拓展。此方法不特是分析虚词对文风的影响,也可以拓展至其他因素对文风的影响分析,甚至是类似的需要定量分析为依据的定性分析工作。本文关于虚词对文风影响的分析结果,与实际情况和已有研究成果都能很好的吻合,证明将主成分分析法引入这方面的研究之中是完全可行的,正是:

虚词妙用难穷本,悟晓真知可为文;

今日抛出主成分,以后开拓待来人。

参考文献:

[1]何乐士等文言虚词浅释[M].北京:北京出版社,1980.3.

[2]李敬.浅谈文言虚词在文中的作用[J].课程教育研究(新教师教学),2013,(5):223.

[3]杨丰收,李建云.我国古汉语文言虚词对断句的作用[J].科技咨询导报,2007,(27):186.

[4]教育部.高中语文教学大纲(试验修订版)[S].

[5]韩愈.韩愈集(修订版).山西:山西古藉出版社,2008.06.

[6]柳宗元.柳河东集.上海:上海古籍出版社,2008.

[7]欧阳修.欧阳修全集.李逸安点校.北京:中华书局,2001.

[8]苏洵原著,金成礼笺注.嘉祐集笺注.上海:上海古籍出版社,1993.

[9]苏轼.苏轼集.山西:山西古藉出版社,2008.08.

[10]蘇辙.栾城集.上海:上海古籍出版社,2009.10.

[11]李俊标注译.曾巩集.河南:中州古籍出版社,2010.6.

[12]李之亮注译.王安石集.河南:中州古籍出版社,2010.5.

[13]汪应洛.系统工程[M].第4版.北京:机械工业出版社,2011.54-60.

[14]方开泰.实用多元统计分析[M].上海:华东师范大出版社,1989.291-302.

[15]王学仁,王松桂.实用多元统计分析[M].上海:上海科技出版社,1990.270-272.

[16]黄润龙主编.数据统计与分析技术SPSS软件实用教程.北京:高等教育出版社,2004.06.

[17]雷淑娟.文言虚词的语音修辞功能[J].修辞学习,2003,(6):10-11.

[18]付琼.唐宋八大家座次考论——以三十四种唐宋八大家选本为据[J].贵州社会科学,2012,(6).

[19]金诤.谈唐宋八大家的文风[J].文史杂志,1993,(5).

[20]周楚汉.唐宋八大家文章论[J].江汉论坛,2001,(7):90-94.

作者简介:

刘桐辛,男,1993年生,重庆涪陵人,东南大学机械工程学院本科生,工业工程系。

猜你喜欢
文风主成分分析影响
河下:文风厚重的“进士之乡”
是什么影响了滑动摩擦力的大小
普枞公路的文风和文脉
没错,痛经有时也会影响怀孕
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
扩链剂联用对PETG扩链反应与流变性能的影响
基于Simulink的跟踪干扰对跳频通信的影响
对电视新闻节目“改文风”的几点思考