计量文体学在文本分析中的应用

2014-07-29 20:53郭丽萍
教育教学论坛 2014年19期
关键词:定量

摘要:区别于传统文体分析的主观性,计量文体学基于语料库的研究,以计量的方式定量地分析文本。本文通过展示计量文体学在判定作家文体风格、确定作品的作者身份、了解小说主题及情节发展和翻译研究中的应用,以突显计量文体学在文体分析中不可替代的作用。由于研究方法不够系统、研究体裁过于单一、计量软件有待升级等等原因,计量文体学还未受到广泛关注,但是作为与前沿科技相结合的一种新的文体研究方法,计量文体学必然会在文体研究中发挥巨大作用。

关键词:传统文体分析;计量文体学;定量;文体研究

中图分类号:G642.4 文献标志码:A 文章编号:1674-9324(2014)19-0179-02

文体学与计算机相结合产生了计量文体学,Leech和Short早就认为文体学需要统计这种定量分析来获得客观的分析结果,以支撑对文学语篇文体特征的主观判断(McEnery & Wilson,2006:117)。对文学语言特征的定量研究其实早在20世纪40年代就开始了。Enkvist也曾认定文体特征具有统计学原理。他认为文体标记在不同文本内出现的密度显著不同,这就是语言文体学被称为定量科学的原因(桂诗春,2005:133)。语料库是由从具有代表性的语言材料中随机抽样输入计算机的大量文本组成的。(杨惠中,2004)。Word Smith是一款计量文体学必备的、功能非常强大的语料库软件,由利物浦大学的Dr. Mike Scott开发,在计量文体学研究中发挥着重要作用。

计量文体学在文本分析中的应用及局限性如下:

1.判定作家文体风格。计量文体学基于语料库这方面的研究,量化出作品的词频、语序等,进而评定该作家的文体风格。例如,在研究Swift的散文时,就以Swift文章中联接词出现的频率与Addison、Johnson和Macaulay文章中联接词出现的频率加以比较:

Swift的文章使用联接词的频率最高,说明他的文章的逻辑性最强。那么“逻辑性”就是Swift这篇文章的文体特征(Milic,1991)。

Milic还对William Faulkner和Gertrude Stein作品中句子长度做了量化统计,发现Stein作品的平均句长是30个词,而Faulkner的平均句长达38个词,由此也可以比较出两人作品风格的差异(隋桂岚,2003)。

2.确定作品的作者身份。《红楼梦》前80回和后40回是否系曹雪芹一人所作,一直备受争议。研究人员将《红楼梦》前80回和后40回分别输入计算机,通过《红楼梦》前80回和后40回生成数据的对比、分析,最终判定《红楼梦》后40回非曹雪芹所作。又如,由于种种原因,起初无法判定《给一位年轻诗人的忠告信》作者的真实身份。研究人员将Swift与其他四位同时代作家作品中的语法结构进行量化对比,发现《给一位年轻诗人的忠告信》结构与Swift作品的结构特征相一致,最终判定该作品系Swift所作。

3.了解小说主题及情节发展。计量文体学通过使用Word Smith语料库检索软件中的wordlist和plotting功能对小说文本的情节进行统计分析。比如想了解小说《傲慢与偏见》的故事情节,首先可以通过对全篇小说keyword的总结,伊丽莎白和达西两人的名字在文中出现的频率最大,分别为596和374频次,由此可以得出小说的主人公是伊丽莎白和达西。另外,对于《傲慢与偏见》关键词的检索分析,对照作者自建语料库,可以做出《傲慢与偏见》的情节展示图,即所谓的plot mapping,可以更清晰地把握小说情节(王雁,2007)。

4.进行翻译研究。不同的译者有自己的翻译风格。通过计量文体分析,可以把握译文和译者的语言风格和模式,把握某种原语对译文模式的影响,以及不同译者对相似文本的不同处理风格(廖七一,2000)。想对比《红楼梦》霍译与杨译译文的学术性,文本分析软件自动将霍译译文分别与英语中的最常用2000词表和学术词表作对比,结果如下:①文本中分布的总词数=4357;②分布在最常用2000词表中的总词数=3622(83.13%);③分布在学术词表中的总词数=47(1.08%);④不属于述两个词表的总词数=688(15.79%)。而对杨译译本进行类似处理,得出的四项相关数据如下:①3602;②2952(81.95%);③29(0.81%);④62(17.24%)。由此,基本可以认为霍译译文比杨译译用词更学术化、更书面化(郑振隆,2009)。然而,迄今为止,计量文体学在文本分析中的应用还不太广泛,语料库的潜力尚未得到充分发挥,具体原因如下:①缺乏系统的研究。尽管计量文体学可以依据定量分析来以获得客观的分析结果,但现今这方面的研究人员偏少,对研究前景的探讨、方法论探讨缺乏系统化。②计量文体学现今的研究体裁比较单一。对小说体裁研究得多,而对散文、诗歌、戏剧、民间文学等其他文学体裁研究甚少。③对文本进行处理必须熟练掌握文本编码、文本分析软件等的使用,这一点也限制了一些研究者研究。④计量文体软件优势不是太明显,还有待于进一步开发,否则无法实现对文体的全方位、多角度的分析。

基于计量和统计的文体研究,使得文体研究和欣赏不仅仅局限于主观的理解,有助于人们更理性地分析文体作品。尽管计量文体学的进展还不尽如人意,但这正是我们探索和发现的空间。随着语料库技术的进步与计量文体软件的进一步开发,计量文体研究的优势势必将提升。随着人们对计量文体学的关注越来越高、研究体裁越来越广泛、研究方法越来越系统,计量文体学必将在文体研究中发挥重大的作用。

参考文献:

[1]McEnery,Tony & Andrew W.Corpus Linguistics.An Introduction[M].Edingburgh University Press,2006.

[2]Milic,L.Progress in stylistics:theory,statistics,computers[J].Computers and the Humanities,1991,(25):393-400.

[3]隋桂岚,孙利望.语料库、统计学与文体分析[J].辽宁工程技术大学学报(社会科学版),2003,(6).

[4]王雁.《傲慢与偏见》的语料库检索分析[J].江苏教育学院学报(社会科学版),2007,(2).

[5]郑振隆.基于语料库的《红楼梦》两个译本对比研究[J].文教资料,2009,(7).

[6]桂诗春,宁春岩.语言学研究方法[M].北京:外语教学与研究出版社,2005.

作者简介:郭丽萍(1989-),女,河南省南阳市人,现为郑州大学外语学院2012级硕士研究生,主要研究方向为翻译理论与实践。endprint

摘要:区别于传统文体分析的主观性,计量文体学基于语料库的研究,以计量的方式定量地分析文本。本文通过展示计量文体学在判定作家文体风格、确定作品的作者身份、了解小说主题及情节发展和翻译研究中的应用,以突显计量文体学在文体分析中不可替代的作用。由于研究方法不够系统、研究体裁过于单一、计量软件有待升级等等原因,计量文体学还未受到广泛关注,但是作为与前沿科技相结合的一种新的文体研究方法,计量文体学必然会在文体研究中发挥巨大作用。

关键词:传统文体分析;计量文体学;定量;文体研究

中图分类号:G642.4 文献标志码:A 文章编号:1674-9324(2014)19-0179-02

文体学与计算机相结合产生了计量文体学,Leech和Short早就认为文体学需要统计这种定量分析来获得客观的分析结果,以支撑对文学语篇文体特征的主观判断(McEnery & Wilson,2006:117)。对文学语言特征的定量研究其实早在20世纪40年代就开始了。Enkvist也曾认定文体特征具有统计学原理。他认为文体标记在不同文本内出现的密度显著不同,这就是语言文体学被称为定量科学的原因(桂诗春,2005:133)。语料库是由从具有代表性的语言材料中随机抽样输入计算机的大量文本组成的。(杨惠中,2004)。Word Smith是一款计量文体学必备的、功能非常强大的语料库软件,由利物浦大学的Dr. Mike Scott开发,在计量文体学研究中发挥着重要作用。

计量文体学在文本分析中的应用及局限性如下:

1.判定作家文体风格。计量文体学基于语料库这方面的研究,量化出作品的词频、语序等,进而评定该作家的文体风格。例如,在研究Swift的散文时,就以Swift文章中联接词出现的频率与Addison、Johnson和Macaulay文章中联接词出现的频率加以比较:

Swift的文章使用联接词的频率最高,说明他的文章的逻辑性最强。那么“逻辑性”就是Swift这篇文章的文体特征(Milic,1991)。

Milic还对William Faulkner和Gertrude Stein作品中句子长度做了量化统计,发现Stein作品的平均句长是30个词,而Faulkner的平均句长达38个词,由此也可以比较出两人作品风格的差异(隋桂岚,2003)。

2.确定作品的作者身份。《红楼梦》前80回和后40回是否系曹雪芹一人所作,一直备受争议。研究人员将《红楼梦》前80回和后40回分别输入计算机,通过《红楼梦》前80回和后40回生成数据的对比、分析,最终判定《红楼梦》后40回非曹雪芹所作。又如,由于种种原因,起初无法判定《给一位年轻诗人的忠告信》作者的真实身份。研究人员将Swift与其他四位同时代作家作品中的语法结构进行量化对比,发现《给一位年轻诗人的忠告信》结构与Swift作品的结构特征相一致,最终判定该作品系Swift所作。

3.了解小说主题及情节发展。计量文体学通过使用Word Smith语料库检索软件中的wordlist和plotting功能对小说文本的情节进行统计分析。比如想了解小说《傲慢与偏见》的故事情节,首先可以通过对全篇小说keyword的总结,伊丽莎白和达西两人的名字在文中出现的频率最大,分别为596和374频次,由此可以得出小说的主人公是伊丽莎白和达西。另外,对于《傲慢与偏见》关键词的检索分析,对照作者自建语料库,可以做出《傲慢与偏见》的情节展示图,即所谓的plot mapping,可以更清晰地把握小说情节(王雁,2007)。

4.进行翻译研究。不同的译者有自己的翻译风格。通过计量文体分析,可以把握译文和译者的语言风格和模式,把握某种原语对译文模式的影响,以及不同译者对相似文本的不同处理风格(廖七一,2000)。想对比《红楼梦》霍译与杨译译文的学术性,文本分析软件自动将霍译译文分别与英语中的最常用2000词表和学术词表作对比,结果如下:①文本中分布的总词数=4357;②分布在最常用2000词表中的总词数=3622(83.13%);③分布在学术词表中的总词数=47(1.08%);④不属于述两个词表的总词数=688(15.79%)。而对杨译译本进行类似处理,得出的四项相关数据如下:①3602;②2952(81.95%);③29(0.81%);④62(17.24%)。由此,基本可以认为霍译译文比杨译译用词更学术化、更书面化(郑振隆,2009)。然而,迄今为止,计量文体学在文本分析中的应用还不太广泛,语料库的潜力尚未得到充分发挥,具体原因如下:①缺乏系统的研究。尽管计量文体学可以依据定量分析来以获得客观的分析结果,但现今这方面的研究人员偏少,对研究前景的探讨、方法论探讨缺乏系统化。②计量文体学现今的研究体裁比较单一。对小说体裁研究得多,而对散文、诗歌、戏剧、民间文学等其他文学体裁研究甚少。③对文本进行处理必须熟练掌握文本编码、文本分析软件等的使用,这一点也限制了一些研究者研究。④计量文体软件优势不是太明显,还有待于进一步开发,否则无法实现对文体的全方位、多角度的分析。

基于计量和统计的文体研究,使得文体研究和欣赏不仅仅局限于主观的理解,有助于人们更理性地分析文体作品。尽管计量文体学的进展还不尽如人意,但这正是我们探索和发现的空间。随着语料库技术的进步与计量文体软件的进一步开发,计量文体研究的优势势必将提升。随着人们对计量文体学的关注越来越高、研究体裁越来越广泛、研究方法越来越系统,计量文体学必将在文体研究中发挥重大的作用。

参考文献:

[1]McEnery,Tony & Andrew W.Corpus Linguistics.An Introduction[M].Edingburgh University Press,2006.

[2]Milic,L.Progress in stylistics:theory,statistics,computers[J].Computers and the Humanities,1991,(25):393-400.

[3]隋桂岚,孙利望.语料库、统计学与文体分析[J].辽宁工程技术大学学报(社会科学版),2003,(6).

[4]王雁.《傲慢与偏见》的语料库检索分析[J].江苏教育学院学报(社会科学版),2007,(2).

[5]郑振隆.基于语料库的《红楼梦》两个译本对比研究[J].文教资料,2009,(7).

[6]桂诗春,宁春岩.语言学研究方法[M].北京:外语教学与研究出版社,2005.

作者简介:郭丽萍(1989-),女,河南省南阳市人,现为郑州大学外语学院2012级硕士研究生,主要研究方向为翻译理论与实践。endprint

摘要:区别于传统文体分析的主观性,计量文体学基于语料库的研究,以计量的方式定量地分析文本。本文通过展示计量文体学在判定作家文体风格、确定作品的作者身份、了解小说主题及情节发展和翻译研究中的应用,以突显计量文体学在文体分析中不可替代的作用。由于研究方法不够系统、研究体裁过于单一、计量软件有待升级等等原因,计量文体学还未受到广泛关注,但是作为与前沿科技相结合的一种新的文体研究方法,计量文体学必然会在文体研究中发挥巨大作用。

关键词:传统文体分析;计量文体学;定量;文体研究

中图分类号:G642.4 文献标志码:A 文章编号:1674-9324(2014)19-0179-02

文体学与计算机相结合产生了计量文体学,Leech和Short早就认为文体学需要统计这种定量分析来获得客观的分析结果,以支撑对文学语篇文体特征的主观判断(McEnery & Wilson,2006:117)。对文学语言特征的定量研究其实早在20世纪40年代就开始了。Enkvist也曾认定文体特征具有统计学原理。他认为文体标记在不同文本内出现的密度显著不同,这就是语言文体学被称为定量科学的原因(桂诗春,2005:133)。语料库是由从具有代表性的语言材料中随机抽样输入计算机的大量文本组成的。(杨惠中,2004)。Word Smith是一款计量文体学必备的、功能非常强大的语料库软件,由利物浦大学的Dr. Mike Scott开发,在计量文体学研究中发挥着重要作用。

计量文体学在文本分析中的应用及局限性如下:

1.判定作家文体风格。计量文体学基于语料库这方面的研究,量化出作品的词频、语序等,进而评定该作家的文体风格。例如,在研究Swift的散文时,就以Swift文章中联接词出现的频率与Addison、Johnson和Macaulay文章中联接词出现的频率加以比较:

Swift的文章使用联接词的频率最高,说明他的文章的逻辑性最强。那么“逻辑性”就是Swift这篇文章的文体特征(Milic,1991)。

Milic还对William Faulkner和Gertrude Stein作品中句子长度做了量化统计,发现Stein作品的平均句长是30个词,而Faulkner的平均句长达38个词,由此也可以比较出两人作品风格的差异(隋桂岚,2003)。

2.确定作品的作者身份。《红楼梦》前80回和后40回是否系曹雪芹一人所作,一直备受争议。研究人员将《红楼梦》前80回和后40回分别输入计算机,通过《红楼梦》前80回和后40回生成数据的对比、分析,最终判定《红楼梦》后40回非曹雪芹所作。又如,由于种种原因,起初无法判定《给一位年轻诗人的忠告信》作者的真实身份。研究人员将Swift与其他四位同时代作家作品中的语法结构进行量化对比,发现《给一位年轻诗人的忠告信》结构与Swift作品的结构特征相一致,最终判定该作品系Swift所作。

3.了解小说主题及情节发展。计量文体学通过使用Word Smith语料库检索软件中的wordlist和plotting功能对小说文本的情节进行统计分析。比如想了解小说《傲慢与偏见》的故事情节,首先可以通过对全篇小说keyword的总结,伊丽莎白和达西两人的名字在文中出现的频率最大,分别为596和374频次,由此可以得出小说的主人公是伊丽莎白和达西。另外,对于《傲慢与偏见》关键词的检索分析,对照作者自建语料库,可以做出《傲慢与偏见》的情节展示图,即所谓的plot mapping,可以更清晰地把握小说情节(王雁,2007)。

4.进行翻译研究。不同的译者有自己的翻译风格。通过计量文体分析,可以把握译文和译者的语言风格和模式,把握某种原语对译文模式的影响,以及不同译者对相似文本的不同处理风格(廖七一,2000)。想对比《红楼梦》霍译与杨译译文的学术性,文本分析软件自动将霍译译文分别与英语中的最常用2000词表和学术词表作对比,结果如下:①文本中分布的总词数=4357;②分布在最常用2000词表中的总词数=3622(83.13%);③分布在学术词表中的总词数=47(1.08%);④不属于述两个词表的总词数=688(15.79%)。而对杨译译本进行类似处理,得出的四项相关数据如下:①3602;②2952(81.95%);③29(0.81%);④62(17.24%)。由此,基本可以认为霍译译文比杨译译用词更学术化、更书面化(郑振隆,2009)。然而,迄今为止,计量文体学在文本分析中的应用还不太广泛,语料库的潜力尚未得到充分发挥,具体原因如下:①缺乏系统的研究。尽管计量文体学可以依据定量分析来以获得客观的分析结果,但现今这方面的研究人员偏少,对研究前景的探讨、方法论探讨缺乏系统化。②计量文体学现今的研究体裁比较单一。对小说体裁研究得多,而对散文、诗歌、戏剧、民间文学等其他文学体裁研究甚少。③对文本进行处理必须熟练掌握文本编码、文本分析软件等的使用,这一点也限制了一些研究者研究。④计量文体软件优势不是太明显,还有待于进一步开发,否则无法实现对文体的全方位、多角度的分析。

基于计量和统计的文体研究,使得文体研究和欣赏不仅仅局限于主观的理解,有助于人们更理性地分析文体作品。尽管计量文体学的进展还不尽如人意,但这正是我们探索和发现的空间。随着语料库技术的进步与计量文体软件的进一步开发,计量文体研究的优势势必将提升。随着人们对计量文体学的关注越来越高、研究体裁越来越广泛、研究方法越来越系统,计量文体学必将在文体研究中发挥重大的作用。

参考文献:

[1]McEnery,Tony & Andrew W.Corpus Linguistics.An Introduction[M].Edingburgh University Press,2006.

[2]Milic,L.Progress in stylistics:theory,statistics,computers[J].Computers and the Humanities,1991,(25):393-400.

[3]隋桂岚,孙利望.语料库、统计学与文体分析[J].辽宁工程技术大学学报(社会科学版),2003,(6).

[4]王雁.《傲慢与偏见》的语料库检索分析[J].江苏教育学院学报(社会科学版),2007,(2).

[5]郑振隆.基于语料库的《红楼梦》两个译本对比研究[J].文教资料,2009,(7).

[6]桂诗春,宁春岩.语言学研究方法[M].北京:外语教学与研究出版社,2005.

作者简介:郭丽萍(1989-),女,河南省南阳市人,现为郑州大学外语学院2012级硕士研究生,主要研究方向为翻译理论与实践。endprint

猜你喜欢
定量
多重荧光定量PCR法同时定量检测4种混合熟肉种源
显微定量法鉴别林下山参和园参
当归和欧当归的定性与定量鉴别
基于力控制的机器人磨抛定量去除研究
10 种中药制剂中柴胡的定量测定
自动包装机定量功能设计与实现
宋代草市镇研究中的定性与定量
慢性HBV感染不同状态下HBsAg定量的临床意义
金嗓子喉片GC/MS快速定性定量测定
鸭肝组织中DHBV cccDNA的实时荧光定量PCR方法的建立