科学计量学视野下的《傲慢与偏见》研究
——一个案例性的探究

2013-10-21 07:25程永艳汤建民
浙江科技学院学报 2013年2期
关键词:计量学奥斯丁傲慢与偏见

程永艳,汤建民

(1.浙江科技学院 语言文学学院,杭州 310023;2.浙江树人大学 科学计量学研究中心,杭州 310015)

科学计量学视野下的《傲慢与偏见》研究
——一个案例性的探究

程永艳1,汤建民2

(1.浙江科技学院 语言文学学院,杭州 310023;2.浙江树人大学 科学计量学研究中心,杭州 310015)

选择1998—2009年中国学术期刊网收录的关于《傲慢与偏见》研究的458篇论文,尝试运用词频、共词、社会网络分析及信息可视化等科学计量学方法,对国内十多年来《傲慢与偏见》的研究现状、研究主题、研究力量分布、研究水平及整体概况和特征等进行了计量分析和可视化识别,对国内该文学研究领域的各方面状况做了一个比较客观而系统的描绘与判断,发现了一些用其他研究方法难以发现的问题。同时,作为一种新的研究方法的探索性尝试,初步探讨了该方法在文学研究领域使用的可能性和前景,以及应注意的若干问题。

《傲慢与偏见》;简·奥斯丁;科学计量学;共词分析;社会网络分析;信息可视化

作为在2007年3月1日世界图书日调查中位居英国人“生命中不可或缺”的百部著作之首,并且在英国被列为最畅销的长销书之一的英国19世纪著名女作家简·奥斯丁(Jane Austen,1775—1817)的小说《傲慢与偏见》[1],在中国学界同样备受关注。从1998年至今,仅在中国学术期刊网收录的文章就有450多篇,这些文章用不同的文学评论方法,从不同的角度,不同的视野,对《傲慢与偏见》进行了较为深入的探讨。中国学术期刊网的数据还显示,从2006年开始,国内对《傲慢与偏见》的研究文章增量迅猛,呈现出强劲的上升趋势。那么,在这十多年来,国内对《傲慢与偏见》的研究主要触及了哪些研究主题及领域?其主要研究力量的分布状况、研究水平及整体概况如何?对这些研究现状的探讨应该是相关学者和研究机构所普遍关心的问题,但经中国学术期刊网文献检索查阅,国内在这方面的研究论文竟呈空白状态!通过更大范围的文献检索进一步发现,国内从宏观层面对诸如某个文学研究领域的研究现状进行全面、深入、客观的研究和评价的文献少之又少,尤其是从定量、实证角度来分析和评价的研究文献就更为鲜见。可以说目前文学研究界还普遍缺乏这样一种意识,即用定量的方法对某个文学研究领域的整体状况做出比较客观和系统的描绘与判断。因此,为对目前国内《傲慢与偏见》研究的现状进行必要的梳理、总结与反思,本研究拟利用先进的计算机数据挖掘技术,从科学计量学的角度,综合运用词频分析、共词分析、社会网络分析及信息可视化等方法,对国内十多年来在此方面的研究进行计量分析,侧重于揭示其研究的产出模式及研究主题结构,以期较全面地展示目前国内对该作品的研究状况。同时,也藉此在文学研究领域引进一种新的研究方法——以词频统计和知识图谱方法为核心的科学计量方式,并以此来探讨引进其他学科的研究方法进行全新视角的交叉学科、跨学科文学研究的可能性及前景。目前,这些研究方法已应用于其他很多学科[2-3]。

1 研究方法与数据收集

1.1 研究方法

本研究的基本方法为:利用先进的计算机数据挖掘技术,综合运用词频分析、共词分析、社会网络分析、信息可视化等科学计量学方法,对论文研究主题的分布,论文发表的年代及作者、机构与期刊分布等进行计量分析和可视化识别。本研究主要采用了Execl词频统计法、共词分析法和社会网络分析法等方法[4]。

1.1.1 共词分析法

共词分析法(co-word analysis)是当今科学计量学、文献计量学的最重要工具之一。其基本原理是:若两个能表达某一学科领域研究状况的专业术语在同一文献中出现,则表明这两个专业术语之间必然存在着一种内在的关系,且出现频次愈高就表明它们之间的关系愈密切,或者说愈相似。这种专业术语可以是论文的作者、关键词,也可以是作者的机构或期刊名等。

1.1.2 社会网络分析

社会网络分析(social network analysis)广泛应用于工业工程、社会行为科学、经济学和营销学中。将它用于文献计量学研究,则可通过社会网络分析中的中心性、中介性和K核等概念,找出具有重要地位的论著、作者、机构或关键词之间的交互关系,发现其结构和特征等。本研究社会网络分析软件采用netdraw[4]。

1.2 数据收集

本研究的数据采集方法为:选择中国学术期刊网全文数据库,在“关键词”和“篇名”栏中输入 “傲慢与偏见”。匹配选择“精确”;时间选择1998—2009年,然后剔除其中不属于规范的研究性质的文章,并对个别词汇的用法进行了适当的统一,如将“奥斯汀”统一调整为“奥斯丁”等,最后得到458篇相关论文的信息,内容包括论文的题名、作者、机构、关键词、发表期刊、发表时间等(本研究数据收集时间为2010年5月15日)。

2 研究结果

2.1 研究的产出模式

2.1.1 论文总量分析

图1 1998—2009年间发表的研究论文数Fig.1 Total amount of research papers during 1998—2009

1998—2009年中国学术期刊网收录的论文总数为458篇,历年的论文数参见图1。

图1数据表明,国内对《傲慢与偏见》的研究在2006年前一直比较平稳,除了2004年忽增至34篇外,其余年份基本保持在每年10~20篇之间;从2006年开始,论文数量呈现大幅度上升趋势,后三年年均论文发表量保持在80~100篇之间。由此可见,学术界对《傲慢与偏见》的研究呈趋热状态。

2.1.2 所发表的期刊分布

统计显示,458篇论文分布在291种期刊中,其中发表1篇的期刊有220种,发表2篇的期刊有44种,发表3篇的期刊有9种,发表4篇的期刊有5种,发表5篇及以上的期刊共有12 种(表1)。

表1 发表5篇及以上论文的期刊Table 1 Academic journals that published more than 5 research papers

对发表论文最多的前12种期刊的来源做一个统计分析,发现主要有四类期刊:

第一类是科技教育类学术期刊。如《科技信息(学术研究)》《文教资料》《科教文汇(中旬刊)》等,其中《科技信息(学术研究)》更是以发表14篇论文高居榜首。文学类研究论文居然更多地在科技教育类学术期刊中被发表,这实在是一个值得关注的奇怪现象。究其原因,这可能和可供文学类研究论文发表的论文期刊相对较少,而每年因为各种原因 (如有的是确有研究心得,有的是为了评职称,有的是为了获得毕业证书,有的是为了完成科研工作任务等) 而产出的众多论文又必须找到一个出口有关。不难想象,这些论文往往质量不高。

第二类是文学和文学研究类期刊。如《安徽文学(下半月)》《时代文学(理论学术版)》《名作欣赏》《外国文学研究》等。估计这和一些以前的纯文学期刊为了求生存和发展现在基本都设有文学学术研究类版面有关,这样做的结果是解决了一部分文学研究类论文的出路。这里值得一提的是,国内的外国文学研究核心期刊《外国文学研究》,也以发表论文总数5篇列在前12位,可见国内的外国文学研究领域对奥斯丁作品的研究也十分关注。不过令人遗憾的是,进一步的查询发现,发表在《外国文学研究》的研究论文,均为2004年以前,近几年则再没有关于《傲慢与偏见》研究的论文在此刊物上被发表。笔者推测,这和近些年来虽然关于作品研究的论文数量上升很快,但其论文质量不高,并且在研究内容和方法上没有新的突破不无关系。

第三类是大学学报类期刊。如《赤峰学院学报(汉文哲学社会科学版)》《和田师范专科学校学报》《牡丹江大学学报》等,这些处于偏远省份的高等院校学报为什么会成为很多研究者发表该类论文的优先选择?或许还有一些值得进一步思考和分析的因素。

第四类是影视类期刊。如《电影评价》《电影文学》等。《傲慢与偏见》的研究论文被较多地发表在影视类期刊应该说不会让人感到奇怪,因为自从1940年美国好莱坞的米高梅公司首次把《傲慢与偏见》改编成电影作品以来,奥斯丁的每部作品都被改编成电影,并不断地被重拍。而每次电影的热映,又反过来促进了文学作品的流传,并引起了更多人的关注。因此,《傲慢与偏见》的研究同样被影视类期刊所青睐。

2.1.3 作者数量的统计

统计论文第一作者,数据显示共有第一作者393位,其中发表1篇论文的作者有348位,2篇论文的作者有37位,3篇论文的作者有6位,4篇论文的作者有2位。这表明,从整体上看,研究《傲慢与偏见》的队伍较庞大,但考虑到又有88.5 %的作者只发表了一篇研究论文,可见《傲慢与偏见》虽引起研究者广泛注意,但对其进行长期研究的并不多。进一步的查询显示,发表相关研究4篇论文的两位高产作者分别是泉州师范学院的林文琛教授和河北经贸大学的秦岚讲师。林文琛教授早在20世纪80年代就开始研究奥斯丁作品,撰写了一系列奥斯丁作品研究的论文,其中共有8篇在研究外国文学的核心刊物《外国文学评论》和《外国文学研究》上发表,在国内外同行中产生了较大影响;而秦岚从2007年开始发表研究奥斯丁作品的论文,三年间发表了4篇,可谓是新生代研究者。再从作者的身份看,他们基本上都是各高等院校外语学院的英语教师,可见在高校外语教师中奥斯丁的作品拥有极高的关注度。而从作者的性别看,则又发现以女性教师居多。

2.1.4 作者所在单位的分布

对论文第一作者的所在单位进行统计,可以得到各单位的论文产出量。湖南师范大学以7篇位居第一,泉州师范学院以6篇位居第二,安徽大学、广东外语艺术职业学院、河西学院、华中师范大学、解放军外国语学院、四川大学各以5篇并列第三,安阳师范学院、河北经贸大学、南京师范大学各以4篇排列其后。从发表论文数列国内较前面的这些单位可看出,关注奥斯丁《傲慢与偏见》的主要是各师范类、外语类和拥有外国文学学科的相关院校。

2.2 关键词统计和论文的主题分布

2.2.1 主要关键词

统计论文关键词,458篇论文中有385篇论文给出了关键词,不同关键词用词共679个,总使用频次为1 470次。其中只使用1次的有523个,使用2次的有78个,使用3次的有29个,使用4次的有10个,表2列出了频次在5次及以上的前39个关键词。

表2 频次在5次及以上的前39个关键词Table 2 39 key words that frequency is over 5 times

由表2可看出,这些关键词既“分散”又“集中”。说“分散”,是因只使用了1次的关键词就有523个,占所有关键词数的77 %,这除了说明关键词的标注本身没有统一标准,因此多词一义的现象比较普遍之外,也在一定程度上反映了十多年来《傲慢与偏见》研究中业余研究占较大部分的特点。说它“集中”,则是指表2的高频关键词中,反映“婚姻和爱情”主题的关键词和反映作品“写作风格”的关键词都不少,而且使用频次都不低。

2.2.2 主要关键词共现图谱

为进一步反映十多年来国内《傲慢与偏见》研究的主题结构,采用共词分析、社会网络分析法对这些关键词做图谱分析。具体方法为:先选择频次不少于2次的关键词(共156个,即认为在十多年里至少有2篇论文中均出现过此关键词),然后计算它们中任意两个关键词在所有论文中同时出现的次数,并将共词计算所获得的数据用社会网络分析中的netdraw软件进行可视化,由此得到图2。图2中的每个顶点代表一个关键词,顶点大小代表该关键词使用的频次,顶点愈大说明其出现频次愈高;顶点间的连线代表这两个词出现在同一论文中的情况,线条粗重的,代表它们共同出现在同一论文中的次数愈多,反之则愈少。

图2 1998—2009年国内《傲慢与偏见》研究的主题结构图谱Fig.2 Theme structure chart of Pride and Prejudice in domestic China during 1998—2009

观察图2,可以很明显地得到以下结论:

1) 不计书名《傲慢与偏见》和作者名字简·奥斯丁,读图可见这十多年来《傲慢与偏见》的研究主要是围绕“婚姻”“爱情”“婚姻观”等关键词展开,这显然和简·奥斯丁作品的永恒主题“婚姻”相一致。她在作品中通过其塑造的女性形象来反映她的爱情和婚姻理念,在她看来,理想中的婚姻关系应该是感情、物质、道德和理智的综合体。与之相对应,学者们在研究其作品时,重点在于探讨作者在作品中所反映的爱情观和婚姻观。从图2中还可看出,把关键词“婚姻”“爱情”“婚姻观”联结在一起的一个“桥梁型”或可称“中间型”的关键词是“金钱”,谈婚姻、爱情自然离不开“金钱”,当然还有“财富”“财产”和“社会地位”,因此,探讨作者和作品中人物形象的“金钱”观也是研究者绕不开和感兴趣的话题。

2) 以图2最大的顶点书名《傲慢与偏见》为中心进行分析,研究结果显示:联结它另一个顶点的高频关键词分别是“简·奥斯丁”“婚姻”“婚姻观”“爱情”“情感”“婚恋观”“反讽”“言语反讽”“讽刺”“情节”“女性形象”“合作原则”“言语行为理论”“会话含义”“性格”《简·爱》《红楼梦》等,归类以上这些关键词,基本上为“婚姻情感”类和“文学创作技巧、特色”类。分析表明,很多研究者从艺术创作手法上对简·奥斯丁作品进行了探讨,并认为“反讽”“言语反讽”“讽刺”是其作品的主要艺术特色,研究者认为奥斯丁把这种“反讽”技巧灵活地运用在对作品中人物的塑造、情节的安排,以及所描写作品女性形象的婚姻、爱情中,以此来评判当时以追求金钱为目的的婚姻观念;再看图2中出现18次的“合作原则”这一高频词,刚开始分析时笔者一时也很难判断其准确含义,通过查阅论文库相关研究论文得知:有一些学者借助美国哲学家H. P. Grice于1976年提出的“会话含义理论”(Grice认为,在所有的语言交际活动中为了达到特定的目标,说话人和听话人双方都应遵守一种原则,他称这种原则为会话的合作原则Cooperative Principle,简称CP)[5],以作品中人物对话对于“合作原则”的遵循与悖逆为切入点来分析作品中人物的性格特征,尝试运用语用学的理论对文学作品进行分析,探讨语用学运用于文学批评领域的可行性与意义(对“合作原则”这个高频词的研究分析令人欣喜地验证了“知识图谱方法是可能可以自动地发现知识的”这一功能)。另外,《简·爱》《红楼梦》的出现,则表明近年来还有一些研究者已把奥斯丁作品和英国另一19世纪著名女作家夏洛蒂·勃朗特的《简·爱》,以及中国古代四大名著之一曹雪芹的《红楼梦》进行了对比研究,研究视角有了进一步的拓展。

3) 再以另一个顶点作者名字“简·奥斯丁”为中心进行分析发现,联结它另一个顶点的高频关键词分别是“傲慢与偏见”“傲慢”“偏见”“女性主义”“女性意识”“女性”“伊丽莎白”“英国文学”“理智”“金钱”“财富”“财产”“婚姻”“婚姻观”“爱情”等,这表明,撇开前面已论述的“婚姻爱情是研究的主要主题”不谈,近年来许多研究者还从“女性主义”的视角来解读奥斯丁的《傲慢与偏见》,认为其在英国文学中,作为女性文学的先驱,以其敏锐的女性视角,将备受冷落和歧视的女性带入了人们的视野,通过对妇女的地位、权利、禀赋等问题的理性思考,奥斯丁在男权文化传统下努力构建起女性文学的王国,从而走出了以男权思想为中心的男权传统的樊篱,表达出明确的女性意识、前卫的婚姻观念和深刻的思想内涵[6]。从女性主义研究视角出发,研究者认为奥斯丁通过她塑造的女主人公伊丽莎白消除她认为的因为社会地位差异而对她傲慢无礼的男主人公达西的误会和偏见,最终缔结美满婚姻来展现她理想、前卫的婚姻观:恋爱婚姻与财产和社会地位相关,但又不完全取决于财产和社会地位,幸福的婚姻应当建立在相互爱慕相互尊重的基础上,为了财产、金钱和地位而结婚是错误的,而结婚不考虑上述因素是愚蠢的。

4) 仔细观察图2的其他一些关键词,并通过查阅论文库原文,还可发现:有一些论文已开始从语用学的角度、叙事学的角度、文学文体学的角度、翻译的角度、跨媒体批评的角度、跨文化批评角度去研究该作品,但从总量看这类论文还不是很多,尚处在研究的初始阶段,但也预示着这些方面有可能是今后研究发展的方向。

3 基本结论和对该方法的进一步讨论

综上所述,本研究借助现代化的计算机数据挖掘技术,从科学计量学的角度,综合运用词频、共词、社会网络分析及信息可视化等科学计量学的方法,对十多年来国内《傲慢与偏见》研究做了主要侧重于揭示该研究领域产出模式及研究主题结构的计量分析,获得了一些较为客观有益的研究结论。如就研究主题而言,研究发现:目前国内对《傲慢与偏见》的研究主题较为集中,主要是在对作品的婚姻爱情观和创作技巧方面的讨论;就产出模式而言,则发现了一些值得进一步思考的问题,如发表论文的期刊结构问题,核心研究队伍的培养问题等;同时也略微探讨了今后研究的一些可能发展方向。这些研究结论将有助于学者了解国内目前《傲慢与偏见》的研究现状和未来走向。

将进一步讨论的是,作为一种新的文学研究方法的引入,作为一种交叉学科、跨学科研究的探索性尝试,是否合适和如何做到合适的问题。因为,本研究采用的这种定量研究的基本方式,也许会令一些读者怀疑:第一,感性的文学作品研究是否可以用图形、列表、统计等量化的方法来评价,文学界是否能接受这种新颖的研究方法;第二,如果可以引进这类研究方法,那么在使用时又应注意哪些问题。

第一个问题是随着信息时代的来临,“应用信息手段解决信息时代的各种问题”(包括人文社会科学的监测和评价)已成为“可能”和“必须”。说“必须”是因为,计算机技术与网络技术的结合,既为科学研究开辟了一条通往新信息源和交往对象的通道,极大地改变了科学研究的手段和方法,但同时也要求科研工作者必须提高对海量信息的检索、选择、管理和评价的能力,否则就会如同在绝对的光明中和在绝对的黑暗中一样,什么也看不见[7]!而从本研究所使用的科学计量学方法和所要研究的问题直接结合的背景看,这种方法既“可能”又“可行”。对一个领域的研究进行研究主题和水平、产出模式、研究整体概况及特征的评估,事实上是一种学术史的研究,而学术史的研究显然既可以采用定性研究方法也可以采用定量研究方法,且最好是同时使用这两种方法,因为这两者既各有侧重又各有利弊,更无法以一种方法去取代另一种方法。再具体到一个问题,如对于一些宏观性、整体性问题的研究来说,如果单凭个别专家的定性判断显然难免会有所偏颇,而随着数据库的完善和数据挖掘技术的成熟,对这一类问题可以采取更为全面和客观的文献计量学方法。诚然,使用定量研究方法仍免不了它的局限,如学科性质的软硬、定量的困难、数据库可能存在的偏差等,但这些应该都不是文学研究领域尝试使用这些方法的障碍。

第二个问题,即使用时需注意的问题,应高度注意以下几点:

一是基于文献数据库的文献计量(知识挖掘)是一项综合性的,需要团队合作才能做好的工作。因为从过程看,它包括获得充足而可靠的数据、掌握一套先进的计算机知识挖掘软件、有一套适合的文献计量框架体系、能够理解用户的需求等多个环节,这些环节中缺了哪一个都会直接影响到研究的质量,但要同时做好这么多环节,掌握这么多知识,单靠个人的力量显然是比较困难的。如本研究就是一个分工合作、学科交叉的结果。本研究第二作者主要负责“方法和数据”部分,第一作者则主要负责“文学角度的数据解读”,正因为有两个不同专业人士的合作,才完成了本项研究。

二是对“数据库”的高度熟悉。文献计量研究是一项用数据发言的研究,一分数据一分结论,无数据就无结论。因此数据的正确性非常重要,这就必须要求研究者对数据库非常熟悉,对数据的来源做到心中有数,否则极易发生偏差而得出错误结论。

三是对数据的解读要慎之又慎。计量研究的目的不是为了统计而统计,不是单纯为了“论文的表述”而表述,而是为了“发现问题”。因此,对数据的解读是一项重要工作。但“数据”本身往往又是抽象的、脱离了原来语境的一种“符号”,因此要对它进行正确解读,就必须要求研究者多多回到“原文”中去检验或者去寻找和发现它的意义,可以说没有经过这两者之间的多次往复运动和迭代,是很难做好这类研究的。

4 结 语

综上,本研究尝试并探讨了在文学研究领域引入词频、共词、社会网络分析及信息可视化等科学计量学方法,进行跨学科、交叉学科研究的可能性和运用前景及应注意的若干问题,获得了一些较新的研究成果。作为一种文学研究领域全新视角研究方法的探索,本研究不敢说抛砖引玉,但却期望引起相关领域研究专家和学者的进一步关注和思考。

[1] 黄秋雨.年年岁岁一床书——影响我的一百本书:英国人选出“生命中不可或缺”的100部著作[EB/OL].(2007-03-13)[2010-06-10].http://forum.home.news.cn/thread/40657785/1.html.

[2] 汤建民.中国高教研究地图:基于CSSCI高教研究论文的计量分析和可视化识别[J].中国高教研究,2010(2):22-26.

[3] 汤建民.学科知识图谱的绘制及在学科发展监测与评价中的应用[J].情报理论与实践,2009(10):55-59.

[4] 汤建民.近十年来国内民办高等教育的研究足迹:基于1999—2008研究论文的计量分析和可视化识别[J].现代大学教育,2009(2):27-33.

[5] 何兆熊.新编语用学概要[M].上海:上海外语教育出版社,2000:154.

[6] 刘际华.走出男权传统樊篱的奥斯丁[J].湖北民族学院学报:哲学社会科学版,2006(6):73-75.

[7] 《中国社会科学》编辑部.当代中国社会科学的未来发展[EB/OL].(2008-01-16)[2010-06-10].http://www.bjpopss.gov.cn/bjpssweb/n28169c52.aspx.

Acasestudyofscientometricalapproachestoprideandprejudice

CHENG Yongyan1, TANG Jianmin2

(1.School of Languages and Literature, Zhejiang University of Science and Technology, Hangzhou, 310023,China; 2. Research Center for Scientometrics, Zhejiang Shuren University, Hangzhou 310015,China)

Based on the selected 458 papers related to the study ofPrideandPrejudicein CNKI database (from 1998 to 2009), the author proposes a series of scientific metrological methods such as word frequency analysis, co-word analysis, social network analysis and information visualization. Quantitative analysis and visualized recognition are then carried out accordingly from the aspects of study situation, study themes, study effort distribution, study level and the whole study condition and characteristics based on the study ofPrideandPrejudiceduring the recent decade. We also give an objective and systematic description and judgment to the domestic literature study of this field and found some problems which can’t be found through other study methods. Meanwhile, as an exploratory attempt to a new study method, the possibility, the prospect and some problems of this method are also discussed.

PrideandPrejudice; Jane Austin;scientific metrology;co-word analysis;social network analysis;information visualization

I561.44;G254.9

A

1671-8798(2013)02-0081-07

10.3969/j.issn.1671-8798.2013.02.001

2012-06-25

教育部人文社会科学研究规划基金项目(09YJA870027)

程永艳(1965— ),女,浙江省永康人,副教授,硕士,主要从事比较文学与世界文学研究。

猜你喜欢
计量学奥斯丁傲慢与偏见
基于CiteSpace的医药语料库文献计量学分析
针刺治疗失眠症的文献计量学分析
基于Web of Science数据库的老年综合评估文献计量学分析
简·奥斯丁的《傲慢与偏见》教会读者什么
简·奥斯丁:别样的“文化研究”
简·奥斯丁:似朋友,似陌生人
可怜又可悲的女人
An Analysis of Mr. Bennet in Pride and Prejudice
基于科学计量学的公安院校科研与评价