英语专业本科毕业论文质量差异对比研究

2018-01-26 10:22王丽君
卷宗 2018年36期
关键词:词频词数毕业论文

摘 要:本文运用语料库语言学的方法,自建超过250万词的英专本科毕业论文语料库,并按照论文质量将其分为高水平,中水平和低水平论文三个子语料库。通过分析语料库中的词频、句长、关键词列表、搭配列表等,发现了高中低分组论文的相同和相异特征。此研究对准确了解当前英专学生学术论文写作质量,以及提高英语学术写作水平具有较强的实践意义。

关键词:英语专业;本科毕业论文;论文質量差异;对比研究;语料库语言学

基金项目:本文为安徽省省级质量工程项目“基于分析性评价体系的英专本科毕业论文质量评估研究”(项目编号:2017jyxm0039)的阶段性成果。同时,本文也受到教育部人文社会科学研究青年基金项目(项目编号:14YJCZH148)的经费支持。

1 引言

《英语类专业本科教学质量国家标准》要求本科生要具有“学习能力以及思辨、创新和科学研究的能力”,而这种能力突出的在毕业论文课程中得以检验(仲伟合, 2015:5)。针对英专本科毕业论文的研究有很多,既有微观层面的选题、摘要、语言和格式问题,也有涉及宏观层面的现状分析、意义分析、课程改革、论文指导体系和评估机制、利用网络资源的写作指导模式、论文指导和管理的网络平台建设问题以及论文写作动机研究(如孙文抗 2004;郭玉鑫 2010;顾佩娅等2010;盛国强,周永模 2011;陈正伦2012)。研究方法多采用文献资料法,问卷调查法,个案分析法,内省法及实验法。同时,出于研究者的研究目的,多选用少量文本或者仅仅是教师针对毕业论文写作的直觉反馈,带有强烈的主观性、片段性和阐述性,无法真实全面反应目前英语专业本科生的论文质量。因此,已有研究者建议运用语料库大数据进行英语写作方面的研究,因为语料库技术能展示那些并非一目了然的现象(Baker 2005:197)。但是学者们的研究对象主要针对大学英语或英专低年级的短篇英语作文写作(如袁昌万,金双军2015;丁永久 2013)。本研究自建超过250万词的英专本科毕业论文语料库,并按照质量将其分为高水平,中水平和低水平论文三个子语料库,拟运用语料库技术,从词数、词频列表、关键词列表、搭配等方面去探讨各类水平论文的相同和相异特征。这是一次将语料库技术应用于英语写作质量分析的实践,其研究结果可帮助教师准确了解当前本科学生英语论文写作质量,对提高英语学术写作教学水平具有较强的实践意义。

2 研究问题与研究方法

本研究尝试回答以下问题:1)通过语料库手段能发现不同水平论文的差异体现在哪些方面?2)高分、中分、低分的英专毕业论文有什么样的相同特征以及差异性特征?

首先,笔者收集了合肥工业大学近4年英语专业本科毕业论文,共计541篇。按照论文分数,分为高分组(85分及以上)105篇、中分组(75分—84分)329篇、低分组(74分及以下)107篇,建立了约250万词的英专本科毕业论文语料库,如表1。

第二,运用wordsmith tools 6.0,针对英专本科毕业论文,以英国学术英语语料库为参照语料库,列出了以关键性(keyness)为标准排序的关键词列表。然后通过分析关键词的搭配词以及上下文,来讨论三组论文的选题特点。

最后,分析词频列表(如表3)以及索引行来讨论论文研究对象,口语化程度,感性和理性的侧重点以及论文主客观程度等。

3 结果与讨论

3.1 高中低分组毕业论文在选题上的异同

毕业论文的选题会直接影响毕业论文的整体语篇的质量。通过观察关键词列表发现,整体来说文学、翻译方向的论文数量高居第1,2位。其原因在于文学和翻译方向的论文参考资料相对来说比较丰富,理论也比较容易看懂。此外,高中低分三组的高频词中都有“English”、“Chinese”、“culture”等,这说明英汉语言对比和中西文化对比等,也是较高频率选题。

进一步分析表2,发现高中低分组选题的侧重点是不同的:第一,低分组和中分组相比,低分组文学选题更为分散,而中分组选取的作品更为集中。低分组的论文关键词大多与文学作品中的人物名称或是作者有关,例如Blanche、Oliver、Riley、 Sula、 Lawrence、Stella等。由此可见,低分组的同学们更多的关注文学题材。而中分组的关键词有百分之八十是人名,这些人名中包括文学作品中的主人公,例如《白鲸记》中的Moby Dick、《德伯家的苔丝》中的Tess、《哈利·波特》中的Harry、《呼啸山庄》中的Heathcliff。中分组与低分组相比,选取的文学类的作品更为集中。第二,高分组选题大多和翻译有关,和其他两组区别较大。高分组明显与其他两组不同,排在第一位的关键词是“Japan”,且排名第十位的是“Diaoyu”,这反映了高分组的同学更加关注于时事政治,或更贴近当代的生活,更加注重新闻方面的搜集与分析。从 “translation”、“corpus”、 “text”等词可以看出高分组的毕业论文大多与翻译有关,并且大多以语料库为手段对文本进行比较;又或者偏重时政新闻的话语分析。

3.2 高中低分组毕业论文在词汇句法层面的异同

第一,词汇数量上高分组最多。英语书面语长度与其英语水平呈显著性正相关,相关系数高达0.7以上(丁言仁,戚焱2005)。因为高中低分三个子语料库库的篇目数量不对等,故只有总词数除以篇目数所得的平均词数较有可比性。观察表1发现,高分组的平均词数为5428,中分组的是4587,低分组的是4037。进一步推算,高分论文的词数远超中分论文和低分论文,超出中分论文词数18.3%,超出低分论文词数34.5%,而中分论文超出低分论文词数13.6%。即从词汇数量上说,高分论文、中分论文和低分论文形成三个梯度,梯度之间的距离差不多。中分论文要想往高分论文上提升,需增加将近1/5的词数;低分论文要想往中分论文上提升,则需增加大约1/7的词数,这个应该不难做到;而低分论文要想直接往高分论文上提升,就需增加超过1/3的词数,这对于学习者来说就具有一定的难度。

第二,语块上高分组更擅长写独立分句。语块通常是作为一整体储存在记忆中,使用时直接提取,无需根据语法规则生成和分析。语块的分类多种多样(如Becker 1975;Michel Lewis 1997;Nattinger,Decarrico 1992等)。本文选择表述较为简洁直观的Altenberg(1998)的语块分类法,将词块分为完整分句、分句成分和不完全词组。完整分句具有独立的主谓结构,可细分为独立分句及非独立分句;分句成分可分为多样分句成分及单一分句成分;不完全詞组指缺乏实意词的词组。为了数据的可比性,笔者从高中低三个子库中各抽取了20篇论文,共计60篇,建立一个小型平衡语料库,然后抽取其中的3-6字符,进行语块分析。

分析结果表明,三组论文的共同点在于:第一,从3-6字符的语块数量上看,3字符语块数量最多,随着字符数的增加,三组语块的数量呈明显递减趋势,6字符语块数量最少。第二,从语块分类上看,完整分句的频数明显低于分句成分频数。进一步细化,单一成分的所占比例始终保持高,其次为多样成分和不完全词组所占比例。这表明在英专学生论文写作中,多使用分词成分或词组来组合文字。而三组论文的不同点在于:高分组中独立分句频数始终高于中、低分组,这说明高分组论文更擅长写独立分句,擅长撰写长句。

3.3 高中低分组毕业论文在研究对象、口语化程度、理性感性侧重点及实例数量上的异同

通过分析词频列表(表3),可以发现以下四点不同。首先,三组论文的研究对象关注点不同,这一点可以从人称代词(he, she, it等)的使用来发现。分析词频列表的前几个人称代词时,都是男性人称代词多于女性人称代词和中性代词。这说明三组论文所研究的男性作家作品,或者作品中的男性人物,或者男性话语,会相对较多一些。不同点在于,高分组的代词词频为:中性代词使用频率>男性人称代词>女性人称代词,其中男性人称代词和女性人称代词词频数目差距很小。而中分组和低分组步调几乎一致地呈现出:男性人称代词使用频率>女性人称代词>中性代词。这就意味着,三组论文写作者的思维方式和关注点有所不同。高分组所用中性代词较之最多,是因为更多时候都在讨论作家作品本身,或者翻译文本本身,而较少涉及作家或者作品中的人物。

其次,三组论文的口语化程度不尽相同,中分组和低分组论文的口语化程度更高,高分组则相对较低。这主要体现在“I”等第一人称代词的使用频率上。“I”在高中低分组的词频出现排位分别是第29,16,14位。低分组过度使用第一人称代词,即过分强化作者的显现度,不符合科研论文要求的严谨客观,而更接近口语的直接和主观。

第三,三组论文的理性和感性侧重点不同。例如,“life”也是三组论文数据库共同具有的高频词之一,人生和生活确实是每个人穷尽一生要思考的问题。按照词频列表的单词排序,高分组论文语料库的“life”一词出现在语言对比等词之后,而在中分组和低分组论文语料库中则是出现在之前。进一步观察索引行发现,高分组论文更多时候是在比较客观地对比语言,而不是以探求人生哲学为主。这就使得高分组论文更加理性和务实,言之有物,逻辑更加清晰,更容易被理解接受。中分组和低分组论文显得更加感性一些,容易陷入言之无物的境况,有些思想不太好用语言组织,很难准确地表达,从而影响论文质量。

第四,三组论文的主观和客观程度不同,这可以从表3中的“translation”一词看出来。高分组中,“translation”一词出现频率位居第1,中分组和低分组位居第6位和第7位。这就说明,三组论文中“翻译”的研究都是一个重要选题。而英汉互译的研究离不开中英文的举例,此类论文中就会出现汉语词汇。三组论文中的翻译类论文的平均中文词数(如表1所示)就体现出汉语例子的数量。研究发现,在涉及翻译的选题时,高分组的中文词数比例明显比中分组和低分组多,这说明高分组举了大量的实例,使研究更具说服力,也使论证的推导过程更加严密,学术客观性得以提升。

4 结论

本文运用语料库的手段,发现了高中低分组论文在选题、词汇层面、句子层面、研究对象、口语化程度、感性理性分析侧重点、主客观程度层面都有异同点,其中差异性特征得到了特别的关注。此研究希望借助语料库语言学的相关手段,较为客观的展现当前本科学生英语学术论文写作的质量差异点,从而有利于教师有的放矢地提高英语学术写作教学水平。

参考文献

[1]Altenberg, B. and M. Tapper. The use of adverbial connectors in advanced Swedish learners written English [A]. In S. Granger (ed.). Learner English on Computer [C], 1998: 80-89.

[2]Baker, P. and Tony McEnery. A corpus-based approach to discourses of refugees and asylum seekers in UN and newspaper texts [J]. Language and Politics, 2005, 4(2): 197.

[3]Becker, J. The Phase Lexicon [A]. In Nash B W, Schank R.Theoretical Issues in Natural Language Processing [C]. Cambridge, Mass: Bolt, Beranek and Newman, 1975: 55-74.

[4]Lewis, M. Implementing the Lexical Approach [M]. London: Language Teaching Publications, 1997.

[5]陈正伦.英语硕士毕业论文写作的动机研究及其启示[J].外语界,2012(6):81.

[6]丁永久.基于语料库的高职英语专业一、二年级学生写作能力的分析[J].中国民航飞行学院学报,2013(4):51-53.

[7]顾佩娅,张烨,,古海波.英语专业本科毕业论文课研究性教学设计与实践[J].外语教学理论与实践,2010(4):44-51.

[8]郭玉鑫.英语专业毕业论文与课程设置、教学模式的关系研究[J].中国科技博览,2010(7):39.

[9]盛国强,周永模.英语专业本科毕业论文存在问题的分析和对策[J].上海海洋大学学报,2011(4):636-640.

[10]孙文抗.英语专业学士论文写作现状分析[J].外语界,2004(3):59-64.

[11]袁昌万,金双军.基于语料库大数据的英语写作实证研究[J].重庆交通大学学报(社会科学版),2015(4):126-129.

[12]仲伟合.《英语类专业本科教学质量国家标准》指导下的英语类专业创新发展[J].外语界,2015(3):2-8.

作者简介

王丽君(1981-),安徽淮南,文学硕士,合肥工业大学外国语言学院讲师,研究方向:语料库语言学,话语分析。

猜你喜欢
词频词数毕业论文
基于词频分析法的社区公园归属感营建要素研究
快速阅读两篇
词频,一部隐秘的历史
云存储中支持词频和用户喜好的密文模糊检索
以关键词词频法透视《大学图书馆学报》学术研究特色
本科毕业论文:取消还是改革
阅读训练一
阅读训练二
新目标英语八年级(上)阅读理解专项测试