基于语料库的图情期刊论文英文摘要主语语言特征研究

2021-07-07 01:39周绪琳
绵阳师范学院学报 2021年6期
关键词:学术论文代词主语

凌 民,周绪琳

(1. 宁波大学图书馆与信息中心,浙江宁波 315211;2. 泉州信息工程学院通识中心,福建泉州 362000)

摘要作为学术论文内容的一个简要概述,通常放在论文的引言之前,是论文中不可缺少的部分[1]18。有人把摘要形象地称为“筛选机”,因为一篇好的摘要能让读者迅速对论文的目的、方法、主要结果、结论及推论有一个概括的了解,读者可以依据摘要提供的信息决定是否有必要详细阅读整篇论文[2]118。随着时代发展,国际化进程加快,科技交流日益频繁,哪怕在国内期刊上发表论文,为了促进国际间的学术交流,学术论文一般也需要英文摘要。英文摘要作为科技论文的重要组成部分,有其特殊的意义和作用,它是国际间知识传播、学术交流与合作的“桥梁”和媒介。尤其是目前国际上各主要检索机构的数据库对英文摘要的依赖性很强。因此,好的英文摘要对于增加期刊和论文的被检索和引用机会、吸引读者、扩大影响起着不可忽视的作用[3]25。所以,汉语科技论文摘要的英译用词和结构越来越受到学者的关注。

一、文献综述

关于科研论文的英文摘要,国内已有少量学者开展了有益的研究。随着他们研究视角的逐年扩大,研究的内容也越来越丰富。

在词汇和语法方面,王海贞(2006)的研究发现中外英语教学与研究刊物的论文摘要在词汇复杂度方面无显著性差异[4];李燕芳(2009)发现中国学习者运用模糊限制语的能力薄弱,模糊限制语使用存在差异[5];陆元雯(2009)的研究结果显示论文摘要大量使用复数第一人称we,较少使用单数第一人称I;不同学科间使用it的频率差异不大[6];邓林等(2017)发现石油类英语学术论文摘要中的自我转述动词以主动语态、现在时为主,主语倾向于使用物称主语[7]。

在语篇和句法方面,胡芳、陈彧(2005)发现英汉学术论文摘要中的主要衔接手段均为词汇衔接,而在语法衔接手段上,中外学术论文表现出一定的差异[8];车君侠(2009)探讨了Science科研论文摘要的语言特点,发现样例在语步、主流句式等方面与一般固有概念存有一定程度的差异[9];张玫(2009)以Science杂志Research Articles栏目中的361篇摘要为基础,分析了被动语态和第一人称代词的使用情况,发现80%的摘要都以第一人称代词作为主语使用了至少一次,以第一人称代词we为主语的达到了20.6%[10];康勤和孙萍(2012)研究300篇英语摘要后,发现时态多采用一般现在时,语态多采用主动语态,可以出现第一人称[11];张一宁等(2018)的研究结果表明,中国高级英语学习者对于现在时动词、现在分词从句、必要情态动词等语言特征使用过多,对于第一人称代词、过去时动词、主位wh-从句、劝说类动词、that从句等使用过少,对这些语言特征的语用功能缺乏足够的认识和重视[12]。

在话语分析方面,郭骅、马磊(2016)以国内外四种顶级社会学期刊的240篇英文摘要为语料,综合考察了文化背景和研究范式对两类常见人际互动元话语[13];吴晓芳、曹凤龙(2016)研究发现中国学者使用元话语要比英语本族人的使用要少,并且交互式话语和互动式话语的十项子类别也出现了显著性的差异[14];黄旭(2017)研究发现,随着时间推移,中国研究者在英文摘要中使用了更多的模糊语,而强势语则出乎意料地保持在较高数量上[15]V。

修辞角度的研究中,云红(2009)讨论了作者身份在论文摘要中的显现与隐现修辞方式,以及评价主体的种类和数量分布[16];赵艺红(2011)探讨了医学论文英语结构式摘要写作的文体修辞特征[17];谭华、穆从军(2016)运用修辞结构理论考察英汉论文摘要的修辞关系分布特点,揭示摘要的语篇构建方式[18]。

在摘要翻译方面,刘丽娟(2014)从显化翻译角度探讨如何利用背景知识译出明晰的译文[19];梁甜甜、单妥(2018)分析了EI论文摘要中相关的名词化用词不准确、语义表述错误、句子衔接松散等问题[20];宋策、华静(2019)研究了如何完成与国际要求更加吻合的框架以及成文后如何把翻译完成的更为准确[21]468-473;孙逸群(2019)分析了人工译文和机器译文术语的异同[22]。

国外摘要研究主要在对比,不但有不同语言、不同学科和相近学科之间的对比,还有摘要与同一论文的引言、讨论、结论进行语言特征之间的比较。James Hartley等(2003)对比分析了Abstract、Introduction和Discussion各自的语言特征[23];Betty Samraj(2005)以Conservation Biology和Wildlife Behavior上的论文为基础,开展了学科之间、introductions和abstracts之间的对比研究[24];Sarah Van Bonn等(2007)对比了英法两种语言语言学研究论文摘要在语态、代词、句长、连接词等方面的差异[25];Watinee Suntara等(2013)比较了语言学和应用语言学论文摘要,发现语言学论文摘要有3个传统语步,而应用语言学有4个[26];Eric Friginal、Sabah Slebi Mustafa(2017)自建8个子库,对比分析了美国作者和伊拉克作者的学术论文摘要的语言特征[27]。Swales(1990)、Nwogu(1997)和Ken Hyland(2000)通过详细研究论文引言,对学术论文进行了功能划分:引入、方法、结果和讨论[28]356、[29-30]。

从上面的综述可以看出,国外的研究对比力度之大,不但涉及同一学科不同作者群间的对比,更涉及跨学科对比;国内研究尽管分析角度越来越多,但词汇和语法仍是研究重点。在主语结构特征、谓语动词结构特征和主谓构成的类联接方面的研究几乎没有相关文献,因此,本文拟探讨图书情报文献学领域类学术论文英文摘要句子主语的结果特征。

二、语料库建库

此次研究,笔者选择了《情报科学》《情报学报》《情报理论与实践》《情报杂志》《情报资料工作》《图书馆》《图书馆建设》《图书情报工作》《图书与情报》《大学图书馆学报》等10种国内图书情报文献学类CSSCI期刊,以被引频次为指标,下载每种期刊在2015年刊发的研究论文20篇高被引论文(从高到低取),然后提取这些论文的英文摘要,建成中国图书情报文献学领域学者学术论文英文摘要语料库。由于这些期刊是CSSCI来源期刊,语料库直接使用了名称CSSCI。为了开展对比研究,笔者又选择了10种同一领域的SSCI期刊,分别从每种期刊提取20篇论文的摘要。这10种国外期刊是InternationalJournalofInformationManagement,MISQuarterly,GovernmentInformationQuarterly,InformationandManagement,JournalofInformetrics,College、ResearchLibraries,JournalofAcademicLibrarianship,Libraryquarterly,JournalofLibrarianshipandInformationScience和ElectronicLibrary。在Web of Science数据库里,检索这些期刊2015年刊发的论文,再以被引为指标,从高到低从每种期刊里下载20篇论文的摘要,建成英语SSCI论文摘要语料库。两个语料库建库所需文献的下载时间分别是2020年8月3日和8月13日。

三、结果与讨论

此次研究自建的两个语料库中,国内10种期刊的200篇论文共计21 746个形符、3 163个类符,篇均形符为108.82个;而10种SSCI期刊的形符和类符分别为35 014和4 569,篇均形符为175.07个。由此可以看出,SSCI期刊摘要的篇均长度比CSSCI的多66.25个形符。那么,这400篇摘要中,句子主语都有什么样的语言特征呢?

(一)句子主语的类型

主语是一个句子所述说的主体,是句子的中心,通常位于句首,居谓语动词之前。主语通常由名词和代词来担当,但其他起名词作用的词、词组或句子,即“名词等同体”也可担任主语。这些“名词等同体”常见的有数词、名词化的形容词或过去分词、名词化的介词、形容词、副词、动名词、不定式、不定式复合结构、for there to be结构、连接代词/副词+不定式、介词短语、从句、句子[31]723-726。学术论文英文摘要句子的主语类型分布情况见表1。

表1 句子主语的类型

从表1可以看出:(1)学术论文英文摘要句子主语的类型较少,只出现8种。(2)两个学习者群体都喜欢使用名词词组作句子主语,且使用情况尤为突出,国外学者的比值接近70%,而中国作者达73.76%。(3)国外作者使用代词作主语的比例高出中国作者7个百分点;两个群体用名词和代词作主语的比例都超过90%,国外作者达到95.01%,中国作者则为93.59%。(4)其他6种主语类型中,虽然使用的比例不大,但两个群体的使用数据在形式主语it和不定式用作主语方面仍出现较为明显的差异;在其他三类主语上(动名词、数词、there be句型)上使用的数据很接近。

值得一提的是,在人称代词使用上,SSCI期刊使用589次,CSSCI期刊是204次,两个群体的使用频率存在显著性差异,母语作者存在超用现象。这与日常英语中人称代词的使用情况截然不同,因为汉语注重主体思维,这种思维模式以“万物皆备于我”作主导,往往从自我出发来叙述客观事物,或倾向于描述人及其行为或状态,因而常用人称。当人称可以不言而喻时,又常常隐含人称或省略人称。英语可用人称主语表达,也常用非人称主语表达。用非人称主语表达时,往往注重“什么事发生在什么人身上”,而汉语则较常用人称主语表达,往往注重“什么人怎样了”或“什么人做什么事”[32]77-79。

(二)句子主语的长度

英语的SV、SVC、SVO、SVOO和SVOC这五大句型中,主语(S)和谓语动词(V)是必不可少的。在语篇推进模式中,句子主语多半是前一句出现过的已知信息,再加上替代、照应等语篇推进模式,人们就经常使用人称代词、指示代词,这在某种程度上使得句子主语不会太长。那学术论文摘要中的主语长度和通用英语语法教材、科技英语翻译或语法教程有差异吗?如果存在差异,它们之间的差异大吗?

从表2可以看出:SSCI期刊的形符和类符远大于CSSCI期刊,其形符数和类符数分别是CSSCI的1.6倍和1.44倍。但是,计算结果显示,SSCI期刊每个主语的平均长度是3.61个形符,而CSSCI期刊主语的篇均形符是4.27个。换句话说,中国图书情报文献学领域的研究人员在撰写学术论文的英文摘要时,他们每个主语的平均长度达到4.27个形符,比SSCI期刊论文多出0.66个。笔者查阅了国内出版的一本通用英语语法[31],统计了一个小节里连续的75个例句,发现主语部分的平均形符是3.76个;笔者选定了国内出版的两本科技英语语法或翻译教程,统计了它们不定式部分连续出现的26个和22个例句[33]1-26、[34]115-127,发现它们的平均形符分别是4.15和3.72。从这四本语法或翻译教程来看,通用英语语法是面向所有读者的,所采用的例句需要通俗易懂;而科技英语语法或翻译教程属于ESP范畴,其读者群有一定的英语基础,这些教程采用的例句有可能略长于通用英语语法。从数据可以看出,尽管这三本语法教程或翻译教程例句主语部分长度有差异,但差异并不是很大,与论文英语摘要句子的主语部分的长度也比较接近,这多半与摘要的性质有一定关系,因为摘要的内容具有逻辑性和完整性的特点,能回答why to study、what to study、how to study、how the conclusions are made. 具体说来,摘要会考虑以下几点:与论文关联性强的背景、采用的调查方法、主要结果与观察数据、主要结论、自己的建议[35]13。这几点涉及的单词常见的有description、explanation、illustration、introduction、analysis、discussion、investigation、study、consideration、outline、review、summary、objective、aim、purpose、calculation、measure、application、assessment、comparison、proposal和recommendation。这些名词在英语摘要中都是高频名词,它们出现在主语位置上的频率非常高,而且它们与形容词、介词、动词等组合的类链接相对固定(见表2)。

表2 中外英文摘要的库容量和主语数量

(三)主语部分中的代词

语篇是一组使用中的语言,它既非小句或者句子之类的语法单位,也不受长短的限制。语篇有时被视为某种超级句子,它虽然是比句子大的语法单位,但是它与句子之间的关系和句子与小句、小句与词组等之间的关系是一样的,即通过成分由小单位组成大单位[36]1。在语篇构建过程中,我们依靠的衔接纽带主要有指称、替代、省略、连接和词汇衔接。指称可分为三种:通过人称类别来表现的人称指称、运用在远近程度上的不同来表现的指示指称、运用相同或相似性表现的比较指称。本文主要探讨人称指称和指示指称(如表3)。

表3 主语部分的代词

从表3我们可以看出:(1) this、these和those这三个词与名词构成名词词组,具有和代词一样的指称功能,都存在中国作者超用现象,只是超用的程度不一样。其中,those的超用情况没有形成较大差异,而these出现显著性差异。此次研究中,两个作者群体之间this的使用情况出现明显差异,中国作者超用。(2) 人称代词中,第一人称单数形式没有出现。外国作者使用了589次人称代词,其中,使用第三人称复数(157次)、关系代词that(107次)、第三人称单数(86次)、第三人称复数(60次),这四个词的频率最高,占代词总数的69.61%。中国作者使用了204次人称代词。使用频率前三位分别是第三人称单数代词it、关系代词which、第一人称复数代词we,分别是63次、60次和40次。中国作者的这三个代词是所使用代词总数的79.9%。(3) 在关系代词方面,which和that的使用频率都存在差异,中国作者超用which,而that的使用不足。

人称代词we是超用的,因为她在学术语体中表示作者与读者是在一起的,增加了认同感[37]113。

(四)主语部分单词的词汇特征

词作为可以独立运用的、最小的语义单位,具有诸多的特征,包括形式特征、形态特征、语义特征、句法特征、语用特征和规则特征[38]11。通过研究学习者词汇产出的特征,我们经常测量单词的词汇独特度、词汇密度、词汇丰富度、词汇变异度、平均词长、词汇复杂度、语义变化度、词汇属性、词汇精准度、词频概貌、名词化程度、词汇错误[39]。本研究主要探讨词汇复杂度和词频概貌。

1.词汇复杂度和多样性

词汇复杂度的计算方法之一是以文本单词长度为统计指标,即利用语料库软件计算单词的平均词长和词长标准差。平均词长是决定语篇难度和复杂性的一个重要因素。词汇的多样性主要取决于单词的派生和同义词。英语和汉语的主要差异之一是汉语中汉字的重复率高,而英语里有大量的同义词或近义词,英语行文主张使用同义替代,加上母语词的用词习惯与生活和工作中的词频效应,可能导致使用不同的单词表达相同意思。下面我们看看这两个作者群体在产出主语时的数据(见表4)。

表4 主语部分基础数据

从表4的平均词长来看:中外两个作者群体的平均词长分别为5.72和5.66,中国作者的平均词长略高于母语者。杨廷君、张建理(2013)研究了中外优秀博士论文的英文摘要,发现两个群体的平均词长分别为5.41和5.56,与此次研究的数据比较接近。一般说来,平均词长小于4时,文本难度较低。由此可以看出,中外这两个作者群体学术论文英文摘要主语部分的用词有一定难度。

由于母语者论文摘要主语部分的用词远多于中国作者,从理论上讲,主语部分的形符数越多,类符数可能随之增加。但是,标准化类符/形符比已经将形符的数量考虑进去,即它的计算结果不会受到摘要主语长度(单词数)的影响。母语者标准化类符/形符比为53.53,比中国作者高出3.04个百分点,说明母语者的用词宽度大于中国作者,他们更擅长于词汇变化,单词的复现率低于中国作者。

2.词频概貌

从小学到大学的英语学习中,我国在各阶段对英语单词数量的要求分别为550词(小学阶段)、1 600词(初中阶段)、3 500词(高中阶段)、4 750词(大学英语四级考试要求)。其中,后续阶段的词汇量要求包含前面阶段已经掌握的那些单词。换句话说,每个阶段较前面阶段增加的单词,它们不但具有一定的难度,从理论上讲,它们的出现频率也低于前面阶段的单词。我们使用新西兰学者Nation编写的程序Range 32,对主语部分的单词进行归类。Range提供的词表中,AWL的第一个和第二个1 000词基本上和West(1953)的《英语通用词表》吻合,第三个1 000词基本上为Coxhead(2000)大学词表,超过这3 000词的,则为专业性词汇[37]55。换句话说,第一个词表里的单词出现频率高,难度也低于第二个词表里的单词,余下类推。

从表5我们可以看出,两个作者群体输出词汇的词频概貌非常接近。在形符方面,中外作者学术论文英文摘要主语部分的单词,出现在word list one里的百分比分别是68.3%和68.52%,只有0.22%的差异;出现在word list two里的百分比分别是16.53%和14.58%,两者之间的差异为1.95个百分点;出现在word list three里的分别是2.9%和2.25%,两者之间的差异为0.65个百分点。在这单个词表以外的单词中,两个群体之间的差异也只有2.39个百分点。由于母语者的类符和词族远大于中国作者,两个群体在形符词频概貌方面的差异略大于类符差异。其中,最大差异值出现在word list one,为5.16个百分点,在word list two和word list three的差异分别为0.74%和3.29%。该软件统计结果中,类符(type)和词族(family)主要反映作者的词汇宽度,即使用单词时的变化,避免重复。例如,统计时,单词is、are、am、being、was、were归目后,就只有1个词族。所以,看词频概貌,了解某个文本的单词分级,我们可重点关注形符在每个词表(word list)的分布情况。从上面的分析可以看出,中外两个作者群体学术论文摘要主语部分单词在几个词表中的单词分布非常接近,差异性极小。

表5 论文摘要主语部分单词的词频概貌

四、结语

此次笔者以400篇高被引论文的英语摘要为研究对象,自建两个语料库,利用语料库语言学技术,探讨了中国图书情报学领域研究人员学术论文英文摘要句子主语的语言特征。这两个语料库中,母语者这200篇学术论文英语摘要的形符和类符分别为35 014和4 569,篇均形符为175.07个,而国内10种CSSCI期刊这200篇高被引论文的英文摘要有21 746个形符、3 163个类符,篇均形符为108.82个。由此可以看出,SSCI期刊摘要的篇均长度比CSSCI的多66.25个形符。研究发现,学术论文英文摘要句子主语的类型较少,只出现了8种。中外作者撰写论文摘要时,90%以上的句子主语不是名词词组就是代词。SSCI期刊作者更喜欢使用代词作句子主语,其使用频率是CSSCI作者的2.88倍;中国作者超用this、these和those这三个词与名词构成的名词词组和which,而that的使用不足。在句子主语长度方面,SSCI期刊每个主语的平均长度是3.61个形符,而CSSCI期刊主语的篇均形符是4.27个。这样的数据与笔者统计的语法教材例句主语长度很接近。SSCI和CSSCI期刊主语部分单词的平均长度分别为5.66和5.72。先前的研究显示,文本单词平均长度低于4时,文本阅读难度不大。但此次研究对象的平均长度远超过4,说明普通读者读起来有一定的难度。在词频概貌方面,SSCI期刊摘要部分主语的词级分布如CSSCI期刊没有太大差异,85%以上的单词都出现在word list one、word list two和word list three。此次研究也发现,SSCI期刊作者在用词宽度或单词派生能力方面强于CSSCI作者,因为他们多半是英语母语者,而中国作者是英语学习者。

猜你喜欢
学术论文代词主语
本期主要学术论文英文题目及摘要
学术论文征集启示
学术论文征集启事
主语从句用法“大揭秘”
消除隔阂,呈现新面孔
这样将代词考分收入囊中
掌握八大考点玩转非谓语动词(二)
英语代词用法练习
人称代词专练
第9卷第1-6期学术论文总目次