■吕 桂
南方医科大学外国语学院,广东省广州市白云区沙太南路1023—1063号 510515
尽管中国出版界积极推进科技期刊国际化,在编委组成、审稿专家、编排标准等方面努力与国际接轨,但不得不承认目前出版语言国际化水平不高制约着中国英文科技期刊走向世界。国内期刊语言国际化水平不高的表现之一是国内英文论文作者自信和权威度的呈现以及论文阐述信息、呈现信息、构建语篇的方式往往不能和国际接轨;按照作者人际身份和语篇身份的定义[1-2],作者自信和权威度在论文的呈现体现了作者对于自身和读者间关系的判断,体现作者的人际身份;作者阐述、呈现信息以及构建语篇的方式体现作者的语篇身份。这里作者并非现实中作者本人,而是指论文语篇呈现出的作者。
目前,已有较多关于科技期刊论文体裁的研究,通过分析语轮、语步,从而对论文写作提出建议[3-5],但并未发现关注论文作者人际身份、语篇身份的相关研究。实际上,如果作者的人际身份、语篇身份不符合国际生物医学期刊论文的写作规约,会直接影响论文的可理解性和可接受性,从而影响国内学术成果的国际推广。我国作者和期刊编辑有必要全面了解论文作者自信和权威度的呈现以及信息阐述、信息呈现、语篇构建的方式,努力呈现符合国际生物医学期刊惯例的作者人际身份和语篇身份。
本研究采用语料库软件检索250篇论文、近百万词次语料,利用语料库语言学关键词分析路径,用跨时段对比方式来凸显作者自信和权威度展现,语篇信息阐述、呈现、构建方式的发展特征。全世界有800 余种生物医学期刊遵循《生物医学期刊投稿的统一要求》[6](Uniform Requirements for Manuscripts Submitted to Biomedical Journals),这是全球生物医学领域研究人员、作者、审稿人和期刊编辑等相关人员必须遵循的规范。该要求于1979年首次发布, 之后与时俱进历经10多次修订。国际生物医学期刊论文作者的自信和权威度的呈现以及作者阐述信息、呈现信息、构建语篇的方式应该也发生着变化。但是,国内作者因语言文化差异,对这些变化的把握可能存在滞后性甚至忽视,不利于提升我国医学技术的国际传播力。从跨时段发展这一视角对作者的人际身份和语篇身份进行分析,可帮助国内作者、编辑更全面地掌握国际生物医学期刊论文作者自信和权威度的展现以及阐述信息、呈现信息、构建语篇的方式,也就是作者人际身份和语篇身份。
作者人际身份是指语篇所呈现的作者的自信和权威度,能展现作者和读者间关系。Hyland[7]指出立场标记语和/或介入类话语资源可表明作者和读者的交互和沟通,体现了人际身份。其中模糊语(Hedges)可弱化作者责任,让读者自己判断论点的可接受性;增强语(Boosters)和自我指称语(Self-Mention)凸显作者在文本中的存在, 呈现出较强的和读者交流的意向;使用insightful、clear、 amazing、ought to、agree、prefer、hopefully、 unfortunately、appropriate、logical这类态度标记语(Attitude Marker)呈现作者主观情感,反映了作者想与读者探讨乃至辩论的期待。读者指代(Reader Pronoun)、指令(Directives)、提问(Questions)等介入语可直接引导读者介入研究内容的讨论。
作者语篇身份是指作者阐述、呈现信息以及构建语篇方式所体现的作者身份;构建何种语篇身份主要取决于复杂名词词组、单音节词、多音节词、连接手段、符号模式等使用特点[1],以及取决于语篇结构、学术话语/个性话语等的使用特点[2]。比如作者是否使用大量复杂名词短语,大量使用单音节词还是多音节词等,显示作者采用学术语言还是日常平实话语;是否大量使用连接方式和信号词,句间关系是否明晰,作者符号模式(比如视觉模式或话语模式)选择偏好等,体现出是否“为读者考虑”的作者语篇身份[1]。
表1 作者人际身份、语篇身份的核心内涵和语言实现资源
本研究采用语料库关键词分析途径进行大样本分析,避免出现因数据分析规模偏小影响结论可靠性和可推广性的问题。
本研究的关键词是指通过语料库软件如Wordsmith 5.0[8]从目标语料自动提取的那些与参照语料相比频繁使用的词汇[9]。具有穷尽性、浓缩性、典型性和代表性特质的关键词浓缩了语篇的内容大意、文体风格乃至作者立场态度等关键信息[9]。作者立场态度体现出作者的自信和权威度,可展现作者对于自身和读者间人际关系的判断,即作者人际身份;而语篇文体风格是作者阐述、呈现信息以及构建语篇的方式,即作者语篇身份。Scott 等[9]指出关键词中连词、限定词、介词和代词等语法类词汇可揭示最典型的语篇文体信息。Bondi[10]指出通用性学术词汇(如factors、variables、condition、psychological、we等)而非专业词汇作为关键词可能表明语篇具有“总结”性文体特征。Hunston等[11-13]指出可从关键词析出态度评价以及语篇组织结构信息。Giannoni[14]利用关键词考察期刊边缘文体——评论、回复、注解和社论的特征,同时也利用关键词分析这些不同类型文本的立场/情态标识等信息。以上从关键词析出的语篇文体方面的信息即可体现作者语篇身份;析出的立场/情态标识等信息即可体现作者人际身份。以上学者的关键词研究为笔者从关键词入手探究作者的自信和权威度,以及作者阐述信息、呈现信息以及构建语篇的方式提供参考。
以关键词为切入点,探究国际生物医学期刊论文作者人际身份、语篇身份的发展特点,可分为以下四个步骤。
(1) 构建具有可比性的论文语料库。首先取料于1976—1989年间发表在5种国际权威生物医学期刊的研究论文,这5种期刊分别为TheNewEnglandJournalofMedicine、BritishMedicalJournal、JournalofClinicalInvestigation、TheLancet和JournaloftheAmericanMedicalAssociation。选取的论文均由英语本族语者撰写并遵循IMRD格式,即Introduction、Methods、Results、Discussion (和/或 Conclusion)格式;每隔2年、每年各取5篇,共计125篇论文构成第一时段语料库(总词量为385889)。再用同样的标准构建第二时段(2000—2013年)的语料库(总词量为563678)。避开20世纪90年代的原因如下:由于计算机和互联网技术的迅速发展,期刊逐步从单一出版纸质印刷本转变为电子出版和纸质出版共存;论文的体裁、作者人际身份和语篇身份伴随信息交流方式的改变也逐步变化,20世纪90年代被视为过渡期。因此,本研究特别挑选1976—1989年以及2000—2013年这两个明显不同的时段,避开20世纪90年代,预期研究结果会更具区别性。
此外,本研究还构建了两个时段的摘要、引言、方法、结果、结论和论文后文本语料库,共12个子库。因为前测表明,亚体裁会影响阐述信息、呈现信息以及构建语篇的方式, 即摘要、引言、方法等这些不同体裁会影响到作者语篇身份。
(2) 用语料库软件Wordsmith 5.0[8]提取关键词表,并对这些关键词的语义语法范畴分类和语境拓展意义进行分析。具体而言:以第二时段语料为参照得到第一时段语料的关键词表;以第一时段语料为参照得到第二时段语料的关键词表;同时还相互比较两个时段摘要、引言、方法等子库得到关键词表。此种互为参照的比较使得两个时段语料的相似特征不会显现出来,所以能凸显两时段变化。将出现在至少三篇论文、同时位居前100的关键词纳入研究范围。关键词分语法、词汇两类;词汇类关键词属于数量有限的“直观可识别的语义领域”(Intuitively Identifiable Semantic Fields)[15]。关键词的语义、语法范畴分类,除直观识别外,还需借鉴语料库语言学的词汇共选理念,即考察关键词与语法的共选、关键词与词汇的共选,以及基于语法和词汇共选所形成的在语义类别和语用功能等更高层面上的共选关系,如语义偏好和语义韵等[16]。例如,通过考察关键词与语法的共选,从而确定了VIEW (本文关键词大写表示经词簇化即lemmatized后的词汇;关键词斜体表示具体词形)、DOWNLOAD为祈使活动类关键词。又例如,通过考察关键词语境,发现第二时段摘要子库中的关键词PARTICIPANT、CONCLUSION、OUTCOME、DESIGN、OBJECTIVE、INTERVENTION、MEASURE、BACKGROUND、MAIN、METHODS、SETTING、CONTEXT通常用于小标题,从而确定为“细目类”关键词(表2)。需要特别说明的是,笔者未对子库的12个关键词表进行彻底的语义语法范畴分类,而是特别关注摘要子库中非常具有作者语篇身份启示意义的“细目类”关键词(详见表2以及2.2.3节分析)。
表2 作者人际身份、语篇身份关键词
注:关键词的关键值范围为(88.3,1234.9),本研究关键值均指T值,关键词的T值越高,关键性越高,和参照语料相比,越是频繁出现在目标语料中;表2关键词后括号内的两个数值分别为软件检索出的该关键词出现频次在目标语料和参照语料中所占的比例;N是指比率过小,可忽略不计。
(3)基于第二步关键词语义语法范畴分类结果与作者人际身份、语篇身份的核心内涵进行语义对接和诠释。该对接基于作者人际身份、作者语篇身份的定义、核心内涵、语言资源以及1.2节中提及的关键词研究;得出关键词表中能够揭示作者人际身份、语篇身份的关键词(表2)。从关键词表中识别能揭示作者人际身份、语篇身份的词项或类别,这是将研究目的和内容具体转化成可用计算机检索指令的关键所在。简单来说,两时段语料互为参照得出的关键词表中能提示作者自信和权威度以及信息阐述、信息呈现以及语篇构建特征的词汇,都能显示论文作者人际身份和语篇身份的两时段差异。
(4)分析可揭示作者人际身份、语篇身份的关键词(表2),评论语言数据信息。这是将从语料库获取的凸显语言形式和频数结果与最初研究命题建立联系的关键步骤[17]。鉴于“语篇关键信息的部分阐释可从关键词周围语境、即最终从文本中获得”[10],这一步主要通过批量语言形式的表征和语义来推导论文所体现的作者人际身份和语篇身份。
从表2可以看出:自我提及类、祈使类活动关键词提示作者自信和权威度呈现于论文的特点;语法词、祈使类活动关键词提示作者阐述信息特点;图表和补充内容类关键词提示作者呈现信息特点;摘要细目类关键词提示作者语篇构建特点。自我提及类代词、祈使类活动以及细目类关键词仅存在于第二时段;两个时段均有语法类词与图表和补充内容类关键词,但具体词汇并不同。
从表2可以看出,第二时段论文作者的自信和权威度更突出,自我确定性更明确。这一论断主要基于分析仅存在于第二时段的自我提及类代词WE和祈使类活动关键词。
分析自我提及代词WE得到两个结果。(1)第二时段语料显著多用WE。自我提及语是学术语篇体现作者存在的关键手段之一,也是作者宣告权威的一种方式。选择出现于文本,作者可彰显对所讨论命题的信心和权威。检索发现WE在第二时段的出现频次大约是第一时段的两倍, 凸显了2000—2013年作者在论文中显示存在的强烈意愿。(2)第二时段作者权威性等级高于第一时段。该结果源于考察与WE频繁共现的典型搭配词(此处搭配词位置限定在关键词右边4个位置内;5.0<关键值<12.3)。Tang等[18]总结了第一人称代词(I、me、my、mine、we、us、our以及ours)可能承担的6个角色,按权威性从低到高分别为代表、 语篇指引者、 语篇构建者、研究过程陈述者、观点提出者以及创始者。第二时段WE(1021)(括号内的数字为词汇出现频次,全文同)和大量研究相关的动词搭配,如used(153)、found(131)、identified(63)、examined(61)、assessed(60)、tested(57)、observed(56)、calculated(46)、compared(39)、investigated(38)、performed(38)、excluded(37)、conducted(37)、included(37)、hypothesized(34)、estimated(31)、obtained(30)、studied(27)和defined(27),表明作者积极的研究者身份;搭配词Thank(72)表明作者的致谢者身份;believe(34)表明作者观点提出者身份。显而易见第二时段WE承担角色的权威性等级相对较高,为第四、第五等级。笔者发现第一时段与WE (827)搭配的典型动词有found(52)、thank(41)、studied(39)、conclude(26),提示作者作为研究者以及语篇构建者的身份,此时WE承担角色的权威性为第三、第四等级,低于第二时段。
祈使类活动关键词VIEW和DOWNLOAD在第二时段出现频次所占比例分别约是第一时段的8倍和2倍(表2)。分析发现VIEW和DOWNLOAD主要用于祈使结构,指令读者做事。VIEW构成了Viewlarge(258)、viewthistable(91)、viewinline(81)、ViewPopup(81)、ViewLargerVersion(26)、ViewSupplementaldata(12)等典型的祈使结构。DOWNLOAD最为典型的搭配是DownloadasPowerPointSlide(26)、DownloadSlide(.ppt)(129)。祈使指令“读者有义务做/不做某事”[19]. Hyland[7]指出指令可指引读者从事文字行为、物理行为和认知行为;文字行为 “指引读者关注文本特定部分”,如Seeexample14below。物理行为“指导读者在现实世界中如何做研究或采取行动”[7],例如Weshouldtakenotesandthencategorisethenotesaccordingto…。认知行为“通过一系列推理引导读者以特定方式理解观点”[7], 例如itisimportanttoconsiderthesourceofthereport。祈使结构viewlarge/thistable/inline/popup/largerversion/supplementaldata指令行使语篇行为;DownloadasPowerPointSlide/Slide(.ppt)等指令行使物理行为。指令行使物理行为、语篇行为表明论文作者引导读者阅读语篇或完成某些行为;这些指令要求读者以作者规定的方式行事,表明作者的权威以及作者和读者间地位不平等,故而这些指令威胁到读者面子。
值得一提的是,笔者认为要求读者行使物理行为、语篇行为的祈使结构对读者强加的力度并不是很大。原因之一,VIEW和 DOWNLOAD构成的祈使结构并未出现在正文中,提示作者尝试减轻指令语对读者的强加之意。原因之二,这些指令的主要目的是给读者提供线索,帮助读者更好地理解命题内容,并突出部分内容以吸引读者注意力,所有这些都有利于读者。原因之三,这些祈使结构要求读者参看图表或下载材料,并未强求读者用作者认定的方式去解读信息。Hyland[7]认为指令行使语篇行为和物理行为对读者施加的力度较低,而指令执行认知行为、 “让读者以作者期待的方式理解观点”,在“三种类型指令中对读者的强制力最大”。
总体而言,自我提及类代词和祈使类活动关键词仅存在于第二时段的事实表明,第二时段比第一时段频繁使用自我提及类代词和祈使类活动词,从而提示作者的人际身份具有如下发展特征:第二时段呈现出更为权威、自信的作者。
2.2.1 语言阐述更趋口语化
从表2还可以看出,论文从书面文本转变为倾向于具有口语特征;这一论断主要基于分析语法类和祈使活动类关键词。
分析语法和祈使活动类关键词提示以下4个语言特征。(1)自我提及代词WE和祈使活动类关键词VIEW和DOWNLOAD作为关键词时仅在第二时段出现,在第二时段出现频次占比分别约是第一时段的2倍、8倍和2倍。(2)第一时段语料频繁使用连词SINCE,出现频率占比约为第二时段的3倍。(3)第一时段语料显著多用较长名词词组。The、of是英文高频词,一般不可能出现于关键词表;the、of出现在第一时段关键词表的事实非常值得关注。语境行显示第一时段语料中有34.2%的由the、of构成的“the+名词+of+名词”结构。(4)第一时段语料中助动词多用于被动语态; 语境共现行观察发现约31.2%的BE以及51.6%的have和had构成被动结构。
以上语法类、祈使活动类关键词分析呈现出的4个语言特征揭示了两时段作者的信息阐述特点。Biber[20]认为大量使用名词和介词是“信息生成(Informational Production)”语篇的特征,学者普遍认同大量使用介词修饰名词短语的“the+名词+of+名词”结构是学术文本的特征之一[21];大量使用连词和被动态是“抽象性(Abstract)”语篇的特征;大量使用第一人称复数代词和祈使类词汇是“交互性(Involved)”语篇的特征。“信息性”和“抽象性”是学术文本的重要特征,而“交互性”是口语文本的重要特征[20];总体而言,和第二时段相比,第一时段语篇更具信息性和抽象性,更具学术特征,而第二时段论文展示出更强的交互性或口语化特点。这表明作者可尝试吸引更广泛的读者群,缩小以往高高在上的科研工作者和普通读者间的距离,让读者有亲切感,以便于更好地推销学术观点。
2.2.2 语篇呈现更突显视觉模式
第二时段论文更突显视觉模式,这一论断主要基于对图表和补充类关键词的分析。
第二时段中图表和补充类关键词种类为第一时段该类关键词的6倍,可见第二时段频繁使用图表、幻灯片(PPT)等视觉工具。索引行表明第二时段中此类关键词 “动词(+形容词)+图表类名词”结构最为常见。动词多是view、see、download、save;形容词多是supplementary、supplemental、larger等;图表类名词多是appendix、table、data、figure、materials、slide(.PPT)等。本研究还发现图表、幻灯片和其他补充信息通常被隐藏起来,或采用小号字体,避免妨碍正文阅读,以方便普通读者掌握主要信息,这可能是因为大多数读者仅关注结果、结论。如果专业读者想重复实验,可点击下载相关图表、幻灯片等资源来深入了解研究细节。第二时段语料使用负载丰富信息的图表或幻灯片(PPT)等,既使语言简洁,又突出视觉呈现,吸引读者注意力,有助于读者识别和吸收信息。
2.2.3 语篇结构更细化
第二时段语篇结构中以更细化的小标题引领,使得关键内容更加突显和聚焦,这一论断主要基于分析仅出现于第二时段摘要子库的“细目”类关键词(表2)。
第二时段摘要“细目”类关键词的索引行检索表明,design、settingandparticipants、conclusion、main、outcome、measures、objective、intervention、background、methods、context通常用作小标题,提示第二时段摘要分解成更多小节,带小标题,细目明确,方便读者自上而下(Top-Down Reading)快捷阅读(图1)。此外,笔者在收集语料时发现,第二时段论文方法部分也通常分解成更多带小标题的小节,但此处不作详细分析,这是因为方法“细目”类关键词数量不多,而关键词数量不多,是因为方法部分并非和摘要一样具有相对固定的模式;小标题的数量和内容并不固定,取决于论文的具体内容,故而很难形成数量较多的、显著多用的关键词。
图1 第二时段分解为更多带小标题小节的论文摘要[22]示例截图
总体而言,作者语篇身份的发展具有如下特征:第一时段语篇阐述方式具学术性,而第二时段论文更趋向口语化。阐述方式变化与Fairclough[23-24]的研究一致:现代社会私人领域话语殖民与蚕食公共领域话语,语言存在“非正式发展”或“口语化”(Conversationalization)倾向,这是话语民主化(Democratization)的典型特征;话语民主化趋势消除不同群体在语言权力、义务及声望的不平等。作者尝试使普通读者更容易吸收信息,显示了作者语篇身份更民主。
第二时段论文信息呈现方式更为注重视觉模式,且语篇结构更细化。这方便读者快速阅读,适应繁忙、高度选择性读者的需求。促成这种变化的重要原因和客观基础在于数字技术的发展,使得图表等的制作和展示成本大幅度降低,极大地方便作者以更易理解的形式展示其学术观点;除此之外,笔者认为这利用了广告促销策略。Wernick[25]和Featherstone[26]将当代文化概括为“促销文化”。受促销文化影响,广告作为有效的宣传方式迅速发展并对其他话语殖民。尽管学术话语的主要目的是提供信息,但第二时段论文写作关注读者需求,以一种含蓄方式方便推销学术观点。本研究结果也符合Fairclough[23]话语具“商品化”特征的观点,他认为“商品化”是指“以商品生产、分配和消费的形式来组织、构思不以商品生产为目的的社会领域和社会机构的过程”。话语商品化可被视为机构话语以及更广泛领域的社会语篇和商品生产相关的语篇,如广告促销语篇侵袭。总体而言,第二时段语篇“商品”化的特点呈现作者更为关注读者需求,体现了作者语篇身份更为“商业化”。
按照Fairclough[23]“话语商业化蕴含了话语民主化”的观点,第二时段作者语篇身份更为商业化。
本研究总结了250篇国际生物医学期刊论文作者人际、语篇身份的跨时段变化特征:作者自信和权威度更为突显,更能体现作者主体身份;语言阐述更趋口语化,语篇呈现更突显视觉模式,语篇结构更细化。本研究认为我国生物医学出版界和作者须顺应国际前沿的生物医学论文写作规范与文化,在论文写作时有意识地克服东西方社会文化观念、思维方式和写作习惯的差异,提升出版语言的国际化和规范化水平,提升文章发表后被主流学术界关注和接受的可能性,提升我国英文生物医学期刊国际认可度。(1)作者应积极调整语言表述方式,凸显更为自信和权威的作者身份;放弃学术写作不应使用第一人称代词的陈旧观点,不要顾虑将作者呈现为事件中心,不要担忧在研究过程中描述作者自身的行为、观点和感受会削弱研究的客观性; 作者还应理解语言阐述的口语化特点,增强其可读性;合理使用负载丰富信息的图表工具,突出视觉呈现。另外也要注意语篇构建方式,注意以更细化的小标题引领以突显关键内容。(2)期刊编辑除修改英文语法和词汇表达外,应重视目前国际生物医学期刊通行的作者自信和权威度在论文的呈现以及信息阐述、信息呈现、语篇构建的特点,正确引导作者完善写作。(3)审稿人衡量论文录用与否,也应考虑论文作者呈现的人际身份、语篇身份是否遵循目前国际生物医学期刊通行的规范。
后续研究可从以下5方面进行。 ①本研究关注论文作者人际、语篇身份的跨时段“差异”,后续研究可关注作者人际身份、语篇身份跨越不同时段仍保持不变的特点,这对于期刊编辑同样重要。②本研究基于关键词列表中的前100个词,后续研究可扩大关键词研究范围。③可关注生物医学之外的其他学科领域,了解不同学科学术论文作者人际身份、语篇身份呈现的特点。④后续也可比较英语本族语作者和中国作者撰写的英语学术论文。中国作者写作无疑会受到中国学术惯例的影响,论文中呈现出的作者身份特点与英语本族语者自然有所不同。⑤本研究关注论文文本;由于目前以网站为基础的数字化媒介已逐步替代印刷介质成为学术沟通的主要平台,后续研究可将彩色标题、粗体、功能图标、视频、动画特征和特效等多模态特征以及超链接等特点纳入研究范围。这5类后续研究,都可从不同角度就论文作者人际身份和语篇身份的呈现为期刊编辑提供有益建议。