唐 苏
(武汉华夏理工学院外国语学院,湖北武汉)
文献引用是学术写作中的一项重要技能。正当合理地引用文献来归纳和评价前人研究的成果与不足并佐证自己的观点,能够明确文章的研究背景及现状,很大程度上提升了该文的写作质量。文献引用的学习和训练是一个长期而复杂的过程,二语学习者往往因文献引用策略使用不当被认定为抄袭,从而被误认为有意违背学术标准和规范。随着学界对文献引用行为的研究从学术道德视角转向语言学视角,区分有意抄袭和无意抄袭(Drum,1986;McLeod,1992;Sutherland-Smith,2008),文献引用不当行为被学界认定为语言学习和学术写作能力发展过程中的阶段特征。本文拟通过分析中国二语学习者学术写作中的文献引用不当行为,以提升二语学术写作能力,强化学术规范,以期为二语学术写作教学提供一些启示。
文献引用是一种借用源文本语句或观点的文献使用方式,包括文内的文本引用部分及缩略的作者信息,和文后参考文献里完整的文献信息。文献引用既可为文章提供有力依据,亦能体现作者观点的独到之处(Hyland,1999)。如果获取不到原文献,可以使用二次引用来归誉该语句或观点的原作者和间接资源的作者,后者信息必须列入参考文献。不当的文献引用方式会被认定为学术抄袭(Pecorari,2003)。
目前学界对文献引用策略的分类并没有达成一致(马蓉 秦晓晴,2014a)。Barks和Watts(2001)构建了一个文献引用策略的三元模型,即释义、概括和直接引用;Shi(2004)将各种文献引用行为总结为三种:未标注出处文字(复制、轻度修改、句法重构)、标注出处文字(复制、轻度修改、句法重构)和直接引用;经过进一步的研究,Shi(2012)认为翻译也是二语学生的一种文献使用方式;Pecorari和 Shaw(2012)从源材料和文章互文关系的角度提出了间接互文性(indirect intertextuality)、常规互文性(conventional intertextuality)、非常规互文性(unconventional intertextuality)和欺骗性互文性(deceptive intertexutality),其中后两者为不当的互文关系。
此外,国外学界对拼凑写作(patchwriting)和释义(paraphrase)的界定存在争议。Howard(1993:233)将拼凑写作定义为“复制文献材料后删除一些词语,改变其语法结构或插入同义词以替代原来的词”。虽然Howard(1993,1995)、Mcdonnell(2004)以及Li和Casanave(2012)等学者肯定了其在二语学术写作初学者学习中的作用和价值,但Pecorari(2003,2008)将其认定为篇章抄袭的一种形式,是一种可归誉源文本的思想表达方式,一种独立的话语重述(Pecorari,2008),是一种与归纳相关的复杂写作方式(Hirvela & Du,2013),缺乏一致的操作定义使学界就何种释义会被认定为抄袭引起了争议(Roig,2001)。Shi(2004)将释义分类为接近释义(close paraphrase)和完全释义(absolute paraphrase)。经过研究,Keck(2006)提出将释义分类为几近抄袭(Near Copy)、少量修改(Minimal Revision)、中度修改(Moderate Revision)和彻底修改(Substantial Revision),其中前两者为不当的文献引用行为。
国内学界也逐渐开始关注二语学术写作中的文献引用。程伟(2007)将文献引用分为四种方式:未标注出处引用、直接引用、释义和二次引用,并基于是否归誉源材料和标注引用对不当引用进行了界定;马蓉和秦晓晴(2014b)综合学界已确认的文献引用方式和互文类型提出了新的文献引用策略框架:概括、完全释义和直接引用(规范互文);复制、接近释义和直接翻译(不规范互文),并提出了“有效引用”的概念,即文中括号标注的被引用文献信息能在文后参考文献中查找到;文末参考文献缺失将被认定为引用信息错误(赵永青等,2016);孙厌舒(2016)综合前人研究将文献引用分为标注引用的借用、未标引用的借用和直接引用三大类,并将前两类进一步细分为完全复制、释义和改写。
学界主要采用文本分析法对文献引用行为进行考察。除了普遍的从道德文化层面对有意图抄袭进行解释,学者们更关注二语学生学术写作的文献引用能力、对文献引用规范的认知、著作权意识等因素导致的无意图抄袭。Pecorari(2003)研究了二语研究生的文本中被认定为抄袭的篇章,并对其进行了访谈;在进一步的研究中,Pecorari(2008)发现二语研究生误用二次引用,将其参考文献直接复制为一手引用;Abasi等(2006)在对二语研究生及其文献引用行为进行的一项案例研究中发现了学校制度定义为抄袭的行为,但并未发现抄袭的主观意图;Lankamp(2009)同样从硕士生的文本中识别了未在参考文献中归誉来源的源材料;Davis(2013)对硕士生进行了纵向研究以考察其源文本使用能力的发展并发现了一些不当引用的行为。国外研究表明,不当文献引用行为在二语学生学术写作中较为普遍。
尽管国内学界同样缺乏对文献引用策略的统一分类和研究,并倾向于从学术不端的道德角度来审视不当文献引用行为,本世纪以来越来越多的学者开始着眼于语言学视角的文献引用不当行为研究。钟伟珍和黄国文(1999)、程伟(2007)发现了研究生论文中的文献引用不当行为;马蓉和秦晓晴(2014a,2014b)研究了二语学术写作中的文本借用策略,研究发现多数文献引用不当行为在于接近释义和复制;对比中美学生对抄袭的认知,张惠琴等(2008)、张聪(2014)发现中国学生对抄袭行为认知欠缺,这也在秦朝霞(2013)的研究中得到了印证,硕士生的引用格式规范认知无明显进步(徐昉,2013)。王俊菊等(2017)使用问卷调查和访谈考察分析了英语专业硕士生的学术写作文献引用,发现研究生的文献引用水平有待提升。硕士生能较好识别显性抄袭,但对隐性抄袭和文献引用不当的认知有限(桂敏等,2016;章木林 邓郦鸣,2019)。
学界对英语专业硕士生文献引用不当不乏实证研究,但尚存以下不足:视角方面,大多聚焦对文献引用不当行为的质性探讨而较少关注原文献来源特点和文本复制量的量化分析;方法方面,对文献引用策略的分类不够详尽,且需结合原文对照进行深入考查文献引用行为。英语专业硕士生代表着相对高的语言水平,理应在其毕业论文中体现出较高的文献引用能力。本文拟以其毕业论文为研究语料,从文献引用策略使用方式这一宏观层面和文献引用文本复制程度这一微观层面探究其二语学术写作中的文献引用策略使用不当。拟回答以下问题:
(1)英语专业硕士生毕业论文的文献引用不当行为的数量有何特点?
(2)英语专业硕士生毕业论文的文献引用不当文本复制量有何特点?
研究语料来自国内某重点大学全日制英语专业硕士生同一研究方向的毕业论文。鉴于文献引用相对集中在文献综述,本文借鉴前人研究(Pecorari,2003;程伟,2007),从25篇论文文献综述部分引用频次不低于30次的硕士论文中随机抽取10篇的文献综述为研究语料,共计36797词。
文献引用研究主要涉及文献引用策略使用量和文献引用文本复制量(Gebril & Plakans,2009)这两个指标,前者关注文献引用的形式,后者关注文献引用的内容。本研究参照APA,借鉴前人研究(Shi,2004;程伟,2007;Petric,2012;马蓉秦晓晴,2014a)改进了文献引用策略编码标准,将文献引用策略分为六大类:直接引用、释义、二次引用、未归功复制、翻译和无效引用,并对文献引用策略使用的适当和不当进行区分(见表1)。标注引用的一个括号计一条引用,包括单引、群引和二次引用(Mansourizadeh & Ahmad,2011)。直接引用指用引号或缩进等形式标记引用;释义是重新表述原文,根据Keck(2006)“特殊联系”(unique links)的分类标准,释义与原文20%及以上的词句重复会被认定为不当引用,包括词的时态、语态和数的屈折变化。概括和拼凑写作也属释义范畴,前者是归纳原文信息,但拼凑写作并未对原文充分释义;二次引用指找不到原文而间接引用他人的引用内容,并归功间接资源的作者,同样需要标记直接引用或者对引用内容进行释义;未归功复制是指照搬原文且不归功原作者;翻译指直接翻译原文而不进行归纳、释义或归功来源等;无效引用指正文中标记了引用,但文后相应的参考文献信息缺失。标记的直接引用(SDQ)、充分适当的释义(ADP)和正确且归功原文的二次引用(CDSC)是适当的文献引用策略。
表1 文献引用策略分类
部分文献引用策略示例如下(粗体为与原文重复的文字):
(1)释义:
原文:Children speak more like adults, dress more like adults and behave more like adults than they used to.
引文1:Yet children are beginning to act more and more like adults every day, by the way they speak and act.(不当释义)
引文2:Modern kids seem to be acting, through dress and speech, like adults at an alarmingly young age.(适当释义)(Cited in Keck, 2006)
(2)二次引用:
原文:This was first suggested by Leonard Bloomfield.He advocated that (i)...and (ii)word“the minimum free form”.(Hu Zhuanglin, 2006:57)
引文:According to Bloomfield (1995, quoted in Hu 2001:79), word is “the minimal free form”.(正确二次引用)
原文:A promising candidate in this regard is the Yes/No test developed and used by Meara and colleagues (Meara and Buxton, 1987; Meara,1989, 1996; Meara and Jones, 1988; Meara and Milton, 2002).(Harrington M, 2006: 73)
引文:It was developed and applied by Meara and colleagues (Meara and Buxton, 1987; Meara and Milton, 2002, cited in Harrington M, 2006).(不当二次引用)
原文:Indeed, questionnaires are often referred to under different names, such as “inventories”,“forms”,“opinnionaires”,“tests”, “batteries”,“checklists”,“scales”,“surveys”,“schedules”,“schedules”,“studies”, “profiles”,“indexes/indicators”,or even simply“sheets”(Aiken,1997).(Zoltan Dornyei, 2003: 5).
引文:Indeed, questionnaires are often referred to under different names, such as “inventories”,“forms”,“opinionnaires”,“tests”, “batteries”,“checklists”,“scales”,“surveys”,“schedules”,“studies”,“profiles”,“indexes/indicators”,or simply“sheets”(Aiken 1997).(未归功二次引用)(3)翻译:
原文:水是中国古代极为典型的根隐喻。以水比德、以水喻道、以水论政、以水谈兵等以自然之水隐喻社会人事的做法是中国古人基本的思维习惯和修辞倾向。而从本质上来说,以水为喻之思维模式和修辞倾向来源于“天人合一”这一中国古代最为基本的思想观念。(Diao Shenghu,2006: 180)
引文:Diao(2006)regards water as the most typical root metaphor in ancient China.It is the fundamental thinking habit and rhetorical inclination for Chinese people to use water in nature to understand the people and events in society, such as virtue, principles, politics and war.He thinks the use of water metaphors stems from the fundamental concept in ancient China that“man is an integral part of nature”.(翻译)
关于文本复制量,本研究借鉴前人研究(Pecorari,2003;程伟,2007)计算了4个次指标,并借助数学极值法,采用极限假设以衡量语料的文献引用不当文本复制程度:指标1指单条文献引用中不当复制文字的百分比;指标2、3、4用于测量语料的整体不当引用程度。指标2(宽范围)为各语料中经对比的不当复制文字在整个语料的占比,其排除了未对比文本中可能存在的不当复制文字,可能由此低估文本的不当引用程度;指标3(窄范围)即各语料经对比的不当复制文字与未对比文字之和在整个语料的占比,因其将全部未对比文字视作不当复制文字而可能高估文本的不当引用程度;指标4是经对比的不当复制文字在已对比文字数的占比。指标4应介于指标2与指标3两个极值之间,文本对比越充分,指标4与真实不当引用程度的误差就越小。
研究用国外广泛采用的查重软件Turnitin检测语料,并人工比对软件标记相似性高的部分和原文,以考查其文献引用的具体情况。原文如期刊文章、硕博论文、论文集以及专著,多数可从中外文数据下载或浏览。研究由两位英语教师分别编码,并对不一致处协商解决。语料标记归功的被引文献计327篇,其中经对比292篇。标记文献引用计508条,其中经对比468条。但经软件查找和人工核实,语料中识别出未归功复制和翻译,因而实际分析对比文献引用549条。数据收集之后用SPSS 25.0进行统计分析。
表2是语料的文献引用策略整体使用情况。横向比较10篇语料(见表2),文献引用策略使用频率最高的是L7(73次),最低的是L4(31次)。各语料中均有不同程度的文献引用策略使用不当,其中最高的是L9(87.30%),最低的是L4(29.03%)。L9使用了29次未归功复制和21次未归功二次引用,L8同样使用了大量的未归功复制和无效引用,而L1中的无效引用高达37次。L4文献引用策略频率最低,而引用策略使用不当量也最低。
表2 各语料文献引用策略频次
纵向比较各文献引用策略(见表3),释义策略使用频率最高(198次),其中适当释义176次,其余五类文献引用策略的使用频率相差不大。虽然适当的释义策略使用量最高,但文本分析发现其中大部分为对原文献内容的整体概括,而并非对其语句的重新阐述。换而言之,写作者未必真实了解掌握释义这一文献引用策略。语料中的未归功复制、翻译和无效引用也有较大的使用量。归功的二次引用的使用量(无论正确与否)较少,而未归功的二次引用使用量则与前者反差较大,且无效引用的标准偏差最大(11.302),说明各语料中无效引用情况差异最大。
表3 文献引用策略描述统计
由表3可见,文献引用策略的使用不当频次总计310次,占比56.5%。进一步分析各文献引用策略使用不当情况(见图1)发现,使用频率最高的依次为无效引用、未归功复制、未归功二次引用和翻译,而不当释义、未标记直接引用和不当二次引用使用频次则较少。
图1 文献引用策略使用不当比例
研究追溯和分析了未归功复制、未归功二次引用和未归功翻译所使用的源文献,大致为期刊文章、学位论文、专著和互联网资源四类(见表4)。未归功二次引用和未归功复制的源文献主要为国外期刊文章和专著,而翻译所使用的源文献则为中文期刊文章和专著,尤其集中于期刊文章的摘要部分。
表4 未归功原文献来源
Pecorari(2003)和程伟(2007)对单条文献引用不当文本复制量的相似度水平进行了划分,鉴于释义策略将20%及以上的重复率认定为不当引用,本研究借鉴前人研究将相似性水平确定为100%、85%、70%、50%、30%和20%。不当重复文本涵盖词的屈折变化,且无效引用的相似性水平确定为100%。由表5可知,文献引用不当文本复制量随相似度水平的上升而增加,且相似性水平为100%。文献引用不当占比51.30%,因其包含相当数量的无效引用和翻译。85%—100%的相似性水平占比21.94%,而其余相似性水平占比则急剧下降。
表5 文献引用不当文本复制量的相似度水平描述统计
根据极值理论,经对比字数越接近总字数,即对比越充分,文本不当复制程度指标越准确。考虑到软件检测和人工核实的有效性,指标4最能准确反映文献引用不当文本复制程度。由表6可知,L2对比最充分(80.68%),因此其指标2和指标3两个极值跨度最小,指标4也最灵敏;而L10则相反(37.53%),因此其两个极值跨度最大,指标4相对误差较大。
表6 各语料文献引用不当文本复制程度
此外,对比各语料的三个指标发现,若三个指标均相对较高,则其文献引用不当文本复制程度较严重;反之亦然。如L9和L8,其“宽范围”相对较高(43.41%;55.08%),其指标4也相对高;而L2的“窄范围”相对较低(47.60%),则其指标4也相对低。然而,需要注意的是,L1和L10中指标2和指标3跨度虽相对较大,但其指标4分别靠近“窄范围”和“宽范围”,表明虽然这两篇文本对比不尽充分,但真实的不当文献文本复制程度仍然可通过指标4来体现。
英语专业硕士毕业论文中各种文献引用策略被广泛采用,这与McCulloch(2013)、马蓉和秦晓晴(2014a)对硕士论文文献引用行为的研究结果一致,表明写作者在学术写作语境中有意识使用各种文献引用策略以佐证自己的学术观点。但突出的问题是,本研究经文本分析发现英语专业硕士生毕业论文中文献引用不当行为较为普遍,使用频率由高到低依次为无效引用、未归功复制、未归功二次引用和翻译,还有少量的未标记直接引用、不当二次引用和不当释义。整体呈现如下特点:
首先,体现文献互文关系但未遵守引用规范。未标记直接引用、不当二次引用和不当释义虽然对源文献语句使用不当,未遵守学术文献引用规范,但标明出处能体现写作文本与源文献之间的互文关系。直接引用策略使用中,写作者往往只归功原作者而并未使用引号、缩进等引用标记。写作者对释义策略的使用表现出对源文献的过度依赖。作者虽有意识对源文献进行加工处理,但常因释义不充分而导致“拼凑”现象,或直接提取源文献内容加以概括。释义是一种要求较高的文献引用策略,写作者需要充分理解源文献,并转换为规范的学术语言来呈现自己的观点,其学术认知负荷则相对更高。写作者的概括策略多为对文献摘要部分信息的直接提取,而非对文献内容进行高度凝练的归纳推理。概括策略的掌握需要较高水平的归纳、推理等思辨能力和双语运用能力(马蓉 秦晓晴,2014a)。释义策略的习得不仅涉及语言能力的发展,还涉及文献引用规范的教学。写作者对二次引用的不当使用,主要是由于未能标记或适当释义文献内容。本研究认为,此三种不当引用策略占比较少,但真实体现了学习者学术写作能力的曲折发展,学习者不仅要知道什么是正当的文献引用行为,还需要知道怎样正当地引用文献,有必要开设相关课程对文献引用策略的陈述性知识和程序性知识进行教学以规范学习者文献引用行为。
其次,掩盖写作与源文献之间的联系。未归功复制、未归功二次引用和翻译掩盖了写作与源文献之间的联系,且使用量较大。写作者倾向于隐藏其写作与源文献之间的关系,其原因除了写作者客观上对文献引用规范认识的欠缺,还有其主观上可能存在的抄袭意图。互联网时代文献资源的开放性和便捷性在助力写作者学术视野拓展和学术写作能力发展的同时,也为不当学术引用行为提供了契机,目前现有检测识别工具的不完善则一定程度上放任了引用策略使用不当行为的蔓延。与马蓉和秦晓晴(2014a)的结论相反,本研究发现翻译策略使用较多。虽然Shi(2012)肯定了翻译策略的合理性,但本文人工对比发现若干语料中有大量对中文专著和论文的翻译未标记来源的实例,且翻译行为很难被查重软件识别。这一发现也可从不当文献引用的源文献来源特点得到佐证,写作者倾向于使用中外学术期刊和专著而不归功来源。上述三种文献引用策略不当掩盖了写作与源文献的联系,无论写作者抄袭意图存在与否,强化学术监督和学术自律都是必不可少的举措。
再次,构建写作与源文献的虚假联系。写作者仅在文内括号标注作者信息但未能在文后参考文献中列出文献详细内容从而导致无效引用,构建了写作与源文献的虚假联系。该行为的解释除了构建虚假联系的主观意图,还有学术写作规范意识的严重缺失,因为参考文献的完整性属于学术引用常识性知识,有别于其他学术认知负荷高、要求一定学术读写能力的文献引用策略。本研究发现的无效引用在引用策略使用不当中占比最大,此结论尚未在其他研究中得到印证,因为已有相关实证研究未涉及该引用行为,但鉴于其在各语料中的使用情况差异较大,本研究认为该行为较偶然,但不可小视。
文本分析发现,语料中文献引用不当的文本复制量水平较高,主要特点如下:
首先,单条文献引用不当的文本复制量较高。研究表明,超过50%的单条文献引用不当相似性水平达100%。分析发现,这是由于语料中存在数量较多的无效引用和翻译。约20%的文献引用不当相似度水平介于85%至100%之间。单条文献引用不当的高文本复制量凸显出写作者学术文献引用规范意识薄弱的问题,其倾向于直接使用源文献将他人成果据为己有,或遗漏源文献信息,因而缺乏对原作者及学术规范应有的尊重。
其次,多数语料中指标4反映出语料整体的文献引用不当复制程度较高。可见,文献引用不当的文本复制量与文献引用策略使用不当情况相匹配,即写作者仅对源文献进行浅层次加工处理,其本质原因则是写作者文献引用能力欠缺,不足以对源文献进行深层次的归纳、推理和总结。学界有从语言学角度来考察学术写作文献引用行为的发展的研究(Pecorari,2008),将文献的不当引用视作学习发展的过程,文献不当引用的主要原因是写作者与英语学术话语社群接触较少(章木林 邓郦鸣,2019),且掌握文献引用规范并非易事(孙厌舒,2016)。鉴于操作的可行性,本研究未对研究语料写作者就文献引用认知进行进一步了解,因而未涉及写作者文献引用策略的意图,故难以判定其有主观意图或只是无意为之,但是本研究反映出写作者的文献引用行为亟待规范,文献引用能力有待提升,这是不争的事实。
就研究发现中文献引用不当的突出问题而言,本文认为,现有识别工具很难实现文内引用标记与文后参考文献的匹配以检测虚假的无效引用,而翻译只能依赖对原文的熟悉度进行人工识别。换而言之,文献引用不当识别工具的工作机制和文献数据覆盖面的问题应受到关注。现有文献引用不当识别工具的工作机制使得上述两类文献引用不当问题长期得不到学界的重视。本研究采用的研究工具Turnitin收录外文数据较丰富,这也解释了语料中相当数量文献引用不当行为的源文献来源问题。以学术道德约束和软件检测识别倒逼写作者正当合理地使用学术文献并不是上策,归根结底,写作者的文献引用知识和学术写作能力才是症结所在。采取有效的学术写作教学手段,强化学术引用规范意识,才能积极地疏导“抄袭”这一国内学界敏感又难以回避的问题。
本文以10篇英语专业硕士生毕业论文的文献综述为语料,以文本分析法考查了二语学术写作的文献引用策略使用不当行为。研究发现:1)英语专业硕士生毕业论文中文献引用不当行为较普遍,使用频率由高到低依次为无效引用、未归功复制、未归功二次引用和翻译,不当引用的源文献主要为国内外期刊和专著;2)英语专业硕士研究生毕业论文中的文献引用不当的文本复制量较高,然而现有检测识别工具并不能完全识别文献引用不当的行为。
本文献引用不当行为的数量和文献引用不当文本复制量两个指标,进一步细化文献引用的分类,结合质性探讨和量化分析,拓展了对文献引用行为的研究视野,研究对二语学术写作教学具有一定的启示。首先,开设学术写作课程以引导和规范学习者文献引用行为为目的,是提升其学术文献引用能力以规避文献引用策略使用不当的必然出路;其次,学习者主动靠近学术话语社群的自觉是关键之举,其文献引用行为的发展不能局限于对学术文献的模仿借鉴;再次,监督学习者学术文献引用行为,提升其学术道德水平和加强学术自律是必要保障。
未来研究可扩大研究语料范围,以减少研究语料中偶然因素产生的误差,还可结合文本分析与写作者对文献引用行为的认知和态度研究,以期更加全面地考查学术文献引用行为。