陈月娥
(安徽建筑大学外国语学院,安徽 合肥230001)
美国语言学家萨丕尔曾说:“ 语言不能脱离文化而存在,也就是说不能脱离社会流传下来的,它决定我们生活风貌和信仰的总体。 ”[1]正是因为语言中渗透着文化,在学习第二语言时,我们必须熟悉与这门语言相关的文化。 社会在变化,文化在发展,而最能及时反映这些变化和发展的非新闻莫属。 因而英语新闻的学习也是了解当今英美社会文化的主要手段之一[2]。 然而,英语新闻很多时候超越了课本和本族传统文化的视野,这不仅表现在词汇和文体上,更是体现在新闻报道内容和知识背景中。 目前国内研究者对英语新闻的研究多集中在其语言词汇特色和文体风格研究上,或者仅仅针对某一具体主题进行研究,如赵国杰[3]对涉华报道中的中国特色词汇研究等, 而很少单独提出对新闻主题总体进行研究。本研究拟通基于大规模真实新闻语料的统计分析,以图式构建理论为基础, 利用 “语义空间”、“语义场”、“词语场”的图式网络模型,把大量分散、相对孤立的关键词和主题用图式网络的方式归纳、分类,形成脉络清晰,结构紧凑的主题图式模型。 利用语料库提取的关键词作为图式模型的词汇填充,使得模型具有信息量大,内容真实、丰富、信息量大的特点,帮助学习者更好地去理解、构建和预测英语新闻的主题图式。
图式就是知识在大脑中的储存单位, 是人脑中一种抽象的、结构化和系统化的知识表征,它包括各种各样的知识,图式的总和便是一个人的全部知识。图式的概念最早来自19 世纪德国哲学家康德,他把图式看成是“原发想象力”的一种特定形式或规则。现代图式理论的主要代表人物Rumelhart[4]认为,图式理论是一种关于人的知识如何被表征, 以及对知识的表征如何以其特有的方式促进知识应用的理论。McCarthy[5]认为新知识必须与现存知识相联系才会得以处理加工, 高效的读者通过激活必要的知识才会对所读文本进行解码。
图式是一个知识框架,围绕这个框架,通过已知的背景知识可以使一定的情景得到解释, 从而使特定图式的知识框架得到扩展。图式不是一成不变的,它是一个开放的体系。人脑中已有的图式知识可以促进学习者的学习。图式在大脑中形成后会对之后获得的信息重新组织、理解和记忆,依据人脑中已存的图式对新输入的信息解码、编码。 根据人们的背景知识结构。 Carrell[6]将图式分为形式图式和主题图式两种, 其中形式图式包括语言图式和语篇图式;主题图式则包括了主题知识、世界知识和文化知识。 Carrell 认为形式图式和主题图式在阅读中对某一图式的激活乃至整个语篇的理解都起着重大的作用。
本研究把语料库词频自动分析与人工语义分析的方法结合起来。 观察语料库是选取2009 年至2011 年期间在美国出版的77 期美国《时代周刊》,对照语料库是英国国家语料库, 使用词性标准软件CLAWS 对语料库进行词性标注, 运用检索工具WordSmith4.0 的Keyword 软件来提取英语新闻词表中的关键词, 并使用语料库Range工具测量它们在基础词表上的分布。
本研究在提取TIME 文本时将杂志中重复出现的一些广告、网址和语句等与新闻内容无关部分进行了剔除,以减少其对统计结果的干扰。 语料库规模约为300 万词次。 TIME 是美国三大时事性周刊之一,内容广泛,对国际问题发表主张和对国际重大事件进行跟踪报道,在美国的媒体中颇有影响力,有世界“史库”之称。 本研究使用的对照词频表来自英国国家语料库。 该语料库是一个大型的现代英语书面语及口语的语料库,约为1 亿词次。该库的书面语部分主题广泛,语料库规模较大[7]。
观察语料库TIME 新闻语料库的形符数2887551、类符数73055、类符/形符比(TTR)2.53%;标准类符/形符比(STTR)51.125,大于对照语料库的42.66;平均词长(Mean WL)4.72, 大于对照语料库的4.64; 平均句长(Mean SL)18.55 词/句,小于对照语料库的19.57 词/句。 从这些数据可以看出,英语新闻具有句子简洁,词量丰富,词长偏长,句长偏短的特点。
关键词提取的理据是,当语篇围绕某个主题展开时,表达该主题的一些词汇会反复出现,在词频上的表现是这些词汇出现频率显著高于随机发生概率。 通过计算观察语料库和对照语料库的词频表,提取出词频差异具有统计学上显著性的关键词。
本研究采用对数似然率计算方法得出Keyness,软件设定max.p value=0.000001,Min.Fre >3, 按Keyness 大小排序提取前500 个候选关键词。去除一些不需要的符号、字母和数字得到485 个关键词,其中实义词474 个,虚词11 个。本文提取关键词的目的是构建新闻英语的主题图式,故去除没有语义功能的虚词。利用语料库Range 工具对关键词在Range 自带有3 个基础词表中的分布情况进行统计,结果如下:
表1:关键词的Range 工具分析结果
Range 的3 个基础词表,分别包括最常用的999 个词族,次常用的987 个词族, 和前两个词频表之外的、高中和大学各科教材中最常用的570 个英语词族。 从Range统计结果来看,有70.4%的关键词不在基础词表之中。尤其是专有名词,比例达到了98.2%。这表明新闻英语的词汇难度大,生词多,理解较困难。
心理语言学的研究表明: 母语使用者大脑中存在着大量的心理词库。 这些词汇并非杂乱无序, 而是一个组织严密的词汇集。 词语通过语义联系结成网络, 便于在交际时被有效快速地提取。 图式是语义记忆里的一个结构, 它对一群信息的一般和期望的排列作出规定[8]。McCarthy[9]曾指出,一个人在用词语来表达真实世界时,词与词之间存在一种谱系关系。 在这种关系中, 处于最上层的是“语义空间”,“语义空间”由各种“语义场”组成,后者表达对真实世界的知识或概念,它们又由“词语场”来构成。 心理图式就是一个高度抽象的, 庞大的语义空间,它由语义场组成。 语义场是对真实世界的反映,体现为各种主题,由对应的词语场来实现[10]。语言空间和语义场就是存在于头脑中不可见的图式,是无法直接观测的。词语场是由具体词汇聚合而成,是可观察到的,可以通过实证的方法加以统计。每一个语义场都应该有如下成分:1)主题词,是知识和经验的抽象,它带有语义场自身的标志性;2)行为词,表达一系列动作的词语;3) 行为者,是行为的主体,是行动的执行者或接受者;4)关联词,行为的客体,是行动的外在事物;5)位置词,即执行动作或行为的环境;6)时间词,即执行动作或行为的时间;7)修饰词等,即描述、评价、数量或限定其他词语的词语。
表2:关键词词性分布表(词例按词频大小排列)
从表2 可以看出:名词占关键词的绝对多数,合计占了全部的81.2%,其中专有名词比例最高,为46.8%。 这说明大量使用专有名词是英语新闻典型的词语特征。 而且这些专有名词大多具有较强的内容和主题色彩, 与热点人物、事件有关。 由Range 工具分析结果可知,这些词汇大多是无法在日常用语和教材中获取,这无疑给二语学习者带来挑战。而普通名词占比为34.4%,它们在语料库中出现频率高,Range 工具分析也表明它们多为常用词汇,词族种类多,词汇广度较大。从表中,我们也可以看出修饰词、时间词等数量均较少。
在下表3 中, 我们对222 个专有名词进行人工语义标注,按照语义分为人名、地名、国别、机构等7 个类别。可以看出,人名占据最大多数,为45.9%。人名中出现频率最高的是OBAMA。 在2008 年当选总统之前,他是一个名不见经传的人物,在BNC 语料库中只出现了1 次,而在观察语料库中出现次数多达2769 次, 关键值达到19,588.85。在地名中, 美国本土的地名, 如NEW YORK,WASHINGTON,CALIFORNIA 等 位 居 前 列。 在 国 别 中,CHINA 频繁出现在英语新闻中, 其出现的频率为1345次,甚至大于出现947 次的AMERICA,可以想象在新闻报道中关于中国的话题是非常频繁的。 当然还有可能的原因是美国的英文表达法不止有AMERICA,还有U.S.等。除此之外,英语新闻中常提及到的机构(如CIA、OSCAR、FBI)、科技(如FACEBOOK、GOOGLE、TWITTER)和组织(如TALIBAN、QAEDA、MUSLIM)的名称均被提取了出来。
表3:专有名词分布表(词例按词频大小排列)
在下表4 中,我们对163 个普通名词进行词义标注,把主题标记性显著的关键词进行了主题标记,共计10 个主题101 个主题词,对其余62 个主题标记不明显的关键词,根据词义属性分为关联事物和关联人物两类。
表4:普通名词主题分布表(词例按词频大小排列)
通过对关键词的语义分析, 不难发现构成某语义场核心的是普通名词中的主题词, 是特定语义场专有的,具有排他性。 例如,提到NEWS、FILM、MOVIE 等主题词就会联想想到 “媒体” 语义场, 提到PRESIDENT、GOVERNMENT、STATE 等主题词就会联想到 “政治”语义场。 其他的词语场不具有排他性, 可以是多个语义场所共享的,如关联词词语场的WORLD、CITY;时间词语场的YEARS、MONDAY;行为词语场的SAYS;修饰词语场的BIG、MORE 等。 语义场的这种构成形式,可以最大的满足交际需要,减少记忆负担,提高词汇提取速度。 在心理图式的作用下,语言使用者在涉及到某一主题时,其对应的语义场即被激活,触发一系列词语场。 由此可见,词语在大脑中并非杂乱无章地堆砌在一起, 而是按语义逻辑联系构成一个组织严密的网络图,共同构成学习者关于该话题的心理词库和图式。 不同主题的心理词库和图式内容上不相同, 但是结构体系一致。 下图为所构建的主题图式模型。
从图1 可以看出,心理图式作为一个语义空间,由若干多个语义场构成,语义场以主题(“媒体”)为聚合中心,由“主题词”词语场组成主题词汇。 例如,“媒体”的“主题词” 词 语 场 由 TV、PICTURES、NEWS、FILM、MOVIE、MEDIA 等23 个关键词组成, 它们在观察语料库中词频高,关键度也高。 这表明英语新闻相对于一般语料而言,“媒体”的主题出现频率高。 直接与“主题词”词语场接触的是“关联词”词语场,“行为词”词语场和“行为者”词语场。这些词语场之间彼此影响,关系紧密,相互激活,是构成语义场的主体部分。而“位置”词语场,“时间”词语场和“修饰”词语场位于语义场边缘,是对主体部分进行修饰和限定,不与“主题词”词语场直接接触。
从数据结果看,10 类主题词词语场解释了21.3%的关键词。 依据各主题词词语场的关键词数量排序, 最多的是传媒、政治、经济和军事,最少的是气候、体育和教育。 关联词词语场解释了24.5%,其中各类专有机构、组织、和产品等名称解释了16.7%的关键词,关联事物解释了7.8%, 出现频率高的关键词有WORLD、CITY 等在英语新闻各主题中均可能出现的常见词;行为者词语场解释了26.8%,其中专有人名解释了21.5%的关键词,出现频率高的人名有OBAMA、BILL、JOBS, 关联人物解释了5.3%, 出现频率高的关键词有PEOPLE、WOMEN、KIDS等常见人物。 行为词语场解释了2.7%,出现频率高的动词有SAYS、SPENDING、KILLED、FIGHT。 由它们构成的语义场主体部分合计解释了75.3%的关键词, 而位于边缘的“位置”、“时间”、“修饰”词语场合计解释了24.7%的关键词。
从图式模型的填充词汇中可以看出, 英语新闻的语义场主题鲜明, 关联词汇中专有名词众多, 诸如机构名称,组织名称等;行为者词汇数量多,大量专有人名出现;行为词较少,最常见的词是SAYS,这符合新闻报道常引用第三人称话语的特点;位置词汇中出现大量专有地名,反映新闻事件的地域特点;时间词汇中绝大部分为狭义时间, 如MONDAY、JUNE、THURSDAY, 而广义时间较少,反映出新闻事件对时间的敏感性和精确性;在修饰词汇中,数量词多为MILLION、BILLION 等,反映新闻事件多具有轰动性和影响力大的特点。
本研究利用真实新闻语料进行大规模统计分析,通过对关键词的提取,语义分析、加工,对词语场进行词语填充, 运用图式理论构建英语新闻语义网络模型。 通过提取出来的关键词进行语义分析和标注,来填充词语场并获得语义场, 本文最终形成脉络清晰的主题图式模型。 它的构建不仅可以帮助语言学习者了解英语新闻的热点和主题分布,而且减轻学习者记忆负担,丰富学习者图式和心理词库,改善词汇识别能力,优化学习者知识结构和语言认知能力,这些对大学英语词汇教学具有积极的指导意义[11]。
由于本研究中仅采用了共时语料库, 没有考虑图式内容的时效性,也没有对比其与本族语新闻主题图式的异同性,这些使得本研究具有一定的局限性,这也是未来研究的方向。
[1]周方珠.翻译多元论[M]. 北京:中国对外翻译出版社,2004:4.
[2]周学艺.美英报刊文章阅读[M]. 北京: 北京大学出版社,2004:12.
[3]范勇.《纽约时报》涉华报道对中国特色词汇翻译策略之研究[J]. 解放军外国语学院学报,2010,(5):82-87.
[4]Rumelhart D.The Architecture of Mind:A Connectionist Approach[M]. Mass: MIT Press,1989
[5]McCarhy.M.Discourse Analysis for Language Teachers[M].Cambridge:Cambridge University Press,1991.
[6]Carrell.P,Devine.J,Eskey.D.Interactive Approaches to Second Language [M]. Cambridge: Cambridge University Press,1988:158.
[7]周江林,张家强.基于语料库的英语空间隐喻研究[J]. 解放军外国语学院学报,2003,(5):27-31.
[8]桂世春.新编心理语言学[M].上海:上海外语教育出版社,2000:445.
[9]McCarhy.M.Vocabulary [M]. Oxford: Oxford University Press, 1990.
[10]李文中. 基于英语学习者语料库的主题词研究[J]. 现代外语,2003,(3): 284-293.
[11] 翟雪松, 林莉兰. 翻转课堂的学习者满意度影响因子分析——基于大学英语教学的实证研究 [J]. 中国电化教育,2014,04:104-109+136.