张 鸰
(厦门理工学院外国语学院,福建 厦门 361024)
国内外学术界对语块的定义有很多,得到广泛认同的是Wray[1]提出的“具有一定结构,表达一定意义的预制的多词单位,它以整体形式被记忆存储,在交际时被整体提取,不需要使用语法规则来加工分析的连续或不连续词汇构成的语串”。在她统计的50多个语块术语中,“formula/formulaic language程式化或公式的语言”最能体现出语块对于交流的“省力”优势。Altenberg & Granger[2]指出,英语自然话语约70%由语块构成。周健[3]抽样统计显示,汉语文本中平均每句有 1.4 个语块。陈红[4]认为汉语中存在较之英语还要丰富、在语言交际使用中更为活跃的语言板块。近十多年来,国内学者普遍认同西方的语块理论价值和应用价值,在语块的界定和功能、语块使用、语块能力的测量、语块教学、语块与辞典编撰、研究综述等6个方面展开了研究[5]。但语块研究文本大多是局限在学术文本或一般性文本,对特殊用途领域的文本研究较少[6]。在学习实践中,学生语块能力的训练局限在大学英语课堂上,很少在专业英语学习或双语结合的语境下运用这个技能。为利于融合“大学英语教学课外实践”“专业英语应用”“中英文技术文档学习”3个元素,本文以认知英文的专业语块为目标,通过选取理工科学生采集本专业技术文档的中英文语块,分析他们在本专业领域识别和采集语块的能力与特点,促进学生积累技术写作语料的意识。
研究对象是来自厦门某普通高校大二和大四的车辆、电气、计算机3个专业的12位学生,每个专业4人;其中男生8位,女生4位。他们英语水平接近且都通过了大学英语六级,在大学英语课堂上接受过语块识别的训练,明确知道语块的特征,如多词结构、程式化表达形式、惯用程度、出现的频率等要素,他们也知道语块分为词级层次类别和句级层次类别,但都从未在本专业的技术文档中运用过语块知识。
研究针对下列2个问题进行探讨性分析:
(1)研究对象采集专业语块的能力,即采集语块的有效性如何?
(2)研究对象采集专业语块呈现的特点是什么,语块类型与采集者专业和性别是否有关联?
研究中,让研究对象用半年时间采集行业中常用的中英文专业(技术)语块各300个。
根据语块所属的语法单位层次,汉语语块可以分为3类: 词级语块、句级语块和语篇语块[7]。考虑到研究对象的水平和实践操作的简便性,案例仅采集词级层次类别的语块,不包括句级和语篇层次的语块,语块的分类均以中文语块为采集标准,即中文部分必须是语块结构方可被采集。
因研究涉及的专业、人员、语料样本均较少,故定位为探索性的微案研究。
将同专业研究对象每2人分为一组,小组成员共同判断所采集的语块是否合适,每个专业安排1人协调组间采集的方向,避免重复采集。
对研究对象进行采集前培训,以明确采集标准、格式、方法、步骤和语块编码、自检方法。具体内容如下:
1.学习语块采集样本
项目组用3个专业的模拟短文(见表1)对参与学生进行实践前语块知识温习,并以其中车辆专业的短文做了语块采集样表(见表2)供参与学生参考模仿。表2中,编码包含了专业名称和语块类别,专业名称以拼音的首字母标识,如CL=车辆, DQ=电气, JSJ=计算机,而语块类别代码以英文词性首字母标识,如NN=名词搭配,NV=名词动词(主谓)搭配, VN=动词名词(动宾)搭配,AdjN=形容词名词搭配,AdvV=副词动词搭配 。如CL-AdvV指的是车辆专业采集的副词动词搭配语块。
表1 模拟采集的短文Table1 Texts for sample chunk Collection
表2 语块采集样表Table 2 Sample chunk for collection form
2.明确采集方法和步骤
根据研究设计,英文语块必须与中文语块意义完全对应,但中英文例句的句义可以各自独立,只要含有目标语块即可。采集前参与学生普遍对如何采集英文语块和英文例句感到畏难。项目组教师为学生演示了以中文语块为向导获取英文语块和英文例句的三步法,步骤如下:
(1) 确定中文语块。采集本行业高频使用,外行人也略有所知的程式化语言。如在车辆技术文档中,“车轮抱死”是一个常用的表达式,会驾驶的外行也不会完全陌生,在产品说明、用户手册、网页资讯等文档中可经常看到,容易获取中文例句,这样的语块具有采集价值。
图1 专业语块采集流程图Fig.1 Flowchart of technical Chunks collection
(2) 确定相对应的英文语块。在百度中输入目标语块“车轮抱死,英文”,从检索条目中可得到tire lock, wheel lock,wheel lock up等英文选项,然后需要在英文网页中逆查验证其正确性和地道性。高频使用的语言通常会优先显示在滚动的备选词条中,根据“车轮抱死”的主谓结构成分,可以判断“wheel lock up”比较适合作为对应语块,汽车专业的学生凭借对汽车品牌的了解也可以从“wheel lock up on 97 dodge 2500”的词条下获得确认。
(3) 确定英文例句。当点击查找时,网页会出现许多与“wheel lock up”相关的英文网站,从中摘选一含有该语块的例句即可。
上述采集方法可以用Baigent[8]所说的语块学习3阶段进行归纳,即辨认—探索—巩固 (identify-explore-consolidate)阶段。专业语块采集流程如图1所示。
研究对象进行为期半年左右(2016年12月至2017年6月)的专业语块采集实践。语料采集源来自产品说明、安装维护文档及其他用户手册(尤其是非专业用户需要阅读的文档)、专业科普书籍网页、行业代表性企业官网、专业产品说明书、中英文教科书等。
研究对象定期(大约6~8周)提交阶段采集的语块并举行跨专业组间讨论、研判、反馈和修正。项目组为研究对象提供了自我核查语块的问题清单和咨询他人反馈清单,研究对象可以借助清单自行核查或求助于他人的反馈对所采集的专业语块进行修正(见表3)。
表3 语块审核问题清单Table 3 Technical chunk check list
研究对象采集的语块分为3个批次提交供相关人员审核。采集语块须经过3个审核环节:本专业学伴、专业老师审核—大学英语老师审核—英语外教审核,被2个审核环节否定的语块被认定为无效。每一批次审核结果均以书面形式反馈给学生,以避免下批次出现类似问题。
采集结束后,研究对象累计采集1 012个语块,剔除无效语块后得到856个有效语块。
1.专业语块采集的有效性
图2 不同专业学生采集语块有效性Fig.2 Validity of technical chunks by collectors’ majors
“研究问题1:研究对象采集专业语块的能力,既采集来的语块有效性如何?”的统计结果如图2所示。从图2可见,各专业学生采集的有效性分别为车辆83.8%,电气84.2%, 计算机85.7%,平均有效性为84.6%。由于车辆专业2名男生因故中途退出项目,车辆采集的语块总数比电气和计算机少,但从有效性看,各专业研究对象的采集质量比较一致,反映了参与学生彼此的专业语块采集能力相近的事实。
2.专业语块采集类别的分布
856个有效语块中有7个语块属于副词动词搭配类别,因其样本太小忽略不计入统计,其他849个有效语块集中分布在形名搭配、名名搭配、名动(主谓)搭配,动名(动宾)搭配4种类别上,用SPSS软件统计得到这4个类别语块的采集频率分布(见表4)。
表4 语块类别分布频率Table 4 Technical chunk distribution by type
针对研究问题2,对语块类别和专业数据、语块类别和性别数据分别做了交叉表(见表5~6)和卡方独立性检验(见表7)。
表5 语块类别*专业交叉表Table 5 Type & major cross-tabulation table
表6 语块类别*性别交叉表 Table 6 Type & gender cross-tabulation table性别
表 7 语块类别*专业和语块类别*性别卡方检验表Table 7 Type & major and Type & gender chi-square test
注:a.0 单元格(.0%) 的期望计数少于 5,最小期望计数为 7.44。b.0单元格(.0%) 的期望计数少于 5,最小期望计数为 17.06。
由表7卡方独立性检验结果显示可知,研究对象的专业和他们采集的专业语块类别存在显著相关(χ2=101.012,df=6,P<0.05)。具体地说,电气专业的学生采集的语块中形名搭配类别的占多数(169/279=60.6%),名名搭配类别的占49%(192/390=49%),车辆专业的学生采集的语块中名动(主谓)搭配类别占42.5%(17/40=42.5%),高于电气和计算机专业,计算机专业的学生采集的语块中动名(动宾)搭配类别占比55.7%(78/140=55.7%),高于车辆和电气专业。研究对象的性别和他们采集的专业语块类别也存在显著相关(χ2=34.031,df=3,P<0.05)。具体地说,女生采集名名搭配类别的语块明显多于男生,占66.2%(258/390=66.2%),男生采集的名动(主谓)搭配类别的语块明显多于女生,占72.5%(29/40=72.5%),女生采集的动名(动宾)搭配类别占57.1%(80/140=57.1%),略多于男生占比42.8%(60/140=42.8%),男女生采集的形名搭配类别的语块比例相近,分别是50.5%(141/279=50.5%)和49.5%(138/279=49.5%)。
1.语块采集类别和专业、性别相关性的讨论
梁颖红等[9]归纳的7种汉语语块中,名词短语和动词短语为前2大类。在研究对象所采集语块中绝大多数(72%)是名词性语块(其中名词和名词的搭配占了40.6%,形容词名词搭配占了31.4%),其余的28%是带有动词的语块,这也印证了词义在语言单位的组合中,“名词和动词往往担任句子结构中最基本的成分”[10],理论概念类名词类语块会占多数的情形还反映出学生偏重于从学术文档采集语料的特点。虽然,在实践前强调查找语料的来源要取自应用性的技术文档,但学生采集的语块和例句仍有不少来自国内出版的专业英语教材以及中文论文的英文摘要,因此,产生过度明显摘录专业术语的问题,如:链路层帧、扩散退火、星拓扑结构,风洞收缩段、邻接矩阵等,这些中文语块普识度不高,在技术文档中也难以被一般产品用户所理解,这样的语块往往在审核时会被删除。
从专业来看,电气专业学生采集的形名搭配语块和名名搭配语块多于另外两个专业,这有可能是因为电气专业对大多数普通人来说,比车辆和计算机专业更抽象,电气所涉及的概念性词组多,容易引起电气学生的采集注意力。采集的语块中28%是带有动词的语块,其中动名(动宾)搭配的语块占20.2%,而且一半以上是计算机专业采集的,这或许是因为计算机专业更加关注操作步骤、操作对象以及操作结果的缘故。而名动(主谓)搭配的语块仅仅占6%,主要集中在车辆学生采集的语块中,电气和计算机专业采集得很少,这原因或许与车辆专业的驾驭操纵性质相关,其语言关注焦点在于操纵动作的主体和动作本身。
从性别来看,研究对象中电气和计算机女生共有4名女生,但她们采集名名搭配类别的语块占66.2%,人均采集数明显多于男生,男生采集的名动(主谓)搭配类别的语块占72.5%,人均采集数也明显多于女生。虽然目前没有查证到直接的文献和证据可以解释性别差异在语言成分选择倾向的差异,但从性别差异的角度来看,女生采集较多的名名搭配类别的语块是句子中的从属成分,不能构建完整的句意,男生采集较多的名动(主谓)搭配语块是句子中的主要成分,这或许与男女性别的社会角色有潜在的关系,因为男性语言策略上倾向于主宰性、逻辑性,女性倾向于从属性、不确定性[11]。
2.其他采集问题讨论
根据李玲[12]的提示,英汉两种语言中的语块形式上不是完全对应的,有些在汉语中是单词,在英语却是语块,反之也存在同样情形。虽然,语块采集要求是中文部分是语块才能被采集,在第一批次语块中学生将虚部、实部、压盘、电势、电能等词纳入采集对象,原因就在于这些词对应的英文是语块,他们误认为英文是语块,中文也应该是语块。除了这些个别的两字词的“伪语块”,学生采集的“四字格”中文形式的语块占采集语块一半以上,绝大部分是连续成分的语块,极少有非连续成分的语块,这反映学生语块识别能力局限在连续的语言单位,识别非连续成分的语块的敏感度不够。
审核中还发现一部分过易或凑数的语块,如:电气事故、电力转型、下载软件、前排座位等,这些语块的专业典型性不足,且结构凝固性弱,采集价值低。表面上看,这是研究对象随意采集的结果,但实际上这间接反映出学生受众意识的不足或缺失。在采集例句遇到需要摘录的中英文例句冗长繁琐时,多数学生是全盘照搬句子,不知道摒弃无关信息,摘取目标语块所在的核心句段,或通过适当的改写来凸显目标语块,这说明了学生缺少灵活运用语言的意识。
为了了解研究对象对采集实践的体会,采集结束后,项目组用开放式问题就实践受益程度及学生自我反思两方面和研究对象进行了QQ线上访谈。研究对象比较一致的留言反馈:一是掌握了如何有效检索验证英文信息;二是参与采集后才比较深刻体会到受众这个概念所包含的内涵。
本研究以车辆、电气和计算机3个专业作为试验性的专业语块采集领域,数据表明,3个专业研究对象所采集的专业语块有效性比较接近,电气专业的学生采集的形名搭配和名名搭配类别的语块均高于车辆和计算机专业,车辆专业的学生采集的名动(主谓)搭配类别语块高于电气和计算机,计算机专业的学生采集的动名(动宾)搭配类别高于电气和车辆。男女生采集的形名搭配类别的语块比例相近,女生采集名名搭配类别的语块明显多于男生,男生采集的名动(主谓)搭配类别的语块明显多于女生,在动名(动宾)搭配类别的语块上,女生略多于男生。采集语块的类别与学生专业和性别均存在相关。
由于采集的语块仅是词级层次的尝试,语料代表性也仅限于3个专业,研究存在一定局限,期望后期研究能从细化专业大类的角度涉及更多专业领域,更深入地采集句级层次的中英语块,如此,所建设的专业语块库对于计算机辅助翻译、技术写作领域将更具有实用价值。
[参考文献]
[1]WRAY A. Formulaic sequences in second language teaching: principle and practice[J]. Applied Linguistics, 2000,21(4):463-489.
[2]ALTENBERG B , GRANGER S. The grammatical and lexical patterning of MAKE in native and non-native student writing[J]. Applied Linguistics,2001 ,22(2): 173-194.
[3]周健.语块教学在培养汉语语感中的作用[C]∥第八届国际汉语教学讨论会文选.北京:高等教育出版社,2007:142-150.
[4]陈红.汉语语块研究[J].社会科学家,2009(6):152-155.
[5]黄燕,王海啸.二语语块研究的“中国图景”: 语块研究的现状与前瞻[J],外语界,2011(3):74-81.
[6]李继民.国内外语块研究述评[J].山东外语教学,2011(5):17-23.
[7]钱旭菁.汉语语块研究初探[J].北京大学学报(哲学社会科学版) ,2008 (9):139-146.
[8]BAIGENT M.Teaching in chunks: integrating a lexical approach[J].MET,1999(2):51-54.
[9]梁颖红,赵铁军,于洁,等.基于改进K-均值聚类的汉语语块识别[J].哈尔滨工业大学学报,2007(7):1 106-1 109.
[10]沈阳.汉语动名语义关系的分析与教学[C]∥第五届国际汉语教学讨论会论文选.北京:北京大学出版社,1999:411.
[11]刘彬.简析性别差异在语言中的体现及原因[J].河南理工大学学报(社会科学版),2008(1):49-52.
[12]李玲.英汉语块对比研究[J].山东农业大学学报(社会科学版),2011(2):109-112.