基于英语聊天群文本的词汇特征研究

2017-01-16 01:22辉,岳
哈尔滨学院学报 2016年12期
关键词:词表语料库聊天

李 辉,岳 祯

(1.淮阴工学院 外国语学院,江苏 淮安 223003;2.保山学院 外国语学院,云南 保山 678000)

基于英语聊天群文本的词汇特征研究

李 辉1,岳 祯2

(1.淮阴工学院 外国语学院,江苏 淮安 223003;2.保山学院 外国语学院,云南 保山 678000)

聊天群成为人们便捷和实用的交流工具,群文本为语言研究提供了第一手真实的语用材料。文章通过对聊天群文本词表特征进行研究,旨在发现聊天文本的独特语言特征和语义功能。

聊天群;文本;词汇;词表;语义

随着网络时代的快速发展,即时聊天不再受时间、地点、方式等条件的限制。即时聊天把兴趣相投的人们联系在一起,进而参加不同目的的兴趣爱好群组。把社交网络平台和腾讯QQ群嵌入外语教学和教学管理领域并不罕见。于兰借助于QQ平台辅助英语写作教学,发现利用此方法可以拓宽学生的学习空间,增强学生之间的互动,营造良好的学习环境,提高学生的学习兴趣和写作能力。[1]彭明娥则在构建主义的理论指导下肯定了QQ群营造学生英语口语语境的重要性,弥补了大学英语课堂教学的不足。[2]同时也有研究网络平台下学生的学习策略和交谈策略的。[3-4]通过网络平台收集英语学习者真实语料,建设小型文本素材,对语言研究有着无可比拟的创新意义。

本文以淮安市某一QQ英语交流群为研究对象,旨在观察群参与者的词汇使用特征。目前语料库驱动方法已经成为词汇研究的主要方法。卫乃兴曾利用中国学习者英语口语语料库(COLSEC)研究中国大学生四六级英语口语的词汇特征。[5]桂诗春建设了英语语言学语料库(ECOL)并在《基于语料库的英语语言学语体分析》一书中详细阐述了语言学词汇特征和语法特征。[6]利用语料库对文本中语块特定功能进行分析也是词汇研究的拓展。[7-8]

一、研究设计

1.语料来源

本文语料来自于江苏省淮安市某一英语QQ交流群。该群以英语交流、英语学习、英语角运作为目的而组成的即时聊天群组,拥有成员300人左右。其成员绝大多数是英语爱好者,也有少数外籍人士。笔者收集了为期一年的群聊天记录,经过剔除噪音整理出纯文本。

2.研究工具及研究方法

本文将借助计算机索引软件Antconc 3.2.1w对研究对象文本生成词表和运用停用词表和词形还原功能,呈现语言使用者的词汇特征,并根据词汇使用语境对其进行定性分析,归纳高频词汇主要功能。本文采用计算机自动提取的定量分析与研究者手工甄别的定性分析相结合的研究方法。

3.研究问题

本文试图回答以下问题:(1)聊天群文本体现了哪些的词汇特征?(2)聊天群即时聊天的词汇特征是否具有口语语体特征?

二、结果与讨论

1.基本信息数据

首先,整理出文本的基本信息。表1显示:文本共有47 511个字符,形符数5 722,类符数1 272,标准类符/形符比为37.88,平均词长3.98,句子数348,平均句长为16.02。

表1 聊天群文本基本信息

从标准类符/形符比来看,可以断定文本词汇密度不大,也就是说在100个词汇量文本中出现接近38个不同词形,可见聊天群参与者词汇使用不是很丰富。从词长来看,单词使用过于简单。互动的句子348个,每句平均由16个词组成,长度相对较长。但单纯从表1中,还不能看出语言使用者的词汇特征,需要进一步去提取、分析。

2.词表数据

再次,通过索引软件Antconc 3.2.1w中的Word List功能生成词频表。表2选取了词频最高的前20个单词。词频最高的是代词类如I、you、me、it、what和冠词类如the和a等。虚词类的有介词in、to,连接词有and、so等。而实词类出现最多的是be动词is和are,情态动词can和名词“english”。通过仔细观察发现am、is、are和a、an可以看作一个单词。通过准备好的词形还原对应表设置新词表,把这类词加以归类。

表2 聊天群文本词表信息(前20)

表3 聊天群文本词形还原词表信息(前20)

表3显示词形还原后的词表数据,不难发现它与表2有着细微的变化。表3显示所有词中频数最高的是be动词类,还有是人称代词、定冠词和冠词类。而在表2中没有看到的助动词在表3中却出现了,如助动词have和do,而且排在了名词english前面。这可能说明这两个词在第一次词表生成时分别被has、had和did、does分散了频数。从词表中,也看到了一种特殊现象,那就是第一人称i和english都是以小写形式出现,第二人称you以u的形式出现。这表明群聊天文本和其他文本的不同之处,聊天者为了节省输入时间,提高交流实效而采取的回避策略,也符合英语语言的省力原则。第二人称you具有唤起聊天者的参与功能。[9]该词的高频出现恰是这一语用功能的体现。

表4 聊天群文本停用词表设置后词表数据(前20)

功能词作为高频词也是预料之中的结果,因为这些功能词都是构建句法结构的常用单位。通过Antconc主界面上的Tool preference菜单进行设置,寻找Use a stoplist listed below并运用事先准备好的停用词表,就会生成想要的词表了。观察表4可见那些功能词已经不见,取而代之的都是名词、动词和形容词等。这些实词如English、ec、Chinese、school等多次出现突出了参与者话题内容,这说明群中聊天主题比较明确,符合组群目的。排在第二位的形容词good,笔者推测good可能是与morning、afternoon固定搭配形成的问候语而导致其频数增多。

3.词表中good一词的使用特征

通过检索共得出42条good在语境中的使用情况,由于篇幅有限,在表5中没有完全列出。如大家所见,表5在一定程度上验证了笔者的推测,good强搭配是问候语good morning,good night或者good evening,然而good afternoon却只有一例。这说明群聊活跃时间主要集中在上午和晚间,而非下午。除了问候语还出现一些祝福语如good luck搭配。其余的则是表达对受话者某一主题的肯定和赞同,如good topic、good idea、good choice、good movie。Good一词在实际语境中的用法使我们明白,单纯靠主观的推测不能完全说明语言的使用特征,真实的语料才是最有力的证据。特定词项的分析能够帮助我们发现语料库中的文本关系、意义和连贯。[10](P65)

表5 语境中good一词使用情况(部分)

4.词表语义功能的分类

为了研究词汇背后的语义功能,笔者把频数为10以上的词进行了语义分类和统计,共归纳出了四种语义功能:寒暄、主题、立场和所指。寒暄功能是参与者在群交流过程中,为了维护彼此之间的人际关系和社会地位,而大量使用寒暄语表示对他人的尊敬、友好、祝福、感谢和歉意。对于口语来说,某种程度上表达人际关系要更重于传递信息功能。[11]表6显示,群聊文本维持人际关系功能的频率明显高于信息传递功能,说明群文本词汇具有口语语体特征。

表6 词汇语义功能分类

主题功能则是参与者彼此交流世界经验的过程。它包括一些施动动词和目标语名词。English、school、corner和ec等名词凸出了群交流主题,动词help、meet、going、want引出施动者信息互动时抢占话轮拥有权。缩略语的出现也说明了谈话的非正式性和网络语言的实效性。

立场功能是话语持有者对经验表达自己所持有的态度和立场。文本中出现的口语化标记语如I know、i don’t know、i think、i say都是话语持有者的观点表达。而感叹词oh、ok、yes则表示赞同、迟疑、中立、肯定和应允等语气。价值负载词love和一些谓动形容词如right也是立场表达的常用词汇。[12]

所指功能是指对事物的认定和事物属性的认定。它包括精确所指just的确切认定功能,模糊所指maybe的不确切把握或者猜测,也包括时间所指如next time、tomorrow等。口语标记词just、so再次说明了群交流语言的非正式性和口语性。

三、结语

本文通过了解聊天群文本词汇可见,虽然词汇类别不丰富、过于简单,但词汇突出了群组交流的目的和任务,且具有文本特有的表现方式如缩略语、简写词、忽略大小写等省力原则。同时词汇功能的展现证明了语言使用者的人际维护策略、主题经验表达和话轮转换策略、立场表达与所指。群文本具有明显的非正式口语语体特征,可以说这是语言使用者把即时口语写在书面上的一种表达方式。虽然本文的文本规模小,但对于了解群语言特征及其功能是一次有价值的探索。也为纵深的研究如群表情符号研究、群语块研究和语篇研究等提供了借鉴。

[1]于兰.基于QQ平台的网络辅助英语写作教学[J].中国电化教育,2010,(5).

[2]彭明娥.大学英语课外口语语境构建[J].教育评论,2010,(2).

[3]陈美华,陈祥雨.基于SNS“人人网”的英语写作匿名性同伴群评研究[J].外语电化教学,2013,(154).

[4]赵婴.文字聊天和视频会议对英语口语交谈策略影响的一项对比研究[J].电化教育研究,2011,(10).

[5]卫乃兴.中国学生英语口语的短语学特征研究——COLSEC语料库的词块证据分析[J].现代外语,2007,(3).

[6]桂诗春.基于语料库的英语语言学语体分析[M].北京:外语教学与研究出版社,2009.

[7]许家金,许宗瑞.中国大学生英语口语中的互动话语词块研究[J].外语教学与研究,2007,(6).

[8]李文中,闫洁.大学生英语口语讯息向词块运用特征分析[J].河南师范大学学报(哲学社会科学版),2010,(2).

[9]宋培茹.英语第二人称视角语用功能的认知解读[J].哈尔滨学院学报,2014,(12).

[10]Cheng,W. Describing the Extended Meanings of Lexical Cohesion in a Corpus of SARS Spoken Discourse[A].In J. Flowerdew,& M. Mahlberg(eds.). Lexical Cohesion and Corpus Linguistics [C].Amsterdam/Philadelphia:John Benjamins Publishing Company,2009.

[11]陈怡.影视语料与当代英语口语解析[M].上海:上海交通大学出版社,2009.

[12]Biber,D. University Languages:A Corpus-based Study of Spoken and Written Registers[M].Amsterdam/Philadelphia:John Benjamins Publishing Company,2006.

责任编辑:思 动

The Study of Lexical Characters Based on English Chatting Texts

LI Hui1,YUE Zhen2

(1.Huaiyin Institute of Technology,Huai’an 223003,China;2. Baoshan College,Baoshan 678000,China)

The chatting groups make convenient and practical communication tools. The chatting group texts provide the first hand authentic linguistic materials. By studying the lexical characters of those texts,it attempts to discover the unique linguistic features and semantic functions.

the chatting groups;texts;lexical;vocabulary list;semantic

2016-04-04

李 辉(1978-),男,吉林四平人,讲师,硕士,主要从事二语习得、语料库语言学研究; 岳 祯(1983-),男,河南信阳人,硕士,主要从事应用语言学研究。

1004—5856(2016)12—0138—04

H319

A

10.3969/j.issn.1004-5856.2016.12.031

猜你喜欢
词表语料库聊天
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
《语料库翻译文体学》评介
我就是不想跟你聊天了
敞开门聊天
华语作为第一语言教学的常用分级词表研制
基于JAVAEE的维吾尔中介语语料库开发与实现
语篇元功能的语料库支撑范式介入
国外叙词表的应用与发展趋势探讨*
常用联绵词表
聊天不倒王