刘梦晨
内容摘要:目前,人类在研究语言学相关内容时,大多青睐于使用语料库。这是因为语料库应用范围比较广泛,它普遍应用于传统语言、语言教学等的研究,也是在人类研究语言学时总结出的经验的基础上诞生而来的,研究结果比较可靠。因此,文章通过人工方式创建一个俄语语料库,并将该语料库应用于俄语教学实践,旨在验证自建语料库在俄语教学应用中的成效。
关键词:语料库 俄语 教学
一、创建语料库
1.结合教学实际需求针对性的选择语料
2014年,秦嘉等学者指出,外语教学中的语料来自于教科书,如教科书中的某些文章、某类词语。通过分析这些文章和词语,还能知道教科书编排的内容是否符合教学大纲要求。他们首先针对这些网站设计好爬虫代码,然后从这些网站的源网页把文章下载至本机电脑,文章格式另存为记事本(.txt)文档。
2.语料库分析工具的选取
本文使用的语料库分析软件为wordsmith5.0。该软件具有以下功能:第一,查找指定语料。第二,以表格形式呈现词汇表。第三,分类统计关键词。第四,批理处理纯文本文档、网页文件。通过实践发现,wordsmith软件能够很好的实现对选定语料的分析,是目前应用最普遍的语料分析软件。
二、自建语料库应用于俄语教学
1.辨别指定领域的关键词语
如果语料库包含庞大的词汇量,则可将语料库划分成若干个子语料库,每个子语料库里存放指定领域的文章,与总语料库的词语相比,这些文章中词语出现的机率更高。通过使用wordsmith软件中的keywords工具能够快速找到指定领域的词语,然后依据该词语在总语料库及子语料库里出现的机率确定其重要程度,最后生成指定领域的关键词列表。
2.检索与搭配
在生成了军事领域的关键词列表后,接下来需要进一步分析该列表中经常使用的词语和比较重要的词语,为俄语教学提供便利。首先调用wordsmith软件的concord工具,设定查询关键字分别为:“учени^、учени^^、учениями。
三、自建语料库应用于俄语研究
为提高研究结果的可信度,本文选择的文章来自于俄国比较有公信力的网站,新闻发生时间为2014-2016年,文章涉及的词汇量达6000万。
1.俄语高频词汇
本文创建的语料库出现机率最高的词汇类型主要为虚词,如前置词、连接词,数量大约为30个,这30个词形主要包括он,от,России,его,РФ,но,года,в,и,на,по、c、до,то,мы,сказал等。从出现的机率来看,在6000万个词汇中,в,и,等词出现的机率为2%,其中。в出现的机率达到了近5%,и出现的机率紧随其后,排在第二位。
从上面阐述的内容可以得出以下结论:本文创建的基于指定三个领域的语料库,词汇出现频率最高的主要为虚词,如前置词、连接词等,排在第二位的主要为实词,如名词及代词等。常见的词汇有в,и,на,по等词,它们在语料库中出现的机率至少为1%。
2.语法范畴概率
在分析了词语的各种呈现形式后发现,语法分布机率呈不规则状态。因此,需要重新找寻统计语法分布机率的方法。本文在统计词汇语法分布机率时,主要选取某个特定词语进行分析统计。例如,本文在统计动词говорить、сказать的各种语法形式在语料库中出现的次数时,首先在语料库中的词汇列表中找到这两个词语的过去时、将来时出现的次数,发现将来时出现的次数近5000次,过去时出现的次数高达10万次,也就是说,这两个词语的过去时在语料库中出现的机率是将来时的25倍。
四、结论
文章创建的语料库中涉及的词汇主要指词形,无论是在分析词汇出现的频率还是分析同一词语以不同语法形式出现的机率时,研究的对象均为词形。文章接下来的工作是深层次的加工与标示语料库中的单词,以便能够统计出所有单词及其变化形式在语料库中出现的机率。结合当前已有的研究技术来看,下一步的主要工作是解决词形与单词匹配精确度的问题。
参考文献
[1]王金花.“一带一路”背景下大学俄语教学改革探析[J].内蒙古财经大学学报,2016,(06):124-126.
[2]劉鑫.混合式教学模式在俄语教学中的应用[J].黑龙江科学,2016,(24):112-113.
[3]许波.浅谈互联网资源在俄语教学中的应用[J].民营科技,2016,(12):221.
[4]李明宇.中俄合作办学铁路专业俄语教学的特点及教学模式初探[J].郑州铁路职业技术学院学报,2016,(04):86-88+91.
(作者单位:四川省都江堰市川外成都学院)endprint