软件的下载与安装

2011-07-13 03:18日本关西学院大学
东北亚外语研究 2011年8期
关键词:例句语料语料库

日本关西学院大学 于 康

【编者按】学会制作语料库,可以随时根据各种需要进行检索,瞬时获取大量的例句。这不仅有利于日语学习,也有助于教师备课和从事日语研究。日本关西学院大学博士生导师于康教授自制的“YUKANG语料库”(1亿3千万字)早已为大家所熟知。从本期起,我们将连载于康教授亲自执笔的新专题“自制语料库”,循序渐进地讲解如何自制语料库和使用语料库,以满足大家的迫切要求。

1.制作“语料库”的目的

语料库指的是储存各种类型文章的大型文字仓库。这个仓库可以根据需要对仓库里储存的信息进行各种各样的检索。比如,只要在检索栏内输入「走る」,并指定与「を」搭配,电脑就会自动从语料库里把所有有关的例句全部调出来。

过去收集例句的时候,通常都是通过目视检索的方法,从小说、报刊等文章中将例句抄录下来。比如,收集2010年一年的『毎日新聞』中「走る」的全部例句,就需要一条一条地从报纸上摘录下来,这不仅需要花费大量的时间,而且还往往容易出现遗漏。如果有了语料库,就可以在数秒钟或数分钟之内完成检索和收集例句的工作,而且还不容易出现遗漏和错误。

尽管制作语料库一直是日语专业的大学生、研究生和教师的一个迫切的愿望,但是,由于受经费和技术要求的限制,制作语料库一直只是少数一部分人的特权。现在日本很多研究单位和学者免费提供制作语料库的有关软件,这些软件大部分都可以从有关网站上下载下来,只要将这些软件按照需要组合起来使用,并掌握一定的制作技术,就可以自己动手制作语料库了。

学会制作和使用语料库,不仅有助于提高运用日语的能力,还有助于寻找毕业论文或研究论文的研究课题。只要按照每期介绍的制作步骤做下去,就可以逐步掌握语料库的制作和使用方法。

2.电脑的配置和基础软件

制作语料库对电脑的配置要求并不很高,只要满足①装有正版 Windows®XP 或 Windows®7、②CPU为Atom,或Celeron,或Core、③内存为1GB以上这些基本条件即可。不过,中文版的Windows®XP或Windows®7偶尔会出现乱码和少数不兼容的情况,有条件的最好安装日文版正版的Windows®XP 或 Windows®7。如果电脑不是正版的Windows®XP或Windows®7,常常会在一些重要环节上出问题,影响正常操作。

制作语料库还需要一个基础软件Java,一般市场销售的电脑都会配有这个软件。这可以点击控制面板,进行确认。如果找不到Java,可以从网上直接下载,下载网站为:http://www.java.com/ja/download/。

3.制作语料库的基本软件以及下载和安装的程序

3.1 基本软件

制作语料库有3个基本软件,它们分别是:

①「秀丸(ひでまる)」、②「えだまめ」、③「ひまわり」。

「秀丸」是用来保存语料的软件,这个软件将各种渠道收集来的语料转换为文本文件(.txt),是处理语料的第一道必不可少的程序。比如,要将「ボランティアのように現地に直接足を運ばなくても、普段の生活の中でできる支援策がある。被災した地域の産品を買うことだ。」这个语料放进语料库中去,首先必须将这段语料用文本文件形式保存才行。这是因为制作语料库的软件只识别文本文件,而拒绝接受Word或其他形式保存的文件。「秀丸」无需任何特别的设置就可以自动保存为文本文件。

用「秀丸」保存的语料是不能直接放进语料库中去的,还需要一道转换手续,即将文本文件的形式转换为语料库专用文件的形式。这道手续是语料进入语料库的一个通行证,如果忽略了这道手续,语料便会被拒绝在语料库门外。获得这个通行证的办法是使用「えだまめ」来转换文件的形式。

上述这两道程序结束后,就可以制作语料库了。制作语料库的软件叫做「ひまわり」,用这个软件对「えだまめ」转换过来的文件进行处理后,语料库就算做成了。

3.2 下载和安装的程序

①下载并安装「秀丸」

在日文版的Yahoo JAPAN或Google的检索框中输入「秀丸」,并进行检索,点击检索结果中的「秀まるおのホームページ(サイトー企画)-秀丸エディタ」,进入「秀まるおのホームページ」,点击「hm804_signed.exe(日本語版)」,下载「秀丸」。下载成功后,点击保存在文档中的「hm804_signed.exe」,安装「秀丸」。安装成功后,会在桌面上或“开始”中出现「秀丸」的标记,点击「秀丸」标记,出现「秀丸」的界面,安装成功。

②下载并安装「えだまめ」

在日文版的Yahoo JAPAN或Google的检索框中输入「edamameコーパス」,并进行检索,点击检索结果中的「『ひまわり』支援ツール/えだまめ/使い方/2-言語データベースと...」,进入网页,点击第二行中的「えだまめ」,出现「『ひまわり』支援ツール/えだまめ」的界面,下载「edamame_v21.zip」。下载成功后,先点击保存在文档中的「edamame_v21」,进行解压缩,然后再点击解压缩后「edamame_v21」中的「edamame_v21.hta」,出现「えだまめ」的界面,安装成功。

③下载并安装「ひまわり」

在日文版的Yahoo JAPAN或Google的检索框中输入「ひまわり コーパス」,并进行检索,点击检索结果中的「全文検索システム『ひまわり』-言語データベースとソフトウェア」,进入网页,点击「ver.1.3 β 05(2011-02-16)...開発版」,下载「ひまわり」。下载成功后,先点击保存在文档中的「himawari_1_3b05」,进行解压缩,然后再点击解压缩后「himawari_1_3b05」中的有向日葵图标的「himawari」,出现「全文検索システムひまわり-[『太陽コーパス』(サンプル)]」的界面,安装成功。

4.小结

制作语料库,需要下载和安装3个软件:①「秀丸(ひでまる)」、②「えだまめ」、③「ひまわり」。如果安装成功后打不开「えだまめ」或「ひまわり」,可能是因为电脑没有安装Java,或Java没有下载成功,此时需要重新安装Java。

猜你喜欢
例句语料语料库
《语料库翻译文体学》评介
基于语料调查的“连……都(也)……”出现的语义背景分析
好词好句
好词好句
好词好句
基于COCA语料库的近义词辨析 ——以choose和select为例
华语电影作为真实语料在翻译教学中的应用
好词好句
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料