误打误撞进来,胸有成竹出去

2017-02-10 15:59尹颖尧曹晓晨陈林芩
大学生 2017年1期
关键词:高山语言学留学生

尹颖尧+曹晓晨+陈林芩

《大学生》:你们的研究方向都是哪些?

高山:我的专业是语言学和应用语言学,方向是计算语言学(语言信息处理)。我的研究兴趣点是机器翻译,它对语言学的要求非常高。当然,这和我的专业有很大关系,我是开罗大学中文系本科毕业的,后来来到北语读计算语言学研究生。北语招国外博士生时,要求很高,在信科只有我一个外国博士生。

卢涌:我的专业和高山相同,主要做语义资源的构建,是偏文的。

林举:我的研究方向是计算机辅助发音教学,对计算机知识的要求高,还需要了解留学生的发音特点。

刘春花:我的方向叫计算机应用科学,更偏技术层面。

《大学生》:考北语的研究生难吗?那么多学校,为什么就选了北语?

高山:当然有难度。北语的留学生博士入学要求很严格,更不要说拿奖学金了。

卢涌:本科毕业时,我想去南开大学学语言学,但是本科导师跟我说,北语是专业性的语言学校,所以我就过来了。当时北语的语言学方向有十几个,我又不想学纯语言类的,导师就建议了计算语言学。

林举:文科生考北语的研究生相对比较难,理工科的容易些,毕竟想考北语研究生的理工科学生并不多,但其实来之后感觉都挺好的。

刘春花:我本科就是北语的,放弃了保研,准备考外校的研究生,但考分不理想,就调剂回来了。

为了解计算语言学专业学习的情况,记者采访了几位研究生。

高山

博二

埃及人

本科在开罗就读

林举

研三准备去新加坡国立大学读博

《大学生》:文科背景和理科背景读这个专业的区别在哪?

高山:计算语言学重点在于语言学、数学和计算机知识,如果做技术,对计算机功底的要求比较高,而要做语言资源的话,语言文学功底应该更强。

卢涌:这个专业对计算机知识有一定的要求,我所在的实验室侧重点是编程。文科转理科,难度还是很大的,要花很多的时间。与我一同进实验室的一位中文系男生,花了很多功夫学编程,他的毕业论文也基本上跟语言资源无关,做的是算法或计算。不论文理生,每个人在这儿读研都得补课,文科生补计算机,理科生补语言学。不过这也是优势啊,都成了复合型人才。每位导师手下都有文科生和理科生。

《大学生》:在北语读研的优势有哪些?

高山:计算语言学是文理交叉学科,北语的语言学研究在国内数一数二,有很多语言学界鼎鼎大名甚至鼻祖级的专家教授。另外,北语的学术氛围十分自由、融洽,导师都十分重视我们的学术研究,每周至少开一次组会,导师跟同学一起讨论研究的进展。

卢涌:每个老师都有自己的团队,每个团队有自己的组会,每周开一次,一个月有一次大的汇报。我们经常去北大等高校开合作组会,老师还会邀请国外老师过来。信科的基础设施、硬件设备非常好,每人都会配工位和计算机。

林举:从我的研究方向计算机辅助发音教学来看,第一个优势是北语的汉语国际教学处于国内顶尖水平。第二,北语有很多留学生,做计算机辅助翻译教学需要很多二语资源,非常需要留学生,而在北语

我们比较有信心,也很看好这种语义分析的方法,相关研究正在进行中。

非常容易找。我们前段时间录了300多个留学生的语调库,学生都是在北语找的。第三,将来我打算出国深造,北语留学生多,英语氛围好,很容易找到语伴。

《大学生》:可否介绍一下你们的项目?

高山:我们的团队会关注国内外的流行语,比如特朗普为什么有人不叫他特朗普,却叫川普?我们还统计了中华传统文化里的成语和小句,如在《论语》或《道德经》等典籍中,哪些成语用的频率多,这反映了什么样的思维方式等。我们还会在报纸里找成语的分布或者使用频率。此外我个人还在做汉语和阿拉伯语的计算机翻译。

卢涌:我现在在做一种语义分析方法。当前自然语言处理的语义分析方法主要有两种,一种是浅层语义分析方法,以语义角色标注为代表;一种是深层语义分析方法,比如语义依存分析。我现在做的深层语义表示( Deep Semantic Representation,简称 DMR),也属于深层语义分析方法,这是我们正在和鲁东大学的老师合作的项目。现在我们标注了 800多句,也正在制定标注规范,主要的难点在于对名词结构的表示上。它接近学术前沿,国内刚刚起步,比较有发展前景,也是老师们很重视的问题。我们比较有信心,也很看好这种语义分析的方法,相关研究正在进行中。

林举:我做过一个留学生声调评估的项目,是导师张劲松教授帮助留学生学汉语的 APP的一部分。刚开始我做的是对单个字声调的判断,导师觉得做单个字太简单,便让我在连续语流中研究声调,比如“今天你吃饭了吗?”导师的博士论文刚好是声调识别,看完老师的论文,又调研一些文献后,我发现在连续语段中,第一声不一定是平的,它受上下文的影响

化。之前的传统做法,是用基频曲线判断声调的对错,通过调研,我发现音段(即声韵母)对基频曲线是有影响的。后来我把这个项目写成论文,在语音顶级会议 interspeech上发表了,还申请了一项发明专利。

刘春花:我的导师荀恩东最近在做句法语义分析器,我承担了其中一个小任务,是汉语功能词的还原,让整个句子的句法结构更加清晰。汉语功能词是指像“了”“着”“或”这样经常用在动词后面的虚词。具体做的时候,我会先对一句没有功能词的句子——比如“他的老师给他提出很多建议”,判断“提出”后加“了”“着”“过”哪一个功能词合适,且哪一个功能词出现的可能性最大。这个判断是由我的计算机通过深度学习的模型得到的。

《大学生》:你们对自己就业有什么计划?

高山:同学们一般是考公务员,另外进百度、搜狗等互联网企业比较多。我现在还没有具体的计划,但就业前景还是很明朗的, IT公司急需我们专业的人才。

林举:师兄师姐出国的比较多,就业的也不少。这个专业很好就业,但是也很苦。我准备去新加坡国立大学读博,再以后,我应该会回高校当老师,继续做计算语言学方面的研究,或者结合人工智能创业,做计算机辅助发音教学这一块。

卢涌:目前还在找工作,前不久参加了公务员考试,但倾向于进企业。这个专业就业还是不错的,实验室的小伙伴有的拿到了中科院软件所的offer,但我更想回家工作。

刘春花:现在自然语言处理很火,这个专业的就业前景很好。我可能会出国读博。

猜你喜欢
高山语言学留学生
第一章 天上掉下个留学生
第一章 天上掉下个留学生
留学生的“捡”生活
高山从何而来?
认知语言学与对外汉语教学
高山生态扶贫搬迁
高山台防雷实践
社会语言学名词
语料库语言学未来发展趋势
基于认知语言学的“认知修辞学”——从认知语言学与修辞学的兼容、互补看认知修辞学的可行性