摘要:在自然语言处理的研究和开发中,双语平行语料库的作用日益突显出来,平行语料库的建设对于机器翻译、双语词典编纂、词义消歧和跨语言信息检索具有重要的价值。因此,设计了高效实用的汉维哈柯双语语料库加工系统。该系统将文档对齐、句子对齐以及词语对齐技术有机地融合为一体,具有高效、方便、快捷和可扩充等特点。该文着重介绍句子对齐技术。
关键词:双语语料;平行语料库;句子对齐
中图分类号:TP391文献标识码:A文章编号:1009-3044(2011)28-6797-03
Study on Sentence Alignment Technology of Chinese-Uygur Kazak Kirgiz Bilingual Corpus Processing and Programming System
TAN