维吾尔语的N-gram语言模型研究

2011-12-31 00:00:00张亚军

电脑知识与技术 2011年17期

　　摘要：针对基于维吾尔语的N-gram模型统计数据稀疏问题造成统计模型识别性能降低，研究针对政府文献和报告领域的语料进行了1到3元文法统计，采用加法、线性插值、Witten-Bell和Kneser-Ney平滑算法进行了约束。结果表明，本实验中Kneser-Ney平滑技术可以大大降低统计维吾尔语的N-gram模型的困惑度。
　　关键词：语言模型；平滑算法；困惑度；维吾尔语-汉语双语语料
　　中图分类号：TP393文献标识码：A文章编号：1009-3044(2011)17-4177-03
　　Research of Uyghur N-gram Model
　　ZHANG Ya-jun
　　(Changji Coll

电脑知识与技术2011年17期

电脑知识与技术的其它文章: 从银联卡电子不停车收费看未来高速公路收费方式; ILASII系统与一卡通系统对接技术研究与应用; 企业电子文件管理平台架构研究; 鸿业暖通软件在课程设计中的应用; 高校数字化校园云计算应用探讨; 新型节能技术在安徽省高速公路隧道照明系统的应用实践