栏目特邀主持人:梁颖红
科技重大项目
栏目特邀主持人:梁颖红
主持人语:国家自然科学基金项目“高精度的跨语言信息检索查询词自动翻译技术研究”(61272259),以网络文本挖掘为手段,研究跨语言信息检索查询词翻译获取的方法,重点研究基于本地语料库和基于网络的翻译技术、基于网络的翻译方法中利用共现信息查询扩展方法获取搜索引擎摘要,克服意译词的挖掘瓶颈;利用频度量度和邻接信息,在有噪声的、规模较小的双语摘要库上抽取高质量的候选单元,提高抽取效率;综合利用音译、表层模版、语义、频度-距离等特征进行译文的选择,提高翻译精确度.通过不同语言的查询,跨语言信息检索使人们能够检索多种语言的文档,即采用一种查询语言检索另一种语言的文档.查询翻译不仅可以极大地改进跨语言信息检索的性能,而且能促进自然语言理解研究与应用的紧密结合.研究成果可用于跨语言信息检索、机器翻译等领域.
继《苏州市职业大学学报》2013年第3期“重大科技项目”栏目发表的课题团队3项研究成果后,本期再推出课题团队的3项成果:陆公正等的《使用机械分词与特征扫描实现对甲骨卜辞的切分》研究成果,依据甲骨文语法及甲骨文词典对甲骨卜辞中进行切分,采用机械分词与特征扫描相结合技术进行中文分词,是建立甲骨文语料库实现计算机辅助甲骨文考释的前提和基础,该方法可以推广到对非甲骨文的普通中文文本中;熊志勇、梁颖红的《基于sif和SCAM结合的复制检测算法》,首先总结了目前主流的复制检测技术,在此基础上,提出一种针对纯文本文档进行复制检测的改进算法,并对算法进行了详细描述,最后比较了改进算法与其他算法的时间复杂度,指出了改进算法的优越性;郭翠珍的《“一X就Y”格式的多词表达敏感特征提取和选择》重点研究如何选择和动态使用各自的敏感特征来抽取“一X就Y”结构的多词表达(MWE),指出了目前汉语MWE抽取存在三个关键问题,重点对“一X就Y”结构的多词表达进行了分析,给出了抽取“一X就Y”结构的多词表达所使用的敏感特征的抽取方法.
感谢苏州市职业大学学报为我们提供这样宝贵的机会和平台展示我们团队的研究进展,感谢学报对我本人及我们团队的信任和支持.我们将继续秉承刻苦钻研、开拓创新的科研精神,争取不断地研发出新的科研成果.
主持人简介:梁颖红,女,教授,博士.1970年出生,黑龙江齐齐哈尔人.现任教于苏州市职业大学计算机工程学院.