新闻全文检索系统的数据预处理技术

2010-12-31 00:00:00石家亮
电脑知识与技术 2010年23期


  摘要:介绍了全文检索的概念及其中的数据预处理技术。结合安徽日报社新闻稿件采编系统和历史资料库系统实际情况,给出了一个新闻全文检索系统的模型框架,并对该目标系统采用的数据预处理技术进行了进一步的论述,结合Memcached内存管理技术提出了一种分块处理倒排索引的办法。
  关键词:分词技术;倒排表;倒排索引;全文检索;Memcached
  中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2010)23-6402-