基于机器学习的中文文本分类技术研究

2011-12-31 00:00:00贾昱晟

电脑知识与技术 2011年21期

　　摘要：基于机器学习的文本分类是近年来发展迅速并受广泛关注的数据挖掘技术。该文介绍了几种重要的文本分类方法例如贝叶斯、K最邻近和支持向量机。根据不同方法在不同数据分布状况的中文数据集上的分类表现，对比分析各方法的性能和优缺点。
　　关键词：中文文本分类；贝叶斯；K最邻近；支持向量机
　　中图法分类号：TP39 文献标识码：A文章编号：1009-3044(2011)21-5194-03
　　Research on Chinese Text Categorization Technology Based on Machine Learning
　　JIA Yu-sheng
　　(Sichuan University Computer College of Computer Science and Technology Departm

电脑知识与技术2011年21期

电脑知识与技术的其它文章: 会计电算化的现状及发展趋势; 网络信息资源在大学英语语用能力的运用; 高职软件专业人才培养模式的创新研究; ITIL下的IT服务问题处理方法探究; 论信息技术对干部培训的双重影响及对策研究; 面向实践能力培养的C程序设计教学实践改革探讨