宋静
摘要:该文将支持向量机应用到组块识别中,并利用支持向量机算法完成了组块识别任务。实验结果表明支持向量机算法在组块识别中有较好的应用。该文的研究结果可以广泛的应用到自然语言处理领域中。
关键词:支持向量机;核函数;组块识别
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2012)33-8060-03
在二十世纪九十年代支持向量机作为一种新的机器学习算法而被人们所熟识。支持向量机(SVM)是依托统计学习理论的基础,根据有限的的信息条件得到较好的的结果。SVM作为统计学的一个新分支,仍旧有很多理论需要进一步研究探讨。支持向量机算法应用十分广泛,除了应用于模式识别等领域,也广泛的应用在自然语言处理技术中,其作用越来与突出。
上个世纪90年代,人们开始将组块识别应用到自然语言处理中。最初应用到英语和日语中,随后应用到汉语等各类自然语言中作用越来越突出。
组块分析也叫做浅层分析[1]。组块识别的目的就是简化句子结构,降低句法分析的复杂性。同时支持向量机还可以广泛的应用于机器翻译、信息检索等领域。
1支持向量机介绍
1.1SVM的基本思想
支持向量机最早应用于二维线性可分的情况。图1就是支持向量机的基本思想。