郭文静 田星
摘 要 为了获得较高的分类准确率,建立支持向量机模型,并采用遗传算法自动选择最优核函数参数,提出基于遗传算法优化支持向量机的图像识别方法。结果表明,该方法具有较优的识别率,整体性能优良。
【关键词】遗传算法 支持向量机 图像识别
1 引言
在医学中,获得合格的X射线图像的前提是获得合适的曝光值,曝光不足或过度都会影响图像质量。X射线成像依赖于穿透人体的部分射线,由于个体组织结构复杂性以及外在因素,导致选取合适的曝光值并不是容易的事,这样就会影响X射线图像的可用性。因此,准确有效地识别曝光量有问题的图片具有一定的研究意义,并对之后进行图像增强处理打好基础。
2 相关概念
2.1 支持向量机
由于X射线图像具有较强的非线性特性,维度较高,同时属于小样本学习问题,与传统分类方法容易出现过学习现象相比,支持向量机在有限的样本情况下具有很大优势,同时能在不增加计算量程度的基础上通过选取合适的核函数,将非线性问题反映到高维空间中,最终找到一个实现分类的最优分类超平面,得到高维线性决策函数,从而取代原函数,因此具有较强的推广能力。
2.2 基于遗传算法优化SVM模型参数
将遗传算法应用到优化SVM参数是,算法过程如下:
(1)对其所输入的图像X射线,进行分析处理,建立测试样本与学习样本。
(2)定义进化最大代数MAXGEN=100,生成种群最大数量为SIZEPOP=20,SVM CV参数为10,代沟GGAP=0.9,指父代中有90%的个体被复制到子代,参数C和g的变化范围为[0,100]。
(3)所生成的染色体即为初始种群。
(4)解码每个染色体计算适应度值。
(5)根据适应度值选择并复制个体进而产生新种群。
(6)进行遗传操作。
(7)判断结果,满足需求则进行下一步(8);判断结果,不满足需求返回步骤(4)。
(8)利用优化的参数C和g建造新的SVM。
3 实验结果
3.1 图像预处理
消除与算法无关的信息,并把源图像二值化,设定阈值为0.4,如图2所示。
截取最小区域图像,并将其转化成16x16标准化图像。最后把这些16×16标准化图像排成一个列向量,让后转置生成100个256的训练样本矩阵。本文选取X射线图像为测试样本与训练样本,其中,100幅训练样本,分为曝光正确和曝光不正确的两类,每类均有50幅,令另外的40幅作为测试样本,每类分别20幅。
3.2 不同参数选择方法的对比
本实验预先定义“曝光正确”图像的标签是“1”。
“曝光不正确”图像的标签是“2”进行训练和测试。
图3、4分别为参数粗略选择结果图和参数精确选择结果图;
图3粗略得出图格寻优的选择结果,C=0.082,g=0.027时对应最佳准确率,为99%;
图4是在粗略选择结果的基础上将变化间隔缩小了一倍,进一步得到精确化形象化的准确率变化,得出取C=0.025,g=0.0625时对应最佳准确率,为99%。
图5为测试集中时一个样本的识别结果出现的偏差,将“2”预测成了“1”,测试集准确率为97.5%。原因是实际图像预测识别中,曝光不正确的图像曝光程度,接近于曝光正确的图像,所以混淆了SVM的识别,导致准确率下降。
4 结束语
在网格寻优法与遗传算法对比之后,进而提出基于遗传算法优化支持向量机的X射线图像识别的方法,自动的选择SVM参数,解决了对性能有非常重要影响的核函数的参数确定问题,取得了较好效果,具有一定的实用价值。
参考文献
[1]张建华,朱春华.基于遗传算法和支持向量机的储粮害虫图像识别[J],2010,38(17):8833-8834.
[2]VAPNIK V. The nature of statistical learning[M].New York:Springer,1995.
[3]吴琳琳.基于SVM技术的手写数字识别的研究[D].山东师范大学,2006.
作者简介
郭文靜(1989-),女,山西省太原市人。硕士研究生学历。助教。主要研究方向为模式识别、超声无损检测。
作者单位
太原工业学院电子工程系 山西省太原市 030003