基于 A-ELM 的移动视觉搜索方法

2016-06-13 10:44洋,许军,
电信科学 2016年4期
关键词:服务器端训练样本分类器

胡 海 洋,许 军, 胡 华

(1.杭州电子科技大学计算机学院,浙江 杭州 310018;2.杭州电子科技大学复杂系统建模与仿真教育部重点实验室,浙江 杭州 310018)

基于 A-ELM 的移动视觉搜索方法

胡 海 洋1,2,许 军1,2, 胡 华1,2

(1.杭州电子科技大学计算机学院,浙江 杭州 310018;2.杭州电子科技大学复杂系统建模与仿真教育部重点实验室,浙江 杭州 310018)

计算机智能技术在图像领域已经得 到 广 泛 的 应 用 。 极 限 学 习 机(ELM)作 为 一 种 新 兴 技 术 ,克 服 了 其 他传统智能技术所面临的一些问题, 吸引了越来越 多研究人员的关注。 首先对 ELM 算法的性 能进行了 分析验证,并将其延伸到图像分类搜索上。 在此基础上,提 出了基本视觉搜索(BMVS)框架,将 ELM 运用到 此框架服务器端,并进一步优化了 ELM 的分类性能。 最后实验证明 ELM 在移动视觉搜索方面的可行性,并通过和支持向量机(SVM)的实验对比验证相关方法的高效性。

分类;极限学习机;移动视觉搜索

1 引言

随着互联网和多媒体技术的飞速发展,声音、图像、视频等数字信息急速膨胀。图像作为一种变现直观的多媒体显示信息,受到人们的重视和青睐。在现实社会应用中有大量的图像产生,如何快速有效地在图像库中匹配检索出需要用到的信息,一直是多媒体以及图像检索研究领域的热点问题,多媒体图像检索不仅可以帮助普通用户寻找到想要的多媒体内容,还可以涉及移动视觉搜索等多个领域。

图1 为 移 动 视 觉 搜 索示 例 ,通 过 移 动 端 的 拍 摄 ,可 以在很短的时间内搜索到相同或相近的图片,并返回相关信息。图 1(a)为拍摄一本软件测试书籍后通过检索反馈此书籍的相关信息;图 1(b)为拍摄一张海报,最终显示出有关此海报的内容。 与简单匹配不同的是,移动视觉搜索是基于算法和数据的,需要搜索框架拥有大量的图像库,之后根据图像处理方法得到图像描述特征,在特征值的基础上进行聚类分析或分类识别。它需要将图像一步步进行解析、提取特征、检索模型、识别等,最后根据检索算法得出和原图类似或相关的图像。

移动视觉搜索是指将移动终端获取的真实世界中的图像或视频作为查询对象,通过移动互联网去搜索视觉 对 象 的 关 联 信 息 的 检 索 方 式[1]。 移 动 视 觉 搜 索 是 基 于图像模式识别的基础,其中移动视觉搜索应用系统包括两个基本的内容:图像匹配和图像检索。在众多多媒体图 像 检 索 中 ,基 于 内 容 的 图 像 检 索 技 术[2]成 为 了 近 年 来 图像检索的热点,其中内容有使用颜色特征、纹理特征、形状特征等。传统的一般使用前馈神经网络来训练图像特征数据 , 其 中 单 隐 层 前 馈 神 经 网 络 (single-hidden layer feed forward network,SLFN)被 广 泛 地 使 用 。但 是 在 之 前 的 理 论研究工作中,输入权重和隐含层阈值总是需要调节的。且传 统 的 SLFN 主 要 使 用 基 于 梯 度 下 降 方 法 (如 BP(back propagation)神 经 网 络[3])、 标 准 的 优 化 约 束 方 法 (如SVM(support vector machine)[4])、 最 小 二 乘 法 (RBF(radial basis function)网 络[5])等 方 法 来 训 练 数 据 ,需 要 多 次 迭 代 ,且容易陷入局部最优解。

极 限 学 习 机 (extreme learning machine,ELM)[6-14]是 由Huang 等 人 最 初 提 出 适 用 于 SFLN 的 一 种 简 单 的 学 习 算法;不同于传统 的学习 算法(如 BP 学习 算法),ELM 不 仅能达到最小的训练错误,同时致力于达到最小的标准权重 ;它 避 免 了 传 统 的 SLFN(single-hidden layer feedforward)学习方法收敛速度慢以及容易陷入局部最优解的可能。本文在深入了解 ELM 算 法的基础 上 ,对 ELM 算法思 想 和 算法公式进行了仔细的研究分析,并且验证分析了 ELM 的分类效果,然后设计 ELM 分类器使之进一步运用 到 图 像搜索方面;同时在给出 ELM 基本概念的基础上,提出 了 一个 基 本 移 动 视 觉 搜 索 (basic mobile visual searching,BMVS)框架来解决视觉搜索中对于网络带宽的依赖,该框架采用ELM 分类器进行训练测试数据。通过这个框架上传下载图片相关信息时候,不用频繁地依赖网络,只需交互一次即可针对搜索的图像进行处理。

图1 移动视觉搜索示例

2 相关工作

[1]对 图 像 检 索 的 过 去 、 现 在 和 将 来 进 行 了 分析,对基于内容的图像检索的主要研究就似乎进行了详细和全面的论述,介绍了典型的基于内容的图像检索系统。最后指出了现存的问题和今后的研究方向。参考文献[6-14]提出了一个新的学习算法——ELM(极限学习机),该算法由新加坡南洋理工大学的黄广斌教授提出,它是一种主要针对 SLFN(单隐层前馈神经网络)的监督型学习算法。参考文 献 [12]在 讲 解 了 ELM 前 对 传 统 的 神 经 网 络 算 法 进 行 了分 析 , 如 SVM、PSVM、LS-SVM 等 , 并 且 在 目 标 函 数 、稳 定性、相似度匹配、学习速度、泛化性能等方面进行了实验对比 分 析 。参 考 文 献[13]重 点 对 单 隐 层 前 馈 神 经 网 络 的 通 用逼 近 性 能 进 行 了 分 析 ,并 且 在 此 基 础 上 提 出 了 一 种 I-ELM的单隐含层神经网络的增量学习算法。之后重点介绍了黄广斌在 ELM 的基础上 进行的一些推广,如将 ELM 推广 到复数域,提出基于 ELM 的在线时序算法等。参考文献[15]提出了一个新的多任务特征选择提取算法。它是以批处理的方式选取每个相关的特征,取代原先要单独评估每个特征。该算法基于一个假设:不同相关的任务拥有共同的结构,不同任务的多特征功能在连接架构中能够被同时学习,这使得该算法可以将多任务的共同理论作为补充信息来促进决策,同时提出了一个有效的迭代算法来促进优化从 而 保 证 收 敛 性 。参 考 文 献[16]提 出 了 一 种 新 的 模 式 识 别算 法 , 称 为 遗 传 主 成 分 分 析 (gentic principal component analysis,GPCA),它 是 结 合 了 遗 传 算 法 和 主 成 分 分 析 ,初 始由特征值和特征向量来构成特征空间。通过特征空间,使用欧式距离来对输入图片进行分类。最后通过在ORL(olivetti research laboratory,人 脸 数 据 库 )中 进 行 实 验 来证明提出的方法优于之前的人脸识别方法。

基于以 上分析,传统的方法如神经网 络 或者 SVM 等,都面临一些挑战问题,如学习速度慢、容易陷入局部最优解和计算顽健性低等。而极限学习机作为一个新兴的技术,克服了上述传统技术所面临的一些问题,在性能和可扩展性方面均能达到很好的效果。

3 极限学习机

极限学习机最初提出应用于单隐藏层前馈神经网络 ,然后延伸到了泛化 SLFN。给定 N 个不同的数据样本,且L个隐层神经元的单隐层神经网络可以零误差逼近这 N个互异的数据样本,则网络模型为:

其 中 ,ai、bi分 别 为 输 入 权 值 和 隐 含 层 阈 值 ,β为 第 i个隐 层 节 点 到 ELM 网 络 输 出 节 点 之 间 的 权 值 ,h(xi)=[G(a1,b1,xi),… ,G(aL,bL,xi)]T为 隐 藏 层 关 于 输 入 xi的 输 出 向 量 ,它 的 作用是将样本 xi由 d 维输入空间映射到 L 维的特征空间。

式 (1)可 简 记 为 :H·β=T,其 中 H(a1,… ,aL,b1,… ,bL,xi,… ,为神经网络隐层输出矩阵。矩阵中第 i行为输入向量 xi在各个隐层节点的 输 出 ,第 j列 为 第 j 个 隐 层 节 点 对 应 的 输 入 向 量 x1,x2,… ,xL的输出向量,。然而由于多数情况下,L<<N。从而使得训练样本的网络输出和实际输出之间的误差也随之产生:Hβ=T+E,即-tj,j=1,…,N。

即网络参数的训练问题转化成了最小化平方损失函数的问题,即寻找最小二乘解,使得:,利用广义逆可得:

其中,H+=(HTH)-1HT。

4 基本移动视觉搜索框架

为了更好地分析和测试 ELM 在多分类情况下的泛化性,同时能更加符合移动视觉搜索的应用所需,本文在移动视觉领域常用三大框架模型的基础上,构建了自己的移动视觉搜索框架模型——BMVS 框架,其模型如图 2 所示 。

在 图 2 所 示 的 框 架 中,移 动端 采 集 图 像 ,不需 要 对 图像进行相关处理,只需收集整理图像并使用网络传输图像到服务器端数据库,服务器数据库端会自动完成图像的相关处理任务(图片接收、特征提取、特征训练测试、显示结果),最后移动端接收识别结果即可。此外,移动端也可下载该分类器和配置信息,便能对相关图像进行匹配和检索。整个模型中,只需上传下载过程中需要网络链接,大大减少了对网络带宽等的需求。在这一过程中,ELM 分类器构造识别包括两个阶段:离线阶段,将图像库特征提取后,同类别标签一 起输入 ELM 分 类器中,构造 一 个 ELM 分类器;在线阶段,首先提取图像的特征,然后送入 ELM 分类器中进行判别,输出识别结果和信息、资源等。由于服务器端要对图片完成特征训练阶段,所以使用 ELM 算法来训练分类器。为了提高训练准确度,本文对提取的特征经过 相关预处理过程,包括 PCA 降维、归一化、数据标准化等4个步骤。

图2 基本移动视觉搜索框架

本文首先对接 收的图像进行 RGB 提取,接着进行HSV 转化,即对转化的 3 种特征通道进行 HSV 特征量化(H 通道量化 16 级 ,S 通道和 V 通道量化成 4 级),再将HSV 分量转换成一个一维数组,并对其进行特征直方图提取 。在 此 基 础 上 本 文 使 用 PCA 方 法[16]来 对 提 取 的 图 像 特 征进行降维操作,其原理就是将原来的数据投影到一个新的空间,新的空间下数据是原样本的一个最大线性无关组特征值所对应的空间数据,本文所实现的相关算法伪码如下。

步骤1 对于m个训练样本图片进行上面的特征提取 转 换 ,第 i 副 图 像 的 特 征 数 据 为 :{xi1,xi2,xi3,… ,xin},n 为 每张图片的特征维数,可以构建一个 A=m×n 的样本矩阵。

步 骤 3 求 样 本 矩 阵 与 平 均 值 的 差 值 :Di=xi-θ,i= {1,2,3,…,n}。

图3 PCA 降维与重构示例

步骤 4 计算样本矩阵的协方差矩阵,它的维度与每个样本的维度相等:

步骤 5 求协方差矩阵 B的特 征 值 和特征向 量 ,并 且根据特征值从大到小进行排列,得到给出成分的重要性级别,忽略重要性低的成分,最后根据得到的最大特征值的特 征 向 量 构 成 一 个 转 换 矩 阵 n·t(t<<n) ,之 后 用 原 来 样 本数 据 m·n×n·t得 到 原 样 本 数 据 在 新 空 间 的 数 据 ,即 降 维 后的矩阵数据。

如 图 3 所示的 实 验 测试中,对 特征图像 进 行 PCA 降维 后 ,图 3(a)是 计 算 特 征 值 的 贡 献 率 ,一 般 会 选 前 85%~95%的特征值对应的特征向量,其对应的特征值数量为降 维 的 列 数 。图 3(b)表 示 的 是测 试 图 在 PCA 降 维 后 ,通过 重 构 与 原 特 征 数 据 进 行 对 比 ,可 以 发 现 PCA 重构的 误差较小。

由 于 ELM 算 法 中 使 用 的 sigmod 函 数 的 取 值 是 0~1,所以要 对 图像提取 的 PCA 降维后 的 特 征数据进 行 归一化处 理 。归 一 化 映 射 函 数 如 下 :, 其 中 ,ymax、ymin为 参 数 ,默 认 为 -1 和 1,xmin、xmax代 表 数 据 矩 阵 中 的最大值和最小值,x代表要归一化的矩阵每一行中的每个数据。

根 据第 3 节 ELM 算法思想 和 ELM 分类的 分 析 ,本 文设计 ELM 分类器 来 训练图像 特 征 集, 其中对 于 输 入层和隐含层之间的连接权值w和隐含层阈值b进行随机选取,同 时 选 择 激 活 函 数 为 sigmoid 函 数 ,相 关 程 序 分 类 器 训 练的程序伪码如下表所示。

步 骤 1 初 始 化 N=150 幅 图 像 训 练 样 本 矩 阵 A={(xi,ti)xi⊂Rn,ti⊂Rm,i=1,… ,N}(即 对 图 像 进 行 上 述 的 提 取 、降 维 、归 一 化 操 作 ),其 中 T={t1,t2,… ,ti},i=1,… ,N 为 训 练 样 本 的 类别矩阵。

步骤2 随机产生输入层与隐含层间的连接权值I与隐含层神经元的阈值 B,取 激 活 函 数 TF 为 sig 函 数 。

步骤 3 根据 第 3.1 节相关计 算式计算隐含层输出矩阵(计算式忽略维数相关转变)。

步 骤 4 计 算 输 出 权 值 矩 阵 :L=pinυ(H')·T'(H'、T'均为转置矩阵)。

步骤 5 计算输入矩阵的预测输出类型矩阵:P=(H'·L)'。

如图4所示,本文对训练样本进行分类器的训练并对预测结果与原类别矩阵进行对比。当神经元的个数向训练样本逼近时,可以发现 ELM 分类器训练 精度会 越来越高。

图4 ELM 分类器训练结果(正确率 Accuracy=99.333 3%)

进一步 对训练好的 ELM 分类 器进行泛化 性能研 究,需要取测试数据样本来进行测试,其中测试数据的相关处理与训练数据一致,测试分为两部分:对样本数据测试,取样本数据中测试部分进行分类测试,由测试结果可以得知分类器的测试性能;对非样本中数据的测试,随机选取相关图像特征取相关数据进行分类预测,考察分类器 的 泛 化 性 能 。相 关 实 验 如 图 5 所 示 ,其 中 图 5(a)是 对 样本数据的测试结果,可知训练好 的 ELM 分类器 测试性 能良 好 ;图 5(b)是 对 非 样 本 数 据 中 的 随 机 相 关 图 像 数 据 进 行的分类预测结果,可知对于非样本相关数 据,本 ELM 分 类器能准确的预测出相关类别并输出相关信息。

图5 ELM 分类器预测效果

5 性能优化方法 A-ELM

由 于 ELM 的一些 阈值 和 输入权值 为 0 导致隐 含 层 节点无效。为了保持 ELM 的高效性,可以设置隐含层节点数目接近训练样本数目,此时样本能达到最好的训练效果,但此时 ELM 的泛化测试能力大大降低。

为了解决上述训练样本与测试样本分类准确率均衡的 问 题 , 本 文 提 出 A-ELM (ascending-extreme learning machine)一种类似增量学习的方法来训练优化分类器的性能,从而解决隐含层节点需要手动随机设置的问题,A-ELM 算法的基本模型如图 6 所示。

由第 3节可知,对于含有 L 个隐含层的神 经网络的函数 为)。同 时 ,理 论 与 实 验 表 明[9],含 有 L 个 隐含层节点的输出函数为:

A-ELM 优化方法的主要思想为:在图中的 隐含层逐一添加隐含层神经元节点数(最大为训练样本数量 N)。每次添 加 节 点 时 , 计 算 出 添 加 节 点 前 后 的 模 型 残 差 En=f-fn[11](其中 f为任意连续的目标函数,初始化为训练样本的目标 向 量 ),命 名 为 φ1,将 此 时 的 隐 含 层 节 点 数 和 模 型 参 数带 入 测 试 样本中,计算 比 较 出测试样 本 的残差 φ2,并对训练 样 本 和 测 试 样 本 的 残 差 和 求 二 范 数 φsum,最 后 依 次 比 较求 出 φmin=min(φsum)即 可 求 出 此 分 类 器 均 衡 的 隐 含 层 节 点数,从而进一步对未知样本进行测试实验。相关的算法伪码如下。

初 始 化 对 于 给 定 的 训 练 样 本 集 合 ψ ={(xi,ti)|xi∈Rn,ti∈R,i=1,… ,N},t=[t1,t2,… ,tN]为 样 本 目 标 向 量 ,隐 含 层 神 经元 个 数 L=0,样 本 残 差 E=t,最 小 残 差 和min=0(N 为 训 练 样本个数)。

步骤 1 当隐 含层 节 点数 L小于最大 样 本 数时候 ,逐一添加隐含层神经元个数:L=L+1。

步 骤 2 对 于 添 加 的 新 的 隐 含 层 节 点 j(j<L)随 机 生 成输 入 权 值 aj和 阈 值 bj。

步骤 3 计算新添加的隐含层 节点 的 输出权重 βj为:,其中E添加节点前的残差,为第 j个隐含层节点 与 N个训练 样本相关的隐含层输出矩阵。

步 骤 4 计 算 添 加 新 的 隐 含 层 节 点 后 的 残 差 :E1=EL=ffL,结 合 式 (3)有 :EL=f-fL=f-fL-1-βL·gL=EL-1-βL·gL(其 中 EL-1表示添加新节点之前的模型残差,EL表示添加之后的新的残差)。

步 骤 5 将 aj,bj等 模 型 相 关 信 息 带 入 到 测 试 集 框架 中 , 重 复 步 骤 3、 步 骤 4 求 出 测 试 集 合 残 差 E2,将与 φMin比 较 , 重 复 实 现 步 骤 1~ 步 骤 5 直 到 求 出 φmin=min(φsum)。

步骤6 对训练样本和测试样本之外的模型样本进行测试,进一步提高分类器的泛化性能。

图6 A-ELM 算法模型

6 实验部分

在本节中,通过实验来验证上述所有理论,采用“MATLAB2010b+VC++”编 程 ,具 体 实 验 环 境 :Asus A43s 2.50 GHz CPU、4 GB 内 存 、500 GB 硬 盘 。实 验 主 要 程 序 采 用MATLAB2010 语言编写。首先第 6.1 节中对 ELM 分类器训练,通过对图片集中种类的采集和处理来训练分类器。

6.1 服务器端 ELM 分类器实验

对 ELM 分 类器训练,通过 对 图片集中 种 类 的采集 和处理来训练分类器。

图7 中 实 验 所 用 图 像 是 从 101_ObjectCategories 图 片集 中 随机选取 6 种类图片 集 ,每 种 30 样 本 (其 中 ,每 种 选取 25 样 本 进 行 训 练 ,5 样 本 进 行 测 试 ,共 计 6×25=150 个训练样本,6×5=30 个测 试样本)进行 ELM 分类器的 训 练 ,由于随机产生输入和隐含层连接权值 w和隐含层阈值 b,所以分类准确率会有一个波动范围。所以本文采取多训练求平均值的方式来衡量训练的结果,由图 6可知对于训练分类器准确率达到 98%,此时测试准确率也能达到 90%可以证明对于此分类器的训练测试效果较好。

图7 服务器端训练测试效果

6.2 对比实验

通过使 用传统的分类算法 SVM 来进行 比 较 ,从而 确定 ELM 分类器的优势。

如 图 8 所 示 ,系 统 通 过 使 用 支 持 向 量 机 (SVM)来 处理图片特征,最后返回训练样本的准确率。为了更好地体现对比性,本文对不同训练样本进行对比实验如图9所示。

图8 SVM 训练测试结果

图9 SVM 和 ELM 对 比

由于随机产生w和b对测试实验结果有起伏的影响,本文对 5 次分类器测试实验取平均值,见表 1。

表1 训练平均值

通过图 9 和表 1、表 2 可以发现 ,当 样 本 数量不多 时 ,ELM 和 SVM 的分类准确率和 分类时间差不多, 当数量增大时候,分类器的准确率就有了比较大的差距,训练时间更是相差比较大。因此,在图像特征检索方面,ELM 比SVM 更有效率性和准确性。

表2 ELM 和 SVM 对比总结

6.3 ELM 的性能优化实验

本节对 ELM 方法进行性能 优 化 实验,使 用 优化性能的 ELM 进行训练测试,进一 步 提 高 ELM 的分 类 训练测试能力和泛化性能。主要分为两部分:A-ELM 的优化结果及性能优势;对相关非样本数据的预测。

如图 10 所示,当逐一增加 隐含层节点 L 时,训练样本残差 φ1与 φ2测试样本的残差的范数和成下降趋势,之后趋于一个最小点,此时即可求出无需人工设置的隐含层节点数。

如 图 11 所 示 ,当 没 有 采 取 优 化 时 候 , 训 练 样 本 的神经元个数是随机生成,要想达到很好的效果,只能人工不断手动设置隐含层节点来慢慢调节,且如需达到最好的训练效果,可设置神经元个数 L=训练样本数目 ,但 此 时 测 试 样 本 的 ||φ2||非 常 大 (也 即 误 差 非 常 大 ),如果想达到一个均合适的分类效果,需要不停手动设置 L。采取优化后,无需手动设置,通过上述的方法,可以自动调节训练样本和测试样本的误差,从而确定一个合适的神经元个数,达到一个均衡的效果,以提高分类器的稳定性。

图10 A-ELM 优化实验

对相关非样本数据的预测方面,为了检验调节 L对分类器的泛化性能的影响,如图 12 中(a)~(d)随机下载 4 幅图片进行测试,图 13 为测试结果。

表3 中 给 出 了 A-ELM 和 未 优 化 的 ELM 对 于 非 样 本数据的测试,可以看到优化后,预测准确度并没有降低,但是由于需要重复调节神经元个数,花费时间增加。但是手动调节来说,A-ELM 有很大的优势。

6.4 移动计算设备的测试

本文对移动计算设备进行了视觉搜索测试,移动计算设备为拥有安卓系统的智能手机或者拥有安卓模拟器的电脑,并且只需要下载分类器和相关信息即可。实验整体流程如下:首先在服务器端和移动端建立连接,设置好端口号和服务器端的 IP 地址,同时在移动端 上 安 装一个安卓 App。打开此应用程序程序,移动计算设备拍摄图像完成采集,上传到服务器进行处理,上传过程中使用序列化方式传输,将图像组织成二进制流的方式进行图像的接收和传输。与此同时,服务器端监听事先设置好的端口并接收图像数据流,之后反序列化成图像显示送入服务器端的分类器中进行分类预测。根据本文所提出的模式框架,服务器端将预测的图像进行相关处理并传输到网络中,移动端接收此图像检测进行显示,同时能返回相关信息。实验展示效果如图 14所示。

7 结束语

图11 性能优化对比

图12 测试图片示例

本 文 在 阐 述 ELM 的 理 论 基 础 上 对 ELM 进 行 了 进 一步的理论与实验分析,并将之运用到移动视觉搜索方面;本文首先对 ELM 算法的性能进行了分析验 证 ,在此基础上,提出了基本视觉框架模型 BMVS,将 ELM 运用到此框架服务器端,并进一步给出了优 化分 类 性能的 A-ELM 方法。最后通过实验证明了 ELM 在移动视觉搜索 方面 的 可行性,并通过和支持向量机 SVM 的实验对比 验证相关 方法的高效性。

表3 ELM 优化前后性能对比

图13 针对图 12 中图片的测试结果

图14 移动计算设备的测试

参考文献:

[1] 段 凌 宇,黄 铁 军 ,高 文. 移 动 视 觉 搜 索 技 术 研 究 与 标 准 化 进展[J]. 信 息 通 信 技 术,2012(6):51-58. DUAN L Y,HUANG T J,GAO W.Technical research and standardization in mobile visual search [J].Information and Communications Technologies,2012(6):51-58

[2] 李 向 阳 ,庄 越 挺 ,潘 云 鹤. 基 于 内 容 的 图 像 检 索 技 术 与 系 统 [J].计算机研究与发展,2001(3),38(3):344-354. LI X Y,ZHUANG Y T,PAN Y H.The technique and systems ofcontent-based imageretrieval [J].JournalofComputer Research and Development.2001(3),38(3):344-354

[3] GURNEY K.An introduction to neural networks [M].London:UCL Press,1997:20-25.

[4] HSU C W,LIN C J.A comparison of methods for multiclass support vector machines [J].IEEE Transactions on Neural Networks,2002,13(2):415-425.

[5] HHUANG G B,SIEW C K.Extreme learning machine:RBF network case[C]/2004 8th Conference on Control,Automation,Robotics and Vision Conference,December 6-9,2004,Kumming,China.New Jersey:IEEE Press,2004(2):1029-1036.

[6] HUANG G B,CHEN L.Convex incremental extreme learning machine[J].Neuro Computing,2007(70):2056-2062.

[7] HUANG G B,BABRI H A.Upper bounds on the number of hidden neurons in feedforward networks with arbitrary bounded nonlinear activation functions [J].IEEE Transactions on Neural Networks,1998,9(1):224-229.

[8] FUNGG,MANGASARIAN O L.Proximalsupportvector machine classifiers [C]/The 7th ACM Sigkdd International Conference on Knowledge Discovery&Data Mining,August 26-29,2001,San Francisco,CA,USA.New York:ACM Press,2001:77-86.

[9] HUANG GB,WANG D H,LAN Y.Extremelearning machines:a survey [J].InternationalJournalofMachine Learning and Cybernetics,2011,2(2):107-122.

[10]HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine:a new learning scheme of feedforward neural networks[J].IEEE International Joint Conference.2004(2):985-990.

[11]HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine:theory and applications[J].Neuro Computing,2005 (70):489-501.

[12]HUANG G B,ZHOU H,DING X,et al.Extreme learning machine for regression and multi-class classification [J].IEEE Transactions on Pattern Anal Mach Intell,2012,42(2):513-529.

[13]HUANG G B,CHEN L,SIEW C K.Universal approximation using incremental constructive feedforward networks with random hidden nodes [J].IEEE Transactionson Neural Networks,2006,17(4):879-892.

[14]HUANG G B,SIEW C K.Extreme learning machine with randomly assigned RBF kernels [J].International Journal of Information Technology,2005,11(1):16-24.

[15]HALL M A,SMITH L A.Feature selection for machine learning:Comparing a correlation-based filter approach to the wrapper [C] // The 20th InternationalFlorida Artificial Intelligence Research Society Conference,May 1-5,1999,Orlando, Florida, USA. California: AAAI Press, 1999:235-239.

[16]PRICE A L,PATTERSON N J,PLENGE R M,et al.Principal components analysis corrects for stratification in genome-wide association studies [J].Nature Genetics, 2006, 38 (8 ):904-909.

[17]HOLTEN D,WIJK V J J,MARTENS J B.A perceptually based spectral model for isotropic textures [J].ACM Transactions on Applied Perception,2006,3(4):376-398.

Mobile visual searching method based on ascending extreme learning machine

HU Haiyang1,2,XU Jun1,2,HU Hua1,2
1.School of Computer Science and Technology,Hangzhou Dianzi University,Hangzhou 310018, China 2.Key Laboratory of Complex Systems Modeling and Simulation,Ministry of Education,Hangzhou Dianzi University,Hangzhou 310018,China

Computer intelligence technology had been widely used in the field of image searching.Extreme learning machine has emerged as a new technology which overcomes the problems in traditional intelligent field and it has attracted more and more researchers.The algorithm performance of ELM was analyzed firstly,extending the method to image classification field.A basic mobile visual searching (BMVS)framework was proposed which applies ELM to image searching and optimizes the performance of ELM.Finally,the experiment proves the effectiveness of the method proposed by using ELM for the mobile vision searching.Through the experiments of comparison with SVM-based methods,the efficiency of the method proposed was also confirmed.

classification,extreme learning machine,mobile visual searching

s:The National Natural Science Foundation of China (No.61572162,No.61272188),The Foundation of State Key Laboratory for Novel Software Technology of Nanjing University (No.KFKT2014B15),The Foundation of Key Research Base for Philosophy and Social Sciences of Zhejiang Province (Research Center of Information Technology&Economic and Social Development)(No.14JDXX04YB)

TP311

:A

10.11959/j.issn.1000-0801.2016088

胡 海 洋 (1977-), 男 , 博 士 , 杭 州 电 子 科 技 大学教授, 主要研究方向为分布式系统、数据库技术、工作流技术。

许 军 (1990-), 男 , 杭 州 电 子 科 技 大 学 硕士生,主要研究方向为数据库技术、图像检索。

胡 华 (1964-), 男 , 博 士 , 杭 州 电 子 科 技 大 学教授,主要研究方向为分布式系统、数据库技术。

2015-04-16;

2016-03-02

国 家 自 然 科 学 基 金 资 助 项 目 (No.61572162,No.61272188);南 京 大 学 计 算 机 软 件 新 技 术 国 家 重 点 实 验 室 开 放 基 金 资 助 项 目(No.KFKT2014B15);浙 江 省 哲 学 社 会 科 学 重 点 研 究 基 地 (信 息 化 与 经 济 社 会 发 展 研 究 中 心 )课 题 资 助 项 目 (No.14JDXX04YB)

猜你喜欢
服务器端训练样本分类器
Linux环境下基于Socket的数据传输软件设计
人工智能
基于差异性测度的遥感自适应分类器选择
基于实例的强分类器快速集成方法
基于Qt的安全即时通讯软件服务器端设计
基于Qt的网络聊天软件服务器端设计
宽带光谱成像系统最优训练样本选择方法研究
基于稀疏重构的机载雷达训练样本挑选方法
基于C/S架构的嵌入式监控组态外设扩展机制研究与应用
基于层次化分类器的遥感图像飞机目标检测