(浙江交通职业技术学院机电与航空学院,浙江 杭州311112)
机器视觉技术具有快速、精确、直观、稳定等诸多优点,在工业、农业、交通、医学等各种重要领域有着非常广泛的应用。目前对机器视觉应用的需求越来越多,针对物体识别的机器视觉应用已经成为热门。目前普遍采用的传统物体识别框架为先训练,后识别,训练和识别过程分开进行[1-3],训练和识别分离的框架有一定的局限性,针对新物体和变化的环境,需重新训练,适应性差,实时性低,自主学习能力弱,这些问题限制了识别系统智能的进一步提高。针对这些问题,研究人员提出的在线识别框架在一定程度上解决了以上问题,但仍然有不少困难。文献[4]将增量学习向量量化算法和在线向量量化算法结合,提出一种针对在线物体识别的算法,在3 h 内针对50个物体的分层特征进行了在线学习识别。但该方法存在特征提取维度高,计算量大的缺点。文献[5-7]在特征提取上采用主成分分析方法,较好压缩数据量,计算开销降低,但容易丢失部分重要信息,因此,提出一种既能保证识别精确性又能保证计算实时性的在线识别算法能很大程度改进上述问题。本文提出一种基于自适应仿生网络的识别算法,算法通过多层神经网络模拟人类记忆结构,将学习到的物体知识存储之网络节点,使得系统可在线学习新的陌生物体。
目前大多数分类器或者学习算法以离线学习为主,而非在线形式。针对非特定物体的在线识别,需要根据不同类别的样本进行自主调整、增加样本知识。文献[8]提出一种可变结构的自组织网络,该网络可针对一般分布的数据进行无监督的在线和增量式的学习,调整网络节点和权值,具有较好的抗噪能力。该网络符合在线识别中可自适应调整学习类别的要求,且在结构上模拟了人类记忆结构,因此适用于非特定物体在线识别。
自适应仿生神经网络的结构与学习过程如图1所示,需要识别的样本物体图片作为网络输入,网络分3层,第一层输入层后,经过两个竞争层,在第二竞争层中生成聚类,以节点形式存储和分类物体类别,即知识,并且该网络节点结构可随着增量的外部识别类别而增加调整,实现自适应的在线识别物体的目的。其中网络核心竞争原理的数学描述为其中,x为输入模式,wj为神经元j的权值向量,℘定义了神经网络,满足该条件的神经元i为竞争获胜神经元。
图1 自适应仿生神经网络结构
根据网络学习原理,自适应仿生网络的学习与识别算法流程如下。
符号定义:ξ为新样本,l为网络节点,Wc为节点权值向量,ε1(t)是胜者节点权值学习率,ε2(t)是胜者近邻节点权值学习率,ΔW为权值更新量,E为节点积累误差,A为网络节点集合。
1)自适应仿生网络输入新物体图片样本ξ;
4)计算输入信号与胜者节点的欧氏距离,并进一步计算积累误差
5)获得当前物体样本的类别判断,如果是新类,那么在网络中新增类别向量,作为新学习知识;如果是已学习类别,那么作出识别判断;
6)若达到学习次数的阈值LT,则输出类别数和类别;
7)返回步骤1,新样本继续输入,进行下一步的学习与识别。
实验使用150个物体样本进行实验,实验比较本文方法与传统框架的PCA 方法进行物体识别的效果,主要比较识别率和识别时间,以及对新物体进行学习的系统扩展能力。
实验结果识别率比较如图2所示。对本文算法和传统PCA 方法采用不同的学习方式,本文算法由于有在线学习能力,采用在线递增新样本方式,传统PCA 方法每次学习固定的样本数,每次增添新样本,则重新批量学习。随着学习次数的增加,每次学习为在线学习新物体,本文方法识别率能随着学习过程不断提高,而传统PCA 每次批量学习后的识别率固定不变,可见本文方法具有对新物体的自适应能力,在前100个样本的学习过程中,但随着样本的增多,识别率得到逐步改善,但识别率比传统方法略低,在样本数从100 增加到150的学习过程中,本文方法的识别率开始好于传统PCA 方法,可见,本文方法在对新样本的适应性和识别率方面,经过不断学习,都好于传统PCA 方法。
图2 实验结果识别率比较
同时,在识别时间上的比较如图3所示。可见,本文算法能维持在一定的时间上,不会因为样本的增加而增加,实现较好的实时性。因此,采用本文提出的基于自适应仿生网络在线识别算法进行物体的在线识别,可以使得识别在线进行,知识得到不断更新,遇到新情况不需要重新学习。随着知识在线积累,识别系统有更好的可扩展性、适应性和鲁棒性。
图3 实验识别时间比较
本文针对传统识别框架不能适应新物体,造成可扩展性、实时性、适应性差的问题,提出一种基于自适应仿生网络的识别算法,以多层神经网络模拟人类记忆结构,使得系统可在线学习新的陌生物体。本文的研究能有效改变传统识别框架带来的局限,能够在线识别非特定的多种物体。通过算法建立一种在线的非特定物体识别框架,在一定程度上拓展了图像识别算法的传统框架,为进一步提高系统智能提供了一种思路。当然本文算法也存在一定的问题,如相比传统训练再分类方法,该方法在线存储节点方式,需要耗费内存,需要在今后的研究中提出新的解决思路,降低内存消耗。
[1]Je H,Kim J,Kim D.Hand gesture recognition to understand musical conducting action[C]//Robot and Human interactive Communication,2007.RO-MAN 2007.The 16th IEEE International Symposium on.IEEE,2007:163-168.
[2]Fang Y,Wang K,Cheng J,et al.A real-time hand gesture recognition method[C]//Multimedia and Expo,2007 IEEE International Conference on.IEEE,2007:995-998.
[3]Bosch A,Zisserman A,Muoz X.Scene classification using a hybrid generative/discriminative approach[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2008,30(4):712-727.
[4]Kirstein S,Wersing H,Körner E.A biologically motivated visual memory architecture for online learning of objects[J].Neural Networks,2008,21(1):65-77.
[5]Ozawa S,Pang S,Kasabov N..A Modified Incremental Principal Component Analysis for On-line Learning of Feature Space and Classifier[J].Trends in Artificial Intelligence,2004:231-240.
[6]Jiang X,Motai Y.Learning by observation of robotic tasks using on-line pca-based eigen behavior[C]//Computational Intelligence in Robotics and Automation,2005.CIRA 2005.Proceedings.2005 IEEE International Symposium on.IEEE,2005:391-396.
[7]Artac M,Jogan M,Leonardis A.Incremental PCA for on-line visual learning and recognition[C]//Pattern Recognition,2002.Proceedings.16th International Conference on.IEEE,2002,3:781-784.
[8]Furao S,Hasegawa O.An incremental network for on-line unsupervised classification and topology learning[J].Neural Networks,2006,19(1):90-106.