仿生模式识别技术研究与应用进展

2016-07-01 00:51陈阳覃鸿李卫军周新奇董肖莉张丽萍李浩光
智能系统学报 2016年1期
关键词:模式识别训练样本识别率

陈阳,覃鸿,李卫军,周新奇,董肖莉,张丽萍,李浩光

(1.工业和信息化部 中国电子信息产业发展研究院,北京 100846; 2. 中国科学院半导体研究所 高速电路与神经网络实验室,北京 100083; 3.聚光科技(杭州)股份有限公司,浙江 杭州 310052)

仿生模式识别技术研究与应用进展

陈阳1,覃鸿2,李卫军2,周新奇3,董肖莉2,张丽萍2,李浩光2

(1.工业和信息化部 中国电子信息产业发展研究院,北京 100846; 2. 中国科学院半导体研究所 高速电路与神经网络实验室,北京 100083; 3.聚光科技(杭州)股份有限公司,浙江 杭州 310052)

摘要:回顾了仿生模式识别与传统模式识别的本质区别,与传统模式识别“分类划分”思想不同,仿生模式识别把模式识别问题看成是各类样本的“认识”,并将“同源连续性”规律作为先验知识,用高维空间几何形体覆盖方法实现对同类事物的学习,因此克服了传统模式识别的缺点。其有效性逐渐受到学者的广泛关注。分析总结了目前已有的仿生模式识别方法的研究和应用,方法研究包括样本点分布的拓扑分析、覆盖算法和重叠空间中样本的归属;应用研究方面包括目标识别、生物特征识别、文本识别、近红外光谱定性分析等。分析表明仿生模式识别是创新、有效的模式识别方法。最后指出同类样本点分布流形的分析方法和高维空间拓扑理论与算法研究等是仿生模式识别未来重要的发展方向。

关键词:模式识别;仿生模式识别;同源连续性;拓扑分析;覆盖算法;目标识别;生物特征识别;文本识别

中文引用格式:陈阳,覃鸿,李卫军,等.仿生模式识别技术研究与应用进展[J]. 智能系统学报, 2016, 11(1): 1-14.

英文引用格式:CHEN Yang, QIN Hong, LI Weijun,et al. Progress in research and application of biomimetic pattern recognition technology[J]. CAAI Transactions on Intelligent Systems, 2016, 11(1):1-14.

模式识别经过多年的发展,已形成了一系列经典的理论和方法。传统模式识别的目的是将对象(样本)进行分类,因此也被称作模式分类[1],传统模式识别认为所有可用的信息都包含在训练样本集中,考虑的出发点是特征空间中若干类别样本的最佳分类划分,代表性方法有Fisher判别分析[2]、支撑向量机(SVM)[3]等。这些方法解决了很多问题,并在多个领域得到了成功应用,为科学发展和社会进步做出了巨大贡献,但这些传统方法也存在一些固有的缺陷:1)对事物进行学习时通常至少需要两类才可进行“区分”,例如在人脸检测中,学习的任务仅是人脸这一个类别,但在训练分类器时,分类器需要学习“人脸”和“非人脸”两种类型;2)已训练好的分类器类别之间的最优分类边界是确定的,若要增加学习新类,则需要重新训练分类器,这将会打乱现有知识(最优分类边界改变);3)未经训练类别的样本很容易被误认为是已训练的某一类,分类器不能有效对其进行正确拒识,这是由于分类边界只是将一个无限特征空间划分为多个无限空间。

中国科学院半导体研究所王守觉院士通过分析人类认识事物的特点,提出了一种全新思想的模式识别方法——仿生模式识别(biomimetic pattern recognition,BPR)[4]。仿生模式识别认为,事物具有“同源连续性规律”,即同类事物的两个不同样本之间,至少有一个渐变过程,在这个渐变过程中的所有样本仍属于该类;也可以这样认为:同类样本在特征空间中是连续分布的,任意两个样本点之间具有某种连续变化的关系。“同源连续性规律”是现实中人类直观认识世界的普遍存在的规律,同时也是仿生模式识别方法用于提高对事物的识别能力的“先验知识”。引入“同源连续性规律”后,研究仿生模式识别如何对某类事物进行学习,就是研究在高维特征空间中如何对该类样本进行最优连续“覆盖”(即对一类样本的“识”);它不同于传统模式识别方法侧重于“别”,即如何在高维特征空间中对不同类样本进行最优“划分”。可见,在特征空间中对某一类样本的分布进行最优覆盖是仿生模式识别的首要目标,覆盖后在特征空间中形成的连续、闭合的复杂几何形体区域赋予该类的属性;则仿生模式识别的识别过程就是判断特征空间中待识别样本点是否落入此几何形体内。若是,则该样本点属于此几何形体所代表的类别;否则认为不属于该类。仿生模式识别于2002年被提出后,被迅速应用到多种识别任务中,获得了有效的识别结果,并展现出独特的优势:

1)仿生模式识别既能够“识”,又能够“别”,对于没有训练过的样本,不会将其错误归为已训练样本中的某一类,而是能够将其正确拒识,实际应用中误识率非常低;

2)仿生模式识别可以不断学习新事物(类别),并且学习某类时不需要负样本(非此类或他类样本)参加训练,学习新类时不需要重新学习已知类,即不会影响原有已经学习好的知识;

3)仿生模式识别在低训练样本数量情况下仍能获得较高的正确识别率,这得益于引入了“同源连续性规律“的先验知识,因而有效的信息不再局限于训练样本。低训练样本数、高识别率的特点,更适合一些不易获取大量训练样本的特殊场合下的识别任务。

仿生模式识别由于其独特的优点,在国内逐渐受到关注,越来越多的研究机构加入研究队伍,从理论、方法以及应用等多方面开展研究,这些研究机构包括中科院半导体研究所、同济大学、中国农业大学、浙江工业大学、厦门大学、深圳大学、中科院苏州纳米技术与纳米仿生研究所、长沙理工大学、合肥工业大学、吉林大学、西安电子科技大学等众多高校和研究机构。仿生模式识别的研究成果不断涌现,先后用于目标识别、生物特征识别、信号处理、医学图像识别、基因预测和近红外定性分析,涉及机器视觉、安防、农业、生物医学、通信以及互联网等众多领域,获得了有益的效果。2002年迄今,在国内学术期刊发表的与仿生模式识别直接相关的论文有80余篇,相关的国内硕士和博士学位论文30余篇,在国际期刊和会议上发表的论文40篇左右,此外,还有3本专著出版[5-7]。

仿生模式识别是我国自主创新的方法与技术,从提出至今,已有十多年的发展,但目前还没有对该技术的全面总结。本文旨在对仿生模式识别进行全面的综述。首先介绍仿生模式识别的基本原理,再对仿生模式识别的实现方法进行分析和对比研究,并给出了仿生模式识别在多个应用领域的使用效果,最后探讨仿生模式识别的未来研究方向,希望能够为该方法的进一步发展和实际应用提供参考。

1仿生模式识别的基本原理

1.1仿生模式识别的基点——“同源连续性”规律

仿生模式识别把同一类事物称为“同源”,这里所谓的“同一类”是指在源头或原理上是相同的一类,而不是拼凑或合并而成的同一类。例如,在手写体汉字识别中,同为简体汉字的手写体认为是同源的;如果手写体汉字中包含了简体和繁体两种字体,“简体”和“繁体”是不同源的,则认为是简体和繁体两类事物的归并。后文所提到的同类,若无特别说明,都是指“同源”同类。依据上述“同源”的定义,同类样本之间有如下 “同源连续性”规律:

自然界中待认识的事物,若两个事物同类但不完全相等,则可以用一个渐变的或非量子化的过程来描述这两个事物之间的关系,在此变化过程中的所有事物与这两个事物同属一类。“同源连续性”规律可用数学描述为:

在n维特征空间Rn中,假设A为某一同类样本(事物)全体的集合,如果样本x,y⊂A,则对于任意ε>0, 必定存在一个集合B满足如下条件:

式中ρ(xm,xm+1)表示样本xm与xm+1间的距离。

1.2仿生模式识别的学习过程

基于1.1节的“同源连续性”规律,两个同类样本间存在连续渐变的关系,并且位于这个渐变过程中的样本点仍属于同一类。仿生模式识别的目标就是把分布在特征空间中的同类样本实现连续覆盖,以二维空间的情况示意图如图1所示。

图1 仿生模式识别覆盖示意图Fig.1 The Schematic Diagram of BPR

图1中,三角形、十字形、圆点表示分别表示三类不同样本,椭圆表示仿生模式识别采用某种覆盖方法在特征空间内形成类别子空间的“认识”方式。也就是说,仿生模式识别的学习过程,就是特征空间中对同类样本点进行连续覆盖的过程,不同的覆盖算法构成了仿生模式识别的学习算法。

通常,特征空间Rn是n≥3的高维特征空间,某类事物样本分布子空间在这样的高维空间中是非常复杂的,实际设计学习算法时,将类别子空间分解为多个封闭的简单几何形体空间(如图1三角形类所示,类别空间被分解成多个首尾相接的椭圆),则用这些简单几何形体的并近似原来的类别子空间,可使仿生模式识别的学习算法灵活、高效。

1.3仿生模式识别的识别过程

图2 识别过程示意图Fig.2 The Schematic Diagram of recognition

综上所述,仿生模式识别与传统模式识别的差别可归纳如表1所示。

表1 仿生模式识别与传统模式识别的差别

2方法研究

仿生模式识别的一般流程如图3所示。

图3 仿生模式识别的一般流程Fig.3 Flow chart of BPR

仿生模式识别为模式识别技术的发展开辟了一条新路径,同时也提出了实现仿生模式识别需要研究的多方面问题,目前的研究主要集中在如下几点:

1)类别子空间的拓扑流形分析:仿生模式识别是一类一类地“认识”事物,在学习某类事物时,需要先分析该类训练样本点的分布,依据同类样本点在特征空间中的分布特性,确定这种分布具有何种拓扑属性,从而确定类别子空间在特征空间中的流形。在确定类别空间的流形及其维数后,仿生模式识别再考虑用何种覆盖方法。

2)覆盖方法研究:研究发现,同一类样本在高维特征空间中的分布表现为一个非常复杂的几何形体,虽然具有一定的拓扑流形属性,但要实现对这个几何形体的覆盖会遇到很多困难,例如选择何种几何覆盖单元、如何确定覆盖的顺序、怎样进行连续覆盖等,这也就成为仿生模式识别研究的热点。

3)识别方法研究:在确定使用哪种覆盖方法后,识别通常会比较简单,只需计算待识别样本点是否落入特征空间中表征某一类的几何形体内。若是,则将样本点识别为该类;若否,则认为不属于该类。理论上,不同类事物在特征空间的覆盖形体不会交叉重叠,因此,决不会出现误识。然而,在工程应用实践中,所采集到的训练样本及待识别样本中往往包含不同程度的“噪声”,特征提取过程中也会丢失一些信息,最终有可能导致类别空间重叠,需要解决处于重叠空间中的未知样本的归属问题。

除上述几个主要研究方向,也有学者将仿生模式识别思想与其他方法相结合,从而提高该方法解决问题的能力。

2.1样本点分布的拓扑分析

成就感降低维度主要集中在年轻人身上,且男性高学历者居多,因为高学历者的思维和男性的打拼精神激励着他去做出改变,而行政工作无聊乏味、单调重复,与自身思想矛盾,从而产生一种大材小用的感觉。

仿生模式识别的核心是覆盖,而分析类别空间的流形是确定用何种覆盖方法的前提。样本点分布的拓扑属性简单分为两种情况,一种情况是拓扑结构是已知的或可以预测的;另一种情况是拓扑结构是未知的。例如在采集训练样本时,设定严格的采集条件,按照一定的规律或顺序采集,此时,样本点分布的拓扑结构是已知的或者是可以估计的。王守觉在目标识别应用中[4],采用了特定的样本采集方式:摄像头在同一水平面上采集目标的0~360°方向的图像,此时目标方向的改变只有一个变量,可认为目标全体样本在特征空间中的分布近似呈环状的一维流形。王宪保等[8]的双螺旋曲线识别任务,识别目标——双螺旋曲线是分布在二维空间的一维流形。王守觉、徐健等[9]在一项人脸身份确认研究中,使用三个摄像头组成一组镜头,这一组镜头同时采集同一人脸的图像得到多个样本点,这多个样本点的分布状况部分反映了该人脸在特征空间中的分布状况,后续用一个多权值神经元对这一组样本进行覆盖完成学习。在高维空间中,遇到更多的是拓扑结构未知的情况,目前还没有有效分析高维空间中点分布状况的系统方法和工具,并且流形的维数越高,分析的难度越大,目前的研究大多假定样本呈一维流形分布[4,10-12],在这些实验中,采用一维流形覆盖,都能够取得很好的识别效果。王宪保等[13]研究了不限定流形维数的仿生模式识别实现方法,研究发现随着覆盖维数的增加,样本的识别率也逐渐提高,但提高幅度逐渐变小。

2.2覆盖算法研究

覆盖算法的实现是仿生模式识别的研究重点,神经网络被证明是有效的方法[14-15]。Wang Shoujue, Zhao Xingtao等[11,16]提出一种超香肠神经网络,网络由超香肠神经元(hyper sausage neuron,HSN)构成,HSN在特征空间中可看成是以两个样本点的连线作为中心线,与中心线距离小于阈值的所有点的集合。在3维空间中,神经元可看成是一个以两个样本点之间的线段作为中线的圆柱体、分别以两个样本点为球心的半个超球共3个区域的并,构成一个新的空间区域,因其在3维空间中像一根香肠,称之为超香肠神经元。王守觉、徐健、Lai Jiangliang等[9,17]还提出了Ψ函数神经网络:Ψ函数神经网络由多权值神经元组成,而多权值神经元的权值通过样本来确定,一个多权值神经元在特征空间中形成的覆盖区域是依据多个权值矢量共同作用形成的复杂几何形体。因此,多权值神经元覆盖的空间状况是由样本决定的。以三权值神经网络进行人脸身份确认,在误识率为0的情况下,正确识别率达到96%,实验结果也显示,增加网络规模可提高识别效果。多权值神经元网络用在非特定人语音识别中[18],每个词汇的训练样本数量为30个的情况下,已训练词汇的误识率仅为1.48%,未训练词汇的误识率为13.29%,而同条件下HMM方法的误识率为89.24%,远高于仿生模式识别方法。王宪保等[8]使用了两种不同结构的神经元来构造一个三层神经网络,该网络可实现一维流形覆盖;由于网络的参数是根据样本直接计算得到,网络不存在迭代时间及收敛性问题;网络的规模也是由样本数量决定的,不存在隐层节点数选择难题。邱立达等[19]将改进蚁群算法引入仿生模式识别的神经网络构造当中,并选取超球作为覆盖几何体。该算法通过设计目标函数、转移概率公式以及信息素更新算法等方法,算出神经网络中覆盖几何体的最优参数;算法还引入调节因子α:α越大,单个神经元的体积越小、神经元数量越多,算法构造的网络的复杂度也就越高、识别率越高;反之,α越小,单个神经元的体积越大、神经元数量越少,算法构造的网络的复杂度也就越低,识别率越低。在实际应用中可通过调整α的取值来平衡网络的性能和复杂度,以满足不同需要。胡静等[20]基于神经网络模块化编程思想,提出了一种实现仿生模式识别的三层前向神经网络结构设计准则,即:采用单隐节点层结构,网络的输入层与隐节点层的连接方式为全连接,将隐节点层划分为C个子节点组,且各个子节点组只与其相应的输出层节点相连接。其中C为学习样本的“基元素”数目,实验比较了严格按照该准则设计的网络与未按照该准则设计的网络在交通标识符形状识别中的效果,隐节点分组时,网络收敛次数更多、识别率更高且训练时间更少,识别速度更快。其他神经覆盖方法研究[21]提出的类高斯混合模型的神经元覆盖方法,王改良等[22]利用动态聚类的方法寻找到每个覆盖区中心,然后用多权值神经元进行覆盖等。

从高维形象几何的观点出发,研究采用多个简单几何体进行局部覆盖,再通过对简单几何体合并或相交的方法,可实现对复杂几何体的覆盖。实际上,从广义神经网络的角度看,简单几何体可以看成是一个神经元,而多个几何体的并或交可看成是多个神经元构成的神经网络。从这个意义上看,神经网络方法和高维形象几何方法是相通的。杨国为等[23]采用高维空间点分布分析方法,给出从数学上证明了找到满意的几何覆盖形体的方法。王宪保等[13]运用高维空间几何理论和流形学习理论,在不需要限定流形维数的情况下,研究了具体实现训练样本的覆盖方法及测试样本的识别方法,并对覆盖维数以及与识别性能之间的关系进行了分析;并将该实现方法应用在语音识别中,取得比传统的HMM和最近邻法(零维覆盖)都要高的识别率。实验还表明,提出的方法对未学习人的语音样本的正确识别率提高更显著;随着覆盖维数的增加,样本的识别率也逐渐提高,但提高幅度逐渐变小;由于点到覆盖体距离的计算是个递归的过程,随着维数的增加,计算量呈级数的增长,综合考虑识别率和识别时间,本文认为二维覆盖是合适的选择。另外,Cao Wenming等[6,24]系统研究了仿生模式识别的几何代数方法,还研究了多光谱图像的仿生模式识别理论和方法[25-26]。

2.3重叠空间中样本的归属判别

武妍等[27]研究发现实际情况中,仿生模式识别为了提高识别率而增大阈值或训练样本增加时,不可避免地出现空间重叠。为了解决处于重叠空间中的未知样本的归属问题,文献提出了适当增大阈值以及允许大样本情况下的空间重叠,在出现空间重叠的情况下,采用相对子空间划分的决策方法(relative division of overlapping space based biomimetic pattern recognition,RDBPR),即通过计算重叠空间中样本到各个特征子空间的距离,得到距离相对最小的类别并将其归类。RDBPR方法能够在不增加误识率的基础上,提高对处于重叠空间中样本的识别能力,从而提高最终识别率。文献的实验结果表明,在训练样本数量较少的情况下,即空间覆盖的几何形体体积较小时,与BPR(biomimetic pattern recognition)相比,RDBPR未显示出明显的优势;但随着训练样本数量增加,在保持较高的稳定性和不显著增加误识率的前提下,RDBPR比BPR的识别率更优。丁杰等[28]给出了通过计算基于类条件的后验概率对样本进行相对区别的判别规则,依据待识别样本与各类别子空间的相对距离做置信评估,根据各类模式散布计算后验概率,实现因空间重叠造成拒识的样本的相对划分,提高识别率。

2.4其他仿生模式识别实现方法研究

由仿生模式识别学习过程可知,训练样本的代表性是进行有效学习的前提,然而在实际情况中由于某些原因,训练样本可能包含有不属于本类的离群样本,会对学习结果产生不利影响;此外,由于多种内外因素的共同影响,采集到的同类样本都会含有不同程度的噪声成分,噪声过大的离群样本通常会导致学习效果变差;另外,大规模的训练样本通常会有冗余,冗余样本的存在使学习时间增加而对学习效果提高不大。丁杰等[28]采用仿射传播聚类(affinity propagation, AP)算法对样本进行聚类去除离群样本,获得更优的识别结果。王改良等[22]利用迭代自组织数据分析方法对训练样本进行动态聚类,寻找到同一类的多个小类覆盖区中心,然后用多权值神经元网络覆盖小类,实现该类的整体覆盖。

此外,还有一些研究,将仿生模式识别思想与其他方法相结合,获得更优的算法效果。赵莹等[29]以仿生模式识别的同类样本之间“同源连续性”为基础,推广了传统的最邻近方法。利用样本点分布的“先验知识”增加训练样本数量,再通过由多个超球体的并所形成的几何形体,覆盖可能的样本点。该方法不但能够更加准确地识别同类样本,还能对非本类样本进行拒识,有效地提高了传统最近邻方法的识别效果。王丹等[30]提出了一种多维多分辨仿生识别方法,其特点是用多分辨分析方法来获取特征空间的多分辨表示,并将HOG(histogram of oriented gradient)描述符用于多尺度分析,获得鲁棒性强、稳定性好的多尺度的特征表示,再通过SOM(self-organizing map)聚类的方法实现了多尺度的样本在特征空间中的覆盖;识别过程给出了一种核函数的多尺度融合决策的识别方法,判定待识别样本是否属于相应的样本空间拓扑覆盖。殷建等[31]从纯数学角度给出基于矢量量化的仿生模式识别算法,并列出了如何进行划分的具体算法和公式。殷维栋[32]阐述了主方向神经网络及覆盖框架的概念,通过分析及实验,说明了主方向神经网络的原理,通过获知训练样本的细节分布,降低了主方向神经网络的噪声敏感度,获得了较好的映射逼近性能,从而具备一定的鲁棒性。但如何选取可调参数、如何确定隐层的神经元数目是主方向神经网络需要解决的问题。

仿生模式识别方法研究可总结如表2所示。

表2 仿生模式识别实现方法研究总结

3应用研究

相比仿生模式识别的方法研究,技术应用研究更受关注,其研究成果更为丰富,包括目标识别、生物特征识别、近红外定性分析、信号处理、医学图像识别和基因预测等,涉及计算机视觉、安防、农业、生物医学、通信以及互联网等领域。仿生模式识别技术的通用性及有效性使其在众多应用中展现出活力,在众多的研究中,仿生模式识别都获得了比传统模式识别更优的综合性能。与此同时,仿生模式识别对未训练样本的极低误识率以及低训练样本下高识别率的优点更为突出。下面将按照技术分类对这些技术应用研究进行总结。

3.1目标识别

仿生模式识别最初应用在目标识别,王守觉[4]用仿生模式识别方法识别观察方向水平的全方位(360°)实物模型,实验采用14个实物模型,其中训练8个模型,另外6个用来做未训练类样本误识率测试,实验显示,已训练类的样本正确识别率达99.75%,而未训练类样本的误识率为0。此外,他还研究了斜视方向的目标识别[33],仿生模式识别的正确识别率达99.89%,误识率仅为0.11%。刘焕云等[34]将仿生模式识别应用于灰度图像目标的识别与跟踪,实验结果表明,该方法对于目标尺寸渐变的视频图像序列中的目标识别与跟踪是有效的和稳健的。在地面声目标识别实用系统中,目标误识率更为关键。黄琦等[35]基于二权值神经元网络实现仿生模式识别的地面声目标识别,在训练样本数为200的情况下,仿生模式识别的正确识别率与GMM、BP网络和RBF网络相当,在90%左右;而当训练样本数下降到80时,仿生模式识别的正确识别率为82.5%,远高于其他3种方法(其中识别率最高的方法约为74%)。实验表明,仿生模式识别有效克服现有识别系统中误识率高、低训练样本数量情况下识别率低、系统需重复训练等缺点。

3.2生物特征识别

生物特征识别是利用人的生理特征或行为特征来进行个人身份识别的统称,常见的有人脸识别、语音识别、虹膜识别等。仿生模式识别应用在人脸识别是研究的一大热点,这些研究包括1∶1的人脸身份确认和1∶N的人脸识别。王守觉、徐健等[17]采用多镜头信息融合,建立多权值神经网络的仿生模式识别方法进行人脸身份确认,正确识别率达到96%,其余4%均为拒识,无一误识。王守觉、曲延锋等[36]研究了仿生模式识别在ORL人脸库上的人脸识别效果,特征提取采用PCA方法,获得了误识率为0的识别效果,而在同样实验条件下,SVM方法的误识率为6%;实验结果表明仿生模式识别方法优于SVM方法及最近邻方法。莫华毅等[37]采用灰度微分的特征提取方法研究人脸的仿生模式识别;蒋加伏等[38]采用PCA与LDA的特征提取方法研究人脸仿生模式识别;周书仁等[39]采用DCT与LDA的特征提取方法研究人脸仿生模式识别;陈勇等[40]研究了基于二进小波变换的人脸仿生模式识别;庄德文等[41]研究了基于LOG-GABOR滤波二值变换的单训练样本人脸仿生模式识别。这些研究方法与其他经典方法相比,误识率更低,综合性能更优。此外,翟懿奎等[42]采用基于局部相位量化(local phase quantization, LPQ)特征提取结合仿生模式识别的方法,对伪装人脸识别进行了研究,该方法优于SVM、SRC及PCA+BPR方法,实验结果证明这种方法具有较高效率,同时大大地提升了伪装人脸识别的性能指标。XU Ying等[43]则采用了LBP+LPQ特征提取及超香肠神经网络覆盖来识别伪装人脸。

仿生模式识别应用在语音识别的研究也较多,并取得了不错的效果。覃鸿等[18]以MFCC作为语音特征参数,对较低数量训练样本情况下非特定人语音的仿生模式识别进行了研究,并将其与其他常规语音识别方法如HMM及DTW进行了比较,每类18个训练样本时,仿生模式识别对未训练类的误识率为13.92%,远低于HMM(95.57%)及DTW(93.67%);研究表明仿生模式识别方法在训练样本数量较少的情况下,就能获得很好的识别效果,而且对于未训练过的词组有较高的正确拒识率,综合性能优于另外两种方法。王守觉、潘晓霞等[44]提出了一种基于动态搜索的连续数字语音仿生模式识别方法,该方法鲁棒性强,适合长短不同、语速不同的连续数字识别。王改良等[22]采用基音频率轨迹作为声调特征,研究了基于仿生模式识别的四种声调识别,仿生模式识别的覆盖单元采用多权值神经元网络,实验与HMM、SVM和BP方法比较,在大训练集下识别率最优,为99.1%;在小训练集下识别率为98.5%,远优于其他方法(其他方法SVM最优,为95.2%)。张卫强[45]等采用归一化的短时子带平均幅度谱作为特征,研究了基于仿生模式识别的固定音频检索方法,并取得了综合性能优良的实验结果。此外还有说话人识别[46-50]、小词汇量语音识别[51-53]、问候语识别[54]。 另外,李晗等[21]将仿生模式识别应用在声音的性别识别,采用WSJ 英文语音数据库,以基音频率为特征,男性和女性的训练样本各为50个,测试样本为850个,覆盖单元采用类高斯混合模型神经元,取得了比HMM更优的识别效果;改用训练样本100个、测试样本500个的实验条件,特征维数为100维时仿生模式识别达到最优,男性识别率达到100%,女性识别率为98.2%。

在虹膜识别方面,翟懿奎等[55]研究一种基于仿生模式识别理论的虹膜识别算法,该识别算法基于小波变换及奇异值分解的方法进行虹膜特征的提取,再利用超香肠神经网络进行覆盖学习。在中科院自动化所的虹膜数据库(CASIAver-1.0)上进行仿真实验,取得了良好的正确识别率,并且对于未参与训练的待识别虹膜样本具有较高的拒识率。XU Ying等[56]也对虹膜的仿生模式识别进行了研究。王丹等[30]将仿生模式识别用于虹膜识别,在JLUIRIS数据库上获得了良好的识别效果。而LI Zhihui等[57]则研究了基于仿生模式识别的多尺度虹膜识别。

仿生模式识别在生物特征识别的其他方面还有李颜瑞等[58]研究的一种基于仿生模式识别的眉毛识别方法,采用小波变换提取眉毛特征和三权值神经网络覆盖学习,在一个有120人的眉毛信息库上进行实验,最高识别率达91.67%。

3.3文本识别

文本识别方面,丁杰等[28]将仿生模式识别应用在手写体数字识别中,数据库使用了NUST手写金额库及Concordia大学的CENPARMI库,与KNN、SVM和通用分类器学习框架方法比较,仿生模式识别方法的可靠性最佳,在小样本识别情况下,比传统模式识别更具有优势。王建平等[59]提取手写体汉字的笔画特征,采用双权值椭圆形神经元覆盖方法进行手写体汉字识别,通过对SCUT-IRAC手写体汉字库中的简单和较复杂手写体汉字识别进行的仿真实验,验证了该方法具有接近人类识别汉字的容错性和准确性。ZHANG Jibin等[60]使用仿生模式识别进行文本分类,实验结果显示三权值神经元网络的效果最优。

此外,胡静等[20]研究了仿生模式识别的交通标识符识别,取每类标识符的10幅图像作为训练样本建立相应的仿生模式识别网络,用另外6幅作为测试样本,识别率最高可达95.47%。

3.4近红外光谱定性分析

仿生模式识别应用在近红外光谱定性分析农作物种子品质方面。中国科学院半导体研究所和中国农业大学做了大量的研究工作,研究人员基于近红外漫反射或漫透射光谱,进行了仿生模式识别种子识别。群体玉米种子品种鉴别方面有苏谦等[65]研究基于仿生模式识别的玉米品种快速鉴别方法,7个玉米品种的平均正确识别率达94.3%,同时正确拒识率达99.1%;邬文锦等[62]在37个玉米品种上的实验结果平均正确识别率达94.3%;卢洋等[63]在近红外短波段采用仿生模式识别方法对37个玉米品种进行识别,获得97.6%的正确识别率;曹吾等[64]研究了采用仿生模式识别方法建立的7个玉米品种近红外定性模型的稳健性与适应性;柳培忠等[65]采用DS算法进一步提高了仿生模式识别的玉米品种近红外定性模型的稳定性。单粒玉米种子品种鉴别方面,贾仕强等[66]采用仿生模式识别方法建立定性鉴别模型,研究了单粒玉米种子品种真实性鉴定的光谱测量方法。贾仕强等[67]还采用仿生模式识别方法,研究了带种衣剂玉米种子的品种鉴别方法。黄华军等[68]则采用仿生模式识别方法研究了玉米杂交种纯度的近红外光谱分析技术。此外,翟亚锋等[69]利用仿生模式识别方法建立近红外定性分析模型,研究了转基因小麦快速鉴别方法。上述研究都获得了优于传统近红外定性分析方法的鉴别效果,值得一提的是,其中一些应用研究成果已成熟并开始在企业中推广。

3.5其他应用

在生物信息学方面,陈阳等[70]利用仿生模式识别原理,采用超香肠神经元网络对水平转移基因进行识别,结果显示仿生模式识别方法对大肠杆菌(Escherichia coli K12)基因组的命中率与目前预测结果最好的八联核苷酸频率的打分算法相比,提高了42.3%,与基于支撑向量机的识别算法相比提高了30.5%。安冬等[71]提出了一种物种自动分类的方法。该方法利用仿生模式识别对嗜肝病毒科病毒及花椰菜花叶病毒科病毒实现自动分类,达到了较高的识别率。SU Qian等[72]研究了基于仿生模式识别的细胞代谢周期识别方法,对酵母的代谢周期的三个阶段,分类正确率分别达到90%、100%和100%。

在医学影像识别方面,JIANG Jiafu等[73]和吴海珍等[74]研究基于仿生模式识别的医学图像分割算法,算法采用Ψ3多权值神经元网络在高维特征空间中对样本进行最优覆盖,然后对覆盖结果进行识和分割,利用该方法得到的实验结果比传统图像分割法准确性更高、可靠性好、泛化能力强。何中市等[75]研究基于仿生模式识别的孤立性肺结节检测方法,实验在小样本集上进行,并与BP神经网络和SVM方法进行比较,从特异性、敏感性等几个指标对实验结果进行比较分析,仿生模式识别方法的综合性能最优。武妍等[76-77]研究运动想象脑电识别,采用增量半监督的仿生模式识别算法,使用脑机接口国际大赛公布的数据集对该算法进行了离线分析、模拟在线实验,以及作者在线采集的实际脑电数据进行了实际在线实验。实验结果表明该算法平均准确率高,并且其在抗过学习和稳定性上也体现出了明显的优势。YANG Xiaoli等[78]研究了仿生模式识别的乳腺癌预测方法,癌细胞转移、预后良好及预后不良的的预测率分别为85%、98%及88%,均优于Fisher判别分析及SVM方法。

在信号处理方面,安冬等[79-80]分别采用自相关特征提取方法和PCA/ICA特征提取方法,研究了基于仿生模式识别的DOA估计,实验结果证明仿生模式识别不仅可以应用于传统的模式识别,还可以应用于非感性的抽象对象的信息处理,并且模型鲁棒性强,计算量较小,在信号处理领域具有普遍意义。

在图像识别方面,蒋加伏等[81]研究了基于仿生模式识别的纹理图像识别算法,采用Contourlet变换提取图像能量特征和超香肠神经网络,在Vistex纹理库上进行仿真实验,分类正确率为100%,优于SVM、k均值和BP方法。耿春云等[82]将仿生模式识别用于海洋微藻识别,实现了不同种及同种不同状态下的藻体的准确识别。胡静等[20]研究了仿生模式识别的交通标识符识别,取每类标识符的10幅图像作为训练样本建立相应的仿生模式识别网络,用另外6幅作为测试样本,识别率最高可达95.47%。

故障诊断方面,SHI Haitao等[83]研究了基于仿生模式识别的电潜螺杆泵状态识别,通过识别电潜螺杆泵的电参数状态来进行故障诊断,正确识别率为86.7%,获得了有效的识别效果。WANG Xiaozhe等[84]将仿生模式识别与匹配跟踪算法相结合进行电路系统的故障检测仿真实验,实验结果表明该方法提高了故障检测的鲁棒性和识别精度。

网络攻击识别方面,周全强等[85-86]针对有监督方法,研究了基于仿生模式识别的未知推荐攻击(用户概貌攻击)检测方法,用于MovieLens数据集实验中,结果表明该方法具有较高的命中率和较低的误报率。

在时间序列匹配方面,闾海荣等[87]基于仿生模式识别思想,利用同类样本间的连续性规律,对时间序列进行排序,将若干新时间序列添加进相邻的时间序列之间,用这种方法增加样本点的数量。实验结果表明,这种方法比基于动态时间弯折的方法更有优势。

仿生模式识别的应用研究可总结如表3所示。

表3 仿生模式识别的应用研究

4结束语

仿生模式识别自2002年提出,为模式识别领域开辟了一条全新的研究方向,诸多学者已经相继提出了一系列具体实现方法并将其广泛应用在模式识别的各个领域。与此同时,将仿生模式识别思想应用在其他信息处理方面,扩大了仿生模式识别研究的范围,拓展了仿生模式识别研究的内容,使仿生模式识别可以解决更多领域的新问题。从目前仿生模式识别的方法研究及应用研究可以看到,还没有有效的分析同类样本点分布流形的方法,还需要发展高维空间拓扑理论与算法,以及更灵活高效的神经元模型等。仿生模式识别优于传统模式识别,且具有光明的研究前景,但是也应清晰认识到,该方法亟待开展深入细致的研究,将该方法及其应用研究向更深层次和更广领域推进。

参考文献:

[1]DUDA R O. 模式分类[M]. 李宏东, 姚天翔, 译. 第2版. 北京: 机械工业出版社, 2003: 9.

[2]FISHER R A. Contributions to mathematical statistics[M]. New York: John & Wiley, 1952.

[3]VAPNIK V N. 统计学习理论的本质[M]. 张学工, 译. 北京: 清华大学出版社, 2000.

[4]王守觉. 仿生模式识别(拓扑模式识别)——一种模式识别新模型的理论与应用[J]. 电子学报, 2002, 30(10): 1417-1420.

WANG Shoujue. Bionic (topological) pattern recognition-a new model of pattern recognition theory and its applications[J]. Acta electronica sinica, 2002, 30(10): 1417-1420.

[5]王守觉, 来疆亮. 多维空间仿生信息学入门[M]. 北京: 国防工业出版社, 2008.

[6]曹文明, 冯浩. 仿生模式识别与信号处理的几何代数方法[M]. 北京: 科学出版社, 2010.

[7]王守觉, 刘扬阳, 来疆亮, 等. 仿生模式识别与多权值神经元[M]. 北京: 国防工业出版社, 2012.

[8]王宪保, 周德龙, 王守觉. 基于仿生模式识别的构造型神经网络分类方法[J]. 计算机学报, 2007, 30(12): 2109-2114.

WANG Xianbao, ZHOU Delong, WANG Shoujue. Constructive neuron networks classification algorithm based on biomimetic pattern recognition[J]. Chinese journal of computers, 2007, 30(12): 2109-2114.

[9]王守觉, 徐健, 王宪保, 等. 基于仿生模式识别的多镜头人脸身份确认系统研究[J]. 电子学报, 2003, 31(1): 1-3.

WANG Shoujue, XU Jian, WANG Xianbao, et al. Multi-camera human-face personal identification system based on the biomimetic pattern recognition[J]. Acta electronica sinica, 2003, 31(1): 1-3.

[10]WANG Shoujue, CHEN Xu. Biomimetic (topological) pattern recognition- a new model of pattern recognition theory and its application[C]//Proceedings of the International Joint Conference on Neural Networks. Portland, America, 2003, 3: 2258-2262.

[11]WANG Shoujue, ZHAO Xingtao. Biomimetic pattern recognition theory and its applications[J]. Chinese journal of electronics, 2004, 13(3): 373-377.

[12]杨建琦, 丁立军, 蒋维. 基于拓扑学识别理论的身份鉴定研究[J]. 嘉兴学院学报, 2013, 25(3): 99-104.

YANG Jianqi, DING Lijun, JIANG Wei. Identification based on topology recognition theory[J]. Journal of Jinxing University, 2013, 25(3): 99-104.

[13]王宪保, 陆飞, 陈勇, 等. 仿生模式识别的算法实现与应用[J]. 浙江工业大学学报, 2011, 39(1): 71-74.

WANG Xianbao, LU Fei, CHEN Yong, et al. Algorithm and application of biomimetic pattern recognition[J]. Journal of Zhejiang University of technology, 2011, 39(1): 71-74.

[14]王守觉, 李兆洲, 陈向东, 等. 通用神经网络硬件中神经元基本数学模型的讨论[J]. 电子学报, 2001, 29(5): 577-580.

WANG Shoujue, LI Zhaozhou, CHEN Xiangdong, et al. Discussion on the basic mathematical models of neurons in general purpose neurocomputer[J]. Acta electronica sinica, 2001, 29(5): 277-280.

[15]WANG Shoujue. A new development on ANN in China - biomimetic pattern recognition and multi weight vector neurons[M]//WANG Guoyin, LIU Qing, YAO Yiyu, et al. Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing. Berlin Heidelberg: Springer, 2003: 35-43.

[16]WANG Shoujue. Biomimetics pattern recognition[J]. Neural networks society (INNS, ENNS, JNNS) newsletter, 2003, 1(1): 3-5.

[17]WANG Shoujue, LAI Jiangliang. A more complex neuron in biomimetic pattern recognition[C]//Proceedings of International Conference on Neural Networks and Brain. Beijing, China, 2005: 1487-1489.

[18]覃鸿, 王守觉. 多权值神经元网络仿生模式识别方法在低训练样本数量非特定人语音识别中与HMM及DTW 的比较研究[J]. 电子学报, 2005, 33(5): 957-960.

QIN Hong, WANG Shoujue. Comparison of biomimetic pattern recognition, HMM and DTW for speaker-independent speech recognition[J]. Acta electronica sinica, 2005, 33(5): 957-960.

[19]邱立达, 刘天键. 基于蚁群算法的仿生模式识别神经网络构造方法[J]. 闽江学院学报, 2013, 34(2): 88-91.

QIU Lida, LIU Tianjian. Constructive method of bionic pattern recognition neural networks based on ant colony algorithm[J]. Journal of Minjiang University, 2013, 34(2): 88-91.

[20]胡静, 王辉, 徐小红, 等. 基于同类样本覆盖的BP网络结构设计准则研究[J]. 系统工程与电子技术, 2007, 29(4): 605-608.

HU Jing, WANG Hui, XU Xiaohong, et al. Study of designing BP neural network structure in congener sample covering[J]. Systems engineering and electronics, 2007, 29(4): 605-608.

[21]李晗, 武妍. 仿生模式识别理论在性别识别中的应用[J]. 计算机工程与应用, 2009, 45(3): 181-183.

LI Han, WU Yan. Gender identification based on biomimetic pattern recognition[J]. Computer engineering and applications, 2009, 45(3): 181-183.

[22]王改良, 武妍. 基于仿生模式识别理论的声调识别[J]. 计算机应用, 2010, 30(10): 2709-2711.

WANG Gailiang, WU Yan. Tone recognition based on biomimetic pattern recognition theory[J]. Journal of computer applications, 2010, 30(10): 2709-2711.

[23]杨国为, 王守觉, 刘扬阳. 仿生模式识别的两个关键技术问题研究[J]. 电子学报, 2008, 36(12): 2490-2492.

YANG Guowei, WANG Shoujue, LIU Yangyang. Research on two key technical problems in biomimetics pattern recognition[J]. Acta electronica sinica, 2008, 36(12): 2490-2492.

[24]CAO Wenming, HAO Feng. Geometry algebra neuron based on biomimetic pattern recognition[M]//WANG Hongwei, SHEN Yi, HUANG Tingwen, et al. The Sixth International Symposium on Neural Networks (ISNN 2009). Berlin Heidelberg: Springer, 2009: 433-440.

[25]CAO Wenming, HAO Feng. Biomimetic pattern recognition based on the Young-Helmholtz model of multispectral image[C]//Proceedings of International Conference on Artificial Intelligence and Computational Intelligence. Shanghai, China, 2009, 2: 398-402.

[26]CAO Wenming, HAO Feng. Multispectral Image Recognition Research Based on Biomimetic Pattern Recognition[C]//Proceedings of the 2nd International Symposium on Electronic Commerce and Security. Nanchang, China, 2009, 2: 133-136.

[27]武妍, 姚潇, 王守觉. 基于重叠空间相对划分的仿生模式识别方法[J]. 模式识别与人工智能, 2008, 21(3): 346-350.

WU Yan, YAO Xiao, WANG Shoujue. Relative division of overlapping space based biomimetic pattern recognition[J]. Pattern recognition and artificial Intelligence, 2008, 21(3): 346-350.

[28]丁杰, 杨静宇. 一种基于AP的仿生模式识别方法[J]. 计算机科学, 2011, 38(5): 224-226, 230.

DING Jie, YANG Jingyu. AP clustering based biomimetic pattern recognition[J]. Computer science, 2011, 38(5): 224-226, 230.

[29]赵莹, 高隽, 汪荣贵, 等. 一种新的广义最近邻方法研究[J]. 电子学报, 2004, 32(12A): 196-198.

ZHAO Ying, GAO Jun, WANG Ronggui, et al. An extended nearest neighbor method based on bionic pattern recognition[J]. Acta electronica sinica, 2004, 32(12A): 196-198.

[30]王丹, 张祥合, 张立, 等. 多维多分辨仿生识别方法及其应用[J]. 吉林大学学报:工学版, 2011, 41(2): 408-412.

WANG Dan, ZHANG Xianghe, ZHANG Li, et al. Multidimensional and multiresolution biomimetic recognition method and its application[J]. Journal of Jilin university:engineering and technology edition, 2011, 41(2): 408-412.

[31]殷建, 殷业, 徐毅. 基于矢量量化的仿生模式识别方法研究[J]. 无锡职业技术学院学报, 2007, 6(5): 31-34.

YIN Jian, YIN Ye, XU Yi. Research on bionic pattern recognition on vector quantization method[J]. Journal of Wuxi institute of technology, 2007, 6(5): 31-34.

[32]殷维栋. 覆盖框架与主方向神经网络[J]. 计算机应用, 2008, 28(8): 2077-2080, 2083.

YIN Weidong. Covering framework and primary direction neural network[J]. Computer applications, 2008, 28(8): 2077-2080, 2083.

[33]WANG Shoujue, CHEN Xu, LI Weijun. Object-recognition with oblique observation directions based on biomimetic pattern recognition[C]//Proceedings of International Conference on Neural Networks and Brain. Beijing, China, 2005, 3: 1498-1502.

[34]刘焕云, 王军宁, 何迪, 等. 仿生模式识别目标自适应跟踪算法[J]. 西安电子科技大学学报:自然科学版, 2013, 40(4): 142-148.

LIU Huanyun, WANG Junning, HE Di, et al. Research on biomimetic pattern recognition for object adaptive tracking algorithm[J]. Journal of Xidian University, 2013, 40(4): 142-148.

[35]黄琦, 魏建明, 刘海涛. 基于仿生模式识别的地面声目标识别方法[J]. 电子测量与仪器学报, 2007, 21(2): 62-65.

HUANG Qi, WEI Jianming, LIU Haitao. Acoustic target recognition based on biomimetic pattern recognition[J]. Journal of electronic measurement and instrument, 2007, 21(2): 62-65.

[36]王守觉, 曲延锋, 李卫军, 等. 基于仿生模式识别与传统模式识别的人脸识别效果比较研究[J]. 电子学报, 2004, 32(7): 1057-1061.

WANG Shoujue, QU Yanfeng, LI Weijun, et al. Face recognition: biomimetic pattern recognition vs. traditional pattern recognition[J]. Acta electronica sinica, 2004, 32(7): 1057-1061.

[37]莫华毅, 王志海, 王守觉. 仿生模式识别在人脸识别中的应用[C]//中国人工智能学会第10届全国学术年会论文集. 广州, 中国, 2003: 311-316.

[38]蒋加伏, 袁承伟. 融合PCA与LDA变换的仿生人脸识别研究[J]. 计算机工程与应用, 2010, 46(19): 160-163.

JIANG Jiafu, YUAN Chengwei. Biomimetic pattern face recognition integration of PCA and LDA transform[J]. Computer engineering and applications, 2010, 46(19): 160-163.

[39]周书仁, 邵晶, 蒋加伏. 基于DCT与LDA的仿生人脸识别研究[J]. 计算机工程与应用, 2011, 47(13): 208-211.

ZHOU Shuren, SHAO Jing, JIANG Jiafu. Biomimetic pattern face recognition based on DCT and LDA[J]. Computer engineering and applications, 2011, 47(13): 208-211.

[40]陈勇, 王宪保. 基于二进小波变换和仿生模式识别的人脸识别[J]. 计算机工程与应用, 2013, 49(17): 186-189.

CHEN Yong, WANG Xianbao. Face recognition based on dyadic wavelet transform and biomimetic pattern recognition[J]. Computer engineering and applications, 2013, 49(17): 186-189.

[41]庄德文, 周德龙. 基于LOG-GABOR滤波二值变换的人脸识别[C]//第29届中国控制会议论文集. Beijing, China, 2010.

ZHUANG Dewen, ZHOU Delong. Face recognition based on Log-Gabor filter binary transformation[C]//Proceedings of the 29th Chinese Control Conference. Beijing, China, 2010.

[42]翟懿奎, 甘俊英, 徐颖. 基于局部相位量化与仿生模式的伪装人脸识别算法[J]. 信号处理, 2012, 28(11): 1498-1504.

ZHAI Yikui, GAN Junying, XU Ying. Disguised face recognition algorithm based on local phase quantization and biomimetic pattern[J]. Signal processing, 2012, 28(11): 1498-1504.

[43]XU Ying, ZHAI Yikui, GAN Junying, et al. Disguised face recognition based on local feature fusion and biomimetic pattern recognition[M]//SUN Zhenan, SHAN Shiguang, SANG Haifeng, et al. Biometric Recognition. Switzerland: Springer, 2014: 95-102.

[44]王守觉, 潘晓霞, 徐春燕, 等. 一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究[J]. 电子学报, 2005, 33(10): 1790-1793.

WANG Shoujue, PAN Xiaoxia, XU Chunyan, et al. Research on speaker-independent continuous figure speech-recognition based on high-dimensional space covering and dynamic scanning[J]. Acta electronica sinica, 2005, 33(10): 1790-1793.

[45]张卫强, 刘加, 陈恩庆. 一种基于仿生模式识别思想的固定音频检索方法[J]. 自然科学进展, 2008, 18(7): 808-813.

[46]武妍, 金明曦, 王守觉. 基于仿生模式识别理论的高阶神经网络说话人识别方法[J]. 计算机工程, 2006, 32(12): 184-186.

WU Yan, JIN Mingxi, WANG Shoujue. Speaker recognition method with high-order neural network based on biomimetics pattern recognition[J]. Computer engineering, 2006, 32(12): 184-186.

[47]李燕萍, 唐振民, 钱博, 等. 基于仿生模式识别的说话人辨认方法研究[J]. 系统仿真学报, 2009, 21(7): 1912-1915, 1920.

LI Yanping, TANG Zhenmin, QIAN Bo, et al. Method of biomimetic pattern recognition for speaker identification[J]. Journal of system simulation, 2009, 21(7): 1912-1915, 1920.

[48]姚潇, 武妍, 王守觉. 一种基于并行覆盖前馈优先神经网络的说话人识别方法[J]. 计算机科学, 2008, 35(8): 125-128.

YAO Xiao, WU Yan, WANG Shoujue. Research on speaker recognition based on the parallel coverage of priority ordered neural network[J]. Computer science, 2008, 35(8): 125-128.

[49]WU Lili, WANG Shoujue. Study on closed-set speaker identification based on biomimetic pattern recognition[J]. Chinese journal of electronics, 2009, 18(2): 259-261.

[50]WANG Shoujue, HUANG Yi, CAO Yu. Study on text-dependent speaker recognition based on Biomimetic Pattern Recognition[M]//WANG Jun, YI Zhang, ZURADA J M, et al. Advances in Neural Networks-ISNN 2006. Berlin Heidelberg: Springer, 2006: 158-164.

[51]QIN Hong, WANG Shoujue, SUN Hua. Biomimetic pattern recognition for speaker-independent speech recognition[C]//Proceedings of International Conference on Neural Networks and Brain. Beijing, China, 2005, 2: 1290-1294.

[52]王守觉, 沈孙园, 曹文明. 基于仿生模式识别的小词汇量连续型语音识别的研究[J]. 哈尔滨工程大学学报, 2006, 27(S): 1-5.

WANG Shoujue, SHEN Sunyuan, CAO Wenming. Research on continuous speech recognition with small vocabulary based on biomimetic pattern recognition[J]. Journal of Harbin engineering University, 2006, 27(S): 1-5.

[53]王宪保, 陈勇, 汤丽平. 结合MFCC分析和仿生模式识别的语音识别研究[J]. 计算机工程与应用, 2011, 47(12): 20-22, 26.

WANG Xianbao, CHEN Yong, TANG Liping. Speech recognition research based on MFCC Analysis and biomimetic pattern recognition[J]. Computer engineering and applications, 2011, 47(12): 20-22, 26.

[54]YE Hong, ZHANG Youzheng, SHEN Jianwei. Study on speech recognition of greeting based on biomimetic pattern recognition[C]//Proceedings of the 2nd International Workshop on Intelligent Systems and Applications. Wuhan, China, 2010: 1-4.

[55]翟懿奎, 曾军英. 一种基于小波奇异值分解的仿生模式虹膜识别算法[J]. 电路与系统学报, 2012, 17(2): 43-48.

ZHAI Yikui, ZENG Junying. The study of biomimetic pattern iris recognition algorithm based on the wavelet transform and SVD[J]. Journal of circuits and systems, 2012, 17(2): 43-48.

[56]XU Ying, LUO Fei, ZHAI Yikui, et al. Joint iris and facial recognition based on feature fusion and biomimetic pattern recognition[C]//Proceedings of International Conference on Wavelet Analysis and Pattern Recognition. Tianjin, China, 2013: 202-208.

[57]LI Zhihui, ZHANG Changhai, LIU Yuanning, et al. Research on multiscale iris recognition technology based biomimetic pattern recognition[J]. Chinese journal of electronics, 2006, 15(4A): 869-873.

[58]李颜瑞, 任小康, 李颜琦. 基于仿生模式识别的眉毛识别方法[J]. 佳木斯大学学报:自然科学版, 2010, 28(6): 858-860, 879.

LI Yanrui, REN Xiaokang, LI Yanqi. Eyebrow recognition based on biomimetic pattern recognition[J]. Journal of Jiamusi University: natural science edition, 2010, 28(6): 858-860, 879.

[59]王建平, 李帷韬, 王金玲, 等. 基于仿生模式识别的手写体汉字识别方法的研究[J]. 中国图象图形学报, 2007, 12(7): 1261-1269.

WANG Jianping, LI Weitao, WANG Jinling, et al. Research on handwritten Chinese characters recognition based on biomimetic pattern recognition[J]. Journal of image and graphics, 2007, 12(7): 1261-1269.

[60]ZHANG Jibin, CONG Shuai, XU Zhiming, et al. A text classifier based on biomimetic pattern recognition[C]//Proceedings of International Conference on Machine Learning and Cybernetics. Baoding, China, 2009, 6: 3463-3468.

[61]苏谦, 邬文锦, 王红武, 等. 基于近红外光谱和仿生模式识别玉米品种快速鉴别方法[J]. 光谱学与光谱分析, 2009, 29(9): 2413-2416.

SU Qian, WU Wenjin, WANG Hongwu, et al. Fast discrimination of varieties of corn based on near infrared spectra and biomimetic pattern recognition[J]. Spectroscopy and spectral analysis, 2009, 29(9): 2413-2416.

[62]邬文锦, 王红武, 陈绍江, 等. 基于近红外光谱的商品玉米品种快速鉴别方法[J]. 光谱学与光谱分析, 2010, 30(5): 1248-1251.

WU Wenjin, WANG Hongwu, CHEN Shaojiang, et al. Fast discrimination of commerical corn varieties based on near infrared spectra[J]. Spectroscopy and spectral analysis, 2010, 30(5): 1248-1251.

[63]卢洋, 梁先扬, 李卫军, 等. 基于近红外光谱短波段的玉米品种鉴别研究[J]. 河南大学学报:自然科学版, 2012, 42(3): 239-243.

LU Yang, LIANG Xianyang, LI Weijun, et al. Study on corn varieties discrimination based on short wave band of NIR spectra[J]. Journal of Henan University (natural cience), 2012, 42(3): 239-243.

[64]曹吾, 李卫军, 王平, 等. 近红外定性分析模型的稳健性与适应性分析[J]. 光谱学与光谱分析, 2014, 34(6): 1506-1511.

CAO Wu, LI Weijun, WANG Ping, et al. Analysis of the stability and adaptability of near infrared spectra qualitative analysis model[J]. Spectroscopy and spectral analysis, 2014, 34(6): 1506-1511.

[65]柳培忠, 张丽萍, 李卫军, 等. 基于DS算法的玉米近红外定性分析光谱校正方法研究[J]. 光谱学与光谱分析, 2014, 34(6): 1533-1537.

LIU Peizhong, ZHANG Liping, LI Weijun, et al. Study on spectral calibration of discrimination of corn variety using near-infrared spectra based on DS algorithm[J]. Spectroscopy and spectral analysis, 2014, 34(6): 1533-1537.

[66]贾仕强, 郭婷婷, 唐兴田, 等. 应用近红外光谱进行玉米单籽粒品种真实性鉴定的光谱测量方法研究[J]. 光谱学与光谱分析, 2012, 32(1): 103-107.

JIA Shiqiang, GUO Tingting, TANG Xingtian, et al. Study on spectral measurement methods in identification of maize variety authenticity based on near infrared spectra of single kernels[J]. Spectroscopy and spectral analysis, 2012, 32(1): 103-107.

[67]贾仕强, 郭婷婷, 刘哲, 等. 基于近红外光谱的带种衣剂玉米种子真实性鉴定方法研究[J]. 光谱学与光谱分析, 2014, 34(11): 2984-2988.

JIA Shiqiang, GUO Tingting, LIU Zhe, et al. Feasibility study on an approach for identifying corn kernel varieties with seed coating agents via near infrared spectroscopy[J]. Spectroscopy and spectral analysis, 2014, 34(11): 2984-2988.

[68]黄华军, 严衍禄, 申兵辉, 等. 鉴别玉米杂交种纯度的近红外光谱分析技术研究[J]. 光谱学与光谱分析, 2014, 34(5): 1253-1258.

HUANG Huajun, YAN Yanlu, SHEN Binghui, et al. Near infrared spectroscopy analysis method of maize hybrid seed purity discrimination[J]. Spectroscopy and spectral analysis, 2014, 34(5): 1253-1258.

[69]翟亚锋, 苏谦, 邬文锦, 等. 基于仿生模式识别和近红外光谱的转基因小麦快速鉴别方法[J]. 光谱学与光谱分析, 2010, 30(4): 924-928.

ZHAI Yafeng, SU Qian, WU Wenjin, et al. Fast discrimination of varieties of transgene wheat based on biomimetic pattern recognition and near infrared spectra[J]. Spectroscopy and spectral analysis, 2010, 30(4): 924-928.

[70]陈阳, 王守觉. 仿生模式识别在细菌基因组水平转移基因预测中的应用[J]. 现代生物医学进展, 2008, 8(8): 1518-1521.

CHEN Yang, WANG Shoujue. Biomimetic pattern recognition for prediction of horizontal gene transfers in bacteria genomes[J]. Progress in modern biomedicine, 2008, 8(8): 1518-1521.

[71]安冬, 王库, 王守觉. 高维空间点覆盖方法在物种计算机自动分类中的应用[J]. 电子学报, 2006, 34(2): 277-281.

AN Dong, WANG Ku, WANG Shoujue. A alignment-free sequence comparison method based on whole genomes and its application to virus phylogeny[J]. Acta electronica sinica, 2006, 34(2): 277-281.

[72]SU Qian, AN Dong, WANG Ku, et al. An Automatic Classification method of metabolic cycle based on biomimetic pattern recognition[J]. Chinese journal of electronics, 2009, 18(2): 332-334.

[73]JIANG Jiafu, WEI He, QI Qi. Medical image segmentation based on biomimetic pattern recognition[C]//Proceedings of WRI World Congress on Software Engineering. Xiamen, China, 2009, 2: 375-379.

[74]吴海珍, 何伟, 蒋加伏, 等. 基于仿生模式识别的医学图像分割方法[J]. 计算机工程与应用, 2009, 45(16): 185-187, 192.

WU Haizhen, HE Wei, JIANG Jiafu, et al. Medical image segmentation based on biomimetic pattern recognition[J]. Computer engineering and applications, 2009, 45(16): 185-187, 192.

[75]何中市, 王健, 陈永锋, 等. 基于仿生模式识别的孤立性肺结节检测[J]. 广西师范大学学报: 自然科学版, 2008, 26(2): 106-109.

HE Zhongshi, WANG Jian, CHEN Yongfeng, et al. Solitary pulmonary nodules detection based on bionic pattern recognition[J]. Journal of Guangxi normal University: natural science edition, 2008, 26(2): 106-109.

[76]GE Yanbin, WU Yan. Towards adaptive classification of motor imagery EEG using biomimetic pattern recognition[M]//HUANG Deshuang, GAN Yong, GUPTA P, GROMIHA M M. Advanced Intelligent Computing Theories and Applications. With Aspects of Artificial Intelligence. Berlin Heidelberg: Springer, 2011: 455-460.

[77]武妍, 徐凯. 基于增量半监督仿生模式识别的运动想象脑电识别[J]. 中国生物医学工程学报, 2011, 30(6): 878-884.

WU Yan, XU Kai. Motor Imagery EEG recognition based on incremental semi-supervised biomimetic pattern recognition[J]. Chinese journal of biomedical engineering, 2011, 30(6): 878-884.

[78]YANG Xiaoli, YANG Siya, HE Qiong, et al. Biomimetic pattern recognition method for breast cancer using gene expression data[J]. Advanced materials research, 2012, 560-561: 401-409.

[79]安冬, 王守觉. 基于仿生模式识别的DOA估计方法[J]. 电子与信息学报, 2004, 26(9): 1468-1473.

AN Dong, WANG Shoujue. A DOA estimation method based on biomimetic pattern recognition[J]. Journal of electronics & information technology, 2004, 26(9): 1468-1473.

[80]安冬, 王守觉. 基于仿生模式识别和PCA/ICA的DOA估计方法[J]. 电子学报, 2004, 32(9): 1448-1451.

AN Dong, WANG Shoujue. A DOA estimation method based on biomimetic pattern recognition and PCA/ICA[J]. Acta electronica sinica, 2004, 32(9): 1448-1451.

[81]蒋加伏, 邹红梅. 基于Contourlet变换和仿生模式识别的纹理图像识别方法[J]. 计算机工程与科学, 2010, 32(1): 60-63.

JIANG Jiafu, ZOU Hongmei. A texture image recognition method based on the Contourlet transform and biomimetic pattern recognition[J]. Computer engineering and science, 2010, 32(1): 60-63.

[82]耿春云, 郭显久. 基于仿生模式识别算法的海洋微藻识别研究[J]. 大连海洋大学学报, 2014, 29(5): 525-529.

GENG Chunyun, GUO Xianjiu. Recognition of marine microalgae based on bionic pattern recognition[J]. Journal of Dalian Ocean University, 2014, 29(5): 525-529.

[83]SHI Haitao, YU Yunhua, KONG Qianqian. Status recognition for electrical parameters of ESPCP based on biomimetic pattern recognition[C]//Proceedings of the 2nd International Workshop on Intelligent Systems and Applications. Wuhan, China, 2010: 1-3.

[84]WANG Xiaozhe, WANG Jinping. Research of fault diagnosis based on matching pursuit and biomimetic pattern recognition[C]//Proceedings of the 10th World Congress on Intelligent Control and Automation. Beijing, China, 2012: 4848-4852.

[85]周全强, 张付志, 刘文远. 基于仿生模式识别的未知推荐攻击检测[J]. 软件学报, 2014, 25(11): 2652-2665.

ZHOU Quanqiang, ZHANG Fuzhi, LIU Wenyuan. Detecting unknown recommendation attacks based on bionic pattern recognition[J]. Journal of software, 2014, 2014, 25(11): 2652-2665.

[86]周全强, 张付志. 基于仿生模式识别的用户概貌攻击集成检测方法[J]. 计算机研究与发展, 2014, 51(4): 789-801.

ZHOU Quanqiang, ZHANG Fuzhi. Ensemble approach for detecting user profile attacks based on bionic pattern recognition[J]. Journal of computer research and development, 2014, 51(4): 789-801.

[87]闾海荣, 韩慧, 王文渊. 基于仿生模式识别思想的时间序列匹配[J]. 电子学报, 2007, 35(7): 1323-1326.

LV Hairong, HAN Hui, WANG Wenyuan. Time series matching based on bionic pattern recognition[J]. Acta electronica sinica, 2007, 35(7): 1323-1326.

Progress in research and application of biomimetic pattern recognition technology

CHEN Yang1, QIN Hong2, LI Weijun2, ZHOU Xinqi3, DONG Xiaoli2, ZHANG Liping2, LI Haoguang2

(1. China Center of Information Industry Development, Ministry of Industry and Information Technology of the People’s Republic of China, Beijing 100846, China; 2. Institute of Semiconductors, Chinese Academy of Sciences, Beijing 100083, China; 3. Focused Photonics (Hangzhou), Inc., Hangzhou 310052, China)

Abstract:An essential difference between traditional pattern recognition and biomimetic pattern recognition (BPR) is reviewed. Different from the idea of “matter classification” of traditional pattern recognition, BPR considers the problem of pattern recognition as the “cognition” of every type of sample, uses the principle of “homology continuity” as a priori knowledge, and performs class recognition by a union of geometrical cover sets in high-dimensional space and feature space, thus overcoming the shortcomings of traditional pattern recognition. The effectiveness of BPR has gradually drawn extensive attention from scholars. In this study, research on BPR and its applications are summarized. The research method includes the topological analysis of the distribution of sample points, covering algorithm research, and a sample’s attribute in the overlapping space. Applications of BPR involve object recognition, biometric identification, text recognition, NIR spectroscopy qualitative analysis, and so on. Results show that BPR is an innovative and effective means of pattern recognition. Finally, important development directions of BPR are reported, such as manifold analytical methods of sample distribution in the same class, topological theory, and algorithm research in a high-dimensional space.

Keywords:pattern recognition; biomimetic pattern recognition; homology continuity; topological analysis; covering algorithm; object recognition; biometric feature identification; text recognition

DOI:10.11992/tis.201506011

收稿日期:2015-06-08. 网络出版日期:2016-02-18.

基金项目:国家自然科学基金资助项目(61572458);国家重大科学仪器设备开发专项项目(2014YQ470377);国家公派访问学者资助项目(留金发[2014]3012号).

通信作者:陈阳.E-mail:xz.zhou@scu.edu.cn.

中图分类号:TP391

文献标志码:A

文章编号:1673-4785(2016)01-0001-14

作者简介:

陈阳,女,1984年生,博士后,主要研究方向为模式识别、云计算、大数据等。

覃鸿,女,1977年生,高级工程师,博士,主要研究方向为图像处理、仿生模式识别理论与方法、近红外光谱定性分析技术、高维信息计算等。

李卫军,男,1975年生,研究员,博士,主要研究方向为机器视觉、模式识别与智能系统、高维计算等。主持完成多项国家“863”计划、国家自然科学基金、国际合作交流等科研项目。发表学术论文30余篇。

网络出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20160218.1452.002.html

猜你喜欢
模式识别训练样本识别率
人工智能
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
听力正常青年人的低通滤波言语测试研究*
提升高速公路MTC二次抓拍车牌识别率方案研究
UPLC-MS/MS法结合模式识别同时测定芪参益气滴丸中11种成分
第四届亚洲模式识别会议
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
高速公路机电日常维护中车牌识别率分析系统的应用
可拓模式识别算法中经典域的确定方法