徐 洁
(山西金融职业学院,山西 太原 030008)
基于PCNN赋时矩阵的图像特征捆绑方法研究
徐洁
(山西金融职业学院,山西 太原 030008)
摘要:本文介绍了传统的脉冲耦合神经网络模型的基本原理及结构,并在此基础上提出了一种基于赋时矩阵的简化脉冲耦合神经网络模型。通过将其应用于图像特征捆绑的具体实际,即利用赋时矩阵记录的各神经元第一次点火时间将图像的颜色与形状信息进行特征的分离及捆绑,从而验证了本文模型的有效性。
关键词:PCNN;赋时矩阵;特征捆绑
1引言
图像的识别与处理一直是计算机领域关注的对象,也有非常广泛的应用背景。国内外研究理论表明,客体对事物的认识经历着对零散信息的认知及整合的过程。人们肉眼所看到的一幅图像,其中最基本的两个特征便是图像的颜色与形状信息。那么,对于图像来说,人眼是如何区分开不同的颜色及不同的形状,又是如何将属于同一对象的颜色与形状信息联系在一起,而不是错误的结合,就是本文所要考虑的捆绑问题,也是目前亟待解决的问题。
目前针对于特征捆绑的研究理论有很多,包括特征整合理论[1]、捆绑的双阶段理论[2]、位置的不确定理论以及神经元同步激活理论[3]等。但是在捆绑理论之外,具体的特征捆绑的模型却非常少,其中有代表性的有史忠植等人提出的Bayesian Linking Field模型以及李海芳等人提出的基于强度的脉冲耦合神经网络模型。基于强度的脉冲耦合神经网络模型提出了将颜色和形状特征进行捆绑的方法,但是捆绑结果的边缘信息并不是很清晰,边缘信息混杂在图形及背景之间。
为此,本文提出了一种基于PCNN赋值矩阵的特征捆绑模型,对视觉感知过程中图像的特征捆绑问题进行研究。仿真实验表明,该模型能够很好地实现图像颜色与形状特征的分离及捆绑。
2传统PCNN模型
传统PCNN被称为第三代人工神经网络,该模型是通过对猴子和猫等动物进行研究,进而发现这些动物的大脑皮层上有同步脉冲发放的现象而提出的[4]。现在PCNN在图像处理方面有着广泛的应用,也逐步体现出了它在处理图像方面的显著优势。PCNN模型不需要像传统神经网络模型一样经过学习或者训练,就能够在复杂背景下提取有效信息,它的信号形式和处理机制也更加符合人类视觉神经系统的生理学基础。
传统PCNN模型是一个二维的神经元阵列,当模型应用于图像处理时,模型中的神经元数目和图像的像素数目是一样的,也就是说脉冲耦合神经网络中的每一个神经元对应于输入图像中的每一个像素,所输入的图像决定了PCNN的网络结构。单个PCNN神经元模型包含三个主要部分:输入部分(Receiving Part)、调制部分(Modulating Part)和脉冲产生部分(Pulse Generating Part),如图1所示。
图1 传统PCNN模型
传统PCNN模型的公式描述如公式(1)~公式(5)所示[5]:
(1)
(2)
Uij(n)=Fij(n)(a+βLij(n))
(3)
θij(n)=e-αθθij(n-1)+VθYij(n-1)
(4)
(5)
在上述方程中,下标ij表示的是当前神经元的标号,下标k1表示的是邻域神经元的标号,n为迭代的次数;模型的输入部分由两部分组成,分别为L通道和F通道。其中,Lij表示神经元的外部输入刺激,Fij表示神经元的反馈输入;模型的调制部分,神经元的内部活动项Uij由Lij和Fij调制产生;模型的输出部分,活动阈值θij跟随着输出Yij的变化而发生变化,当内部活动项Uij大于活动阈值θij时,神经元被激发,产生输出脉冲。
3简化PCNN模型及赋时矩阵
传统的PCNN模型过于复杂,需要恰当的设置模型中的各类参数,才能够得到较好的实验效果,因此最优参数的选择就成为了模型最先要解决的问题。而PCNN模型中的每一个参数都具有特定的物理含义,对于最优参数的选取,还需要通过实验来进行逐步的设定,制约了脉冲耦合神经网络应用的深度和广度,因此在本文中采用简化的PCNN模型[6]255-257,反馈输入项、链接输入项及内部活动项分别采用公式(6)~(8)进行运算。
Fij(n)=Iij
(6)
Lij(n)=∑MYij(n-1)
(7)
Uij(n)=Fij(n)(1+βLij(n))
(8)
传统PCNN中Yij作为链接输入项的一部分影响着其周围的神经元,因为传统PCNN模型中的对周围神经元的影响只有0和1两种情况,造成了加权不公平的情况,从而导致模型的结果有所偏差。所以,本文模型中将输出项修改为公式(9)所示形式,这样可以使得不同输入的神经元对周围神经元的影响区分开来,便于后期进行图像特征的分离。
Yij(n)=Uij(n)/θij(n)
(9)
传统PCNN中以Yij作为模型的输出,并以此作为图像处理的依据。但对于本文进行图像的颜色与形状的特征分离及捆绑来说,传统PCNN模型的二值输入无法满足需求,本文采用赋时矩阵Tij作为模型的输出,赋时矩阵中准确的记录着每一个神经元的第一次点火时间,如公式(10)所示。
(10)
传统PCNN模型中阈值的输出是有规律的周而复始,如图1所示。但是这种有周期性的脉冲变化并不符合人眼对事物的认识[6]255-257,本文中考虑的只是神经元发放脉冲的一次循环过程,所以将阈值输出部分修改为简单的单调递减指数函数,如公式(11)所示,使其更加符合特定的特征捆绑任务。
θij(n)=e-αθθij(n-1)
(11)
4实验结果与分析
4.1 实验原理
在图像颜色与形状捆绑过程中,需要将输入的彩色图像转换为灰度图像,并使用改进的PCNN模型进行处理,图像特征分离及捆绑依据赋时矩阵的输出结果。其中,转换后的灰度图像是一个二维的矩阵,二维矩阵的每一个像素对应于PCNN模型中的每一个神经元,以每一个像素的像素值作为该神经元的外部输入。
4.2 实验图像
在这一节,将通过一幅图像作为模型的输入来演示如何针对具体图像进行颜色及形状的分离和捆绑,从而验证本模型的有效性。本文所采用的实验图像包含三个数字,分别为数字1、数字6以及数字3,它们拥有不同的颜色。数字1所对应的RGB值为(160,60,10),数字6为(200,80,80),数字3为(20,100,10),背景为白色,所对应的RGB值为(255,255,255),如图3所示。
图3 实验图像
4.3 特征分离
PCNN模型中,输入图像的像素值对应于相应神经元的输入,神经元的输入不同,相应的神经元的初次点火时间便不相同,而通过模型得到的赋时矩阵中准确的记录着每一个神经元的初次点火时间,通过点火时间的不同将不同输入的神经元区分开来。而输入图像的像素值对应着图像的颜色信息,所以通过PCNN模型的处理可以将不同的颜色信息区分开来。同时,一个图形边缘部分的像素值和图形内部的像素值是相同或相近的,但边缘部分的像素值和内部的像素值所对应的邻域内的神经元却有很大的差异,而这些差异也将导致不同的点火时间,这样就可以将不同图形的形状信息分离出来。
图4 特征分离结果显示
由特征分离结果可以看出,图像中数字部分在不同的时刻点火。数字1在第10次迭代过程中点火,数字6在第12次迭代过程中点火,数字3在第10次迭代过程中点火,背景部分200不同的点火时间代表着不同的神经元输入。同时在图中能够清楚的看到数字的边缘信息,因为边缘像素的值与内部神经元的值是相同或相近的,但由于领域内神经元的不同输入,导致边缘神经元的点火时间介于图形内部神经元和背景神经元点火时间之间,清楚的显示着图形的边缘信息。总之,图形的颜色信息由不同的点火时间来确定,图形的形状信息由边缘神经元来确定。这样,图像的颜色与形状信息就被分离开来了。
4.4 特征捆绑
在PCNN模型运行过程中,神经元接收到的外部刺激越大,被激活的时间越早,神经元接收到的外部刺激越小,被激活的时间越晚,神经元被激活的时间的早晚与神经元接收到的外部刺激的大小有直接的关系。
彩色RGB空间向灰度空间转换的公式为GRAY=0.299R+0.587G+0.114B,经计算,本文所给出的实验图像中数字1所对应的灰度值为84.2,数字6所对应的灰度值为115.88,数字3所对应的灰度值为65.82,背景所对应的灰度值为255。在基于PCNN赋时矩阵的捆绑模型中,图像中每一个像素的灰度值都对应于相应神经元的外部输入刺激,灰度值越大,神经元就会越早被激活,灰度值越小,神经元就会越晚被激活,故而根据灰度值的大小可以判断出三个图形的激活时间顺序分别为:背景部分、数字6、数字1、数字3,而根据PCNN模型分离结果得到的各个对象的点火时间也验证了这一点,如图4所示。
通过重复对图形内部取200个不同的神经元坐标值进行计算,每次得到的神经元发放脉冲的顺序都是一样,分别为背景部分、数字6、数字1、数字3;同时通过重复对图形边缘部分取200个不同的神经元坐标值进行计算,得到的边缘部分对应的神经元发放脉冲的顺序也都是一样的,分别为背景部分的边缘、数字6部分的边缘、数字1部分的边缘、数字3部分的边缘。这样,就可以按照发放脉冲的顺序将属于同一个对象的颜色与形状特征捆绑在一起。
5结束语
本文在传统脉冲耦合神经网络的基础上提出了一种基于PCNN赋时矩阵的捆绑模型,将赋时矩阵作为模型的输出进行特征的分离及捆绑。实验表明,该模型能够很好的完成图像颜色与形状的捆绑任务。
参考文献:
[1]TreismanAM,GeladeG.Afeature-integrationtheoryofattention[J].CognitivePsychology,1980, 12(1): 97-136.
[2]HumphreysGW,CinelC,WolfeJ,etal.Fractionatingthebindingprocess:neuropsychologicalevidencedistinguishingbindingofformfrombindingofsurfacefeatures[J].VisionResearch, 2000, 40(12): 1569-1596.
[3]EngelAK,SingerW.Temporalbindingandtheneuralcorrelatesofsensoryawareness[J].TrendsincognitiveSciences, 2001, 5(1): 16-25.
[4]J.L.Johnson,M.L.Padgett.PCNNmodelsandapplications[J].IEEETransactionsonNeuralNetworks,vol. 10,no.3,pp.480-498, 1999.
[5]J.M.Kinser.Asimplifiedpulse-coupledneuralnetwork[C].Orlando:ProceedingsofSPIE,vol. 2760,no. 3,pp. 563-569, 1996.
[6]LiuM,GongHL,LiuJL.PCNNmodelbasedonvectorandapplications[J].Control&Automation,2009, 25(4-3):255-257.
(责任编辑侯中岩)
中图分类号:TP183
文献标识码:B
文章编号:1673-5382(2015)04-0086-04
作者简介:.徐洁(1987-),女,山西晋城人,山西金融职业学院助教,硕士.
收稿日期:2015-08-03