基于弦理论的目标轮廓提取方法

2015-01-22 11:53娄联堂陈佳骐
关键词:纵坐标轮廓能量

娄联堂,陈佳骐,但 威

(中南民族大学 数学与统计学学院,武汉430074)

基于弦理论的目标轮廓提取方法

娄联堂,陈佳骐,但 威

(中南民族大学 数学与统计学学院,武汉430074)

为保证目标轮廓的连续性,以弦理论为基础,在满足Dirichlet边界条件下,建立目标轮廓能量泛函模型.通过把目标轮廓曲线看作离散粒子相互作用组成的系统,构造粒子运动的响应函数,模拟粒子间的相互作用,采用增量法,逐步搜寻满足条件的轮廓曲线,在满足能量泛函最小时,提取出目标轮廓.实验结果表明:通过设置相关参数,能够有效提取出目标轮廓曲线,保证轮廓曲线的完整性,使得曲线支持无级缩放.该算法只须给定两个端点就可提取一条开目标轮廓曲线,减少了目标轮廓提取人工交互次数,提高了工作效率.

弦理论; 目标轮廓提取;能量泛函模型;响应函数

图像目标轮廓提取在机器视觉中扮演着重要的角色,广泛应用于图像分割[1]、图像检索[2]、目标检测和目标识别中.通过应用的模型知识的不同,可以分为基于物理的轮廓模型和基于统计学的轮廓模型.在物理轮廓模型中最早是以经典力学为基础,由Mumford和Shah将能量泛函引入到目标轮廓提取中,使得复杂的轮廓提取问题转化为简洁明了的数学问题[3-5],此后为了消除图像尺度对模型的影响[6,7],适用范围更广的量子力学模型[8]被引入目标轮廓提取中.本文通过目标轮廓的弦理论表示,建立轮廓曲线的能量模型,通过模拟粒子在势场中的运动,搜寻使能量泛函达到最小值的目标轮廓曲线.提取出的轮廓曲线具有无级缩放的性质,而且能够通过参数方程具体表示出来,具有连续性.

1 目标轮廓曲线的弦理论表示

在物理学的弦理论中,存在两种形式的弦.通过弦的两端是否相连,可分为开弦和闭弦.

若一维开弦x(σ),y(σ),σ∈[0,π]满足Dirichlet(狄利克雷)边界条件:

x(0)=x(π)=0,y(0)=y(π)=0.

(1)

则:

(2)

其中:

(3)

若一维开弦x(σ),y(σ),σ∈[0,π]满足Neuman边界条件:

(4)

则:

(5)

其中:

(6)

本文在满足Dirichlet边界条件下,提取已知起点和终点的目标轮廓曲线.设目标轮廓曲线的起点和终点分别为(xs,ys)和(xe,ye),即目标轮廓曲线L:(x(σ),y(σ))满足条件:

x(0)=xs,x(π)=xe,y(0)=ys,y(π)=ye.

(7)

进行坐标转换后并使用Dirichlet边界条件,可以得到目标轮廓曲线的参数方程,通过对其进行正弦展开得:

(8)

于是:

(9)

(10)

2 轮廓提取模型的建立

对于目标轮廓,可看作是一条两端固定的开弦在外部势场作用的引导下,从初始状态到达轮廓所在状态时的曲线.轮廓曲线总能量表示为:

Etol=Eint+Eext,

(11)

式中内能主要包括由于运动弦所具有的动能和由于拉伸、弯曲所造成的弹性势能.

(12)

其中α,β为相应的权重系数.

外部能量为弦在所处位置上具有的势能:

(13)

f(x,y)为势函数,一般与图像的梯度有关,为准确提取图像中目标轮廓曲线,f(x,y)应为图像梯度的单调递减函数,并且是非负函数,例如,对于图像I(x,y),可以取f(x,y)=e.

于是,目标轮廓提取问题,可以看作在内能和势能的作用下,粒子在势场中的运动轨迹,粒子沿此轨迹有最小能量,即目标轮廓提取问题可变为求解使得下面能量泛函达到最小值时的轮廓曲线:

(14)

(15)

最终将图像目标轮廓提取问题转化为求使得(15)式达到最小值时各系数X1,…,XN,Y1,…,YN的值.进而由(8)式可求得完整的目标轮廓曲线,该曲线支持无级缩放.

3 算法设计及模型求解

3.1 响应函数的构造

hσ0(σ)应满足以下性质:

(1) hσ0(σ)≥0;

(2) hσ0(0)=hσ0(π)=0,hσ0(σ0)=1;

(3) hσ0(σ)在[0,σ0]上单调递增,在[σ0,π]上单调递减;

(4) hσ0(σ)在[0,π]存在二阶连续导数.

本文中采用如下形式的hσ0(σ):

hσ0(σ)=e-γ(σ-σ0)2-a(σ-σ0)2n,n≥2.

(16)

其中参数γ,n可通过自行调试设置,参数a由性质(2)可解得:

(17)

(18)

若当前曲线所处的位置为(x0(σ),y0(σ)),在d个单位大小的运动响应函数hσ0(σ)的作用下,位置变化为(x1(σ),y1(σ)).改变前后位置之间存在的转换关系为:

(19)

若变化前的系数为X1,X2,…,Xn和Y1,Y2,…,Yn,变化后的系数为X11,X12,…,X1n,Y11,Y12,…,Y1n.改变前后,系数之间存在的转换关系为:

(20)

则最终的目标轮廓曲线参数方程可由处于初始状态的曲线和粒子运动响应函数来表示:

(21)

(22)

其中,系数xm,ym分别表示轮廓曲线从初始状态到达总能量最小时,横纵坐标受到各响应函数的影响程度.

3.2 模型的求解

为了得到能够使能量泛函达到最小值的目标轮廓曲线,在此使用增量法来求解,即对于曲线(x(σ),y(σ)),每次在(x1,y1),…,(xM,yM)中选择一个点(xi,yi),允许点的横坐标和纵坐标能增加或减少d个单位,使新的目标轮廓曲线的总能量小于原来的总能量,直到总能量不变为止.

具体算法流程为:

(i) 目标轮廓曲线的初始状态为首尾两点连接成的一条直线:

此时,曲线所具有的内能和外部能分别为:

Eext(x(σ),y(σ))=

(ii) 设置横纵坐标可变范围d,求需要变化的点m0、相应的横坐标变化量Δx、纵坐标变化量Δy,使得:

在运动响应函数的作用下,横纵坐标的改变量可由(19)式得到,频率分量系数的改变量可由(20)式得到.在得到横纵坐标及各频率分量系数后,可以通过(15)式求得总能量,进而通过比较,找到使得总能量达到最小的响应函数、横纵坐标的改变量、各系数变化量.

(iii) 若Emin

4 实验结果及分析

本文在Matlab7.10.0环境下实现其相关算法,完成灰度图像目标轮廓曲线的提取.在模型(15)中各权重系数α,β调节着各能量在总能量中的比重.取值将决定总能量在收敛到最小值时,曲线能否到达目标轮廓所处的状态.在尝试过程中发现,α的取值限制着曲线的伸展长度,α取值越大,曲线越难振动;取值过小,会造成曲线随意振动.β决定着曲线的弯曲程度,β取值越大,曲线越平滑,造成难以提取出轮廓局部凹凸细节;取值过小,会使得轮廓曲线中添加过多的、无用的局部凹凸细节.

在目标轮廓曲线的参数方程中,正弦级数频率最大值N的取值反映轮廓的具体走势.对于轮廓曲线的取点个数M,若取得太大,会严重消耗内存和时间;若取得过小,会影响局部细节的提取.在此同样不断地尝试对N,M进行取值.

对于粒子的运动响应函数式(16),参数γ,n将会影响响应函数波型的宽窄.在设置横纵坐标的取值范围d时,取值过小会造成搜寻次数过多,消耗时间,有可能使搜寻结果陷入局部极小值;取值过大会使每次搜寻过程消耗过多的内存,增加程序中间计算量.

在参数设置为α=0.001,β=0,N=15,M=400,γ=2,n=2,d=5的时候,光学图像中初始曲线在迭代过程中的变化情况见图 2.

为方便目标轮廓的提取,在图像上选取初始点的过程中,应尽量选取靠近目标轮廓边缘的点.对于图 3中目标轮廓的提取,通过参数的调整发现α=0.001,β=0,N=15,M=400,γ=2,n=2,d=5时,能完整地提取光学图像和X射线图像的目标轮廓;d=20时能提取出完整的超声图像中的目标轮廓,如图 4.

通过算法的实现,对本文所建立的能量泛函模型进行求解,能够较为完整地提取出图像中目标轮廓曲线,得到轮廓曲线的参数方程,进而保留了轮廓曲线的相关性质.

但是在初始点的选取上,需要人工选择,使得初始状态的曲线尽量地靠近轮廓曲线,对各参数没有定性的方法确定其取值大小,只能通过实验结果尝试后选取.

本文算法提取一段开曲线,只须给定两个端点,从目标轮廓提取的角度,这已经是初始点个数的极限,其它的轮廓提取模型(如snake模型等)提取一条开轮廓曲线往往要选择很多初始点,并且提取的结果与这些初始点的位置有很大的关联性.当然,在本算法中,将一段封闭曲线分割为几段开曲线要提取,此时,为了让实验结果更理想,分段的数量有时可以大一点,即使这样,所取的点数也不是太多.

[1] Malik J, Blelngie S, Leung T, et al. Contour and texture analysis for image segmentation[J]. IJCV, 2001,43(1):7-27.

[2] Cao Y, Wang C, Zhang L, et al. Edge index for large-scale sketch-based image search[C]// IEEE. IEEE International Conference on Computer Vision and Pattern Recognition . Barcelona: IEEE, 2011:761-768.

[3] Belongie S, Malik J, Puzicha J. Shape matching and object recognition using shape contexts[J]. IEEE Transcantions on Pattern Analysis and Machine Intelligence, 2002, 24(4): 509-522.

[4] Mumford D, Shah J. Boundary detection by minimizing functionals[C]// IEEE. IEEE International Conference on Computer Vision Pattern Recognition, San Francisco: IEEE, 1985(5): 22-26.

[5] 夏利民, 谷士文. 基于活动轮廓的运动目标的动态分割[J]. 中国图象图形学报, 1999, 4A(8): 631-634.

[6] Ambrosio L, Tortorelli V. On the approximation of functionals depending on jumps by elliptic functionals[J]. Comm Pure and Appl Math, 1990, 43: 999-1036.

[7] Malladi R, Sethian J, Vemuri B. Shape modeling with front propagation: a level set approach[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1995, 17(2): 158-175.

[8] Lou L,Ding M.Principle and approach of boundary extraction based on particle motion in quantum mechanics[J].Optical Engineering,2007,46(2):027005-027005-16.

Object Contour Extraction Based on String Theory

Lou Liantang, Chen Jiaqi, Dan Wei

(College of Mathematics and Statistics,South-Central University for Nationalities,Wuhan 430074,China)

In order to guarantee the continuity of the object contour, the energy functional model of object contour based on the string theory satisfying the Dirichlet boundary conditions is established in this paper. By taking the object contour curve as a composition system of discrete interaction particles, the response function of particle motion is constructed such that the interaction between particles is simulated. Finally, the incremental method is adopted to gradually search contour curve which satisfies minimization condition of energy function. Experimental results show that the object contour can be extracted effectively by reasonable configuration of relevant parameters, in the meanwhile, the integrity of the contour curve can be ensured and the extracted curve can be zoomed without limitation. An open contour curve with two end points can be extracted efficiently using this algorithm which need lesser manual interaction.

string theory; object contour extraction; energy functional model; response function

2015-09-07

娄联堂(1966-),男,教授,博士,研究方向:数学应用方法与图像处理,E-mail: louliantang@163.com

国家自然科学基金资助项目(60975011);中南民族大学中央高校基本科研业务费专项资金资助项目(YZZ13003;CZW15051)

TP751.1

A

1672-4321(2015)04-0123-06

猜你喜欢
纵坐标轮廓能量
·更正·
更正
勘 误
OPENCV轮廓识别研究与实践
能量之源
诗无邪传递正能量
高速公路主动发光轮廓标应用方案设计探讨
开年就要正能量
第五届播睿智杯“奇思妙想”有奖数学知识竞赛
凝聚办好家长学校的正能量