可视媒体数据分割技术研究

2017-04-07 09:41史瑞芳
中国管理信息化 2016年22期
关键词:分割数据技术

史瑞芳

[摘 要]人的视觉是一个复杂的系统,人类有80%的外界信息来自视觉,所以随着科学技术发展,可视媒体开始出现并得到广泛的应用。但由于可视媒体的规模越来越大,在带宽、计算效率的限制下,数据分割技术越来越受到关注。基于此,本文以图像分割技术为研究对象,展开论述,分析了图像分割技术的基本方法,并探讨了关键实现技术,仅供参考。

[关键词]图像;数据;分割;可视媒体;方法;技术

doi:10.3969/j.issn.1673 - 0194.2016.22.084

[中图分类号]TP391.41 [文献标识码]A [文章编号]1673-0194(2016)22-0-02

1 图像分割概述

图像分割就是将一张图分割成相似但不相交区域的过程,在可视媒体的应用当中,高质量的图像分割是后续更高水平操作如语义解释、识别等的前提。

在计算机视觉和图像处理领域分割是非常重要的操作,它代表着处理图像底层的第一步。以数字图书馆来说,大量图像视频的收藏需要按照图像视频的内容构建目录、排序及存储,实现最有效率地浏览和检索可视媒体数据。在图像视频的底层属性当中颜色和纹理是最重要的两个,所以为实现上述目的可基于颜色和纹理进行分割构建目录和索引。另一个典型的例子是使用互联网传输信息,互联网上大规模的多媒体数据流需要传输,数据压缩成为有限使用带宽来完成的关键,当前使用的编码方法就是通过模仿人类视觉来减少由于压缩所带来的缺陷,也就是将场景在视觉上细分为有意义的区域去寻找语义表示,这显然涉及了图像分割。

颜色表示法在彩色图像处理当中最为常用,比如:常见的RGB空间,其色彩由红蓝绿成分以及透明度表示,例如用Photoshop打开一张图片,在上锁状态下显示的是RGB通道,解锁后有四个通道即红蓝绿通道以及Alpha通道。这是基于直角笛卡尔空间的,这与人类视觉系统当中3个不同种类感光圆锥细胞(三波段滤过器)获得彩色图像三色理论一致。可惜的是RGB空间并不能够完全实现颜色感知的高层次处理。

2 图像分割的基本方法

2.1 EM算法

期望最大化算法(Expectation-Maximization,EM)在解决数据残缺问题方面十分出色。事实上,数据集当中通常会少一些变量或是观察不到的隐含变量的模型均可归属于数据残缺,这类问题中观察不到变量,对于所有可观察对象均是未知的。EM算法是一种在残缺数据中计算极大似然估计的迭代统计技术,其基础是模型聚类方法当中的统计方法。也就是将某个数学模型和给定的数据进行最佳拟合。以高斯混合模型对图像颜色分布建模为例,假设混合分布产生一系列的观察值,该分布有多个同方差高斯分布组成,若取其中一个独立同方差高斯分布,并由此产生一个样本获取数据点,设定多个这样的数据点为指定的数据集,在多維空间中找到数据集对应的点,作为一定分布样本值。那么该分布就能够由多个高斯密度函数的加权平均值所表示的概率密度函数来描述。多个高斯密度函数的有限集合也就是高斯混合模型。

EM算法作为迭代算法,每次迭代均由求期望和极大化两个步骤组成,前者用于计算对数似然函数的期望,后者用于选择期望最大参数,然后代入前者再次计算期望,如此循环往复,直到获得最优解。

2.2 马尔可夫随机场

马尔可夫随机场理论(Markov Random Field,MRF)的应用已经十分广泛,它通过直接方便的方法用概率描述图像像素的空间相关特性。数据统计当中马尔可夫过程保持离散的时间和状态,这个过程称为马尔可夫链,条件概率决定这个过程的统计特性。它很好地描述了平面网格结构中图像像素间的空间相关性。因此在二维平面上,可以将图像看作二维随机场,必须考虑空间相关性。

根据上述分析,条件分布可以用来描述马尔可夫随机场,其中条件分布表示随机场的局部特性,不过这样一来通过局部特性定义整个随机场很困难,所以Besag将Gibbs与马尔可夫随机场联系起来,提出了关于方形网格的数据统计模型,获得了实际应用方法。

在实际的运用当中,马尔可夫随机场常与估计理论和同级决策结合,按最优原则确定目标函数,比较常用的是MAP(最大后验概率)。二者结合形成MAP-MRF体系。若观测图像和原始图像同属于二维平面上的随机场,进行图像分割,原始图像成为标记场,通常情况下,观测图像会受到关照条件、系统原因或是随机噪音的影响出现图像失真现象。所以,要直接由观测图像得到原始图像几乎不可能,只能给出一个估计,此时利用MAP计算最大值。事实上MAP估计是一个优化问题。

2.3 ICM算法

寻求条件概率最大数的迭代方法(Iterated Conditional Modes,ICM)算法中,Modes为众数,ICM是确定松弛的方法,其目标在于减少随机退火的计算负担,速度快,但选取初始值比较关键,因为仅允许干扰负增长,所以常出现局部最小的局面。典型的随机松弛方法是随机退火算法,速度慢,迭代过程当中新计算结果在接受过程中会产生随机扰动,理论上能够得到全局收敛。

2.4 区域生长算法

这种算法的基本思想就是集合相似性质的像素点构成区域,即先将要分割的区域找一个起始点像素作为生长点;然后将周边与生长点像素有相似性质的像素集合到同一个区域内;再将这些新添加的像素作为生长点继续上述操作,直到所有满足条件的像素均被包含进来,这样就获得了一个完整的区域。

值得注意的是,实际应用中需要解决以下问题:一是起始点像素的选择;二是选取周边相似特性像素的准则;三是生长停止的规则和条件。

可通过具体问题的特点选取起始点像素,也就是用迭代方法由大到小依次收缩最终找到想要的像素点,这种方法适用于2D图像和3D图像,比如:军用红外图像,通常检测目标辐射大,其亮度就会比较高,所以可选择最亮的像素作为生长点。如果没有具体问题先验知识,可以利用生长所用准则计算每个像素,若结果显示出聚类特点,那么可选择最为接近聚类中心的像素作为生长点。

在区域生长过程当中,还需注意一个要素——堆。因为区域生长过程中起始点像素周边像素要不断依照生长准则来判断,确定其是否具备同起始点像素相似的特性,若是则需要进行关键字排序,并作为新的生长点。堆排序中,每个需要排序的记录仅占一个存储空间。

HeapAjust堆调整,这个步骤是保持堆特性的关键,其输入参数是一个数组及其元素的索引,调整前要保证以二叉树为根的子树保持堆特性。不过索引的元素值可能会比其下属节点的值小,可能破坏堆特性,HeapAjust就是将索引节点下滑使索引的节点为根的子树符合堆特性。

Heap_min小顶堆,可以利用由下到上的方法,调用HeapAjust将数组转化成堆。

Delete_min删除堆顶元素,然后将剩下的堆内元素重构小顶堆。

3 实现技术研究

上文对图像分割技术的基本方法进行了研究,基于这些内容,下文利用Matlab软件+C语言的方式来实现图像分割。

MATJWORKS公司的Matlab数学软件将数值分析、矩阵计算、图形显示和信号处理集成为一体,含大量函数可以调用,功能强大,其使用解释性语言,在执行速度方面有待改进而且开源在算法和保密方面不利,运行环境受限。C语言成熟,速度快但比Matlab复杂,将二者结合起来,协同工作,应用范围更广。

要实现二者的结合,Mex文件必不可少,这是一种能够在Matlab中调用的C语言衍生程序,使较大规模的C语言程序能够易于在Matlab中调用,无需重写Mex,如果出现不可避免的循环计算瓶颈时,可用C语言重写Mex文件来解决。

如图1中的(a)(b),(a)为原始灰度图像,(b)为求反显示结果。

在使用Mex文件时要注意:第一个输入宗量是原始图像数据,prhs[]是雙精度指针,所以做double处理,然后作为第一输入宗量;API函数同样返回双精度指针,所以通过Mex得到的图像需进行uint8处理,这样才能显示。

利用上述方法,只需对Mex文件稍作调整就可以在Matlab软件当中,利用上文提供的基本方法实现图像分割。

4 结 语

图像分割作为数据分割高级应用的第一步,一直是焦点也是难点,同时图像分割也是图像处理转变为图像分析的关键。所以本文将图像分割作为研究对象,研究可视媒体数据分割技术。本文分析了图像分割技术当中的EM算法、MRF算法和区域生长,并利用Matlab/C混合编程实现图像分割,有一定的参考价值。

主要参考文献

[1]钱吟,曲建峰,郑巧英.多种媒体特色资源的可视化应用研究[J].图书馆杂志,2016(3).

[2]汪淼,张方略,胡事民.数据驱动的图像智能分析和处理综述[J].计算机辅助设计与图形学学报,2015(11).

猜你喜欢
分割数据技术
机载Lidar建筑物点云中非建筑物点剔除研究
离婚纠纷按揭商品房分割问题探析
一种借助数据处理构建的智能食堂管理系统
数据化艺术的生成探究
探讨电力系统中配网自动化技术
移动应用系统开发
北京市中小企业优化升级
浅谈计量自动化系统实现预购电管理应用
基于改进遗传算法的图像分割方法