深度学习及其在目标和行为识别中的新进展
郑胤,陈权崎,章毓晋
摘要:目的:随着互联网技术的发展以及计算机硬件性能的增强,人们可以获得的数据量规模越来越大,同时处理数据的能力也不断的提升。这两方面因素使得人们希望从大规模数据中有效的提取信息。深度学习是近些年机器学习领域中涌现出来的一个新的研究领域,它通过构建深度网络来从数据中学习特征,而这种特征学习的方法在实践中被证明十分有效。为了引起更多的计算机视觉和机器学习领域的研究者对深度学习技术进行探索和讨论,并推动深度学习在目标识别和行为识别领域的进展,本文对深度学习以及其在目标和行为识别领域的进展进行概述。方法:本文首先对深度学习进行概述,介绍深度学习与神经科学中哺乳动物的信息表达的关系,并且指出目前深度学习已经成为计算机视觉中的一个热点方向,每年都有大量的研究成果出现,产生了诸多深度学习的新算法和新方向,而同时深度学习算法的性能也逐渐在一些国际重大评测中超过了其他传统的方法;接着,本文对深度学习的原理进行综述,结合当前深度学习的进展将深度学习技术进行分类归纳,并且对当前主流的深度学习架构:基于限制玻尔兹曼机的深度学习架构,基于自编码器的深度学习架构进行介绍,并且对训练深度网络时的稀疏性约束进行介绍;在此基础上,本文介绍了目前深度学习的新进展:用于增强鲁棒性的去噪自编码器、考虑像素之间关系的三元因子玻尔兹曼机、通过引入卷积运算来共享参数的卷积受限玻尔兹曼机以及收到受限玻尔兹曼机启发而提出了神经自回归分布估计器。接着,本文介绍目前深度学习在目标识别和行为识别中的应用:谷歌公司通过计算机集群来训练大规模深度网络的“虚拟人脑”项目;深度学习在大规模视觉识别竞赛中取得的进展;神经自回归分布估计器在同时的图像分类和标注中的应用以及深度学习在行为识别中的应用。结果:本文在最后的部分阐述了深度学习与传统的神经网络之间的关系、深度学习的优缺点,以及目前深度学习理论需要解决的主要问题,并且指出深度学习的本质是学习到多层的非线性的函数关系,而这种多层的非线性的函数关系使得人们能够更好地对视觉信息进行建模,从而更好地理解图像和视频。结论:该文对拟将深度学习应用于目标和行为识别的研究人员有所帮助。
来源出版物:中国图象图形学报, 2014, 19(2): 175-184
入选年份:2016
基于欧氏距离图的图像边缘检测
张闯,王婷婷,孙冬娇,等
摘要:目的:图像边缘往往携带着图像的大部分信息,这些边缘信息是目标识别及图像分割所依赖的重要特征信息。人类视觉系统可以根据图中像素色彩的一致性得到图像的边缘信息。为了提高边缘提取的准确性,使得提取到的边缘具有更高的信噪比,本文提出一种基于欧氏距离的图像边缘检测方法,该方法计算图像内像素点之间的欧氏距离,得到图像的距离图,对距离图进行适当处理后,即可以得到图像的边缘信息。方法:两个像素之间的欧氏距离能够反映两个像素之间的相似程度,即数值越小,两个像素之间的差异越小,并且区域的欧氏距离可以把边缘像素点差异放大。通过计算以两个像素各自为中心点的7邻域的欧氏距离,计算得到整幅图像的欧氏距离图。在得到的距离图中,物体的边缘被有效地增强,边缘的可靠性显著提高。进而提出一种改进的Canny算子,采用3×3邻域计算x方向、y方向、45°方向、135°方向、225°方向、315°方向一阶偏导数取其中最大值作为该点的梯度,取 3×3 邻域局部极大值抑制非极大值,降低了传统Canny 算子对噪声的敏感性,使得检测的边缘更加精细,有效地提高目标的识别概率。结果:算法的实验采用atlab7.0.1,由C语言编写完成,图像库采用tid2008标准图像库,对景物大致分为,建筑、肖像、风景、静物、水域5大类,对其分别进行了边缘检测,检测结果与 Canny算子检测结果进行了对比。并使用‘边缘点的检出率’‘边缘点的误检率’及‘信噪比’3个指标进行了量化比较。从量化结果分析,本文方法很好的保持了边缘的有效信息,可以有效地检出物体的轮廓。结论:本文提出的基于欧氏距离图的图像边缘检测方法,利用了图像边缘处小区域的距离来得到距离图,距离图很好的描述了图中景物的外部轮廓。对距离图进行改进的 Canny算子边缘检测,可以有效地得到图中物体的轮廓。与一般的边缘检测算法比较,虽然不能检测到细节,但是只针对于目标轮廓的检测,更加有利于基于轮廓的图像目标识别。
来源出版物:中国图象图形学报, 2013, 18(2): 176-183
入选年份:2016