◆张国栋
基于深度学习的图像特征学习和分类方法的研究及应用
◆张国栋
(北京科技大学 北京 100083)
当前,在我国人工智能发展的过程当中,深度学习是研究的一个主要方向。本文尝试从深度学习的基本内涵出发,进一步地探讨图像特征学习和分类方法相关的研究以及具体的应用。
深度学习;图像特征学习;分类方法
目前,在学术领域,评价人工智能的一个主要指标是其所具有的学习力系统能否随着经验的积累而不断进行自身的学习能力的提升。尤其是,随着科学技术的不断发展,大数据时代已经到来,在为深度学习等相关人工智能技术提供巨大发展契机的同时,也为深度学习环境下的图像特征学习和分类展开深层次的应用研究提供了新的思路。本文基于深度学习的基本内涵,探讨图像特征学习和分类方法的应用,对于促进该领域相关研究的深入和完善有着一定的现实借鉴意义。
深度学习,从某种角度上,可以理解为一种经验数据的自我提升的过程。从宏观角度来看,深度学习可以借助较为复杂的模型来处理大规模的数据分析任务。同时,通过对原始的数据产生影响,进行着更加复杂的分析。
从机器学习的角度来看,深度学习主要是一种对相关数据的表征进行学习的方法,通过对表征所体现出来的向量以及特定的形状区域来进行综合分析来完成相应的学习任务。深度学习可以借助监督和非监督式的方式来完成,在进行深度学习的过程中,也可以借助特征提取的来对过往的手工特征的获取的方式进行替代。
从本质上来看,进行深度学习其主要目的是对人脑的神经网络进行模拟,从而更好地提高人工智能水平。在进行深度学习过程当中,一般来说会主要面临以下几个方面的问题:例如,人脑本身就具有一定的深度,另外,在人脑进行认知的过程当中会呈现出不断出逐层递进的过程。同时,如果深度不够,相关的学习效果也会受到一定的影响。从目前来看,深度学习主要应用在计算机视觉、语音识别、以及相关语言处理等诸多领域。
在深度学习领域,图像特征学习是当前该领域研究的主要方向。随着整个互联网信息的不断发展,图像的捕捉以及图像的识别是深度学习当前研究的主要方向。需要强调的是,图像学习尤其是图像特征学习作为深度学习应用的一个主要方向,其所具有的方法主要体现在以下几个方面:
基于深度学习背景下,图像特征学习过程当中,单层特征学习方法拥有较为广阔的应用前景。该方法主要依托神经网络模型,在此基础上,进行多层网络的构建。目前,在进行人工神经网络等相关领域研究时,科学家主要是以仿生和神经网络计算作为主要的研究主线。在仿生基础上,主要是探讨神经元能否被视为随机变量,通过概率图模型的构建来有效地进行相关模型及参数的分析。需要强调的是,在原有的手工特征学习中,相关的学习方法,随着神经网络技术发展已经不断完善。特别是针对原有神经网络一些不足,通过必要的训练,可以达到理想的效果和目的。这也是当前神经网络相关技术不断向前发展的过程中所面临的一个主要挑战。
在进行深度学习的过程当中,图像特征学习还可以通过借助多层特征学习的方法来完成。其中主要是借助子空间学习的方式来进行完成。这一方法主要是进行降维空间中的相关数据本质进行分析,也可以理解为降维算法。传统的降维算法,主要是进行相关投影矩阵的分析来进行相关转换数据的获得。通过借助“全局块”模型的构建来实现整个构建过程当中的优化。需要强调的是,在进行这种多层学习过程当中,一方面,需要借助大量的训练样本;另一方面对神经网络提出更高的要求。在进行深度学习过程当中,无论是单层特征的学习,还是多层特征的学习,其主要的目的是为实现人工智能的深化和发展。
为了更好地把握在深度学习背景下图像特征的学习和分类方法,在具体的应用过程当中,应该充分借助反向传播中的相关系统来进行激活函数以及卷积层和聚合层的使用等等。通过这种方式来有效地对深度的神经网络进行系统的训练。同时,还需要借助必要的几种损失函数以及最大间隔最小分类误差等来进行深度学习的相关训练。通过引入多任务的深度卷积网络,进一步地强化多任务背景下,深度学习在特征学习与分类中的提高。
在进行深度学习过程当中,图像分类主要是对整个图像的语义内容进行宏观层面的判定。在当前整个市场领域,图像分类无论是在信息检索,还是在用户需求分析领域都拥有着较大的应用潜力。
在传统的图像分类中,2009年主要是通过表征图像以及大规模的数据训练来进行图像分类。但是,这种图像分类的方法,由于是在不同目标函数的指导下,通过分开训练所得的,因此,无法进行有效的联合。到2002年,以卷积神经网络为代表的深度学习算法被广泛的使用在图像的识别中。斯坦福大学的相关研究人员,也进一步发现了卷积神经网络所具有的优势。在今后的深度学习基础上,图像的分类也将会呈现出更加专业化、多元化、科学化的发展方向。尤其是,当前我国著名的搜索引擎开发商百度,通过建立拥有更为丰富信息源的图像数据库,结合深度学习相关算法来进行图像的分类和过滤,其整体的分类精确度已经达到了百分之九十以上。
在今后的深度学习不断提升的过程当中,图像特征学习和分类也将呈现出更加广阔的应用空间。从当前比较热门的无人驾驶来看,通过借助深度学习,帮助计算机相关系统来有效地了解道路交通情况,各种路标以及意外紧急情况的妥善处理等等。通过这种方式不断地完善自我的识别检测能力,从而更好地满足深度学习的要求。
在进行图像特征学习中,需要明确特征的内涵。目前,在整个学术领域,围绕图像特征的研究,主要是相关的手工特征以及在计算机视觉领域中所呈现出来的表观特征为研究对象。在深度学习背景下,无论是直方图,还是物体检测方面都可以有效地进行特征的投影,从而取得相应的效果。例如,在机器人应用在寻路系统中,就有着重要的特征学习和分析能力的提升参数。从以上的数据任务和学习中,需要不断地对原有的特征分析方法进行有效的深化,从而进一步地得到相关景深图像的大小、边缘等具体特征。
总之,当前在整个深度学习领域,围绕图像特征学习以及分类方法研究已经取得了系统的成果,尤其是在单特征编码以及深度卷积网络方面都产生了不少的研究成果。本文从深度学习基本内涵出发,对图像特征学习和分类方法进行系统的研究,对于促进该领域相关研究的深入和完善有着一定的现实借鉴意义。
[1]冯子勇.基于深度学习的图像特征学习和分类方法的研究及应用[D].广东:华南理工大学,2016.
[2]赵永威,李婷,蔺博宇.基于深度学习编码模型的图像分类方法[J].四川大学学报(工程科学版),2017.
[3]张洪群.一种基于深度学习的半监督遥感图像检索方法[J].遥感学报,2017.
[4]李琳,余胜生.基于深度学习模型的图像质量评价方法[J].华中科技大学学报(自然科学版),2016.
[5]倪嘉成,许悦雷,田元荣.基于深度学习的MINST手写体字符分类研究[C].全国图象图形联合学术会议,2013.