刘明明
基于条件深度卷积生成对抗网络的图像识别方法
刘明明
武警工程大学密码工程学院,陕西 西安 710086
在信息技术爆炸的时代,对在大量数据下互联网的发展情况进行分析是非常关键的。对基于条件深度卷积生成对抗网络进行分析,通过对图像数据的基本特征进行分析和研究,提出了基于条件深度卷积生成对抗网络的应用方案,为其进一步发展打下了坚实的基础。
条件深度卷积网络;图像识别;生成对抗网络
生成对抗网络是Goodfellow等在2014年提出的一种生成模型。不同于传统生成模型, 生成对抗网络在网络结构上除了生成网络外,还包含一个判别网络。生成网络与判别网络之间是一种对抗关系。对抗的思想源自博弈论。博弈双方在平等的对局中各自利用对方的策略变换自己的对抗策略,以此达到获胜的目的。引申到生成对抗网络中,即生成器和判别器为博弈双方,生成器拟合数据的产生过程,生成模型样本,优化目标,达到纳什均衡,使生成器估测到数据样本的分布。目前,生成对抗网络在图像和视觉领域得到了广泛的研究和应用,已经可以生成数字和人脸等物体对象,构成各种逼真的室内外场景,从分割图像恢复原图像,给黑白图像上色,从物体轮廓恢复物体图像,从低分辨率图像生成高分辨率图像等[1]。
图像数据包括大量的数据与数据的存储分析结构等。海量数据主要是交互式的数据,是结构化或者非结构化的数据。我们可以通过这样的数据对过去发生的事情进行判断,也能够对将来的事情进行预测。大部分数据是非结构化的数据,融合了文本、图像、音频等信息,因此只有设计更可靠的算法来读取数据,才能够将其中蕴含的信息提取出来。在传统数据中,广泛存在的还是结构化的数据。结构化的数据不仅读取比较方便,而且可以很容易地观测信息。但是在大数据时代,数据的读取极其依靠强大的算法,这就是它们主要存在的差异[2]。
条件生成对抗网络(Conditional Generative Adversarial Networks,CGAN)是在GAN(Generative Adversarial Networks,GAN)的基础上加上了条件扩展为条件模型。如果生成器和判别器都适用于某些额外的条件,例如类标签,那么可以通过将其附加到输入层中输入到生成器和判别器中进行调节,可以指导数据生成过程。条件生成对抗网络的构造是极为复杂的。对该模型而言,待修正的参数包括条件与噪声等,各参量在工作中可能存在一些耦合现象,因此只依靠研究人员的相关经验来进行调整,成本较高,效果也较差。目前,借助现代计算机的全局搜索工具来进行模型的修正是极为关键的。利用数学建模的方案可以使问题变得抽象,同时对其进行优化调整。优化算法的种类是非常多样的,但是从根本原理上来概括,优化算法主要包括精确算法和启发式算法两大类别。精确算法可以对解空间得到最优化的解,比如线性规划和动态规划等;但是精确算法由于存在一定的局限导致使用范围受限,比如局部最优解较多或者是决策参数过多时,工作效率就会降低,无法解决大型问题。在工作量增加之后输出精度也较差,因此目前使用广泛的是启发式的算法。
利用启发式算法,可以很快地深度卷积生成对抗网络中的参数因子。每更新一次参数因子就是在缩放部件特性曲线,利用计算机的快速计算能力,可以在很短的时间内完成优化计算[3]。从本质上是可将其归入参数优化问题的,可将其概述为给定测试图像特定的目标路径,要求从数据集中找到与之最接近的图像。为了能够得到符合要求的测试数据,需要经历的时间较长。该问题的自动求解,能够大大降低测试人员承担的工作量,而且生成效率也能得到提高,进而推动网络整体质量的提高。
将条件加入深度卷积生成对抗网络中的生成器,利用卷积网络提取特征的能力加上条件辅以训练,之后将训练好的C-DCGAN中的判别器部分抽取出来,添加Softmax后形成用于图像识别的新网络结构。在实际应用中,该网络可以提升图像识别的准确率。目前,图像数据分析的要求是评估图像数据,以为将来的决策提供帮助。这些评估指标主要包括图像数据的播放量、曝光量、分享量等,只有这样才能够对其将来的传播情况进行预测[4]。
眼球系数指的是图像数据中每个点吸引浏览者眼球的能力。眼球系数已成为很多图像数据网站分析用户行为的关键因素。这些图像数据包含了大量的信息,因此需要进行更加科学的收集,利用更符合实际情况的机器学习等算法进行深层次的探究。只有这样才能够更好地评估这些数据,从而根据用户的实际情况进行图像数据推荐与广告推送等,为企业带来收益。
采用更先进的方法也能过滤网络图像数据网站中的一些不良图像数据,将具有正能量的图像数据更多地推荐给用户,利于弘扬社会风气,将机器学习应用于社会建设中有着极好的效果,因此在图像数据网站的建设中,应大量采用这样的技术,以较低的成本和较高的效率做好图像数据的筛选工作。通过手机定位技术等可以分析网络图像数据的用户分布情况。通过用户在网络图像数据网站的行为还可以分析用户对该图像数据网站以及上面所包含图像数据的满意程度。按照用户对网络图像数据的忠诚程度,可以将用户划分为初级用户、高级用户和深度用户等。初级用户登录网络图像数据网站的频率较低;而高级用户则经常使用该类网站;深度用户不观看,而且经常上传图像数据,这样就可以更好地分析用户的人群特征。用这个方法和原图像进行比较,从而达到匹配的效果。选用一些样本作为原始的数据,在判断时计算待测的数据和原模板之间的距离,找到和这个模板最相近的输出值,从而确定最适配的图像。
为了提高分析结果的科学性与严谨性,提升准确度,我们需要利用Softmax等方法来分析各项指标,还需要对时间和评价次数采取归一化处理,以确保全部的程序所得到的结果处于相同的数量级上。本文提出的方法能够在确保算法性能的基础上控制算法时间,降低时间消耗,尤其是在大规模程序中,这种时间优势更加突出。条件深度卷积的方式有利于实现图像的高速处理,便于进一步掌握其特征,从而利用这样的图像特征做好系统辨识、模式识别、图像生成等工作,在军用和民用领域都有着较为广阔的发展前景。
在对抗网络图像处理过程之中,因为某些非人为政策、地理、天气等客观的不确定的因素而形成的变化,致使其准确率产生意想不到的变化,所以必须在识别时总结提出各种可能遇到的问题和因素,然后对所产生的问题进行分析探究,最终找到合理的方法解决问题。
[1]张龙,赵杰煜,叶绪伦,等. 协作式生成对抗网络[J]. 自动化学报,2018,44(5):804-810.
[2]赵树阳,李建武. 基于生成对抗网络的低秩图像生成方法[J]. 自动化学报,2018,44(5):829-839.
[3]张营营. 生成对抗网络模型综述[J]. 电子设计工程,2018,26(5):34-37,43.
[4]曹志义,牛少彰,张继威. 基于半监督学习生成对抗网络的人脸还原算法研究[J]. 电子与信息学报,2018,40(2):323-330.
Image Recognition Method for Generative Adversarial Networks Based on Conditional Depth Convolution
Liu Mingming
School of Cryptography Engineering, Engineering University of PAP, Shaanxi Xi’an 710086
In the era of information technology explosion, it is very important to analyze the development of the internet under a large amount of data. The paper analyzes generative adversarial networks based on the conditional depth convolution. By analyzing and studying the basic features of image data, the paper puts forward the application scheme of generative adversarial networks, so as to effectively study it and lay a solid foundation for its further development.
conditional depth convolution network; image recognition; generative adversarial networks
TP183;TP391.4
A
刘明明(1992—)男,汉族,山东五莲人,研究生学历,研究方向为信息隐藏、生成对抗网络。