孙明辉
(贝叶斯电子科技有限公司,浙江 绍兴 312000)
由于时代的持续性发展,图像作为一种信息传播介质逐渐发挥着愈发重要的信息交流作用。但是图像在采集、传输等期间,极易出现一些失真问题,造成图像信息无法精准地表达。在图像清晰度识别方面,传统的应用技术一般是利用提取图像特征等方法给予识别与评估。由于图像特征的提取具备较强的复杂性,特别是对高维图像、背景复杂图像等来说,在提取其数据特征等方面存在一定的偏差。一些学者通过对失真图像展开研究,发现需要对其中提取的图像特征进行区别整合。例如:一些学者通过提取图像中的均方误差、峰值信噪比、图像亮度、对比性等参数,将其认定是支持向量机的输入参数,接下来对其实施模型建设与评估。还有一些学者利用离散余弦调整区域内的频率系数进行特征统计、峰度值、颜色饱和度等分析,然后将其当作是支持向量机输入参数,由此能够确定图像的模糊比。还有一些学者认为,需要通过分析空间对比与结构分布等IQA方法进行图像识别度分析,然后确定图像的灰度波动图,并创建与原图空间结构信息变化相吻合的矩阵,接下来通过支持向量回归法实施模型训练,由此能够实现识别目的。部分学者认为,按照谐波均值的汇总方法评估FR-IQA的最终质量分值,由此来区分图像的清晰度。尽管通过提取图像特征能够获得比较清晰的图像识别信息,但是必须要通过一系列复杂的预处理过程,方可获得较高图像的清晰度,同时图像的特征提取也是非常繁琐的。因为特征提取的难度非常大,对此,这种方法的通用性并不强。
结合以上方法的分析与研究来看,通过卷积神经网络给予识别分析,将整合到的图像混合到各个程度的高斯造影中,创建Caffe框架结合GoogLeNet网络模型,然后把存在造影与清晰的原图直接当作输入参数,接下来利用卷积神经网络对其实施模型创建,即可获得相应的分析结果。整个处理构成非常精简、直接、高效,通过大量的实验能够验证了这一技术的精准性、有效性等,而且能够直接取消繁琐图像特征的预处理过程。对此,在图像信息处理方面存在较强的实践应用价值。接下来通过实验分析法对这一技术的实际应用流程展开整理与分析。
实验数据来自于某高速公路若干个卡口的高清图像,摄像头整合到的图像一般覆盖了不同的时间段,对此,数据覆盖的信息量是非常大的,而且还存在一些复杂的干扰因素(例如:在不同的气候或者环境下等),最初的数据仅仅是增添了程度不一的三类高斯噪声,其方差各是0.01、0.07与0.3,由此能够说明实验研究方法的精准性、稳定性。实验操作过程中对应的图像总计是177340张(原图和三类噪声图像各是44335张),在实施训练操作的过程中,训练集与评测集各是90%与10%。
caffe框架是由伯克利人工智能研究小组和伯克利视觉和学习中心开发的,这是一个具有可读性同时内容清晰、完整的深度学习开源框架,其通常对应的是C++语言编写,能够兼容命令行、Python与Matlab接口,其对应的内部构件有五个,即:Solver、Net、Laver、Blob、Proto等。①对于Solver模块来说,其包括两大构成元素,即:训练网络与评测网络,其功能是对深度网络模型实施训练指导,这也属于实验数据处理的一个重要构成元素。值得注意的是,这一组件一般是用于对深度网络模型的创建与训练,必然会对最终的实验效果带来一定的影响,这种情况通常能够引起大部分实验者的关注。②对于Net模块来说,其一般是对模型内的函数实施计算,然后通过不同系列层组合而成,对应的是五环计算图,若要确保前向迭代与逆向迭代的精准性,需要保留计算图内全部的中间值。比如:一个最具有代表性的Net模型一般是由磁盘中加载数据进行推进的,由完成计算分类和重构目标函数的任务这一过程开始,能够在这一模块中发挥整体运输等功能。③Layer模型属于创建框架体系的一个重要的网络基础,并且也属于模型组成单元中一个规模非常小的计算单元,其功能有两个:计算模型内的本质特征,明确具体的落实任务。在进行信号输入或输出的过程中,一般是通过“Input Blob或Output BLOB”等给予阐释。④对于Blob模块来说,其属于框架的一个存续结构,一般是用来负责对数据处理形成的具体数据实施封存,也能够存储一个无限维数的矩阵,一般来说,则能够对其中的高维数据实施便捷化处理。⑤对于Proto模块来说,其一般是按照框架内对其中的一些结构进行读取、存取等功能,由此能够实现数据的转换,并进一步明确用户定义数据格式的具体参考标准,能够在不同语言系统中对不同的对象进行序列化处理。
一开始的卷积神经网络的应用是为了辨别二维图像形状,其对应的是不同的感知器,能够发挥自主学习等特点,而且还能够自行处理相关数据,具备非常强的容错性,其权值共享和局部连接的网络结构与生物神经网络存在一定的类同性,能够大大减少网络模型的繁琐度,并且也能够降低权值数量。基于此,它通常是在上世纪末期得到深入性地运用,因为在那个年代中,计算机技术的发展速度相对滞缓,并未与时代发展同步(缺乏训练数据,并且计算过程繁琐等),但是若要通过深层次的神经网络进行相关模型提炼,则存在一定的难度。不过,若有通过深层次的神经网络系统中获得相关模型,也是比较困难的一件事情,对此,对其展开深入性地研究困难重重。这些年来,因为计算机对应的一些技术得到广泛发展,且应用范围在不断扩大,所以随着硬件诸如CPU技术的持续升级,之前存在的一些无法解决的问题,能够在目前技术应用下得到有效地解决与处理,让卷积神经网络在一些热门的机器设备中发挥积极的推动作用,并且能够大范围地渗透到图像处理范围内,其常见的有两种,即:卷积层与池化层。①卷积层是CNN和核心操作,主要作用是特征提取[1],一般是包括若干个特征面,并且不同的特征面一般对应着若干个最小单元的神经元,其数量不一。神经元是一种相对独特的输出函数,其一般是利用卷积核和上一层特征面的局部区域对接,由此能够对卷积操作获得的输出图形特征进行提取,从而更完整地捕捉到相关图像的识别信息。另外,卷积层输入通常代表着一个三维数据。另外,对于卷积层的参数来说,又称作为矩阵或卷积核,通常是按照随机梯度下降更新的方式对其中的参数进行调整。②池化包括最大池化和平均池化[2],一般是指对卷积层输出特征实施操控与处理,由于输入的是一些存在完整性的图像,涉及到一些不重要的次特征,对此,通过池化处理能够确定主特征,由此能够增强特征局部的不稳定性,并且能够大大提升计算速度,其一般是对不同区域中用来运算这一区域中特征的中间值或最大值进行整合[3],然后实施个性化的训练与指导,由此能够创建一个训练模型。由此来看,池化层代表着对不同特征图进行单独操作与设计,同时还需要输入一个相应的特征图。如果认定池化范围已经确定的话,那么其对应的输入特征图,需要提取其中一些小图,并确定子图的最大值,或者用来确定子图的中间值,由此能够将其认定是一个输出值。在进行签证的过程中,通常能够将其认定是最大化池化,后者代表着均值池化。在创建池化层的过程中,其功能一般是用来减少特征图的分辨率,同时能够缩减其计算规模,由此能够大大提升网络的鲁棒性能[4-6]。
如果把混入高斯噪声之后的图像数据集一并地上传至实验系统中,即可创建最终的训练模型,然后把数据集中的10%(各类对应4433张图片)认定是验证集,然后对其验证处理,最后即可获得实验结果。
由此来看,如果是在GoogLeNet网络模型的作用下创建的预测模型,那么其对应的输出结果通常能够渗透到混淆矩阵中,它一般是用来呈现模型分类的一个正确数与错误数,通过矩阵分析能够发现:对含有混合高斯噪声方差是0.01的图片,在对其进行识别分析的过程中,仅有一张识别错误,精准性突破99.98%,对于原图像的识别率来说,精准率是99.62%,其对应了17张图片识别错误;对应噪声方差是0.07的识别率,通常也仅有99.59%;对应的噪声方差是0.3,其识别率尽管是非常小的,但是一般能够突破96.38%,尽管整体的识别率非常小,大概是6.38%,但是其中某一张的识别率是极高的。通过这一数据能够发现:对于这种图像信息提取方法来说,其对于图像清晰度的识别效果是非常明显的,由此能够直接说明这种评估方面具备较强的可行性与有效性。
随着科学技术的持续性发展,网络技术实现飞跃升级,图像与社会中各个行业的信息传递有着很大的相关性。在海量数据整合、分析等背景下,对其实施图像识别则是目前大数据下的研究热点,并且也对图像特征信号提出极大的要求。现今,考虑到图像信息存在一定的繁琐性,而且对应的一些运算技术存在一定的局限性。所以,在图像识别层面来看,识别精度与性能提升已经是目前研究工作的一个重难点。其对应的主流技术比较多。不同学者通过长期的研究发现:在运用深度学习技术之后,其在图像清晰度识别方面的应用是愈加广泛与深入。通过自然语言处理、语言个性化识别等,能够获得不错的研究成效。对此在本文的研究中,笔者以深度研究发现探讨卷积神经网络图像清晰度识别的具体应用策略。根据图像清晰度的识别分析,我们能够发现:在通过不同提取方法展开研究的过程中,其能够直接识别出程度不一的噪声图像。那么与一些传统的操作技术进行对比,一般需要把原始图像对其展开预处理,例如:提取图像的部分特征等进行操作处理,把提取到的一些特征认定是支持向量机的输入参数,在对其进行训练模型分类的过程中,还需要创建相应的模型,同时还需要创建一个固定阈值,由此能够确定图像的清晰度。这种提取方法具备的优势是非常突出的,那就是无需对图像实施预处理,即可获得相关信息的提取特征。另外,也能够直接把图像认定是输入参数,借助于卷积神经网络对其实施深度分析,由此能够创建训练模型,接下来还需要将验证集的图像输入至模型内,对其进行验证分析,最后能够确定最终的实验信息。根据此次的实验验证结果能够发现:这一方法在识别图像清晰度方面是非常高的,其精准率能够突破99.98%,也就是说,针对这一类图像的清晰度来说,其存在一定的类同性,通常能够给予直接识别与分析。这种方法的应用能够避免图像在传递、采集等过程中受到噪声等因素的干扰,而且也能够确保图像信息能够更加完整、清晰地呈现出相应的图像内容,以便于进行前端设备监测,确保工作人员能够动态地掌握设备的运行状态。
总而言之,卷积神经网络是一种用来模仿人体神经组织的模型结构,它的内部组成包括两大部分:卷积层与池化层。同时,在具体应用的过程中,必须要明确上下级的层级规则,而且还需要确定周围神经组织之间的衔接性,由此能够确保不同层级之间的强约束力,并使其维持一定的关联性。通过深度学习理念在图像分类、清晰度等识别中的灵活应用,能够体现出目前大数据的应用价值,而且也是目前机器领域智能化研究的一个重要热点,为了能给更加清晰、完整、高效地实现图形分类、图像信息识别等带来可能。在本文的研究中,必须通过模型训练,然后借助于深度分析法分析建构模型的网络参数与特征信号,最后发现,在算法性能、识别精准性等方面得到明显提升,由此来看,这一应用方法具备一定的推广与实践价值。当然,在本文的研究中,也存在一些遗憾的地方,那就是在训练环节耗用的资源比较多,希望在今后的研究中能够继续优化和完善。