李观发
摘要:21世纪以来,智能化技术的飞速发展,使人工智能逐渐渗透到各个领域中,并影响着人们的方方面面,图像识别便是人工智能的重要体现。近些年来,人们对图像识别技术的愈发关注,使图像识别技术的应用领域正变得愈发广泛,在地质勘测、医疗诊断、面部识别等都会应用到图像识别技术,这也使图像识别技术成为人们的一大关注焦点。鉴于此,本文便对人工智能背景下图像识别技术进行浅要的分析,以期能够进一步提高图像识别技术的应用水平。
关键词:人工智能 图像识别技术
引言
在人工智能背景下图像识别技术已经成为一种新兴的技术手段,该技术在短短的几十年里得到了迅猛的发展,并在指纹识别、卫星云图识别、医疗诊断、安全验证等诸多领域中发挥着越来越重要的作用。在人工智能的带动下,图像识别技术的应用水平正得以不断提高,关于图像识别技术的应用,也正受到越来越多人的关注。为了使图像识别技术能够得到更好的应用,以下便对人工智能背景下图像识别技术进行浅要的分析。
1图像识别技术
图像识别技术作为人工智能的重要应用体现,其自诞生以来,便经历了三个发展应用阶段,图像识别技术在应用初期,主要用于对文字进行识别,随后其被应用于数字图像的处理与识别,最后则开始进一步应用到物体识别之中。现如今,图像识别技术的功能已经变得非常强大,其应用领域也变得日益广泛。对于图像识别技术来说,其原理并不复杂,该技术中主要是以信息处理为核心,利用计算机来对图像进行记忆与识别的,在应用过程中,其能够对人体大脑进行模拟来提取图像特征,然后根据相应的認知规律来对不必要的冗余信息进行排除,以此确定重要信息,明确图像分类,这样工作人员便可根据自身所需随时随地的从计算机数据库中调取到想要的图像,并且可获得较为满意的图像识别结果。需要注意的是,图像识别技术终究与人眼识别有所不同,因此在图像识别技术应用过程中,其所提取的图像特征是不稳定的,正是这种不稳定性,会对图像识别技术的应用效率与准确性造成明显影响。因此,在人工智能背景下,图像识别技术中的图像特征具有重要意义。
2人工智能背景下图像识别技术浅析
在人工智能背景下,人们在应用图像识别技术时,主要包括两种,一种是通过神经网络来进行图像识别的技术,另一种则是通过非线性降维方法来进行图像识别的技术,以下便对这两种图像识别技术进行逐一论述。
2.1神经网络
神经网络作为人工智能中的一种重要技术,其是以现代神经生物学作为基础而研究出来的,神经网络能够对生物过程进行模拟,以此对人脑在计算过程中所具有的某种特性结构进行反映,事实上,神经网络并不是完全依据人脑神经结构来进行模仿的,其只不过是以抽象化方法来对人脑的神经系统进行描述,以便于提高计算结构的效率。在以神经网络为核心的图像识别技术中,其主要是借助于神经网络学习算法来进行图像识别的,在利用神经网络来实现图像识别时,往往需要先采取预处理方法来处理图像,在该预处理环节中,需要将图像从原有的真彩色模式转换成灰度模式,即使真彩色图像通过预处理手段使其转化成灰度图像,在预处理中,还需要对灰度图像进行旋转、放大、归一化等处理。为了使神经网络能够在图像识别中充分发挥作用,还要根据图像识别的功能及对象来设计相应的神经网络,在对神经网络进行设计时,需要对输入层、隐含层乃至输出层进行逐一设计,然后还要确定初始权值以及期望误差。在对输入层进行设计时,需要结合图像识别的具体对象来明确求解问题,确定最佳的数据描述方法。
为了使人们更易于理解,本文在设计输入层时,将图像样本的尺寸缩放大小设置成16 x16,网络输入为256维。在对隐含层进行设计时,则要对隐含层的数量及其单元数量进行确定,现阶段,许多研究都证明隐含层的层数及其神经元数量会直接影响到图像识别精度,因此需要确定最佳的隐含层层数及神经元数量,只有这样才能确保图像识别精度达到最为理想的应用效果。因此,在对隐含层中的单元数进行确定时,需要结合经验公式L=a+M+N、L= lOg2Ⅳ,这样可避免削弱神经网络的泛化能力。针对神经网络在对外样本进行训练时出现的识别率较低问题,在上述经验公式中,输出层中所含有的神经元数量由M进行表示,而输入层中含有的神经元数量则由N来进行表示。需要考虑的是,对神经网络隐含层中一些影响不大的神经单元进行删除,可使神经网络的应用性能得到一定程度的提高,不过其结构确定却需要投入较长的时间来进行研究方可确定。在对神经网络中的输出层进行设计时,通常会采用多输出型来设计神经网络。但在确定初始权值时,为了使神经网络的收敛性能更佳,一般要将初始权值的选值范围控制在(-1,1)之间,在确定期望误差时,应根据预期的误差值及训练时间进行确定,本文将期望误差值确定为0.001。
在对神经网络进行设计后,便要对神经网络进行训练,为了确保其识练结果能够与图像识别需求相符,本文应用MATLAB软件中的newff函数对相应的两层网络进行创建,该网络中的输出神经元为1个,输入神经元的数量为16×16个,隐含层中的神经单元数量为26个,采用learngdm作为学习函数,将学习速率的初始值控制在0.01至0.6之间,最大循环训练为2500。本文利用该神经网络来识别手写的26个英文字母,从识别结果中可以了解到,节点数量的不同会对图像识别准确率产生直接的影响,当隐含层中的节点为26个时,可使图像识别需求得到有效满足。从神经网络的训练时间及其在图像识别时所产生的误差性能曲线可了解到,以神经网络为工具来进行图像识别,可使26个手写的英文字母得到有效识别,并且在识别过程中具有良好的抗干扰性能,识别效率非常快,并且识别结果也较为准确。因此,凭借上述特点,神经网络还可应用于更复杂的图像识别工作中。
2.2非线性降维
以非线性降维方法来进行图像识别也是经常被人们所用到的,人们在利用计算机来进行图像识别时,其自身便相当于进行高维识别,由于高维特性的影响,致使计算机在进行图像识别时往往需要承受很大负担,进而影响到图像的识别效果和速度,而通过非线性降维方法,则可有效提高图像识别速度和识别质量。所谓非线性降维,是在不对图像结构进行破坏的基础上,通过对自身维度进行降低,以此提高图像识别精度和速度。比如在对人脸进行识别时,由于人脸图像中的不均匀特性广泛分布于高纬度空间,这也使计算机在识别人脸图像时的耗费时间过长,从而给计算机造成很大负担,而通过非线性降维方法,则可使人脸图像变得相对紧凑,进而提高人脸识别效率。
3结语
总而言之,在人工智能背景下,图像识别技术已经广泛应用于医疗诊疗安全检查身份识别等领域其也给民众的生活带来了巨大改变,使民众充分感受到人工智能所带来的便利。为了使图像识别技术能够更好的为民众服务,就必须要对图像识别技术进行更加深入的研究,使人工智能能够真正融入到人们的生活。
参考文献
[1]计算机人脸图像识别技术[J].技术与市场,2014,21(11):283.
[2]孟广仕,图像识别技术在人工智能中的应用[J].信息与电脑(理论版),2018(12):152-153.
[3]张娟.三维多媒体视觉图像人工智能识别方法仿真[J],计算机仿真,2018,35(09):435 438.