利用神经网络基于矩阵相似度的图像体态识别

2018-06-05 10:18张永东王建军
科教导刊 2018年3期
关键词:人工神经网络

张永东 王建军

摘 要 模式识别的首要工作任务是提取图像特征。本文基于图像矩阵相似度特征进行体态识别。文中首先简要介绍人工神经网络机器学习法,其次基于矩阵理论提出图像矩阵相似度,最后利用人工神经网络训练提取样本图像的矩阵相似度特征进行体态识别。实验结果表明,利用人工神经网络训练提取样本图像的矩阵相似度特征进行体态识别能获得较高的图像中人体体态识别率。

关键词 人工神经网络 矩阵相似度 图像体态识别

中图分类号:TP391 文献标识码:A DOI:10.16400/j.cnki.kjdkx.2018.01.015

Body of Image Recognition Based on Matrix Similarity Using Neural Network

ZHANG Yongdong, WANG Jianjun

(College of Biomedical Engineering, South-Central University for Nationalities, Wuhan, Hubei 430074)

Abstract The primary task of pattern recognition is to extract the features of the image. The purpose of this paper is to achieve the posture recognition based on the matrix similarity feature of the image .The paper first introduces the machine learning method of artificial neural network, and then puts forward the matrix similarity of the image based on matrix theory. Finally, we use artificial neural network to extract the matrix similarity feature of sample image for posture recognition. The experimental results show that the recognition rate of the posture recognition is higher by using the matrix similarity feature of the artificial neural network to extract the sample image.

Keywords artificial neural network; matrix similarity; posture of image recognition

0 引言

特征提取是图像模式识别的基础,在图像模式识别实际应用中,优秀的机器学习算法配上良好的特征提取,是模式识别的关键。目前应用较多的机器学习算法有PCA模型[1]理论、贝叶斯、[2]人工神经网络[3](Artificial Neural Networks)等;图像特征有SIFT特征、[4]HOG特征、[5]Edgelet特征[6]等。经过查阅相关文献,本文利用人工神经网络训练提取样本图像的矩阵相似度特征进行体态识别,实验结果表明本文方法能获得较高识别率,具有重要的理论意义和实践价值。

1人工神经网络

人工神经元[7]是构成人工神经网络的最基本的单元,形象化地对生物神经元进行了描述,通过具体的数字及语言进行表达,模拟生物神经元的功能、结构,并用模拟图进行表示。图1是一种简化的人工神经元结构模型。它主要包括三个基本元素:连接权值、求和单元、激活函数。

图1中,是神经元的样本输入,是各样本权值, 是求和函数,是偏值,是激活函数,是神经元的输出,则神经元的整个输入为:

计算过程中通过人工神經网络训练学习,[8]利用S型激活函数,对图像二维坐标轴进行分类。

2 矩阵相似度特征

2.1 图像矩阵相似度理论

在矩阵理论中,设A、B为n阶矩阵,如果存在n阶可逆矩阵P,使得,则称矩阵A与B相似。在图像模式识别中,目标对象的识别也可以用图像矩阵相似理论。[9]

图2中,横轴是图像像素点的相对位置,纵轴是像素点对应的灰度值。当两张图像的像素点及灰度值分布呈现同一个趋势特征时,即可认为图像矩阵相似。

2.2 图像矩阵相似度特征提取

图像矩阵相似度特征提取的主要思想是经过图像增强、滤波后,去除噪声留下图像中含有人体区域的边缘轮廓,最后统计人体边缘轮廓灰度特征值。本文图像矩阵相似度特征提取的详细步骤如下:

(1)采样。使用像素关系重采样,当图像训练样本过大时进行缩小,当训练样本过小时进行放大,此步骤可以避免图像出现波纹。在实验中可以更方便地对样本进行训练。

(2)滤波。图像的主要特征信息都保存在像素边缘的部分。如果直接统计图像灰度值,在对图像进行边缘检测时,噪声会掩盖像素边缘的特征信息,因此必须采用滤波函数与图像做卷积来改善边缘检测器的性能以及减少噪声。通常的滤波器主要有高斯滤波器,[10]即将图像与尺度为 的高斯函数做卷积。式(2)是以尺度 =5?大小的高斯内核函数减少噪声示例。

(3)增强。增强是指基于图像中像素邻域的梯度变化值,增强像素边缘灰度值。增强的算法有很多种,在实验中主要是通过计算图像的梯度方向和幅值。采用的是Sobel滤波器[11]的梯度幅值和方向的方法。将一组转置的矩阵分别作用在图像的水平方向和垂直方向。

其梯度幅值和方向分别为:

图像经过增强后,可以将图像像素边缘及邻域灰度值有显著变化的点凸显出来。

(4)提取图像矩阵相似度特征。经过滤波、增强后的图像还是会含有较多的噪声以及那些图像局部含有人体区域但又不影响识别过程的像素,为了去除这部分的像素,提高识别效率,本文对训练图像采用边缘检测[12]处理。通过边缘检测后,舍弃较多的无用像素,将遗留下来的含有图像特征的像素点保存在一个图像特征矩阵中,形成图像矩阵相似度特征。

3 实验和结果

在目前公开的数据集中,由于还没有摔倒救助状态数据集,本文从各个图片数据库和搜索引擎等途径收集制作了总计400张求助样本图片。

收集的400张求助样本数据集大多是方形,基于实验的需求,将其缩放为统一大小。本文中样本数据集采用Pedestrian Data数据集。[13]为了与求助样本统一,将样本(如图3)加上两条黑边(如图4),以便于实验训练。

实验中将正常和求助训练样本各自初始值设定为100张,每次迭代增量100张,经过三次训练。将剩余的624张正常样本和100张求助作为检测样本,实验正确识别率可达80%以上。为了进一步验证本文利用神经网络基于矩阵相似度进行体态识别方法的有效性,本文以Weizmann、[14]KTH、[15]Hollywood、[16]UIUC action dataset[17]四种数据库中的行人直立行走的视频部分作为实验对象,也获得了较好的实验结果。图5为Weizmann数据库体态识别效果图,图6为四个数据库中人体体态识别的正确率。

4 结语

本文依托VS2010平台,利用OpenCV函数库,提出利用神经网络基于矩阵相似度对图像中人体体态进行识别的方法。实验结果表明,该方法对图像中人体正常站立和摔倒求助两种状态有较高的识别率,有重要研究价值。

参考文献

[1] 蒋伟峰,刘济林.基于PCA学习子空间算法的有限汉字识别[J].中国图象图形学报,2001.6(2):186-190.

[2] 张剑飞.贝叶斯网络学习方法和算法研究[D].东北师范大学,2005.

[3] 肖晔.人工神经网络学习算法的研究[D].北方交通大学 北京交通大学,1992.

[4] 肖健.SIFT特征匹配算法研究与改进[D].重庆大学,2012.

[5] 周柯.基于HOG特征的图像人体检测技术的研究与实现[D].华中科技大学,2008.

[6] Sundararajan K.Unified point-edgelet feature tracking[J].Dissertations & Theses - Gradworks,2011.

[7] 韩力群.人工神经网络教程[M].北京:北京邮电大学,2006

[8] 李永明.人工神经网络BP学习算法的研究及在人脸识别中的应用[D].山东:山东大学,2012.

[9] 高楠.傅俊英.赵蕴华/基于两种相似度矩阵的专利引文耦合方法识别研究前沿[J].现代图书情报技术,2016.3(2):41-50.

[10] 謝勤岚.图像降噪的自适应高斯平滑滤波器[J].计算机工程与应用,2009.8(16):32-46.

[11] 管鹏举,王开民,曹晓梅.基于中值滤波及Sobel算子的图像边缘检测技术研究[J].装备制造技术,2016(8):211-212.

[12] Zhou, P.,Ye, W.,& Wang, Q.An Improved Canny Algorithm for Edge Detection[J]. Journal of Computational Information Systems,2011.7(5):1516-152.

[13] Chin G K W, Niel K P V, Gilescorti B, et al. Accessibility and connectivity in physical activity studies: the impact of missing pedestrian data.[J]. Preventive Medicine, 2008, 46(1):41.

[14] Blank M, Gorelick L, Shechtman E, et al. Actions as Space-Time Shapes[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2007.29(12):2247-2253.

[15] Park S, Aggarwal J K. A hierarchical Bayesian network for event recognition of human actions and interactions[J]. Multimedia Systems, 2004.10(2):164-179.

[16] Marszalek M, Laptev I, Schmid C. Actions in context[C]// Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on. IEEE, 2009:2929-2936.

[17] Du T, Sorokin A. Human Activity Recognition with Metric Learning[C]// European Conference on Computer Vision. Springer-Verlag,2008:548-561.

猜你喜欢
人工神经网络
基于人工神经网络的故障诊断专利浅析
人工神经网络发展历史与训练算法概述
基于人工神经网络的优化配置研究
基于人工神经网络的地震电场卫星数据异常识别
ANN、ANFIS和AR模型在日径流时间序列预测中的应用比较
人工神经网络在旅游人数预测中的应用研究
中国房地产上市公司治理状况预测
浅析人工神经网络在汽车轮轴松旷间隙检测中的应用
基于改进隐马尔科夫模型的畜禽全基因组关联分析中的多重检验方法
基于人工神经网络的经济预测模型