基于图像处理技术的智能化人体行为识别模型研究

2022-11-09 08:23冉宪宇
微型电脑应用 2022年10期
关键词:差分图像处理聚类

冉宪宇

(陕西国防工业职业技术学院, 计算机与软件学院, 陕西, 西安 710300)

0 引言

随着科技水平以及信息化技术的发展,人体行为识别在诸多领域拥有广泛的应用前景。其中图像视频是重要的信息载体,如何实现识别智能化是解放生产力、提升工作效率的关键。通过图像处理技术提取有效信息,采用精密的算法准确识别出人体各类行为无论是对科技发展还是对民生的便利性都具备很大的现实意义,因此本文从运动目标检测、特征提取、行为识别几个方面逐层推进、深入研究。

1 图像处理技术

1.1 技术简介

数字图像主要是利用数值像素表示及存储各类设备获取的二维图像信号,图像处理技术主要是对数字图像进行分析与转换,最终实现各类目标计算。数字图像在形式上主要包括由特定色彩模型组成的彩色图像、采用数值矩阵表示的灰度图像、特殊的只有0和1取值的二值图像等[1]。

1.2 降噪处理

实际生活中,由于成像设备得到的原始图像受各类因素影响会存在噪声,影响图像质量,也影响特征提取,为了提升识别准确性,需要进行降噪处理。首先,分析噪声的来源,主要包括受传感器等设备影响、由于环境因素干扰以及传输过程信道干扰产生的噪声几大类;其次,利用滤波器进行过滤,常用办法包括中值滤波法、均值滤波法、高斯低通滤波、小波滤波等。

1.3 图像增强

由于设备或环境影响导致最终效果不佳,通过图像增强可以进行改善,将关键部分突出,其余部分弱化或剔除。目前比较常用的方法包括:将灰度值重新分配的直方图均衡化法、利用隶属度函数实现变换的模糊增强法等。

1.4 形态学处理

形态学主要用于描述图像的区域形状,达到提升处理性能的效果。因为数字图像的形态学处理是在集合论的逻辑运算基础之上的,所以在图像的分割以及后处理时经常使用形态学处理的相关技术。主要包括将原始图像通过结构运算变长或者变粗的膨胀运算、缩小或细化的腐蚀运算以及梯度运算等。

2 运动目标检测

在图像序列中识别行为的过程中,最核心也是最基础的是先定位到运动目标,之后才能进一步分析其行为,因此本节首先对运动目标的检测进行分析与研究。

2.1 检测步骤

在人体行为识别过程中对于运动目标的检测属于核心环节,将运动目标提取出来作为后续识别分析的基础。检测方法大体分为两类:一类是通过轮廓检测,一类是通过速度及加速度的变化以及不同帧之间背景差异检测。轮廓特征容易变化,不利于实时检测。因此本文采用第二类速度检测法,检测步骤主要包括图像预处理、提取颜色纹理等特征、运算转换、聚类分析。

2.2 背景提取模型

读取N帧图像处理为灰度图像序列fi(i=1,2,3,…,N),将坐标像素值作为高斯分布均值ui,l(x,y),初始化处理之后建立混合高斯背景模型

(1)

2.3 改进的帧间差分算法

帧间差分法的核心思想是利用不同时段的图像进行差分,最终得到差分图像,利用相邻时刻之间像素的差异变化检测运动目标,剔除未改变的像素之后根据阈值进行判断。根据差分方式的不同主要包括两帧、三帧、加权累积等。由于两帧差分法对加速、减速明显的目标容易出现重影,三帧差分法虽然可以克服这一缺点,但在目标存在空洞时也容易产生误判,为了提高判断准确度,本文基于三帧法构建一种改进帧差法,步骤如下。

(1) 选定四帧连续的图像fk(x,y),fk+1(x,y),fk+2(x,y),fk+3(x,y)进行去噪增强预处理后得到dk(x,y),dk+1(x,y),dk+2(x,y),dk+3(x,y)。

(2) 将一与三、二与四进行隔帧差分计算,得到二值化图像

(2)

(3)

(4)

(5)

其中,g1k、g12k为差分后图像,i×j为每帧图像大小,M为预设阈值,λ为抑制系数取为2,Δm1、Δm2为动态阈值。

(3) 对二值化图像进行目标颜色标记。

(4) 对上一步骤进行逻辑与运算

M(x,y)=g1(x,y)g2(x,y)

(6)

2.4 构建运动目标检测模型

基于上文模型及算法,融合背景提取模型与改进帧差法实现目标检测,首先分别采用2种算法获取图像,然后进行与运算,利用形态学处理消除少量空洞之后得到运动目标。构建过程如图1所示。

图1 运动目标检测模型构建流程

3 图像特征提取

判断出运动目标之后,针对图像的特征提取也至关重要,简而言之,人体行为识别过程就是特征聚类分析的过程。因此本节着重研究提取算法。

3.1 选取原则

物体的特征属于区别与其他物体的标志性特点,在图像处理过程中,亮度、尺寸、角度变化等都是其影响因素。选取特征时应注意:

(1) 选用的特征互相之间要具有独立性,避免冗余导致计算复杂;

(2) 特征之间差异越大越好,如此才更利于识别;

(3) 特征维度不应过大,避免算法复杂度增加。

3.2 特征指标

根据特征选取原则,图像特征指标选择如下。

(1) 颜色:颜色特征具备良好的稳定性,不随目标大小或方向改变,清晰、直观。描述方式包括直方图、聚合向量、相关图等[3]。

(2) 纹理:表面特征,属于灰度等级变化的表征方法,提取方面包括统计法、结构法、信号类法等。

(3) 形状:本质特征,通常包括轮廓与区域两种,可分解为点、线、面。

(4) Sift:Sift特征用于描述局部特点,具有良好的适应性,不受亮度、尺寸、旋转等影响,可理解为寻求包括位置、尺度、方向的特征点。

3.3 改进k-均值聚类算法

k-均值算法是应用较多的聚类算法,核心思想是不断更新聚类中心进行迭代收敛。算法将含有n个对象的数据集X划分为k个簇Cj,利用聚类准则函数判断是否终止。但该算法易陷入局部最优解且过于依赖初始值且初始值比较随机。因此本文提出优化改进:

(1) 针对局部最优问题引入遗传算法来解决;

(2) 针对初始值随机问题采用类内以及类间距离方法。

整体算法流程如图2所示。

图2 改进k-均值聚类流程

int(Xi,Xj)=2*d(Xi,mj)-D(mi,mj)

(7)

接下来根据公式

ave≤σ*int(Xi,Xj),σ∈[1.5,2.5]

(8)

判断是否成立,如果满足式(8)说明属于同一聚类,不满足式(8)则不属于同一聚类,由此获得最佳聚类数Kopt,以其作为聚类中心进行遗传编码。

4 行为识别建模

基于上文的目标检测与特征提取,以获取识别所属的各类初始数据,重点构建针对这些初始数据的识别模型构建。

4.1 改进的HSMM模型

隐马尔科夫模型(HMM)基于马尔科夫假设、状态与时间无关的不动性假设以及输出只和当前状态有关的独立性假设,这些假设条件虽然简化了复杂度,但在某种程度上漏掉了前一时刻的有用信息。因此本文对其进行改进,以HMM模型为基础,增加时间组成成分,构建隐半马尔科夫模型(HSMM),引入状态停留的时间概率函数,将下一时刻的状态与当前状态及停留时间进行关联。采用左右连续型HSMM模型,步骤如下。

(1) 设隐状态数量N,数据集S=[S1,S2,…,SN],t时刻隐状态

qt∈[S1,S2,…,SN]

(2) 设状态对应的观测值总量M,数据集V=[v1,v2,…,vN],t时刻观测ot∈[v1,v2,…,vM]。

(5) 设观测概率矩阵B={bj(k)}N×M,其中bj(k)=p(ot=vk,qt=Sj),1≤j≤N,1≤k≤M。

(6) 设状态停留时间概率D,取结合t-1时刻状态i的概率与t时刻转移到状态j的概率,记作高斯分布p(j,d)=n(d|uj,σj)。

(7) 得到HSMM模型

λ=(N,M,π,A,B,D)

(9)

4.2 基于HSMM模型识别人体行为

在人体行为识别过程中应用HSMM模型进行处理的流程如图3所示。

图3 HSMM模型识别流程

(1) 利用前向—后向算法,输入观察序列O和模型λ,求解输出概率P(O|λ)的大小。

(2) 利用Viterbi算法,输入观察序列和模型,求解最佳隐状态序列Q。

(3) 利用BW算法实现参数估计,求解使P(O|λ|)最大的模型[5]。

5 实证结果分析

为验证本文构建的模型的准确性,从KTH人体行为数据库中选择了6种不同运动形态的行为视频,每种姿态选取10条记录,以此作为训练样本集获得HSMM模型,迭代次数设置为1 000,取另外一组各10条视频作为测试样本集,进行10次测试后以算术平均值进行统计作为识别率,识别结果如表1所示。

表1 利用HSMM模型识别人体行为结果表

由此可以得出,平均识别率达到97.5%,具有良好的识别效果。

6 总结

本文引入图像处理技术,通过改进的帧差分算法实现运动目标检测,通过改进的k-均值算法进行聚类分析提取特征,通过改进的HMM模型实现人体行为识别,实测准确率较高。但场景相对简单,选取的验证行为也较少,并且在算法的抗干扰性、计算速度等方面还需要进一步研究与探索。

猜你喜欢
差分图像处理聚类
RLW-KdV方程的紧致有限差分格式
一种傅里叶域海量数据高速谱聚类方法
符合差分隐私的流数据统计直方图发布
海战场侦察图像处理技术图谱及应用展望
人工智能辅助冠状动脉CTA图像处理和诊断的研究进展
基于ARM嵌入式的关于图像处理的交通信号灯识别
基于图像处理的废有色金属自动分选算法研究
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法
基于Spark平台的K-means聚类算法改进及并行化实现