利用朴素贝叶斯分类器的视频分类方法

2019-10-17 02:55成东坡

武汉工程职业技术学院学报 2019年3期

庞博成东坡

(1.商丘职业技术学院河南商丘：476100；2.济源高级中学河南济源：459000)

对比赛及训练录像的重复观察，进行视频点评和视频分析，是教练和研究人员在训练和科学研究中使用的一种重要方法。从视频图像数据中提取关键信息能够帮助运动员提升运动成绩，提供技术支持，帮助其进行运动恢复。然而，如何对海量的视频进行分类是一个关键问题。近年来，已经有大量的研究人员，针对这一问题进行了探索。其中，文献[1]针对视频的分类问题，提出一种基于隐马尔可夫(Hidden Markov Model，HMM)模型的分类方法。该方法在各类运动训练视频片段的连续帧中提取4维运动特征向量。文献[2]提出一种基于类型标志镜头与视觉词袋模型相结合的视频分类方法，并分别提出了单一视频及混合视频2种分类算法。文献[3]提出一种多特征和神经网络相融合的视频识别模型(MF-RBFNN)，提取反映视频的静态和动态特征进行分类。

朴素贝叶斯分类器是机器学习一个常用的分类模型。本文提出了一种基于朴素贝叶斯分类器的视频分类方法，该方法对视频进行特征提取，提取纹理、颜色以及亮度三种反映其运动类别的特征。然后，进一步进行基于朴素贝叶斯分类器的视频分类。对于输入的几种特征，采用极大似然估计，直至完成最终的分类。实验结果表明，提出的视频分类方法取得了令人满意的分类结果。

1 视频特征提取

1.1 纹理特征提取

设视频f有L个灰度级，G表示灰度共生矩阵，其元素nij表示灰度分别为i和j的像素对的次数。其中：

nij=N{(x,y)|f(x,y)=i,

f(x+Δx,y+Δy)=j}

(1)

其中，f(x,y)表示像素点(x,y)处的灰度级，Δx,Δy表示两点间的方向θ和距离d。采用4种常用的纹理特征作为分类特征。

(2)

(3)

(4)

(5)

1.2 颜色特征提取

假定帧大小为M×N，并转换为HSV模型，并划分大小为h×v的k×k块。其中h=M/K，v=N/K，以xi,m,n表示视频中第n块内第i个像素点m分量的像素值。则视频颜色特征为：

(6)

(7)

(8)

其中，ξm,n，xi,m,n，Sm,n分别表示第块内分量的均值、方差、三阶矩。n∈[1,k×k]，i∈[1,h×v]，m∈[H,S,V]。

1.3 亮度特征提取

(9)

以y表示块亮度比较编码值，其中l≤m≤k×k,2≤n≤k×k-1。

(10)

通过式(10)可对帧按块亮度均值比较并进行编码。

2 朴素贝叶斯分类器分类

2.1 朴素贝叶斯分类器

贝叶斯分类器是已知的第一种概率分类器，它由所依据的方程式而得名[4-6]。朴素贝叶斯分类器是机器学习一个特别质朴而深刻的模型[7-8]：当你要根据多个特征而非一个特征对数据进行分类的时候，可以假设这些特征相互独立(或者你先假设相互独立)，然后利用条件概率乘法法则得到每一个分类的概率，然后选择概率最大的那个作为机器的判定[9-10]。

给定一组训练数据集{(x1,y1),(x2,y2),…,(xm,ym)}，其中，m是样本的个数，每个数据集包含n个特征，即Xi=(xi1,xi2,…,xin)。类标记集合为{y1,y2,…,yk}。设p(y=yi|X=x)表示输入的X样本为x时，输出的y为yk的概率。假设现在给定一个新的样本x，要判断其属于哪一类，可分别求解p(y=y1|x),p(y=y2|x),…,p(y=yk|x)的值。哪一个值最大就属于哪一类，即求解最大的后验概率arg maxp(y|x)。具体求解方式，根据贝叶斯理论有：

(11)

一般的，朴素贝叶斯理论假设各个特征之间是相互独立的，则上式可以写成：

(12)

由于式(12)的分母，对于每一个p(y=yi|x)求解都是一样的，所以实际操作中可以省略。最终，判别公式变为：

(13)

2.2 分类过程

在提取到视频的颜色、亮度以及纹理特征之后，然后进行基于朴素贝叶斯分类器的视频分类。对于输入的几种特征，采用极大似然估计。在朴素贝叶斯法中，学习就是意味着估计先验概率p(y)和条件概率p(x|y)，然后根据先验概率和条件概率，去计算新的样本的后验概率p(y|x)。

其中，在先验概率p(y)的极大似然估计如下：

(14)

假设输入样本的第个特征的可能的取值集合为{αj1,αj2,…,αjsj}，则条件概率p(x(j)|y=yi)的极大似然估计如下：

p(x(j)=αjl|y=yi)=

(15)

3 实验结果

提出的视频分类方法的实验流程如图1所示。具体的实验步骤为：

图1 提出的视频分类方法的实验流程

(1)通过网络搜集5种体育项目的运动视频，分别为篮球、足球、斯诺克、蹦床、网球，图2所示为5种项目的视频帧图像示例；

(2)使用MATLAB 2017将所有视频帧的分辨率统一调整为400×370；

(3)在Windows XP下，利用VC++6.0进行编程，对视频图像进行特征提取，提取纹理、颜色以及亮度三种特征；

(4)将3种不同的特征进行融合，采用极大似然估计，直至完成最终的分类过程；

(5)输出分类结果。

5种不同运动项目的训练集和测试集的视频帧数、来自比赛场次情况如表1所示。

表1 几种运动项目的视频数据集情况

如图3所示为足球运动视频中的目标提取结果示例，从图3中可以看出，运动目标较少和较多时，提出的方法均可有效提取出运动目标。

图3 足球运动视频中的目标提取结果示例

最终的分类准确率如表2 所示，其中对篮球、足球、斯诺克等5个运动项目均取得了90%以上的分类准确性，由此验证了提出的分类方法的可靠性。

表2 不同项目视频的分类准确率

4 结论

朴素贝叶斯分类器是分类算法集合中基于贝叶斯理论的一种算法，本文提出了一种基于朴素贝叶斯分类器的视频分类方法。对视频进行特征提取，提取纹理、颜色以及亮度三种反映其类别的特征。在提取到视频的颜色、亮度以及纹理特征之后，然后进行基于朴素贝叶斯分类器的视频分类。对于输入的几种特征，采用极大似然估计，直至完成最终的分类。实验结果表明，对篮球、足球、斯诺克等5个运动项目均取得了90%以上的分类准确性，提出的视频分类方法取得了较为准确的分类结果，证明了提出的方法的有效性。