利用朴素贝叶斯分类器的视频分类方法

2019-10-17 02:55成东坡
武汉工程职业技术学院学报 2019年3期
关键词:贝叶斯朴素分类器

庞 博 成东坡

(1.商丘职业技术学院 河南 商丘:476100;2.济源高级中学 河南 济源:459000)

对比赛及训练录像的重复观察,进行视频点评和视频分析,是教练和研究人员在训练和科学研究中使用的一种重要方法。从视频图像数据中提取关键信息能够帮助运动员提升运动成绩,提供技术支持,帮助其进行运动恢复。然而,如何对海量的视频进行分类是一个关键问题。近年来,已经有大量的研究人员,针对这一问题进行了探索。其中,文献[1]针对视频的分类问题,提出一种基于隐马尔可夫(Hidden Markov Model,HMM)模型的分类方法。该方法在各类运动训练视频片段的连续帧中提取4维运动特征向量。文献[2]提出一种基于类型标志镜头与视觉词袋模型相结合的视频分类方法,并分别提出了单一视频及混合视频2种分类算法。文献[3]提出一种多特征和神经网络相融合的视频识别模型(MF-RBFNN),提取反映视频的静态和动态特征进行分类。

朴素贝叶斯分类器是机器学习一个常用的分类模型。本文提出了一种基于朴素贝叶斯分类器的视频分类方法,该方法对视频进行特征提取,提取纹理、颜色以及亮度三种反映其运动类别的特征。然后,进一步进行基于朴素贝叶斯分类器的视频分类。对于输入的几种特征,采用极大似然估计,直至完成最终的分类。实验结果表明,提出的视频分类方法取得了令人满意的分类结果。

1 视频特征提取

1.1 纹理特征提取

设视频f有L个灰度级,G表示灰度共生矩阵,其元素nij表示灰度分别为i和j的像素对的次数。其中:

nij=N{(x,y)|f(x,y)=i,

f(x+Δx,y+Δy)=j}

(1)

其中,f(x,y)表示像素点(x,y)处的灰度级,Δx,Δy表示两点间的方向θ和距离d。采用4种常用的纹理特征作为分类特征。

(2)

(3)

(4)

(5)

1.2 颜色特征提取

假定帧大小为M×N,并转换为HSV模型,并划分大小为h×v的k×k块。其中h=M/K,v=N/K,以xi,m,n表示视频中第n块内第i个像素点m分量的像素值。则视频颜色特征为:

(6)

(7)

(8)

其中,ξm,n,xi,m,n,Sm,n分别表示第块内分量的均值、方差、三阶矩。n∈[1,k×k],i∈[1,h×v],m∈[H,S,V]。

1.3 亮度特征提取

(9)

以y表示块亮度比较编码值,其中l≤m≤k×k,2≤n≤k×k-1。

(10)

通过式(10)可对帧按块亮度均值比较并进行编码。

2 朴素贝叶斯分类器分类

2.1 朴素贝叶斯分类器

贝叶斯分类器是已知的第一种概率分类器,它由所依据的方程式而得名[4-6]。朴素贝叶斯分类器是机器学习一个特别质朴而深刻的模型[7-8]:当你要根据多个特征而非一个特征对数据进行分类的时候,可以假设这些特征相互独立(或者你先假设相互独立),然后利用条件概率乘法法则得到每一个分类的概率,然后选择概率最大的那个作为机器的判定[9-10]。

给定一组训练数据集{(x1,y1),(x2,y2),…,(xm,ym)},其中,m是样本的个数,每个数据集包含n个特征,即Xi=(xi1,xi2,…,xin)。类标记集合为{y1,y2,…,yk}。设p(y=yi|X=x)表示输入的X样本为x时,输出的y为yk的概率。假设现在给定一个新的样本x,要判断其属于哪一类,可分别求解p(y=y1|x),p(y=y2|x),…,p(y=yk|x)的值。哪一个值最大就属于哪一类,即求解最大的后验概率arg maxp(y|x)。具体求解方式,根据贝叶斯理论有:

(11)

一般的,朴素贝叶斯理论假设各个特征之间是相互独立的,则上式可以写成:

(12)

由于式(12)的分母,对于每一个p(y=yi|x)求解都是一样的,所以实际操作中可以省略。最终,判别公式变为:

(13)

2.2 分类过程

在提取到视频的颜色、亮度以及纹理特征之后,然后进行基于朴素贝叶斯分类器的视频分类。对于输入的几种特征,采用极大似然估计。在朴素贝叶斯法中,学习就是意味着估计先验概率p(y)和条件概率p(x|y),然后根据先验概率和条件概率,去计算新的样本的后验概率p(y|x)。

其中,在先验概率p(y)的极大似然估计如下:

(14)

假设输入样本的第个特征的可能的取值集合为{αj1,αj2,…,αjsj},则条件概率p(x(j)|y=yi)的极大似然估计如下:

p(x(j)=αjl|y=yi)=

(15)

3 实验结果

提出的视频分类方法的实验流程如图1所示。具体的实验步骤为:

图1 提出的视频分类方法的实验流程

(1)通过网络搜集5种体育项目的运动视频,分别为篮球、足球、斯诺克、蹦床、网球,图2所示为5种项目的视频帧图像示例;

(2)使用MATLAB 2017将所有视频帧的分辨率统一调整为400×370;

(3)在Windows XP下,利用VC++6.0进行编程,对视频图像进行特征提取,提取纹理、颜色以及亮度三种特征;

(4)将3种不同的特征进行融合,采用极大似然估计,直至完成最终的分类过程;

(5)输出分类结果。

5种不同运动项目的训练集和测试集的视频帧数、来自比赛场次情况如表1所示。

表1 几种运动项目的视频数据集情况

如图3所示为足球运动视频中的目标提取结果示例,从图3中可以看出,运动目标较少和较多时,提出的方法均可有效提取出运动目标。

图3 足球运动视频中的目标提取结果示例

最终的分类准确率如表2 所示,其中对篮球、足球、斯诺克等5个运动项目均取得了90%以上的分类准确性,由此验证了提出的分类方法的可靠性。

表2 不同项目视频的分类准确率

4 结论

朴素贝叶斯分类器是分类算法集合中基于贝叶斯理论的一种算法,本文提出了一种基于朴素贝叶斯分类器的视频分类方法。对视频进行特征提取,提取纹理、颜色以及亮度三种反映其类别的特征。在提取到视频的颜色、亮度以及纹理特征之后,然后进行基于朴素贝叶斯分类器的视频分类。对于输入的几种特征,采用极大似然估计,直至完成最终的分类。实验结果表明,对篮球、足球、斯诺克等5个运动项目均取得了90%以上的分类准确性,提出的视频分类方法取得了较为准确的分类结果,证明了提出的方法的有效性。

猜你喜欢
贝叶斯朴素分类器
学贯中西(6):阐述ML分类器的工作流程
隔离朴素
基于贝叶斯定理的证据推理研究
基于贝叶斯解释回应被告人讲述的故事
基于朴素Bayes组合的简易集成分类器①
朴素的安慰(组诗)
他是那样“笨拙”和朴素——30多年后,我们为什么还需要读路遥?
最神奇最朴素的两本书
一种自适应子融合集成多分类器方法
租赁房地产的多主体贝叶斯博弈研究