基于大间隔最近邻算法的人类活动识别研究

2020-05-11 12:24王丽晓

数字技术与应用 2020年2期

王丽晓

摘要：随着社会的不断发展，人工智能越来越深入的融入到人们的生活，而人工智能的一个应用智能家居大大提高了人们的生活水平。智能家居中最重要的部分就是人体安全监控，而这一技术的核心就是人类活动识别。传统的识别技术速度慢、精确度低，而度量学习能很大程度改善传统人类活动识别技术的不足。本文研究的是将大间隔最近邻应用到人类活动识别中以提高识别效率。

关键词：大间隔最近邻;人类活动识别;度量学习

中图分类号：TP391 文献标识码：A 文章编号：1007-9416（2020）02-0091-02

人工智能的核心是机器学习，而机器学习结果的好坏取决于对未知事物的分类精度，而在进行分类的过程存在着数据之间相似性的比较，传统的相似性对于特定的相似性需求往往得不到好的效果，这就导致了度量学习的出现，得到一个比较实用的相似性比较标准。本文选用的度量学习算法是大间隔最近邻，下面是论文的具体内容。

1 大间隔最近邻算法

大间隔最近邻算法（LMNN）是基于K-近邻分类的马氏距离度量。LMNN算法的最后结果是一个训练马氏距离，该度量能使距离目标数据最近的K个数据属于同一类，使与目标数据不同类的样本尽量远离。算法的思想来源于对稳定的K-近邻分类的两个简单的考虑。一方面，每个训练输入数据应当与其k个最相近的数据具有同样类别;同样的，具有不同类别的训练输入样本应当使其尽量远离训练数据。算法训练的最后结果是训练得出样本数据上的线性变换矩阵，经过该矩阵转换后的样本数据可以满足上述两方面的要求。在实际运行过程中，这两方面的要求时通过两个函数表达式来表达的。一个表达式是处理与目标数据具有相同类别且距离较远的，经过表达式的变化使距离变小;另一个是处理与目标数据具有不同类别且距离较小，处理后使其远离目标数据。这里有个问题，就是“大”和“小”的标准，此时需要引入新的概念来定义“大”和“小”。

2 算法介绍

2.1 朴素贝叶斯（NB）

朴素贝叶斯法是一种基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集，首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型，对给定的输入，利用贝叶斯定理求出后验概率最大的输出。因此，朴素贝叶斯需要得到帧被标签为标签的概率。

2.2 1-近邻（1NN）

1-近邻是k-近邻的一种特殊情况。K-近邻算法是一种基本分类与回归的方法，它的输入为样本的特征向量，可以对应到特征空间;输出为样本的类别，实现对样本的分类。K-近邻假设了一个给定的训练数据集，其中实例类别是已定的。对其进行分类时，对于新的实例，根据其K个最近邻的大多数的表决来决定新实例的类别。运用到试验中就是K-近邻分类器通过在训练数据中找到距目标数据最近的数据并将类别从邻居传播到目标数据来为每个目标数据分配类别。

2.3 伴随有拒绝任务的1-近邻（1NN-M）

伴随有拒绝任务的1-近邻是在1-近邻的基础上对数据的选择设置了一定的范围，合格范围是距目标数据R宽的圆形范围，超出圆形范围的数据和别忽视。如果在R的范围内没有目标邻居出现，我们就认为目标数据 “未观察到”。那么目标数据的标签将由所有“为观察到”的数据中找到距离它最近的数据，由大多数的这个数据的类别决定目标数据的类别。考虑到需要在度量学习之后进行拒绝处理，那么需要我们手动选择拒绝半径，以在辨别和拒绝任务上实现同等的准确度。拒绝半径可以通过交叉验证的方法来选择，以实现识别和拒绝任务之间期望权衡。

2.4 带有大间隔最近邻算法的1-近邻（1NN-R）

LMNN算法简单介绍如下。

LMNN算法学习了一个马氏距离D：

（2-1）

LMNN的目标是训练得到一个空间转换矩阵——最大化不同类别数据间的距离，并且最小化相同类别数据间的距离：

最小化：

目标函数：

（2-2）

是一个二进制数，其值表示和是否同类，也是一个二进制数，其值表示是否是同类中选中的最近邻，是松弛变量。在目标函数中，第一项最小化所有训练样本与其所选择的近邻之间的距离。第二项最大化所有样本中（通过松弛变量）相同标签样本和不同标签样本之间的间隔。

LMNN训练样本数据最终得到一个空间转换矩阵，其目的是使查询数据按照我们的要求变换，我们可以通过选择转换后的k个与目标数据最近的样本数据的类别来定义目标数据的类别。通一般情况下我们设置k=3。

3 样本介绍

本文的实验用到了2个公开的数据集，Weizman数据集和由论文提供的两个样本集中其中一个样本集及Kernel1样本集。下面简单介绍一下样本集的情况。

Weizman数据集是由9个演员演示10个活动形成标签序列与3个额外的序列共93（9×10+3）个独立动作序列用于训练度量模型和评估分类精度。

Kernel1数据集包含由8个演员做14个活动形成的532个数据序列，仅从一个角度拍摄的。

4 评估规则

为了表达分类的效果，我们需要一个评价规则来描述分类效果，这个就是我们说的评估规则。将数据集分成两部分及训练是数据集和测试数据集，训练样本集用来训练目标度量，测试数据集用于测试訓练结果。对于测试样本集来说，训练结果将数据正确分类的数量n与测试样本总数N的比值就是我们要的测试结果。本文的分类正确率计算由下面公式计算：

具体的评估规则如下：

规则1：查找样本集中某一个演员的所有序列的。

规则2：查找样本集中所有与查询序列动作和演员都匹配的序列。

规则3：查找查询的数据。如果演员一个动作只做一次，那么该规则与与规则2相同。

規则4：查找测试集中与查询动作相同的所有数据。

5 实验结果

NB、1NN、1NN-M和LMNN算法在Weizmen数据集和Kernal1数据集在上的运行结果分别如表1、2所示。

分析在Weizmen数据集实验数据，可以得到下面分析结果。NB、1NN和1NN-M算法的平均识别精度分别是93.84、95.71和97.58，通过计算我们可以看出应用LMNN算法的识别精度相较于NB精度提高了3.74，相较于1NN精度提高了1.8。从有拒绝任务的实验结果中可以得到1NN和LMNN的平均识别精度分别是84.72和90.4，LMNN相较于1NN精度提高了5.68。

分析在Kernal1数据集实验数据，可以得到下面分析结果。NB、1NN和1NN-M算法的平均识别精度分别是97.06、97.37和98.39，通过计算我们可以看出应用LMNN算法的识别精度相较于NB精度提高了0.31，相较于1NN精度提高了1.02。从有拒绝任务的实验结果中可以得到1NN和LMNN的平均识别精度分别是8530和93.76，LMNN相较于1NN精度提高了8.46。

6 结语

从数据上看度量学习中大间隔最近邻算法确实在一定程度上提高了人类活动识别的精度，我们在以后的研究中还可以尝试其他的度量学习算法，将其应用于需要识别、分类任务的各个领域，以期待它更好的表现。

参考文献

[1] Veeraraghavan A，Chellappa R，Roychowdhury A K. The Function Space of an Activity[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition.IEEE Computer Society，2006：959-968.

[2] Weinberger K Q，Blitzer J，Saul L.Distance metric learning for large margin nearest neighbor classify-cation[J].Advances in neural information processing systems，2006，18：1473.

[3] Weinberger K Q，Saul L K.Distance metric learning for large margin nearest neighbor classification[J].Journal of Machine Learning Research，2009，10（Feb）：207-244.

[4] Do H，Kalousis A，Wang J，et al.A metric learning perspective of SVM： on the relation of LMNN and SVM[C]//AISTATS，2012：308-317.

[5] Khan Z A，Sohn W.Abnormal human activity recognition system based on R-transform and kernel discriminant technique for elderly home care[J].IEEE Transactions on Consumer Electronics，2011，57（4）.

Research on Human Activity Recognition Based on Large Interval Nearest

Neighbor Algorithm

WANG Li-xiao

（Zhengzhou Vocational College of Electronic and Information Technology， Zhengzhou Henan 451400）

Abstract：With the continuous development of society， artificial intelligence is more and more deeply integrated into people's lives， and an application of artificial intelligence in smart home has greatly improved people's living standards. The most important part of the smart home is human security monitoring， and the core of this technology is human activity recognition. Traditional recognition technology is slow and has low accuracy， and metric learning can greatly improve the deficiency of traditional human activity recognition technology. This paper studies the application of large-spaced nearest neighbors to human activity recognition to improve recognition efficiency.

Key words：large-spaced nearest neighbor; human activity recognition; metric learning

数字技术与应用2020年2期

数字技术与应用的其它文章: 一种炼铁熔融还原炉(SRV)配套热风炉系统的自动控制实践; 基于PLC技术的电气工程自动化控制应用; 基于PLC控制系统的转炉炼钢关键设备性能提升优化实践; 机械制造产业中数控加工技术的应用研究; PLC技术在电气工程自动化控制系统中的应用; 数控技术和计算机辅助设计在数控机床中的应用