李东璐 四川大学计算机学院
随着科技的发展和人民生活水平的不断提高,智能化产品已经大量融入人们的工作生活。当今的许多工厂拥有一系列生产线,大量的工人在自己的负责区完成重复性工作,如何保证工人效率和产品合格率是工厂最关注的问题。雇佣监工会浪费财力和人力,并且不能够保证客观公正;工人们的工作成果是否符合要求只能通过最终产品检验得知,效率低下。基于上述社会问题,目标行为跟踪分析对流水线工厂的意义十分深远。
人体行为分析的流程大致可以分为3个步骤:检测出视频中的运动人体,再进行运动特征提取建立模型,最后通过分类器进行行为描述和识别得到结果。
运动特征的提取简单来说就是从视频或者一组图像序列中提取出是计算机可以理解的信息,便于之后的数据分析。运动特征包括常用特征量和复杂背景量,其中常用特征量通过复杂度(人体边界像素数与人体总像素数之比)、长宽比(人体最小外接矩形的长宽比)和紧凑度(人体像素和外接矩形内像素的比值)因素确定。首先可通过背景减图和目标跟踪算法识别出运动的人体,进行特征提取时,需要保证特征具有易于提取、较小的冗余、特征之间较强的独立性、不同类别对象的特征值区别大的特点。复杂背景量是考虑到在背景比较复杂并且在变化的情况下人体可能与之有较大的相似性,从而对特征提取的结果干扰较大。所以目前比较流行的有以下几种算法。
2.1.1 帧间差分
因为相邻帧的背景都有很大的相似性,所以通过比较相邻帧提取运动的人体,有效避免了复杂背景的干扰。
2.1.2 局部投影算法
当要识别的目标占据了画面的绝大部分,此时一些自然物体类似经过的动物,被风吹动的树枝等很容易影响特征提取,通过局部区域划分和运动矢量的估计,得出较为准确的全局运动矢量。
行为分析最基本的两个问题是行为描述和行为识别;其中行为描述可基于图像底层或高层人体结构;。行为描述与识别可基于模板匹配和状态空间的方法,通过对系统输入的运动特征及采样数据进行对比分析,输出相应的分类识别。
行为识别最关键的问题在于如何从输入的大量样本中获取行为参考序列,并且学习和匹配行为序列可以处理相似运动特征的微小变化。目前较为常用的有以下几种算法
2.2.1 基于低层图像信息的模板匹配算法
低层图像信息就图像本身携带的信息,包括人体轮廓,运动轨迹,速度,光影特征等,其获取方法简单,所以这种算法一直以来都是行为描述的一个重要方向;但的是它具有一定的局限性,一般用于有规则的行为识别。
2.2.2 基于高层人体结构的行为描述算法
高层人体结构信息是指人的结构呈现的姿势,与低层图像信息相比可以更加精确恰当地描述行为。根据运动的模型不同,还可以继续分成:点模型,二维平面模型,三维立体模型;其中较为重要的算法二维平面模型中的基于freeman链码的人体描述算法。首先给出freeman链码的定义:用曲线起始点的坐标和边界点方向代码来描述曲线或边界的方法,它将线状地物或区域边界,由起点和一系列在基本方向上的单位矢量,给出每个后续点相对其前继点的方向编码表示。由于人体行为具有一定的周期性,所以该算法采用标准化的人体行为轮廓的拐点序列等技术,计算得出人体罗阔气点及去西安方向,进而及孙处人体轮廓曲线拐点间的夹角序列和长度序列,进行轮廓匹配的出结果。经实验证明,基于freeman链码的人体行为描述可以快速的对行为动作进行特征提取,所提取的特征能有效的代表其对应行为且能够被有效的识别,在人体行为分析方面具有一定的参考价值。
流水线工厂工人人数较多,且有明显的动作周期性,通过人体行为识别技术可以极大提高工厂监管效率,并且能公正合理地提供一个较为清晰的执行标准,可提高员工积极性与工作专注力;对于机器故障损坏也可以及时发现抢修,提高整个工厂的工作效率和质量;可以做到有效防范意外事故的发生,对整个社会都有十分积极地影响。