杜明坤 王茜仪 朱瑞
摘要:为减少利用足迹人工计算身高的误差,提高身高分析的效率和准确性,探索利用赤足迹多个长宽特征和BP神经网络自动分析身高的新方法。通过测量赤足迹获得多个长宽测量值,将多个测量值及其不同组合作为特征向量,以人的身高作为训练样本和测试样本的标签,并利用BP神经网络进行训练和分类,实现对身高的自动分析。实验结果表明,该方法可以有效对身高进行自动分析,比传统方法具有更高的准确率,为利用完整赤足迹甚至残缺赤足迹分析身高提供了新思路。
关键词:赤足迹;BP神经网络;长宽特征;身高;自动分析
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2019)31-0203-03
1引言
在实际工作中,通常根据现场勘查提取的足迹推算身高,以提供侦查线索,缩小侦查范围,对案件的侦破具有重要作用。传统分析身高的公式是“身高=赤足迹长×7”,其操作简单易于计算,然而其推算身高的误差较大,且赤足迹全长的系数过大,在测量其长度时,稍有误差就可能导致推测的身高与实际身高相差较大。本文对赤足迹各长宽特征进行研究,对其进行测量获得多个长宽测量值,将相应的测量值组合成不同的特征向量,再根据设置的误差值将身高等分为多个区间,对每个区间进行赋值作为不同类别的标识,利用BP神级网络对训练样本特征向量和其相应的类别标识进行训练,得到身高分类器,通过分类器对测试样本特征向量进行分类,推算其相应的身高,并比较不同特征向量在设置不同误差值时的准确率,为利用完整赤足迹甚至残缺赤足迹分析身高提供了更有效的新方法。
2特征提取
根據赤足迹的形态结构特点,本文主要利用赤足迹的多个长宽值来进行特征提取,获得不同的特征向量,并用测量人的身高作为相应特征向量的初始标签。测量的身高值由头顶部与地板的垂直距离确定(在弗兰克福水平面上头的最高点),同时用于测量的赤足迹样本通过油墨捺印获取,即让占有油墨的赤足通过行走将赤足迹遗留在纸张上。
2.1测量长宽值
在测量多个长宽值之前,需要先标记出赤足迹的多个特征点:跖内缘最突点;跖外缘最突点;跟内缘最突点;跟外缘最突点;跟后缘最突点;最长趾前缘最突点;第二趾中心点。在此基础上确定足迹中心线,然后测量相应的长宽值。
如图1所示,A点为跖内缘最突点,B点为跖外缘最突点,c点为跟内缘最突点,D点为跟外缘最突点,E点为跟后缘最突点,F点为最长趾前缘最突点,G点为第二趾中心点,H点为过F点作EG延长线的垂线的交点,I点为EG延长线与第二趾前缘的交点,J点为EG与足趾前缘的交点,其中足迹中心线为E和G两点的连线。每个赤足迹的长宽特征需要测量以下4个值:AB
3BP神经网络
BP(Back Propagation)神经网络是Rumelhart、Williams、Hin-ton和McCelland等人的科学小组于1986年提出的概念,是一种按照误差反向传播算法训练的多层前馈神级网络,是一种有监督的导师指导的学习方法。BP神经网络模型主要由三层组成,分别为输入层、隐含层和输出层,隐含层可为一层或者多层,每层网络都由多个能够进行并行计算的神经元构成,其网络结构如图2所示。
BP神级网络的学习过程由信号的正向传播和误差的反向传播两个过程组成M,如图2所示,实线表示信号的正向传播,虚线表示误差的反向传播。
其中Ei为第i个训练样本的误差,tji为第i个样本的第j个输出层神经元的的期望输出。在正向传播过程中,预设e为期望误差精度,当符合全局误差E≤e时,则终止当前运算,否则进行误差反向传播过程。
误差反向传播误差是指通过正向传播得到的实际输出与期望输出之间的差值由输出层输入,经过隐含层变换,最后传到输入层,在这一过程中,网络的连接权值不断被调节修正。为使误差逐渐缩小,需要沿连接权值的负梯度方向进行修正,隐含层和输出层的连接权值修正量△Mjt与误差的负梯度方向成正比,如公式(4)所示。
BP神经网络算法也可以说是对误差函数求极小值的算法,在正反两个过程反复运算中,不断调整修正每层的连接权值和阈值,并比较全局误差E与期望误差精度e的大小,当满足全局误差E≤e时,则训练完成,并保存相应的权值和阈值,否则继续进行迭代训练。
4基于赤足迹长宽特征的身高自动分析方法
在身高自动分析方法中,本文有效利用赤足迹的多个长宽特征信息,提取样本不同的特征向量,再通过预设的误差值将身高等分为多个区间,对每个区间进行赋值作为不同类别的标签,根据每个样本的身高所对应的身高区间为其赋值新的类别标签数据,最后结合BP神经网络算法对样本进行训练和分类,以提高身高分析准确率。
对于w个样本(xi,yi),将其按照一定的比例划分成训练样本集P和测试样本集Q,分别记为(pxi,Pyi)和(Qxi,Qyi)。利用BP神经网络在训练样本集P上进行训练,获得分类器,再将分类器在测试样本集Q上进行分类测试,获得身高分析的识别结果,具体步骤如下:
(1)构建初始网络,将各个连接权值、阈值、期望误差精度和学习率进行初始化,并对训练样本集进行归一化处理,使其转化为直接用于计算的训练样本数据和期望输出。
(2)将标准化后的训练样本输入BP神经网络,通过各层神经元进行正向传播运算,得到网络的实际输出。
(3)根据网络运算的实际输出与给定的期望输出计算得到网络误差,然后对网络误差是否满足期望误差精度的要求进行判断,如果满足要求执行(5);否则执行(4)。
(4)进行反向传播运算,计算出每层各个神经元的连接权值修正量和每层神经元的阈值修正量,然后对相应的连接权值和阈值进行修正,再返回(2)。
(5)训练完成,得到分类器。
(6)对测试样本集进行归一化处理,利用分类器对其进行测试,得到输出结果,再对输出结果进行反归一化,得到身高分析结果。
5实验结果与分析
为检验本方法的有效性,将不同特征向量结合BP神经网络算法与传统分析身高方法“身高=赤足迹长×7”在身高误差=1△1=1分析身高-实际身高1≤ri时分别进行比对分析。按照训练样本数量与测试样本数量比值为8:1的原则,在样本集中随机选取训练样本和测试样本,进行多次实验取均值作为实验结果。
由表1可以看出,用特征向量结合BP神经网络的方法均比传统方法分析身高精确度更高。在身高误差小于1cm时,利用赤足长(X1)+BP神经网络分析身高的准确率最高(33.4%),传统方法仅为8.3%。在身高误差小于2cm時,利用赤足长和足跖宽(X6)+BP神经网络分析身高的准确率最高(49.5%),其次为赤足长(X1)+BP神经网络的方法(48.5%),传统方法仅为15.6%。在身高误差小于3cm时,利用赤足长和足跖宽(X6)+BP神经网络分析身高的准确率最高(65.4%),其次为赤足长(X1)+BP神经网络的方法(64.5%),传统方法仅为24.4%。在身高误差小于4cm时,利用赤足长(X1)+BP神经网络的方法分析身高的准确率最高(71.8%),传统方法仅为38.3%。在身高误差小于5cm时,利用赤足长(X1)+BP神经网络的方法分析身高的准确率最高(83.2%),传统方法仅为44.9%。在各个误差范围内,本文方法均比传统方法表现出了更高的分析准确率,在身高误差分别小于1cm、4cm和5cm时,利用赤足长(X1)+BP神经网络分析身高的准确率最高;在身高误差分别小于2cm和3cm时,利用赤足长和足跖宽(X6)+BP神经网络分析身高的准确率最高,其次为赤足长(X1)+BP神经网络的方法。
对于残缺赤足迹,在无法测量赤足足迹全长时,可根据本文方法采用赤足迹局部部位的长宽测量值提取特征向量,然后结合BP神经网络进行分析。例如,当赤足迹缺少足跟部位时,可以采用第二趾长和足跖宽(X8)+BP神经网络的方法;当赤足迹缺少足趾部位时,可以采用足跖宽和足跟宽(X8)+BP神经网络的方法。不论采用何种特征组合的特征向量,其分析准确率在不同身高误差范围内均高于传统方法,表现出较好的分析性能。
6结论
本文提出了一种基于赤足迹长宽特征的身高自动分析方法,根据赤足迹各长宽测量值与身高存在关联的特点,利用赤足足迹全长、第二趾长、足跖宽和足跟宽的测量值提取不同的特征向量,然后通过预设的误差值将身高等分为多个区间,为每个样本重新赋值新的类别标签数据,再结合BP神经网络算法对样本进行训练和分类,实现身高的自动分析。实验结果表明,本文方法在选择赤足长(X1)或赤足长和足跖宽(X6)特征向量时,其分析性能最好,且不管利用何种特征向量均比传统方法的分析准确率高得多,同时为利用残缺赤足迹分析身高提供了新方法。