基于SVM 和KNR 的体型分类算法

2020-03-24 03:49先诗亮刘本永
智能计算机与应用 2020年11期
关键词:体型聚类函数

先诗亮,刘本永

(1 贵州大学 大数据与信息工程学院,贵阳 550025;2 贵州大学 智能信息处理研究所,贵阳 550025)

0 引言

在行人识别领域,目前比较成熟的技术主要是人脸识别,但是人脸识别容易受到表情变化、光照条件,面部遮挡物的影响。因此,如果将被识别对象的体型特征(比如矮胖、高瘦等)加以利用,可以很好地弥补人脸识别的缺陷。许多学者对体型测量展开了研究,并取得了很大进展。

这些功能的背后是市场化在发挥作用。市场化有两个基本要素:一是交易行为各方完全自愿;二是交易价格遵从约定或随行就市,没有任何其他外力的任意干预,即完全的市场化。失去市场化这个前提,不仅各类金融基础产品的经济价值和风险价值变得扭曲,围绕这些基础产品所衍生的金融产品的价值也会变得扭曲,金融市场的功能和效率将大打折扣。

基于图像的体型测量方法主要分二种:一种是立体视觉方法[1-2],一种是单目测量方法[3]。立体视觉法需要进行三维重建来实现测量,其主要步骤是图像匹配、摄像机参数标定。单目测量法避免了图像匹配、相机标定的难点。Criminisi[4]等首先提出未标定图像的视觉测量理论,利用图像的消失点和消失线信息,以及映射变换中共线四点形成的交比不变性的性质,推导出度量信息之间的比例关系。此后,Peng[5]等人提出以场景中的规则物体建立欧式坐标系,以便测量其几何量的方法。根据投影几何中的约束关系,以及共线四点交比不变的性质,建立约束方程求得目标的高度。但该方法仅能准确测量规则物体的长度。

国内二铵市场持续整理,云南地区市场持续以出口为主,企业当前集中供应出口订单,内销量较少。东北地区有小范围成交价格在2950元/吨,但因货源紧张,企业惜售心态明显,当前暂未有大面积成交出现。西南地区64%二铵市场报价在2600-2650元/吨,湖北地区64%二铵主流出厂报价在2700-2750元/吨。西北地区64%二铵出厂报价为2800元/吨。华东地区64%二铵主流出厂报价2650元/吨。

与基于图像的测量方法相比,基于视频的体型测量方法不仅可以利用视频的运动信息,还可以对每帧的测量结果进行概率统计,提高测量的精度。董秋雷[6]等人采用混合高斯模型提取头顶点,根据几何约束计算垂足点,结合投影矩阵求出人体高度。Park[7]等人根据前景区域的主轴线和前景区域的交点计算头顶点、垂足点,根据摄像机参数和投影矩阵求出人体高度。以上方法都需要事先进行相机标定。姜明新[8]等人提出一种为未标定视频下的人体身高测量方法,通过构造虚拟水平面和虚拟垂直线来提取特征点,完成身高测量。

以上体型测量方法虽都能较准确的得到人体身高,但是求解过程都比较复杂。有些场景下,并不需要准确的身高数据,而高瘦、矮胖这样的体型特征或许更有用处。基于此,本文研究了一种基于人体宽高比的体型分类算法,将体型分为正常、矮胖、高瘦3 类,并尝试将核非线性表达器[9](KNR)用于实现体型分类算法,并在相同条件下,与支持向量机[10](SVM)的分类性能作对比。

1 支持向量机(SVM)

支持向量机是一种结构风险最小化的统计学习方法,是基于分类边界的方法。若给定一个具有N个输入/输出对的训练集:

传统的线性回归估计线性函数Y=WTX+b是通过最小二乘估计的方式实现的,其表达式为:

教师要自觉提高自身的思想道德品质。在思想上,教师要树立科学的世界观,积极的人生观,正确的学生观和崇高的职业理想。在政治上,教师热爱祖国,热爱教育事业,贯彻国家推进校园足球的政策。在道德上,遵守法律法规,遵循教师职业道德规范,爱岗敬业,关爱学生。

其中,xi∈X、yi∈Y,X为训练样本的输入集,Y为训练样本的输出集。

线性回归估计适用于样本能够线性分离的情况,但在实际应用中很多样本是不能够线性分离的。为了得到更好的结果,支持向量回归通过非线性映射φ,将数据X映射到一个高位特征空间F中,使得φ(X)在特征空间F中具有很好的线性回归特性。首先在该特征空间中进行线性回归,然后返回到原始空间中。支持向量回归可以通过最优化问题来解决:

高校内部各项软硬件设施的建设,其最主要的目标,是要满足整体工作需求,包括教学工作与管理工作。但与发达国家的高校相对比,我国高校的基础建设依然体现出落后的趋势,后勤信息化管理平台的建设与更新也不到位。但是高校后勤管理是一项内容复杂、贯穿全程的综合性管理工作,服务的范围广、数据分散难以收集,且关联多个部门,因此如果没有先进的技术与设施,管理目标是无法达成的[2]。

(4)利用findcontour 对新轮廓图进行轮廓检测,画出主躯干的边框,如图3 所示;

使用Lagrange 乘子法,得到式(3)的对偶形式:

其中,k(xi,xj)=<φ(xi),φ(xj)>核函数。常用的核函数有线性核、多项式核、高斯核等。核函数可以将m 维高维空间的内积运算,转化为n 维低维输入空间的核函数计算,从而解决了在高维特征空间中计算的维数灾难等问题,为在高维特征空间中解决复杂的回归问题奠定了理论基础。最终,可得出如下回归函数:

2 核非线性回归(KNR)

假设拟合函数所属空间为再生核Hilbert 空间,xi为第i个训练样本,x为测试样本,定义其对应的核函数如式(8):

通过3.1 节的处理已获得每张图片的主躯干的长度和宽度,将7 500 张图片主躯干的宽度和长度比值进行聚类,其目的是将体型数据分为正常、高瘦、矮胖3 类。聚类所用参数见表1。

(3)保留μ+σ和μ-σ的列数,其余列的像素全部置为0,得到一个新的轮廓图;

式中,M为原图像像素点的总数;a为系数向量。由最小二乘准则估计a,如式(10):

(2)健康教育:患者对自身病情的不了解会导致患者产生恐惧心理,护理人员应该通过分发健康宣传手册和直接讲解的方式,让患者从专业的角度认知自身的病情,增强治愈的信心。

其中,T表示向量或者矩阵的转置,+则表示矩阵的MoorePenrose 广义逆,并且K中的第i行第j列的元素为:

另外,英国和美国之间还有一些明面上的文化差异,比如“floor”一词在虽然在书写上没有差异,但在两国之间的发音和意思却截然不同,在英国“the ground floor”为“一楼”的意思,“the first floor”为“二楼”;而在美国,“一楼”的表达为“the first floor”,“二楼”则表示“the second floor”与英国的表达正好差一层。这些基本的知识细节,在教学中笔者都曾告知学生注意。

除了社区调查,研究人员还访问了国家林业局昆明堪察设计院、云南省社会科学院、普达措国家公园管理局、普达措森林生态旅游公司、香格里拉红坡村委会、西双版纳热带雨林国家公园管理局及其下辖的五个景区运营公司,以及怒江大峡谷国家公园管理局。

3 实验及结果分析

本实验采用中科院的CISIA-B 数据集,该数据集由124 人的二值轮廓图组成。其中每个人有3 种形态(背包、穿夹克、正常),每一种形态有十一个角度(从00,180,360,...,1800)。本文选取了数据集中所有人正常形态的00二值轮廓图,共计7 500张图片,每张图片的分辨率均为240*320。算法流程如图1 所示。

图1 算法流程Fig.1 Algorithm flow

3.1 人体主躯干轮廓检测

轮廓检测指在包含目标和背景的数字图像中,采用一定的技术和方法来实现目标轮廓提取的过程[11]。常用的轮廓检测算法是Opencv 中的findcontour。该算法核心是确定二值图像外边界、孔边界之间的层次关系,找到最外围的边界,然后用边框将该边界画出。本文为了减少手臂的摆放、衣着对体型的影响,采用如下步骤完成:

(1)对原始二值轮廓图的每一列进行遍历,统计每一列非零像素的数量,得到一个像素数与列的关系,如图2 所示;

(2)对像素数非零的所有列求均值μ和方差σ;

2.3.3伴栽方法一般用活动菌床法,选择质量符合要求(7~8月培养的直径8~12厘米)的菌材(海拔1 200米以上的松木树培养菌材)运到栽培现场。将栽培场地岩土挖开扫平,垫一层50厘米厚的干净河沙,上面撒一层枯枝,落叶,菌材顺坡排放,间距3厘米,排完后,用砂填平菌材,埋菌材一半时,垫平间隙填砂,将种麻放于菌材两侧的空隙中,每个种麻相隔15厘米,菌材两侧各放一个,最后用砂厚盖,厚度为10厘米,完成栽培,米麻是撒布于菌材间,其他相同。

其中,ζ为不敏感值,ε,为松弛变量,表示ζ带的上界和下界,所有在ζ带内部的样本点(xi,yi)都不是支持向量;C 为代价函数,l为支持向量的个数,WTW为正则化项,主要是为了防止过拟合现象的发生。

(5)得到主躯干宽度和高度,计算宽高比。

图2 像素分布Fig.2 Pixel distribution

图3 原始图与主躯干效果图Fig.3 Original image and body main contour image

3.2 Kmeans 聚类

Kmeans 聚类是一种无监督学习算法,其思想是在给定的样本集,按照样本之间的距离大小,将样本划分为K 个簇,让簇内的点尽量紧密的连在一起,而使均方误差最小,同时簇间的距离尽量的大[12]。

最早实行导师制的是英国牛津大学,时间可以追溯到14世纪,几百年来,牛津大学通过实行导师制培养出许多诺贝尔奖获得者,同时英国历史上的多名首相也毕业于牛津大学[2]。随后,本科生导师制开始在世界各大高校中逐渐应用。在我国高校中,本科生导师制起步较晚,最早是在1938年浙江大学实行。新中国成立之后,由于政治原因,本科生导师制被逐渐放弃,被苏联教育模式的学年制慢慢取代,并且一直沿用到今天。

其中,k为核函数,则拟合函数f(x)有多个核函数叠加而成,表示如式(9):

表1 聚类过程Tab.1 Clustering process

聚类结果如下:

冬林,认识你,我要感谢多年好友张笑天先生。那年,身为吉林省作协主席的张笑天,带了一批拟评上首届吉林省文学奖的文学作品,进京请雷达、李敬泽、白烨,以及笔者再研究一下。我们审读后一致认为胡冬林的《青羊消息》为最佳。第二年全国第一届环境文学评奖终审会上,我发现竟没有《青羊消息》,便向主持评奖的全国人大环境与资源保护委员会主任委员曲格平先生指出,这次评奖漏掉《青羊消息》是很大的遗憾。会上,同任环境文学奖评委的雷达、李敬泽同意我的看法。根据评奖规则,有三位终评委同时提议、推荐,便可列入评议对象。包括王蒙在内的全体终评委看了《青羊消息》,便一致同意该作品荣获首届环境文学奖。

第一类的聚类中心:018,含有2 122 个宽高比数据;第二类的聚类中心:0.20,含有3 821 个宽高比数据;第三类的聚类中心:0.22,含有1 557 个数据。

为了方便验证本文的分类算法,采用五折交叉验证法:

在第一类的2 122 个数中选取2 000 个数据,在第二类的3 821 个数中选取3 500 个数,第三类的1 557 个数中选取1 500 个数,将以上取出的3 组数据均分为5 等份,并随机取一组作为测试集,其余4 组用作训练集展开多次实验。

3.3 KNR(核非线性回归)分类器训练

KNR 分训练阶段和测试阶段,整体的训练流程如下:

(1)本文采用高斯核,确定核函数k的形式;

(2)高斯核函数关键参数σ的估计;

(3)利用每类体型数据的训练样本及核函数,按照式(11)构造核矩阵K,并根据式(10)计算对应的系数矢量α;

(4)给定一个训练样本x,将其输入到每类KNR 分类器中,根据式(9)计算每类的输出,取输出值最大的分类器所对应的类别作为x的分类结果。

根据3.2 节可知,3 种类别都有5 种不同数据集,为了更加明显的和SVM 比较分类效果,需估计出每一种数据集性能较理想的σi(i=1,2,3,...,15)。σ的估值过程为:首先,将σi的初始值σi0取为训练样本的方差,然后按照式(10)和式(9)分别求出相应的的K和α,根据测试样本可得到αi0下的准确率;将σi的值从0.2σi0开始,按照相隔0.1σi0的增值规律增加到2σi0,统计对比相应的识别率。当取到最高识别率(见表3)时,得到的最佳σ估计值见表2。

表2 σ 的最佳估计值Tab.2 The best estimate of σ

3.4 KNR 与SVM 的性能比较

为了与SVM 进行比较,SVM 也采用高斯核,并且使用相同的训练和测试样本,同时其σ取表2 中每一类经过多次实验后得到的均值,即0.33,0.27,0.47。将3 类的训练集和测试集样本送入SVM 中,得到的准确率对比结果见表3。

表3 KNR 和SVM 准确率对比Tab.3 Comparison of accuracy between KNR and SVM

实验结果表明,在本文研究的三分类体型任务中,KNR 的平均识别率总体上好于SVM,证明了KNR 用于多分类问题的有效性。

4 结束语

本文利用人体主躯干宽高比来描述体型,通过对轮廓进行处理,提取到了人体主躯干数据,尽可能地消除了手臂、衣着对宽度测量的影响。作为一种尝试,将KNR(核非线性回归)用于体型分类中,并与SVM 进行了性能对比。从实验结果可以看到,KNR 得到了满意的识别率。如何在该分类算法基础上,实现异常体型的检测,则是未来工作需要进一步解决的问题。

猜你喜欢
体型聚类函数
一种傅里叶域海量数据高速谱聚类方法
一种改进K-means聚类的近邻传播最大最小距离算法
校车连体型主动式安全气囊保护效果的研究优化
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法
科学家发现体型比手机还小的恐龙化石
体型最小的猫,竟然是个恐怖的大胃王
关于函数的一些补充知识
高中数学中二次函数应用举隅オ
基于Spark平台的K-means聚类算法改进及并行化实现
无独有偶 曲径通幽