郝文斌,王彬宇,苟瑞,朱佩佩,陈凯
(1.国网四川省电力公司成都供电公司,四川成都610041; 2.电子科技大学自动化工程学院,四川成都611731)
基于主成分分析与独立成分分析的热释电红外信号特征提取技术
郝文斌1,王彬宇1,苟瑞2,朱佩佩2,陈凯2
(1.国网四川省电力公司成都供电公司,四川成都610041; 2.电子科技大学自动化工程学院,四川成都611731)
提出一种基于主成分分析(PCA)和独立成分分析(ICA)的人与老鼠热释电传感器红外信号特征提取的方法。首先对采集到传感器数据进行去噪预处理,并使用FFT变换到频域分析。然后用主成分分析法提取频谱数据主要信息,降低数据冗余量,同时保留了99.95%以上原始信息。最后使用独立成分分析法提取统计独立的独立成分,并用峰度系数来描述人和老鼠的独立特征分量信息。实验结果说明:提取的特征量都能充分描述人与老鼠的实际信息,且人与老鼠的特征差异足够明显,为提取人和老鼠热释电红外信号的特征提供一个有效可行的方法。
热释电红外传感器;特征提取分类;FFT;峰度系数
在现如今社会中,热释电红外传感器(PIR)广泛应用于安防系统,其对光线光照条件要求不高且红外线穿透力强等特点,同时具有低功耗,低成本,隐蔽性好,体积小,对环境有较好的适应性等显著优点。
国内外众多学者都对红外传感器识别技术进行了大量研究,2006年韩国釜山国立大学研发了基于PIR阵列实现检测室内人员活动情况[1]。波兰的M.Kastek等设计了一种用于远距离红外辐射源检测的PIR探测器系统[2]。J S Fang等[3]使用PIR探测器对固定路径上来回行走的人体进行检测和辨识。程卫东等[4]采用PIR传感器对人体行走运动特征进行研究。王林泓博士[5]采用小波熵对人与狗的识别分类进行了有效研究。
本文采用单只PIR作为探测器,采集检测视角内人与老鼠的自由运动信息,并提出一种基于主成分分析和独立成分分析相结合,分析人与老鼠的释电红外信号特征的方法。
热释电探测器一般由热释电传感器、菲涅尔透镜与信号调理电路构成,如图1所示。热释电传感器基于热释电效应,将接收到的变化的温度信号转换成变化的电信号输出;菲涅尔透镜,一般有两个作用,一方面将视野范围内不同角度的红外光线聚焦到热释晶体上,增强电信号的输出;另一方面将探测器的视野范围分成明暗交替的区间,使人体视场移动时,形成变化的红外信号从而输出变化的电信号。由于热释电传感器输出的极为微弱的电信号(mV级),必须经过调理电路放大滤波去噪后,才方便对其处理。
图1 热释电探测器检测原理
图1中,人通过一个明区和一个暗区时,根据光学成像的几何性质,可以推出热释电输出信号的频率为
其中:v——人体的运动速度,m/s;
fb——菲涅耳透镜的焦距,mm;
S——热释电晶体的宽度,mm,标准的双元热释电晶体为1 mm;
L——人体至菲涅尔透镜镜面中心的距离,mm。
2.1 主成分分析原理
由于测得的时域波形信息不利于进行数据的深入挖掘,需要将采集到的数据进行去噪、标准化和FFT变换,将数据变换到频域分析。人和老鼠在频域上的特征直观上差异不明显,很难较好反映出人体和老鼠两者的特征差异;另一方面由于FFT得到频谱数据量较多,且冗余量较大,为了提高特征提取效率,频谱数据需要使用主成分分析进一步处理。
主成分分析是一种常用的基于变量协方差矩阵对信息进行处理、压缩和抽提的有效方法。主成分分析的目地是精简变量个数,去除冗余数据,用尽可能少的变量去表示观测到数据中的大部分信息,即将多个实际观测到的变量转换成尽可能少的互不相关的综合指标的统计分析方法。通过这种变换,可以有效解决观测到的原始数据变量之间的共线性,解决由此带来的运算数据量大且不稳定、矩阵病态等问题。主成分分析是将主成分表示为原始观测量的线性组合。
式中:Xj——原始数据矩阵标准化后得到的矩阵,方差为1;
fij——相关系数矩阵的特征值所对应的特征向量矩阵中的元素,i=1,2,3…n,n为相关系数矩阵的维数。
在确定主成分个数时,可以根据相关矩阵特征值的累计贡献率,选取适当的个数。
选取合适的主成分可以在降低数据维度的同时,将原始数据主要信息保留下来。但是由于主成分物理含义不明确,为进一步分析人和老鼠的特征信息带来了挑战,所以本文利用独立成分分析对原始数据信息进行进一步挖掘。
2.2 独立成分分析原理
独立成分分析(ICA)是盲源信号[6]分离的一种信号处理方法,其目的是把从多通道测量所得的混合信号分解为若干相互独立的成分,因此被分解出的诸分量更容易具有实际的物理或生物意义[7-8]。设无噪声的瞬时线性的混合源基本模型可表示为
式中:S——独立成分向量矩阵;
A——混合矩阵;
Y——观测混合信号源向量矩阵。
因为已知的仅有观测的向量矩阵Y,源向量矩阵S和混合矩阵A都是未知,故A与S的解都是不唯一。由上分析,独立成分分析法其实是寻找混矩阵W:
使得S的估计F尽可能独立。
根据目标函数的不同,实现ICA算法常用的有最大非高斯性法、极大似然估计法和最小互信息法等,Chein-I Chang以负熵作为衡量非高斯性的指标,提出了一种基于定点迭代的算法,称为FastICA算法,这种算法具有简单方便、收敛速度快和稳定性好等优点,它有并行计算和逐一计算两种计算独立成分的方式,后者容易产生误差积累,本文采用前者并行计算的FastICA。
2.3 数据特征提取整体流程
数据处理流程如图2所示。
图2 数据处理流程
峰度系数(Kurtosis)是用来反映频数分布曲线顶端尖峭或扁平程度的指标,用来度量数据在中心聚集程度,统计学中用四阶中心矩测定,计算公式为
其中:x——样本均值;
xi——样本值;
n——样本个数;
s——样本标准差。
峰度系数可以较好表征独立成分所包含的数据特征。通过独立分析法,人和老鼠的数据频谱特征分量被独立的分离出来,计算各个独立成分的峰度系数并进行比较,可以有效区分人和老鼠的特征差异。
在完成PIR的信号特征提取后,便可以送入分类器对特征进行分类。提取的特征差异性直接影响到分类器的性能,因此本文重点考察特征提取。
3.1 实验设置
实验环境尽可能模拟实际应用环境,实验系统检测装置为1个壁挂式PIR探测器(RE200B),向下倾斜角为13°,安装在离地面1 m高处,数据采集设备为一台示波器。实验时1人从探测器的视角内(5 m之内)以正常行随机速度和随机路径走过,采集数据75组,每组采集时间为24 s,采样频率250 Hz(6 000数据点),每组实验采集相互不影响;在进行老鼠实验时,由于野生老鼠行动难以控制,我们将老鼠圈在探测器前一个活动圈里,里面撒上一些食物,让老鼠在活动圈内自由活动觅食,同时尽量减少周围环境对老鼠的惊扰,老鼠的活动圈选取范围靠近PIR探测器,并且对PIR产生可观输出的最大范围圈,为距离墙角0.4 m,大约长1.3 m宽1 m的矩形活动范围(以充分研究老鼠的影响),采集数据75组,每组数据采集时间为24 s,每组实验采集相互不影响。
本试验中,去除一些因操作等其他原因造成的不合理数据后,采集到人体和老鼠各75组数据,随机抽取人体、老鼠各36组数据用于实验数据分析。
3.2 实验数据合理性分析
测得时域波形信息不够直观,分析过于复杂,无法准确进行数据深入挖掘,因此将采集到数据去噪、标准化后进行FFT变换,变换到频域分析,36组人体和36组老鼠频谱数据中随机抽取8组列出,如图3、图4所示(FFT变换后有6 000个点,频谱图中只画出了幅度不为0的点)。
图3 人体频谱图
图4 老鼠频谱图
因路径随机速度随机,人体和老鼠的频谱段相对集中在0~2 Hz频段,在实际试验中,人体活动范围最近时距离PIR探测器最近大约L=1 m,最快速度的大约为v=1.5 m/s(人正常速度约为1 m/s),假设在最近距离时速度也最大,菲涅尔透镜焦距为fb=10 mm,热释电晶体的宽度S=1 mm,则最大频率为:
频率最低时是缓慢移动且距离最远时,这时频率接近0;因此人体频率是分布在0~2 Hz是符合试验的。
老鼠自由活动觅食时,走走停停,速度时快时慢,实验观察出现最快速度时比人体稍快大约1.7m/s,假设这时距离也在最近处,则老鼠频率最大时为
实际中由于老鼠在围栏边缘时,围栏有一定高度遮挡,PIR检测到老鼠的Lr>1.08 m,同时在最近处速度也有可能不是最大,或者最大速度时距离也不是最近,故导致频率并未达到计算的2.5 Hz。
上述频谱图对比,可以初步看出,老鼠的频谱相对人体比较丰富,这也反映了移动热源穿过明暗区域时的路径和速度不同,由于老鼠走走停停,速度波动较大,而人在行走时,确定初速后一般速度不会波动太大,且行走路线相对老鼠而言也带有较强的目的性,一般都是从视角的一边穿越到另一边,而不同于老鼠,在视角内来回走动,因而老鼠相对人的频率要丰富些。
综上分析,将采集到的试验数据进行FFT变换后分析,完全符合且能反映实际实验情况,是合理有效的。但是在上图中这种频率幅值在丰富度上差距不太明显,很难反映出人体和老鼠两者特征差异,因此频谱数据需要进一步处理。
3.3 数据特征提取
数组数据每行标准化后得到36行6000列的数据矩阵,FFT变换后仍然得到36行6000列的频谱点数据矩阵,数据冗余量巨大,从上述频谱图中也可以得知,存在大量为0的频谱点,为了方便运算,需要使用主成分分析法将频谱点矩阵数据进行压缩,本论文根据累计贡献率选取了12个主成分,这样就将36维的矩阵降低到12维,维数降低2/3,精简大量的冗余数据,人体保留了99.98%原始信息,老鼠保留了99.95%原始信息。这一步处理实际上是采用主成分对数据进行精简处理,为独立成分分析打下基础。
采用主成分分析得到的12维新观测矩阵,对其进行独立成分分析,可以得到12个独立成分,数据特征被依次分离出来,这些特征是相互独立且具有物理意义的。人体和老鼠的独立成分如图5和图6所示。
图5 人体独立成分
图6 老鼠独立成分
由上图对比所示,独立成分的作用是提取分离主要特征,在这些人体特征比较强的频率点,会被提取分离出来,表现在提取的某个独立成分则为:在独立成分中,该频谱点峰值极高,得到强化,周围峰值较低,得到弱化,这个峰值差异越明显表征该点特征越强。而人的频谱成分没有老鼠丰富,所以人的频谱在某些频率点上的特征比较弱,因而在某个独立分量中,该频率点峰值与周围较低峰值相差不大,差异不够明显;另一方面老鼠比人的频谱丰富,特征性较强的频率点较多,分出的独立成分就表现为峰值差异比人较明显。
为了更好描述这些特征,即更好描述这些独立成分峰值差异,本论文采用峰度系数来衡量各个独立成分的特征差异。峰度系数是用来反映频数分布曲线顶端尖峭或扁平程度的指标。将人和老鼠的12个独立成分,分别求峰度系数,并与每个独立成分的峰值点所在的频率对应起来,制作成表格如表1和表2。
表1 人体频率峰度系数表
表2 老鼠频率峰度系数表
因老鼠的独立成分峰值分别对应前12个频率点,无法获得老鼠在此频率点之后其他频率点的特征情况,为了不引入人为误差,选取人和老鼠分别强化前12个频谱点的独立成分的峰度系数绘制峰度系数曲线。如图7所示为人和老鼠的频率峰度系数曲线,纵坐标为独立成分峰度系数,横坐标为该独立成分强化的频率点,即独立成分峰值所在的频点;蓝色曲线为人体峰度系数曲线,红色曲线为老鼠峰度系数.
图7 频率峰度系数曲线
老鼠的峰度系数(红色)分布前端较平稳,每个频率点峰度系数较大,明显大于人体的峰度系数。这表明了该独立分量最高峰值点与周围峰值点差异明显,表征着该频率点的特征明显。由于每个频率点峰度系数都很大,表征着蕴含老鼠明显特征信息的频率较多,老鼠的频谱分布比较丰富。这反映在老鼠的活动中走走停停,路径来来回回,速度波动较大的活动特性上,即该曲线能完全充分表征老鼠活动信息,完全可以作为老鼠的有效特征信息。
人体的峰度曲线则波动较大,只有在某些特定频点峰度系数较大即这点特征信息较为明显,而在某些频率点较小甚至为0,这表明在这点的特征信息不够明显或者没有,反映在独立分量中就是(该频点)最大峰值与其他峰值差异不大,这符合人体频谱分布比较单一的频域特性,而这也与实际人活动特性相吻合,人在经过菲涅耳透镜划分的明暗区域的方式没有老鼠复杂,故频谱分布没有老鼠丰富。人的路径一般是从视角一边到另一边,即使在视角内迂回,也很少像老鼠行动来来回回的习惯,而且一旦行走,在PIR视区那段短距离范围内,人的速度波动范围较小,因此该(蓝色)峰度曲线能完全表征人体的活动信息,完全可以作为人的特征信息。
综上所述,人和老鼠的特征曲线走势区别较大,峰度系数值也区别很大,两者特征差异极为明显,因而可以作为人和老鼠的良好的区分特征信息。
本文针对老鼠这一误报源问题,提出了基于傅里叶变换、主成分分析和独立成分结合使用的方法提取人体和老鼠的特征信息,不仅精简了2/3的冗余数据,还保留了99.95%以上的原始信息,并使用峰度系数这一指标对特征信息进行了有效描述,分离出的特征都能有效充分反映各自的实际活动信息,且人与老鼠之间的特征区别明显,可以作为有效分类识别的特征。
[1]HA K N,LEE K C,et al.Development of PIR sensor based indoor location detection system for smart home[C]// SICE-ICASE international Joint Conference,2006:2162-2167.
[2]KATEK M,PIATKOWSK S T.Passive infrared detector used for detection of very slowly moving or crawling people[J].Optoelectronics Review,2008,16(3):77-84.
[3]FANG J S,HAO Q,DAVID J B,et al.Path-dependent human identification using a Pyroelectric infrared sensor and Fresnel lens arrays[J].Optics Express,2006,14(2): 609-624.
[4]程卫东,董永贵.利用热释电红外传感器探测人体运动特征[J].仪器仪表学报,2007,29(5):1020-1023.
[5]王林泓,龚卫国.基于小波熵的低误报率人体热释电红外信号识别[J],仪器仪表学报,2009,30(12):2485-2487.
[6]赵青,胡波,凌燮亭.非理想信道多用户数字信号的盲分离[J].电子学报,1999,27(1):41-44.
[7]钟明军,理学报,唐焕文,等.空间独立成分分析实现你IRI信号的盲源分离[J].生物物理学报2003,19(1):7-983.
[8]武振华,史振威,唐焕文,等,新的独立成分分析算法实现功能磁共振成像信号的盲分离[J].生物物理学报,2004,20(3):188-192.
(编辑:徐柳)
A new way of extracting the character of PIR signals by PCA and ICA
HAO Wenbin1,WANG Binyu1,GOU Rui2,ZHU Peipei2,CHEN Kai2
(1.State Grid Chengdu Power Supply Company,Chengdu 610041,China; 2.School of Automation Engineering,University of Electronic Science and Technology of China,Chengdu 611731,China)
In this paper,a new way has been presented to extract the character of pyroelectronic infrared sensor(PIR)signals from human and mice by principal component analysis(PCA)and independent component analysis(ICA).Firstly,the noses is removed from the original signals.Then the processed signals is translated from time domain to frequency domain by FFT.Next the signals are compressed by PCA in order to select the main useful information which remains the 99.95%of the original information.In the end,the principal typical components that is measured by kurtosis are picked up precisely from human and mice by the use of ICA.Experimental data show that the principal typical components can efficiently express the huge difference between the feature information about human and mice.In brief,this method provides an effective and feasible approach for obtaining the character of PIR signals from human and mice.
PIR;feature extraction and classification;FFT;kurtosis
A
1674-5124(2016)11-0113-06
10.11857/j.issn.1674-5124.2016.11.023
2016-02-04:
2016-03-25
郝文斌(1976-),男,辽宁本溪市人,高级工程师,博士,主要从事电力系统继电保护及调度运行等研究。