王志秦
WANG Zhi-qin
(唐山学院 信息工程系,唐山 063000)
随着科学技术的进步和发展,生物特征识别,如指纹识别、虹膜识别等,已经广泛应用于身份鉴别场合,但是目前的生物特征识别系统对应用环境的要求还较为苛刻,还不能做到高效、非打扰、高识别率等效果。人耳识别是以人耳图像作为研究对象,是一种新的生物特征识别方法。研究表明人耳特征是长期保持不变的,与其他生物特征一样具有不变性和唯一性。人耳位于头部两侧,在位置和角度上比其他生物特征更为有优势,有利于实现高效、非打扰的识别方式[1]。本文采用数字信号处理器构建了人耳图像识别系统,利用摄像机采集人耳图像,利用高速数字信号处理器完成图像信息预处理和特征提取识别,并通过以太网与上位计算机数据库交换信息。
人耳图像识别系统首先需要对人耳图像进行采集,通过算法对人耳图像进行定位,之后对整幅图像进行裁剪,将裁剪后的人耳图像进行归一化和灰度增强变换处理,然后利用人耳识别算法进行特征提取,提取后的特征送分类器分类并与人耳特征数据库中的数据进行模式匹配,最后将识别结果显示出来。整体设计方案如图1所示:
图1 人耳图像识别系统整理方案图
1.1 人耳图像的定位算法
对于人耳图像的定位方法有很多种,如肤色分割方法、模板覆盖查询方法,阈值分割方法等。本文采用阈值分割法。首先将采集的图像转化为灰度图像,根据直方图的灰度阈值,将灰度图像中的像素点与该阈值进行比较,灰度值大于阈值的为一部分,灰度值小于和等于阈值的为另一部分,将图像中不同的区域划分开并进行二值化,达到阈值分割的目的。其中灰度阈值的选取具有决定划分结构优劣的作用。通过观察发现多数人的耳部上边缘与头发相接,而人耳与侧面的皮肤与头发具有明显的不同,所以用阈值分割法就可以容易的将人耳图像分割出来。
分割出来的人耳图像,以左耳图像为例,左耳的轮廓边缘位于图像的右上侧,利用图像的右上区域部分进行灰度扫描,从上向下逐行扫描,当遇到第一个灰度为255的点停止,该点被认为是耳廓的上部顶点。再由右向左逐列扫描,得到耳廓的右侧顶点。由此即可定位人耳图像在整幅图像中的所在位置坐标。
1.2 人耳图像的预处理
在得到了人耳图像在整幅图像中的位置坐标后,根据统计经验,人耳顶点大约在人耳中轴线位置,耳廓的右端点到耳廓上部的距离大约占耳长的1/3左右。由此可以确定对图片裁剪的坐标和尺寸。
由于是对人耳图像的采集是动态捕捉,采集图像的角度、位置和距离有可能不同,因此需要对人耳图像进行归一化处理,将裁剪好的原始图像通过缩放调整到相同的尺寸和位置,来消除人耳相对于摄像机的平移、距离和旋转对图像的影响。本文中每幅图像分别归一化为197×100像素的灰度图像。
为了消除现场不同光照对人耳图像的影响,采用对图像进行灰度增强的方法,根据灰度图像直方图中灰度值聚集区域,适当加大对比度。
经过以上图像预处理的步骤后所得到的人耳图像即可作为后续识别算法的原始图像。
目前人耳识别算法主要有主元分析方法、线性判别分析方法、几何学方法、神经网络方法等,其中基于整体特征提取的线性判别分析方法应用较广泛。基于线性判别分析(LDA,Linear Discriminate Analysis)的特征提取方法是模式识别中常用的一种特征提取方法,该方法生成的特征向量子空间使样本间离散度和类内离散度的比值达到最大,具有较主成分分析方法更好的识别效果。Hua Yu和Jie Yang在2001年提出了直接线性判别分析(DLDA)方法,解决了LDA方法的小样本问题[2],提高了线性判别分析在实际应用中的特征提取效果。本设计采用采用了LBP算法与DLDA算法相结合的特征提取方法。传统的人耳特征提取方法通过采集人耳图像并进行灰度调整和归一化处理,再采用主成分分析方法或线性判别分析方法对图像的特征向量进行分析,筛选出能够达到最佳识别效果的特征向量,用于分类识别。局部二元模式(Local Binary Pattern,LBP)[3]通过比较图像中每个像素与其周围像素灰度值大小,并利用二进制模式表示比较结果,可以对灰度图像中邻近区域的纹理信息进行有效提取。LBP特征的优点是对灰度变化不敏感且计算简单。采用LBP算法变换后,加入了中心像素点与周围像素点的相关性,减小了光照变化和角度变化对特征提取的影响。
将多尺度的概念引入到基于LBP的人耳特征识别领域,将LBP算法的特征引入多尺度因素,在不同尺度上对图像进行分析,可以提高识别率。基于LBP和小波变换的特征提取方法首先采用离散小波变换的方法对图像进行两次分解,并在此基础上提取人耳图像的多尺度LBP特征;通过匹配多尺度LBP特征信息来实现人耳的分类识别。
随着数字信号处理技术的发展,DSP以高性能的系统核心,强大的信息处理能力得到了广泛应用。由数字信号处理器构成的嵌入式信息处理系统,能够实时地对大量数据进行处理,能够实现复杂的数字信号处理算法,在影音和图像处理领域具有广阔的应用前景。本文设计的基于DSP的人耳图像识别系统以数字信号处理器(DSP)为核心,对采集的图像进行算法处理[4]。系统硬件结构由以下几部分组成,系统的结构如图2所示:
图2 人耳识别系统硬件组成结构
通过CCD摄像机采集的视频数据流经视频解码芯片解码后送到视频端口,存入FIFO存储器中,当数据满时产生直接访问存储器中断,将数据搬移到SDRAM中,系统可直接从SDRAM中取出图像数据进行处理。处理结果经视频编码芯片送至显示器进行实时显示。系统程序和已有人耳特征库信息存储在Flash ROM中。数字信号处理器通过自身具有的以太网接口与上位PC机进行信息交换。
3.1 数字信号处理器
本设计采用的数字信号处理器为TI 公司的TMS320DM642,是一款针对视频和图像处理领域应用的高性能定点处理器芯片,最高时钟频率为720MHz,最大运算速度 5760MIPS。该芯片具有三个可配置的视频接口,同时支持三路视频输入或者输出;一个 10/100M 的以太网接口;64位的外部存储单元接口(EMIF),支持连接同步或异步存储单元;是实现实时视频图像处理系统的优秀平台[5]。
外部存储器采用两片 32 位数据宽度的SDRAM,总容量为32 兆字节,用来作为 DM642片内存储器的扩展,主要存放视频处理时的视频图像数据。采用两片共 32兆字节的 Flash 存储器存放图像处理的程序和实现人耳识别时所需的数据库。
3.2 视频解码芯片
视频解码芯片的作用是对输入的模拟视频信号进行采样并数字化。本系统中使用 Philips 的SAA7113视频解码芯片来采集模拟视频信号并将其转换为数字信号送给 DSP 处理。SAA7113支持PAL、NTSC制式,支持隔行扫描和多种数据输出格式,可自动监测 50Hz、60Hz 的场频信号,并可在PAL 制式和 NTSC 制式下自动转换,能够在输入的复合视频信号 CVBS 或分离视频信号S-VIDEO中选择一路视频信号,将YUV三个分量分离并通过A/D 转换以及对亮度、对比度和饱和度进行控制后产生标准的 BT656 YUV4:2:2 格式的 8 位视频数据。
3.3 视频编码芯片
视频编码芯片能够将处理后产生的数字信号转换为模拟视频信号输出并显示在电视机等监视设备上,以便对算法的效果进行验证。本系统使用Philips公司的SAA7121视频编码芯片进行 D/A 转换来产生模拟视频信号,通过 VP0 端口传输给电视显示。SAA7121 支持 PAL 与 NTSC 格式的视频编码能把 8 比特或 16 比特的 BT656格式数字视频信号转换成 PAL或 NTSC 标准的模拟电视基带信号。
系统软件设计采用了DSP/BIOS实时多任务操作系统,利用DSP/BIOS来实现任务的实时调度、中断管理、网络通信和实时监测。DSP/BIOS占用极少的 CPU 资源,提供了底层的应用函数接口。在使用 DSP/BIOS 编写代码后,CCS 可以提供多种分析和评估代码工具,如图形化显示各个线程占用的 CPU 时间、代码执行时间统计、显示输出信息等,可以直观地了解代码各个部分的开销情况。通过DSP/BIOS 工具可以更加好地控制 DSP的硬件资源,更加灵活地协调各个软件模块的执行,从而大大加快软件的开发和调试进度。
本系统的软件流程图如图3所示,在图像采集和图像显示两大模块中间加入人耳检测模块,如果监测到人耳则进行图像采集、分割、预处理和识别,并显示识别结果;如果没有检测到人耳图像,则显示直接采集到的图像。
图3 人耳图像识别系统流程图
本设计对6名实验人员的人耳图像进行采集和实验,每人采集不同角度和位置的左侧人耳图像12幅,并将采集的图像特征信息预先存储。实验时再次分别采集实验人员的左侧头部图像,通过实验系统对人耳图像进行定位、图像裁剪、图像预处理、特征提取和分类识别并将识别结构显示在显示器下方。当人耳特征提取算法的提取的特征数为40时,人耳定位和识别时间约为5.5秒,平均正确识别率为83.3%,达到了良好的识别效果。
本文针对生物特征识别系统中的人耳识别,应用数字信号处理器构建人耳图像识别系统,利用摄像机和高速数字信号处理技术,完成人耳图像采集和特征识别,实现了基于DSP的人耳图像识别系统。该系统具有自动采集识别、快速准确、识别率高等特点,可用于机场、银行等需要身份鉴别的安保环境和需要自动采集数据的场合,具有很高的实际应用价值。
[1]张海军,穆志纯,危克.人耳识别技术研究进展综述[J].计算机工程与应用,2004,33:2-5.
[2]孙宁,冀贞海,等.基于局部二元模式算子的人脸性别分类方法[J].华中科技人学学报(自然科学版),2007,35:177-181.
[3]苑玮琦,刘畅.人脸人耳图像采集装置设计[J].微计算机信息,2010,22:9-12.