郭小磊 辛平 陈广大 程明 韩志伟
摘 要:针对盲人因视觉的缺失而导致的生活困难与精神空虚的难题,提出可与盲人交互并为其提供多种服务的导盲助手方案。采用STM32F407系列开发板与树莓派为控制核心,运用图像处理与语音识别等技术为盲人的生活提供包括道路障碍检测、环境语音提醒、熟人识别、文字识别、语音位置分享、危险状态检测与报警、人机交互等多种功能。系统功能全面,使用方便,具有较高的实用价值。
关键词:穿戴式;图像处理;语音交互;功能全面
据统计,中国现有超过1400万的盲人,因视力的缺失,他们的衣食住行都需要他人的帮助。
为了提高盲人的生活质量,设计研究出了基于图像处理的智能穿戴式导盲设备。用户可以通过语音的方式向系统下达指令,获得自己想要知道的相关信息,并且可以让摄像头成为自己的眼睛,进行人脸识别与文字识别,以提升自主生活能力。整个系统功能全面,操作简单,性价比高,从辅助盲人生活的角度为盲人提供全方位的帮助。
一、智能导盲系统总体设计方案
本系统主要由可放置于腰部的设备主体和位于肩部与手腕部的传感器组成,以STM32F407系列与Raspberry Pi为控制核心,包含摄像头模块、VS1053语音提示模块、电机振动提示模块、GPS/GMS模快、MPU6050危险状态检测模块。系统通过摄像头对盲人前方的道路进行检测识别,当发现障碍物时,立即通过语音提示模块与振动电机模块对盲人进行提醒,伴随着盲人和障碍物距离的拉近,振动电机会通过逐渐加快振动频率的方式向盲人进行反馈。当盲人前方出现其熟人时,开发板通过肩部摄像头采集的信息进行识别,再由语音模块向盲人播报人员信息。当盲人想要观看前方的文字内容时,系统即可通过摄像头对前方文字进行识别,语音告知盲人文字信息,并且当盲人行走过程中出现危险倒地不起时,MPU6050检测后触发危险状态报警模块,由GSM通信模块将此状况和盲人的位置信息发送到其亲人的手机上,为对盲人的快速救援提供帮助。
二、导盲系统硬件设计
(一)控制模块设计
系统以STM32F4系列开发板与树莓派为控制核心,使用OpenCV库。主控制器负责处理摄像头所捕获的图像信息,音频输入的语音数据处理以及处理服务器的信息等。这是实现系统人脸识别、文字识别、语音识别、语义分析与交互应答的核心。
(二)图像采集模块设计
图像采集传感器采用CMOS摄像头,使用标准的SCCB接口。图像采集可采用不同分辨率的传感器,高分辨率的传感器细节较为清楚,但是对主控制器处理的压力增大,将导致主控制器处理缓慢,产生延时,占用内存过多等问题,因此系统选用200W像素摄像头作为图像采集传感器。
(三)语音模块设计
系统采用VS1053模块为语音数据采集模块,是系统指令识别与语音应答的基础,该模块自带有声音拾取器,将声音信号初步处理后变为电压信号,经过模拟数字转换器转换为数字信号。因系统对语言指令识别有较高的要求,故模块直接将数据传输至主控制器,由主控制器解析处理,并产生应答。
(四)基于级联分类器的人脸识别
本系统主要应用级联分类器进行人脸的识别。Haar特征使用检测窗口中指定位置的相鄰矩形,计算每一个矩形的像素和并取其差值。然后用这些差值来对图像的子区域进行分类。在检测窗口中可以放大或平移得到一系列子特征,他们的白黑区域面积比始终保持不变。
在本穿戴式智能导盲系统进行人脸识别时,先计算识别对象的第一个Haar特征的特征值,与第一个分类器阈值对比,当Haar特征的特征值小于该阈值时,进入下个比较步骤;当Haar特征的特征值大于该阈值时,该弱分类器输出右值并结束。然后计算第二个Haar特征值,与第二个弱分类器阈值对比,步骤同上。把多个这样的分类器并联,即将输出结果值相加,即可得到一个强分类器的输出结果,该结果与设定阈值做对比,当结果大于该阈值时,认为当前检查窗口通过了该强分类器,即认为是盲人的朋友。
三、结语
本系统结构主要由可放置于腰部的设备主体和位于肩部与手腕部的传感器组成。已完成系统样机,经测试可实现的功能有道路障碍检测、环境语音提醒、熟人识别、文字识别、语音位置分享、危险状态检测与报警、人机交互等多种功能,性能稳定,识别率高,能够帮助盲人应对生活中遇到的多种困难,在保证其安全的同时,提高其自主生活能力,减轻家庭负担。
参考文献
[1] 张玉欣,孙浩.基于D-S证据理论的多特征融合纸币真伪识别方法研究[J].电脑知识与技术,2018,14(21):226-229.
[2] 陈广大,刘德君,李天旭,等.便携式水果硬度测量仪的设计[J].中国农机化学报,2016,37(7):85-88.
[3] 曲丽萍,王宏健,边信黔.基于自适应重采样的同步定位与地图构建[J].探测与控制学报,2012,34(3):76-81.