基于OpenCV技术的智能盲杖设计与实现

2024-08-23 00:00:00李政轩李杰翁一帆李永胜宋长坤
河南科技 2024年14期
关键词:图像处理

摘 要:【目的】以提升视障人士的生活质量和独立性,基于OpenCV技术开发一种创新的视障人士辅助装置——智能盲杖。【方法】通过摄像头实时采集环境图像,借助OpenCV技术进行图像处理和分析,并且融合了语音提示和导航功能,帮助视障人士更加准确地定位和导航。【结果】研究结果表明,该装置可以成功辅助视障人士感知周围环境,并提供准确而及时的视觉信息。使用该装置后,视障人士展现出更高的独立性和安全性。【结论】基于OpenCV技术的视障人士辅助装置是一种创新、实用的设计,显著提高了视障人士的生活质量和日常行动能力。未来的研究方向包括优化硬件设计,提高系统的稳定性和耐用性,以及扩展语音提示和导航功能,以适应更多日常场景,从而为视障人士群体带来更广泛、更深远的益处。该设计对提升社会包容性和促进科技助力残障人士生活品质方面具有积极意义。

关键词:图像处理;语音提示;导航功能;定位与导航

中图分类号:TP391.4" " 文献标志码:A" " 文章编号:1003-5168(2024)14-0027-04

DOI:10.19968/j.cnki.hnkj.1003-5168.2024.14.005

Design and Implementation of Intelligent Blind Cane Based on OpenCV Technology

Abstract:[Purposes] The purpose of this study is to develop an innovative assistive device, intelligent blind cane, for the blind based on OpenCV technology, aiming to enhance the quality of life and independence of visually impaired individuals.[Methods] Real-time environmental image capture is achieved through a camera, and OpenCV is utilized for image processing and analysis. The device goes beyond image recognition, incorporating voice prompts and navigation functions to assist blind individuals in more accurate positioning and navigation.[Findings] Research findings indicate that the device effectively aids blind individuals in perceiving their surrounding environment, providing accurate and timely visual information. After using the device, individuals with visual impairments demonstrate increased independence and safety.[Conclusions] This study emphasizes the assistive device based on OpenCV technology as an innovative and practical solution, significantly improving the quality of life and daily mobility of blind individuals. Future research directions may involve optimizing hardware design to enhance system stability and durability, as well as expanding voice prompts and navigation functions to adapt to a wider range of daily scenarios. This research contribution not only propels advancements in the technological field but also holds positive implications for enhancing societal inclusivity and leveraging technology to improve the quality of life for individuals with disabilities.

Keywords: image processing; voice prompts; navigation functionality; positioning and navigation

0 引言

视障人士作为社会中的特殊群体,因缺乏视觉能力而在日常生活中面临比常人更多的困难与挑战。为提高视障人士的生活质量和独立性,许多研究专注于开发各类视障人士的辅助装置。在这些装置中,基于计算机视觉技术的视障人士辅助装置成为研究的热点之一。OpenCV①(Open Source Computer Vision Library)作为广泛应用于计算机视觉领域的开源库,具备强大的图像处理和分析功能进行图像标定[1],已广泛应用于各种图像识别和分析任务中。

本研究旨在基于OpenCV技术开发一种视障人士辅助装置,通过图像处理和分析为视障人士提供必要的视觉信息。该装置通过摄像头实时采集图像,利用OpenCV进行物体识别、人脸检测和障碍物识别等处理,从而帮助视障人士感知周围环境。同时,该装置还具备语音提示和导航功能,有助于视障人士更准确地定位和导航。本研究将通过试验,评估该装置的效果,以验证其在提高视障人士生活质量和独立性方面的潜力。预计该研究的结果将为视障人士辅助技术的发展提供有益的参考和借鉴。这一创新性的视障人士辅助装置有望成为促进社会包容性和改善视障人士生活的有效工具。

1 智能盲杖工作原理分析

首先,智能盲杖的摄像头负责捕获周围环境的图像。经过初步处理,图像被转化为计算机可理解的矩阵数值形式,从而完成图像的传输;其次,通过图像处理算法对传入的图像矩阵数据进行预处理,识别出障碍物、交通信号灯和标志等关键元素;最后,将分类后的数据及其相关的距离信息等传输到树莓派主控中。同时,传感器模块负责检测前方的障碍物。一旦发现障碍物,传感器模块将触发信号,将该信号传送至树莓派主控进行处理。树莓派主控始终接收搭载在盲杖上的模块所发来的数据,特别是图像视觉数据。树莓派主控通过综合处理这些数据,利用内置的路径规划算法为用户规划路径,并通过语音实时播报给用户。

智能盲杖系统通过图像处理和传感器技术的协同作用,能够实时感知用户周围环境,并在检测到障碍物时及时提供语音导航,为视障人士提供更安全、更便捷的出行体验。

2 智能盲杖模块架构

2.1 树莓派4B主控制器

树莓派(Raspberry Pi)是一款卡片式电脑,拥有全面的基本功能,广泛应用于各种项目中。树莓派4B以其强大的性能,成为导盲杖系统的主控制器,负责图像传输和图像处理[2]等相关需求。

2.1.1 性能卓越。树莓派4B在性能方面表现卓越,搭载了更快的处理器和更大的内存,能够处理复杂的图像数据。

2.1.2 图像传输。作为主控制器,树莓派4B负责与摄像头模块进行连接,实时捕获环境图像。通过CSI排线,将图像传输至树莓派,为后续的图像处理提供数据源[3]。

2.1.3 图像处理。树莓派4B搭载了强大的图像处理库,例如OpenCV,用于对捕获的图像进行实时处理。其中包括物体识别、人脸检测及障碍物识别等关键任务,为视障人士提供必要的视觉信息。

2.1.4 可扩展性。树莓派4B支持各种外部设备的连接,具有良好的可扩展性。使得导盲杖系统可以集成多种传感器和模块以满足不同的功能需求。

2.1.5 低功耗设计。树莓派4B采用低功耗设计,适合移动设备的应用。这确保了导盲杖系统在使用过程中能够保持较长的续航时间[4]。

2.2 Air780e通信模组

Air780e模组是基于LTE Cat.1蜂窝移动通信技术的物联网通信模组。基于EC618芯片平台低功耗特性加上合宙在低功耗方面的深度开发,极大降低联网待机功耗,显著提高在表计、物流、低功耗安防等应用场景设备的待机时间。首先,通过串口或SPI接口向模块发送AT指令,配置模块工作模式、频率、功能等参数;其次,编写发送的程序,并通过Arduino或其他开发板进行程序发送,将数据发送给Air780e模块;接着,调用模块,并将数据通过串口或SPI发送出去。模块接收到数据后发送给开发板;最后,开发板接收数据并通过解析处理,将数据转换为可读模式。

2.3 定位模块

Air780e 模块正常联网后搜索附近的信息并上报给后台,后台可以查询当前的定位,并结合信息强度等因素进行计算,最后将计算出的经纬度返回给模块。紧急按钮允许用户将当前数据发送到智能手机以获得帮助。当老人遇到突发情况时,按下按钮就会将目前的数据传输到手机上,通过手机就可以看到使用者当前的位置。

2.4 MPU6050姿态传感器

MPU6050姿态传感器由三轴加速度计和三轴陀螺仪组成,可以测量物体在x、y、z三个方向上的加速度和角速度。加速度计可以检测物体的线性加速度,而陀螺仪可以检测物体的角速度。通过将加速度计和陀螺仪的测量结果进行组合,可以计算出物体的方向和角度。工作方式采用MPU6050,通过I2C总线通信协议,可以直接连接到微控制器或单片机上。MPU6050工作时,会不断地读取加速度计和陀螺仪的数据,并进行数据处理和滤波。处理后的数据可以通过I2C总线发送给微控制器或单片机,以供后续处理和应用。

3 智能盲杖系统工作原理

3.1 树莓派系统配置与图像识别算法开发

为实现智能盲杖的图像识别功能,首先,应在树莓派中插入基于Ubuntu的系统镜像文件;其次,搭建必要的操作系统环境,并下载安装深度学习及科学运算库,包括Opencv、Tensorflow②、pandas③、numpy等。图像识别算法[5]的开发涵盖数据获取、图像预处理、特征提取、分类器选择与决策。树莓派4B作为主处理器,确保系统具备足够的性能来满足图像处理的需求。

3.2 摄像头模块驱动与图像传输

摄像头模块的驱动与图像传输是智能盲杖中至关重要的部分。通过CSI排线将树莓派与摄像头连接,使用OpenCV库捕获实时视频。这一步骤还包括对图像进行编码,以便于传输至后端服务器,确保摄像头模块的正常工作和图像传输的流畅、可靠。

3.3 微信公众号集成与实时通知

将智能盲杖与微信公众号集成,用于通信、更新和实时通知。通过微信公众号的消息推送功能,向用户发送设备状态、位置信息等重要信息。结合微信提醒功能,确保用户能够及时收到重要的提醒,如低电量、系统故障等。在设计中要注重用户隐私,明确数据收集和使用的目的,并提供隐私政策说明。

3.4 树莓派运行

考虑到导盲杖的结构与便携性,导盲杖的使用过程中需要“脱机”工作,也即需要将多余的显示器部分删除掉。该过程可以依靠树莓派中的脚本实现程序的自启动,确保树莓派开机后便可以运行障碍物识别的相关程序。使用Shell进行脚本的编写,将运行Python文件的代码放在testboot.sh中,运行命令sudo nano/etc/rc.local并进入rc.local,把supi-c\"exec/home/pi/testboot.sh\"加在exit 0之前,便可实现开机时执行脚本的效果,至此自启动脚本部分完成。

4 智能盲杖整体设计

智能盲杖的整体设计如图1所示。树莓派4B主控制器作为系统的核心,可以提供强大的性能,实现图像数据处理和整体系统的控制。摄像头模块用于捕获周围环境的实时图像,为图像识别提供输入数据。传感器模块检测前方的障碍物[6],触发信号并传输给主控制器,用于安全导航。Air780e模组基于LTE Cat.1蜂窝移动通信技术,用于联网和位置信息的获取。紧急按钮允许用户在遇到紧急情况时发送求助信号,提高用户的安全性。微信公众号通知用户相关信息。紧急情况的处理,用户按下紧急按钮,触发紧急求助信号,通过微信通知用户,并上传至后台。

5 结语

本研究旨在借助OpenCV技术开发一种基于图像处理和分析的视障人士辅助装备,致力于提升视障人士的生活质量和独立性。通过对实时图像的处理和采集,该装置能够识别物体、人物和障碍物,并为视障人士提供必要的视觉信息。同时,配备语音提示和导航功能,更好地帮助视障人士进行定位和导航。

通过验证该设备的实用性和应用效果发现,该装置能够有效地辅助视障人士感知周围环境,提供准确的视觉信息。使用该装置后,视障人士表现出更高的独立性和安全性,为其日常行动带来了明显的改善。

基于OpenCV的视障人士辅助装置是一种实用且高效的解决方案,能够显著提高视障人士的生活质量。这一技术的应用不仅提供了实时、全面的环境认知,也增强了视障人士的生活自主性。未来期望进一步优化该装置的设计,推动智能辅助技术在残障人士生活中发挥更大的作用。通过持续的创新和改进,为社会提供更为人性化、智能化的辅助设备,为视障人士群体创造更加平等、便捷的生活体验。

注释:

①OpenCV(Open Source Computer Vision Library)是一个开源计算机视觉和机器学习库。它提供了丰富的工具和算法。

②TensorFlow(中文名为“张量流”)是由 Google Brain 团队开发的一个开源机器学习框架。

③Pandas(Python Data Analysis Library)是一个开源的数据分析和数据处理库,建立在Python编程语言之上。

参考文献:

[1]ZHANG Z .A Flexible New Technique for Camera Calibration[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000, 22(11):1330-1334.

[2]HAO G,MIN L,FENG H.Improved Self-Adaptive Edge Detection Method Based on Canny[C]//International Conference on Intelligent Human-machine Systems amp; Cybernetics.IEEE, 2013.

[3]张学武, 范新南. 视觉检测技术及智能计算[M]. 北京: 电子工业出版社, 2013.

[4]MEMBREY, PETER,HOWS, et al.树莓派学习指南:基于Linux[M].北京:人民邮电出版社,2014.

[5] ZHANG C C , ZHANG K , NI R ,et al.Unleashing the Potential of Machine Learning: An Exploration of State-of-the-Art Algorithms and Real-World Applications in Computer Vision[C]//2023 Congress in Computer Science, Computer Engineering, amp; Applied Computing (CSCE).IEEE,2023.

[6]WANG H , LIU C , YU L ,et al.Research on Target Detection and Recognition Algorithm Based on Deep Learning[C]//2019 Chinese Control Conference (CCC).IEEE, 2019.

猜你喜欢
图像处理
海战场侦察图像处理技术图谱及应用展望
基于ARM嵌入式的关于图像处理的交通信号灯识别
电子制作(2019年15期)2019-08-27 01:12:12
基于图像处理的机器人精确抓取的设计与实现
机器学习在图像处理中的应用
电子制作(2018年18期)2018-11-14 01:48:20
Bayesian-MCMC算法在计算机图像处理中的实践
电子测试(2018年6期)2018-05-09 07:32:01
改进压缩感知算法的图像处理仿真研究
电子测试(2017年11期)2017-12-15 08:57:08
模糊图像处理,刑事侦查利器
图像处理技术的实战应用
遥感图像处理软件在文物高光谱数据分析中的应用
基于图像处理的定位器坡度计算
电气化铁道(2016年4期)2016-04-16 05:59:46