张小雨 王健宇
【关键词】导盲;人工智能;导航;5G;数字孪生
随着人口的增长和老龄化程度的加深,到2050年,全球预计会有7.03亿人面临中重度视力损害或失明[1]。根据现有的统计数据显示,中国约有至少1700万盲人[2],但是我们在日常生活中可以看到的自由出行的盲人的数量却很少。2016年中国信息无障碍产品联盟关于《中国互联网视障用户基本情况报告》出行调研显示,在1805个视障者中,有30%的视障者基本不外出,一周出行4~6次或6次以上不需要家人陪同的仅占9%[3]。
图1 视障者出行情况
盲人作为人类社会中的弱势群体,其出行困难一直是国家和全社会高度重视的问题。盲人群体人数逐年增加,能否保障盲人安全可靠、智能高效地出行,是社会进步的重要标志。
国务院于2020年7月8日印发《“十四五”残疾人保障和发展规划》通知:“将科技助残纳入科技强国行动纲要,促进生命健康、人工智能等领域科学技术在残疾人服务中示范应用,开展残疾预防、主动健康、康复等基础研究,扶持智能化康复辅助器具、康复设备、盲文数字出版、无障碍等领域关键技术研究和产品推广应用[4]。”
工业和信息化部、中国残疾人联合会于2020年9月印发《关于推进信息无障碍的指导意见》 ,指导意见提出“鼓励信息无障碍终端设备研发”“支持开发残健融合型无障碍智能终端产品”“重点加快智能导盲设备等智能终端的设计开发”“指导第三方机构按照无障碍规范与标准进行符合性测试”等要求[5]。
中国盲人协会通过全国人大和全国政协提出有关加快研发智能导盲设备的建议与提案,分别得到科技部、工信部等多个部门的积极响应和部署。
盲用信息与智能无障碍推进工作的盲人代表倡议聚合优势资源,集中攻克难关,举各个部门之力,共同研发能主动引导、安全避障、精准定位、人机交互等智能智慧高科技导盲产品,帮助盲人无障碍出行,提升广大盲人的生活质量和参与社会、创造价值的能力。
现阶段大多数盲人出行的方式以人员陪伴、导盲杖辅助和导盲犬引领为主。
从现实角度出发,人员陪伴的方式无法做到随时随地跟随盲人,且盲人群体也有独立自主的心理需求。
传统的导盲杖依然是目前使用接受程度最高的导盲辅具。这种盲杖设计结构简单,功能基础,通过敲击来判断地形以及周围环境障碍,判断高度有限,易发生危险。
导盲犬通过特殊的训练可以引导盲人行走,躲避道路危险情况,但一条导盲犬从选种、培训、上岗,需要大量的时间,且价格昂贵。此外,导盲犬被社会接受的程度不够高,加之其工作年限的限制,致使其无法被普及也无法成为理想的导盲方式。
随着现代科学技术的蓬勃发展,各种智能产品的发展研究备受青睐,智能化给人们的生活带来了很多便利与机遇,人们开始关注如何利用科技手段去提高盲人群体的生活质量,满足独立、安全出行的愿望的问题。为了让视力障碍群体能够更好地融入社会、更好地去感知世界,真正成为社会的参与者和贡献者,需要借助科学技术设计生产出具有高性能、高精度、高智能性以及协同、共融系统的导盲产品。
为满足盲人独自出行的基本要求,高科技导盲产品需具备障碍物与路况识别、地图构建、精准定位、智能导航、迅速反馈等主要功能。以上功能的实现需要人工智能、云计算、定位与导航、5G移动通信、人机交互等技术的支撑。
人工智能(Artificial Intelligence),简称AI。现代意义上的人工智能诞生于1956年的特茅斯学院夏季学术大会,AI的初衷是由机器模拟人类、动植物和物种种群的行为,学者们认为其学习过程或智能的表征特点理论上都可以被机器精准地模拟出来。面向特定领域的人工智能(即专用人工智能),如语音识别、人脸图像识别等,因具有应用场景需求明确、所在领域专业技术成熟、模型建立过程简单可行的特点,在特定人工智能领域已经实现单点突破,如图像识别等单项测试中已经达到超越人类的水平。目前,人工智能技术已在教育、安全、金融、交通、医疗健康、家居、游戏娱乐等多个领域取得技术成果并广泛应用,并且应用场景也越加丰富。
目前人工智能技术已经渗透在智能导盲产品的研发制造中,如应用人脸识别技术进行用户识别、缩短机器人权限认证时间;应用表情、姿态识别技术对用户的体力和情绪进行感知,并据此调整行进速度;应用行为预测技术预测用户行动,降低机器人速度过快而引发用户摔倒的概率[6]。智能语音技术和图像识别检测技术是智能导盲产品最核心的关键技术。智能语音技术是一种以语音信号识别为基础,搭配自然语言处理和对话管理技术,将语言输入信息提取、分析,最终通过语音合成或文字等方式输出的人机语言交互技术,是最早落地的人工智能技术之一。图像识别技术可以对场景中的对象进行定位、识别和分类,区分交通信号灯、汽车和行人,同时配合超声波、红外和TOF摄像头等传感器,提高识别准确性,结合语音提示引导,实现盲人的主动避障和出行引导。
云计算(Cloud Computing)技术是一种分布式计算技术,通过网络“云”将庞大的数据计算处理任务划分为成若干个小任务,然后将每个任务分发给多部计算机组成的系统,每个计算机仅计算处理一个或数个小任务,每个小任务被计算处理后,再将结果合并最后返回给用户。云计算技术甚至可以实现每秒10万亿次的运算能力,并且可以随时获取,按需使用。利用这项技术,用户可以在数秒之内处理数量高达数以千万计甚至亿计的信息,由此获得与“超级计算机”同样算力的网络服务。智能导盲产品需要收集分析大量的信息,用来引导盲人出行。需要收集和处理的信息包括路面状况、路面障碍物、行人、车辆等环境信息,斑马线、盲道和人行道的位置、交通灯及交通标志的指示信息等交通信息,自身位置、朝向、目的地位置及前往目的地的合理路径信息等导向信息[6]。借助云计算技术,可以满足智能导盲产品的人工智能、人机交互等需要處理大量实时运算的要求。
定位与导航技术,当盲人在陌生环境下进行有目的的行程时,需要获取自身的精确位置、目的地位置及行进路线等信息[7]。导盲设备实现精准定位和路径规划的关键技术主要包括:基于GPS/北斗等数据定位、定位标签、循迹导航、3D环境模型等等。在室外环境中,最常用且经济的定位方式是借助民用导航系统,如GPS、北斗导航系统等提供的信息,并在此基础上补充通过图像系统获取的交通状况信息,如行车道、斑马线、建筑地标等,从而形成适用于辅助盲人出行的专用地图。在室内环境中,由于建筑物对民用导航系统的信号具有削弱效果,民用导航系统的定位准确性大打折扣,已无法用于实时导航。对于小型室内环境,可预先建立3D环境模型,再结合室内定位手段进行导航。对于大型室内环境,如医院、商场、剧院等,此类场景建立3D模型的成本过高,可在地面加铺电子轨迹或密集布置电子标签的方式实现面向盲人的室内导航。室内导航还可以采用蓝牙信标、超声波定位系统等技术,配以专业的室内地图,还可以提供详细的室内设施介绍。通过以上这些技术,可以实现室内、室外、公交车站导航模式的无缝切换。
5G,即第五代移动通信技术。相比于4G网络,5G网络有增强移动宽带(eMBB)、超高可靠低时延通信(uRLLC)和海量机器类通信(mMTC)三大优势。增强移动宽带(eMBB)主要面向移动互联网流量的爆炸式增长,能够为飞速增长的移动互联网用户群体提供更加沉浸的体验;超高可靠低时延通信(uRLLC)主要面向工业控制、实时互动、远程医疗、自动驾驶等对时延和可靠性具有极高要求的行业应用需求;海量机器类通信(mMTC)主要面向智慧城市、智能家居、环境监测等需要部署大量传感器并采集海量数据的应用需求[8]。对于导盲产品而言,需要大带宽的传输能力来支持云计算技术大量的数据传输,超高可靠低时延来支持实时通信引导,辅助盲人及时对环境变化做出反馈;5G通信技术刚好契合大流量、低时延的要求。
电力供应技术。现代导盲产品按照计算形式可分为离线式和在线式。离线式导盲设备需具备一定的算力,可独立处理位置信息和环境信息并做出反馈,在线式导盲设备对本地算力的要求有所降低,但需要强大的网络连接能力来進行数据的传输。无论何种形式的导盲设备,终端算力和高速网络连接都需要足够的电力进行支撑。在目前的实际应用中,锂离子电池的实际容量为200mAh/g,远距离无线充电技术传输功率受限且尚不成熟,光伏电池受限于体积且在室内环境下效能不佳。受制于设备电源技术,导盲产品需要在可穿戴性、功能性和易用性之间达到平衡。
近年来,智能导盲产品在市场上开始流行。智能导盲手杖可以通过传感器技术来实现测距、测位移、识别图像等功能;借助5G通信技术,通过手杖与无线通信网络的连接,实现远程信息互通互动;借助计算机技术快速处理从传感器、麦克风和网络等传来的各类信息,迅速判定行进方向并给出提示。导盲头盔、导盲耳机、智能导盲背包、智能导盲手环和智能导盲鞋等,形态各异的导盲产品在人脸识别、物体识别、定位与导航、智能语音、传感器、雷达等各项技术的加持下,在一定程度上降低了视障人士的出行阻力,但距离让视障人士自如出行的最终目标仍有差距。
人机交互功能是衡量产品“友善性”的一个重要因素,在智能导盲产品中,盲人得到的反馈信息应该是实用、易理解且丰富的,同时盲人也可以选择通过向智能导盲产品系统输入指令来获得更人性化的导盲服务人机交互、人机互动。一个好的智能导盲产品应该能够快速、高效地对盲人行进进行提示,正确地接收使用者的要求,并做出响应,常见的智能交互有触控屏、语音交互、手势识别等。
智能导盲机器狗[9]是一种正在研究中的智能导盲产品,以现有导盲犬为仿生对象,外形具有狗的身体形态,将更易被视力障碍者所接受。其内部预置高精度室内外地图信息,通过摄像头阵列来识别道路、交通标识及障碍物。四足移动的方式可以轻松上下台阶、跨越浅坑等障碍,可自主决策引导盲人进行精确避障并按照用户的指令行动。利用5G、短距离通信、高精度卫星定位和自动化控制等技术实现低延时快速响应,主动识别、主动避障、主动判断、主动引领、立体空间安全避障。此外,智能导盲机器狗还可通过语音、音效、震动等多种方式实现主动引领、导盲及远程人工导盲。不仅如此,智能导盲机器狗与传统导盲犬相比,服务周期长,且内部的数据具有可移植性,即使更换智能导盲机器狗,其内部的个性化数据也可长期伴随主人。
云端智能机器人是未来导盲产品的呈现形式之一。云端智能机器人利用立体视觉、超声雷达、惯性导航等传感器采集、压缩相关数据,利用5G通信技术经机器人专用网传输数据到云端。云端机器人通过深度学习技术对数据进行理解、分析、处理,形成指令,再经机器人专用网络回传至导盲终端,通过语音或者触觉的方式反馈给盲人。通过北斗/GPS卫星定位、场景识别、云端计算机视觉、多传感器融合、自然语音交互、人工智能和环境地图等技术实现拟实现室内室外导航、精准定位、自主识别、自主避障、自主规划路线等功能。
仿生眼球的研究。日前,我国科研人员已研制出电化学仿生眼球。目前的实验数据表明,这颗仿生眼球能够分辨黑白颜色,响应速度比人眼快一倍,最高分辨率可达到人眼的6倍[10]。仿生眼融合人工智能技术,能够在夜视、多维等功能上做出突破,比如在黑暗中也能看清事物。这项研究已经进入临床试验阶段。因为要考虑到仿生器官与人体直接的融合度,所以必须经过缜密的实验过程,才能在人体内应用。
从各项数字技术的发展,到高端导盲科技产品的涌现,从底层系统的全方位运用,到如何为盲人朋友们营造一个更天然友好的世界,智能导盲系统的诞生将让我们对这个世界有更多想象。利用融合物联网、人工智能、数字孪生等技术,打造出无障碍城市一张网。通过各种传感设施采集外部环境信息,并经过传输、处理,实现自动识别路径关键标志、语音交互、导航引领、一键求助等功能,建设无障碍智能城市,让盲人自由出行。科技拥有着独特的魅力,它让很多事情从不敢想到变为现实,我们希望通过高科技可以给盲人带来一个真正无障碍的世界,和所有的人一起有更多交融,智能导盲系统,带给我们的就是这样一个世界。