田甜 张飞 李铭麟 张璇 王佳贺
随着全球人口老龄化的加剧,老年听力障碍逐渐成为公共卫生的重大挑战。听力障碍不仅影响老年人的交际和日常生活,还影响其精神健康和生活质量。由于老年听力障碍的复杂病因(包括遗传因素、环境影响、职业噪声暴露等多种因素[1])和老年群体的特殊性,对其有效的诊治和管理仍然面临着一系列挑战。
最近几年,人工智能(artificial intelligence,AI)技术的突破性进展为处理这些问题提供了新的前景。AI通过大数据分析、精确建模和预测以及高效的自动化决策,为改善老年听力障碍提供了强大的工具。研讨如何利用AI技术改善老年听力障碍,为医疗卫生领域的研究者提供了新的方向。本文旨在回顾和讨论AI改善老年听力障碍的最新进展,为未来相关领域的研究提供参考。
老年听力障碍,狭义上特指年龄相关的听力损失(age-related hearing loss,ARHL),这是一种与年龄增长有关的听觉系统退化性疾病。在广义上,其是指发生在老年人群中的所有听力障碍,包括但不限于ARHL。本文的研究范围为广义老年听力障碍,包括由自然衰老、噪声暴露、耳部感染或疾病、药物毒性、基因因素、系统性疾病、耳蜡阻塞、耳部肿瘤等各种因素引起的老年听力障碍。
在全球范围内,听力障碍是非常普遍的问题,特别是老年人群。根据世界卫生组织的最新数据,超过5%的人口(其中成年人4.32亿,儿童3400万)患有听力障碍。由于人口老龄化,到2050年,估计将有超过7亿人患有听力障碍,即每10人中就有1人患听力障碍[2]。在老年人中,听力障碍的患病率更高,65岁以上老年人的听力障碍患病率可达1/3以上[3],听力损失成为老年人第三大常见慢性疾病。
老年听力障碍有以下特点:(1)听力损失程度更严重。在听力障碍病人的流行病学调查中,最大年龄段分组(>80岁)的中度听力损失(>40~60 dB)患病率超过轻度听力损失(>25~40 dB)患病率[4]。(2)辅助治疗设备使用困难。相对于更容易适应技术改变的中青年人,老年人往往需要更多的时间和支持来适应电子类的听力辅助设备。(3)易伴随其他健康问题。老年人的工作、社交活动并不活跃,患有听力障碍相关疾病后更加重其沟通困难和社交隔离,引起焦虑、抑郁等心理疾病以及认知障碍[3]等其他健康问题。因此,老年听力障碍者更需要综合医学干预。
全球每年在耳科和听力保健服务上的总支出,平均下来,相当于每个人要分担近10元的费用[2]。从宏观的社会和国家视角审视,老年听力障碍无疑会引起累积的经济负担和支出。因此,老年听力障碍带来的众多问题和挑战是我们亟需解决的课题。
AI是指由人造系统所表现出来的智能,分为弱人工智能和强人工智能两类。弱人工智能系统专注于某一具体任务,如语音识别、图像识别等,它们的应用已经非常广泛。而强人工智能则能够理解或体验周围环境,就像人类一样具有全面的思考能力。但是,由于当前技术以及伦理限制,现阶段AI在医学中的应用集中在弱人工智能方面[5]。
AI包括很多子领域,如机器学习(ML):机器可以通过提供的数据集的经验进行改进;深度学习(DL): 由多层神经网络组成,使机器能够自行学习和做出决策;自然语言处理(NLP): 使计算机能够从人类语言中提取数据并根据该信息做出决策;计算机视觉(CV): 计算机从一系列图像或视频中获得信息并理解等。目前,AI在医疗健康领域的应用已经越来越普遍,比如ML用于预测疾病、DL应用于医疗影像的诊断[6]、NLP用于医疗信息的获取和处理等[7]。这些技术为改进和优化医疗服务提供了巨大的空间。Topol[8]预测,AI与医学的结合将迎来一个“医生辅助”时代。
3.1 早期预警 老年听力障碍的预测大多依赖于对象的自我报告,如询问老年人是否有听力问题、是否有噪声的暴露史等。这种方法的局限性在于很多老年人可能不会察觉自我听力下降,增大了漏诊率。我国学者黄治物及其团队开展的“基于遗传与环境因素作用辅助AI决策的耳聋防控研究”医工交叉项目,计划收集大样本人群数据,包括生物特征、听力水平、遗传信息、环境暴露、生活方式、共病等,然后利用AI技术对这些数据进行综合分析,实现对老年听力障碍的早期预警[9]。
3.2 高效精确的诊断 老年听力障碍的诊断包括详实的病史、仔细的耳镜检查、实验室听力测试、专业的鼓室压力测量以及声学反射等步骤。这些步骤需要大量时间完成,特别是对于那些认知障碍、难以配合的老年人群,可能会增加病人的焦虑和心理压力[10],也增加了医疗系统的负担。另一方面,传统听力检测通常需有专业人员手动控制语音信号刺激的强度和频率,以确定受试者的听力损失和言语感知水平,因此,检测主观性大,易产生人为误差。AI在老年听力障碍的诊断方面显示出巨大潜力,提高了诊断效率与精确度。
ML可用于纯音听力测试中的掩蔽管理。用探测音测试病人听力较差的一侧耳朵时,需要对听力较好的一侧耳朵播放窄带噪音以避免交叉听力的影响,传统掩蔽的管理需要多次迭代,在测试耳中不断重新建立阈值来调整非测试耳中的掩蔽量,非常耗时且困难。Heisey等[11]在ML听力图程序中添加标准化掩蔽协议形成了动态掩蔽,与传统手动掩蔽在准确性上相当,但效率大大提高。
相比于局限性大的纯音测试,ML也可进一步运用于脑干反应(ABR)的测试中。纯音听力测试依赖于对病人进行感知评估,但对于认知障碍、语言障碍、严重听力损伤的老年人来说,他们无法表达聆听体验。ABR的检测可以避免这些局限性,但难度大,往往需要经验丰富的耳科医生。Al Osman等[12]使用ML进行自动化语音诱发ABR分析,通过区分健康听力障碍和病理性听力障碍,帮助临床医生更好地诊断听力障碍。
除了在专业医院检测外,对于行动不便的老年人,也可以佩戴以ML为基础的自动听力计,自行测试并及时向专业医疗人员反馈。Raja Sankari等[13]开发的自动听力计能够利用多种ML模型(如支持向量机、随机森林和AdaBoost模型)分析语音信号,并准确评估在250~8000 Hz范围内的听力情况,3种模型的准确率分别高达98%、96%和96%。除了准确性高,这类自动听力计还具备携带便捷、可个性化定制等优势。
AI还可以通过听力阈值对听力障碍进行分类诊断。Abd Ghani等[14]研发的混合ML模型,利用频繁模式增长(FP-Growth)算法和朴素贝叶斯(NB)算法,能根据空气和骨传导的听力阈值准确地进行症状分类。这种AI驱动的模型还可以根据需要设置评估的精度和置信水平,避免过度治疗或低估病情。
耳部影像诊断技术上也有AI的应用。Cha等[15]提出了利用DL和大型耳内镜图像数据库来自动诊断耳部疾病的ML模型,其识别出6种不同中耳疾病的准确率高达90%。目前,基于此种技术的商业产品如“hearScope”[16]等已上市。此外,Li[17]也成功运用了AlexNet网络模型和极限学习来识别耳部核磁共振图像中的组织特征,对听力损失进行分类。
3.3 智能化助听设备
3.3.1 助听器:从全球范围来看,助听器的使用率很低,4.014亿中重度听力损失人群中仅有17%的病人使用助听器[18]。一部分是因为老年人认为助听器是衰老和功能丧失的标志而拒绝使用,但最主要还是因为助听器本身的性能不佳[19]。一般来说,助听器的首选音量增益和响度水平是为“标准用户”“标准听力环境”设定的,然而每个用户的具体需求和环境差异大,一次性定制无法兼顾各种用户的不同需求。由于老年人的听力感知理解逐渐退化,其对声音的偏好更具有特殊性。
在用户个性化方面,Balling等[20]结合了高斯过程的数学模型和信息论,通过ML将用户偏好程度转化为助听器增益参数,从而优化特定用户的声音体验。同样,有学者利用卷积神经网络和双向长短期记忆网络等DL模型对用户在音频环境中的偏好进行学习和建模,进一步确定个性化助听器的音频压缩参数,从而提高用户听力感知[21]。
在声场识别和噪声处理方面,Bhat等[22]使用DL技术处理音频信号,针对不同的环境噪声来进行语音增强,以提高听者的语音质量和可理解性。Fan等[23]进一步开发了助听器应用程序(APP),自动识别5种不同的声场,包括公共汽车、地铁、街道、室内、汽车,通过多音频帧和块的叠加,优化助听器的声音清晰度。
利用AI,一些助听器还可以多角度保障老年人安全。Starkey Livio AI助听器能通过步数跟踪检测用户的行动状态,一旦发生坠落动作,及时发出警报,从而防止老年听力障碍者独自活动时出现意外[24]。
3.3.2 人工耳蜗(CI): CI的植入没有年龄限制,如今已经帮助超过200万名听力受损的儿童和成人恢复听力,其中包括150 000名老年人[25],是70岁以上甚至80岁以上病人听力康复的治疗选择[26]。然而CI植入也存在一些缺点:(1)候选时间长且复杂。医生需对多个术前变量的相互作用进行主观判断。然而,合并AD等认知障碍的老年病人通常难以描述自我主观感受,并且老年人群常伴有多病共存现象,即变量多,这些都会使医生的准确判断更为困难。(2)植入效果差、并发症多。CI植入术后病人言语听觉改善的结果不尽相同,部分病人会发生不适、噪音反馈、复发性炎症和耳道感染恶化等[27]。AI技术的应用为CI植入提供了新的可能性和研究方向。
AI的引入可以提高候选过程的效率和准确度,从而保证植入效果。Abousetta等[28]利用ML的模型预测了CI植入术后病人的病情恢复情况,结果显示AI分类模型对语言年龄缺陷、语音缺陷和社会缺陷的预测准确率分别为56.66%、88.11%和40.46%,均超越了传统的统计方法。这有助于医生更准确地判断哪些病人能从CI手术中受益。
DL技术改进了CI术前的医学图像处理。与传统的医学图像分割技术相比,DL可以实现自动特征提取,减少人为干预,从而获得更好的分割结果[29]。Li等[30]采用了一种基于U-Net的改进网络模型,以实现对人体耳蜗解剖结构在CT图像中的自动分割,这类术前准备工作有助于提高老年人群CI手术的成功率,减少术后并发症。
此外,AI也有助于解决配置听觉处理器的问题。记录电触发的镫骨反射是最常见的传统配置方法,但是在耳蜗或听神经病变的情况下,记录并不准确。Levin等[31]利用神经网络处理神经反应的遥测数据,以更高的精度合成CI听觉处理器的调谐卡,最终预测准确率高达99.2%。
AI不仅改善了CI的配置过程,也参与调节过程。Waltzman等[32]在FOX(Fitting to Outcome Expert)APP中使用了基于AI的编程算法来调节CI,其效果与传统医生标准编程技术(EC)的效果相当。
3.4 长期康复护理的远程医疗助力 远程医疗的兴起实现了辅助听力设备佩戴者的本地自我管理[28],解决了病人居住地偏远以及老年人行动不便带来的问题,为老年听力障碍病人的长期居家康复护理提供了有力的技术支持。
远程医疗可以帮助病人进行助听器的微调。如智能手机里的APP——ReSound Assist, 可以收集病人的远程要求并接收新的助听器设置。Convery等[33]评估了这个APP的远程通信功能,结果显示其具有高度的可行性。
在CI方面,Meeuws等[34]综合利用了FOX程序和远程医疗技术,使CI佩戴者能在听力学家的远程指导下进行自我测试和自动装配。此外,FOX编程方法还可以实现跨中心的标准化,并增加许多可能受益的个人访问。
AI在老年听力障碍的早期预警、高效精确诊断、智能化辅助设备、远程医疗等方面已经取得了实质进展。目前一些应用可能不及传统方法或与其相当,但ML等是一个不断学习、自我优化的过程,只要数据样本不断扩大,更加丰富多样,通过增加训练集和验证数据样本等方式[35],模型的准确性可以不断提高,其最终性能预期将超越纯人工方法。当然这并不意味着AI将替代人类的临床决策能力,正如应用X线、CT等影像技术一样,对于临床医生来说,将AI视为一种临床决策辅助工具来帮助判断和减少认知偏差[36],将是未来听力障碍诊治的新方向。
最后,AI在改善听力障碍中的应用目前仍面临伦理和数据安全问题[37],因此,相关伦理规范隐私保护机制必须建立,以提高病人对AI的信任度。