朱达仁,王梓琪,宋 震,李正超,李晓寅,陈淑莲,陈旭义*,王振国*
(1.武警后勤学院,天津 300309;2.武警特色医学中心研究部,天津 300162;3.天津中医药大学,天津 301617)
抑郁症是一种常见的精神疾病,严重困扰着当代人的身心健康。根据世界卫生组织(World Health Organization,WHO)于2017年的统计,目前全球约有3亿多名抑郁症患者,患病率约为4.4%[1]。2019年发表的“中国精神卫生调查”报告显示,我国抑郁症的终生患病率为6.8%,12个月患病率为3.6%[2]。抑郁症轻则使人睡眠紊乱、兴趣减退,重则使人自杀轻生。有研究指出,精神病性重度抑郁症(psychotic major depression,PMD)的自杀未遂发生率是51.5%,是非精神病性重度抑郁症(16.7%)的3倍以上[3]。目前,抑郁症的临床诊断方法可分为主观方法和客观方法。主观方法以量表为主,如汉密顿抑郁量表(Hamilton depression scale,HAMD)[4]、贝克抑郁量表(Beck depression inventory,BDI)[5]、抑郁自评量表(self-rating depression scale,SDS)[6]等,这类方法存在一定的主观性,缺乏有效的客观评价指标。当前的客观方法可分为生物学指标和影像学指标,从临床研究的效果来看,目前仍没有单一的抑郁症生物学指标具有足够的敏感度和特异度,影像学指标也只能给临床医生提供参考,并不能直接定性。因此,当前的客观方法仍处于实验探索阶段。
眼动分析作为另一种客观评估手段,不仅能描述瞳孔的动态变化,还可以记录人眼所注视的位置及眼睛运动轨迹,能够最直观地反映人的注视点和注视时间,对描述人类视觉的感知过程与特点、重现个体基本认知的加工过程有着重要意义[7],是其他技术无可比拟的。本文旨在对眼动分析设备的发展及其在抑郁症领域研究中的应用现状进行回顾,系统总结当前的研究现状。
眼动分析最早可以追溯到19世纪,当时人们主要通过观察来记录眼球运动轨迹[8]。1879年,Javal将镜子放置在受试者的正前方,实验者站在其身后,通过肉眼观察镜子里的受试者,但只能观察到大的眼球运动,眼睛旋转1°以下实验者无法察觉,显然该方法相对简单、粗糙[8]。后来,出现了机械记录眼球运动轨迹,由于准确率较低,这种方法已被淘汰[9]。随着科技的进步,人们陆续发明了各种设备,包括眼电图(electrooculogram,EOG)[10]设备、巩膜接触镜(scleral contact lens,SCL)、瞳孔-角膜反射(pupil-corneal reflex,PCR)眼动仪等传统设备。本章节重点讨论传统与新兴眼动分析设备的发展情况。
1.1.1 EOG设备
EOG是由Mowrer、Ruch和Miller于1936年提出的[8,11],其理论基础是角膜和视网膜之间存在电位差[12],眼球每次轻微移动,眼睛周围的电位差就会产生微弱的变化(EOG设备系统面板及其佩戴效果如图1所示)[13],不同的电位差对应着不同的眼球运动状态,从而达到眼动分析的目的。目前EOG设备包含BlueGain、PLUX等公司的产品。EOG设备的优势在于:(1)在硬件复杂性和计算要求方面,EOG设备对资源要求较低;(2)可以与脑电图共用一个电信号信统,形成眼动和脑电数据一体化,且系统的稳健性更高;(3)成本更低[14]。该设备的缺陷是:(1)只能测量相对于头部位置的眼球运动,因此通常不适用于注视点测量[15];(2)有研究表明,即使眼球没有旋转,眼睛周围的电压也会受到眼球上方眼睑运动的影响[16];(3)受其他生物电位干扰,如脑电、肌电信号,照明条件和头部运动等各类因素[12]都会在不同程度上干扰试验结果。
图1 EOG设备系统面板及其佩戴效果[13]
1.1.2 SCL
SCL[17]在1952年由Ditchburn和Ginsborg提出[8],他们用一根杆子固定在隐形眼镜上,在杆子的末端是一个平面镜,从镜子反射的光束进入光学系统,并传到位于受试者眼睛前面的屏幕上,当眼睛运动时,入射光束和反射光束以及镜子的法线保持在同一平面上,反射光的旋转角度是眼睛旋转角度的2倍,以此来实现记录眼球运动。到了1963年,Robinson[18]发明了第一代SCL,也称巩膜搜索线圈,实现了电磁记录的技术革新,后来由Collewijn等[19]进一步改良,可以不用手术植入SCL,而是由受试者直接佩戴,近似于现代的隐形眼镜。进入21世纪以后,随着眼动分析技术的愈发成熟,CHRONOS VISION、C-N-C Engineering等最新产品问世。SCL是将机械或光学参考物体安装在隐形眼镜上,然后直接佩戴于眼睛上的设备,其原理是隐形眼镜片内植入线圈,线圈延伸出一根导线连接电源,通过外围电磁场发出的脉冲信号来定位镜片在空间中的位置,从而实现眼动分析。SCL佩戴效果及相应部件示意图如图2所示[20]。SCL具有较高的时间分辨力和系统精确度,因此被认为是眼动分析领域的“金标准”[21]。然而,该设备的缺点也很明显:(1)其是最具侵入性的方法,插入镜片需要小心;(2)佩戴镜片会引起受试者不适;(3)该设备一般不适用于注视点的测量[15]。
图2 SCL佩戴效果及相应部件示意图[20]
1.1.3 PCR眼动仪
Merchant等[22]于1974年首先发现由于头部侧向运动和眼睛旋转的改变,相对于瞳孔中心位置的角膜反射始终保持不变。随后,Monty[23]于1975年发明了第一代PCR眼动仪,该设备是通过给眼睛照射红外光,在角膜表面产生反射,由瞳孔中心和角膜反射的亮点组成矢量[如图3(a)所示],该矢量随眼球运动而变化,进而达到分析注视方向的目的。这种设备相对准确,也是当前主流的眼动分析设备,对受试者无干扰,易于掌握和使用。进入21世纪以后,市场上常见的有Tobii、EyeLink、Smart Eye等公司产品,眼动分析设备的采样频率也从30 Hz提高到1 200 Hz,准确度从5°提高到0.16°,相关技术日趋成熟。PCR眼动仪原理及相应眼动仪产品如图3所示[24-27]。然而,该设备普遍存在2个缺陷:(1)需要清晰、无障碍的瞳孔视图,这在某些个体中很难实现,例如受试者有突出的眉脊或眼睑裂缝狭窄;(2)当受试者眼睛闭上时,该设备无法跟踪眼球位置,从而在其眨眼时造成眼睛位置数据的缺失[28]。上述问题需要科研人员在未来的眼动分析设备开发中努力解决。
图3 PCR眼动仪原理及相应眼动仪产品
1.2.1 可穿戴眼动仪
2001年,Pelz等[29]开发了一种可穿戴眼动仪[如图4(a)所示],用于监测复杂任务,其对受试者眼睛、头部和全身运动的干扰最小。该可穿戴眼动仪可以佩戴长达2 h,不会限制受试者的自然运动或行为,并保留其周边视力。在受试者眼睛的右侧有一个模块,包括红外照明器、微型摄像机和光束分离器,用于使相机与照明光束同轴。视网膜上的反向反射使瞳孔背光,产生明亮的瞳孔图像。外反射镜将光路折向护目镜前方,热反射镜将红外照明引向眼睛,并将眼睛图像反射回眼睛摄像机。第二台微型摄像机安装在右眼上方的护目镜上,从受试者的视角捕捉场景。控制器、显示单元和记录系统都包含在受试者佩戴的背包中[如图4(b)所示],这也是最早的可穿戴式眼动仪。2021年,Tobii公司开发出眼镜式眼动仪——Tobii Pro Glasses 3[如图4(c)所示][30],该眼动仪的每个镜片上配有8个红外照明器和2个眼动跟踪相机,以便记录眼睛运动和方向,镜框前端内置1个高清场景摄像机,用于捕捉受试者面前的场景画面,镜架内置存储卡和电池,确保视频存储和供电,采样频率可达100 Hz。Tobii Pro Glasses 3最大的优势在于允许受试者自由移动并与环境自然交互,使得研究场景不再局限于实验室,研究范围大大拓展,可应用于真实场景中,最大程度上确保捕捉到自然、真实的行为。
图4 可穿戴眼动仪示意图
1.2.2 “无线”搜索线圈
虽然SCL的眼动追踪精度是实验室和临床上准确记录眼动的公认标准,但该设备的缺点之一是从线圈到相关电子设备有连接线,这根电线会对受试者造成刺激,并且在实验过程中有断裂的可能。2008年,Roberts等[31]开发了SCL的改进版本——“无线”搜索线圈,其最大优势是没有连接线。“无线”搜索线圈的原理是通过发射机向线圈发射脉冲流,接收机检测无线线圈反射的共振脉冲,从而通过共振脉冲信号的相对强度来判断线圈方向(线圈方向对应着受试者的注视方向)。该设备保留了高准确度、高精密度和高采样频率的优点,同时使设备便携且更舒适。“无线”搜索线圈及其佩戴效果如图5所示。
图5 “无线”搜索线圈及其佩戴效果图[31]
1.2.3 角膜反射眼动分析设备
2019年,Borsato等[32]开发了频闪性屈光眼球追踪(stroboscopic catadioptric eye tracking,SCET)系统,并发明了一种基于卷帘相机和频闪结构红外照明的角膜反射眼动分析设备(如图6所示)。其中,角膜在折反射系统中充当球面镜,跟踪角膜上的多个闪光点,而不是跟踪常见的眼睛特征,如瞳孔中心或虹膜轮廓。Borsato等通过仔细调整相机曝光和照明周期,将一个图像帧划分为多个波段,以提高注视点的时间分辨力。
图6 角膜反射眼动分析设备实物图及角膜反射实景图[32]
目前普遍认为抑郁症患者有明显的认知功能障碍,主要表现在注意力、记忆、执行功能和其他认知活动方面[33]。近年来,眼动分析设备的发展为抑郁症临床诊断提供了新的思路,有助于科研人员研究抑郁症患者的认知功能障碍,探索抑郁症生物学标记物和发病机制[34],从而更好地为抑郁症的早期识别、评估、干预及治疗提供参考依据[35]。抑郁症领域的眼动研究大致可分为单一眼动分析设备和眼动分析设备结合其他检测设备两大类。
Li等[36]设计了注视实验并提取了基于情感带宽、瞳孔直径变化的生理信号和基于注视行为的注意偏差信号,其利用Tobii-T120眼动仪,以120 Hz频率采集每个注视点的位置、时间、瞳孔大小,结果共分为两大类特征:眼动行为特征(正注意偏向和负注意偏向)和眼动生理特征(正/负情感带宽、正/负瞳孔直径变化率)。每类特征包括7项指标:最小值、下四分位数、中位数、上四分位数、最大值、均值和标准差。共计42个分类指标,即14个眼动行为指标和28个眼动生理指标。采用核极限学习机对主成分分析特征进行抑郁识别,准确率为91.00%、敏感度为91.06%、特异度为92.31%。利用眼动仪测量的优势在于:获得了外部情绪刺激下眼球运动的情绪信息,其可以反映抑郁症患者当前的情绪。此外,与其他方法相比,利用眼动仪测量还具有数据采集简单、分类特征少的优点。Rantanen等[37]为了分析抑郁症和非抑郁症受试者的注视行为,寻找人际攻击的注意偏向证据,使用EyeLink 1000桌面式眼动仪(该设备采用1 000 Hz的采样频率,精确度较高)记录眼球运动,提取出以下眼球运动指标:首次注视概率、首次注视时间、总注视时间、首次注视次数、总注视次数和运行计数。结果显示当首先观看攻击性图片时,抑郁症组和非抑郁症组在早期信息处理(首次注视时间)中都表现出对人际攻击性图片的注意偏向,但当受试者能够预测攻击性图片时,这种偏向只在抑郁症患者中更明显。
为了提升抑郁症诊断的可靠性,提高其鉴别率,眼动分析技术结合多种检测手段的研究逐渐兴起,通常与功能性MRI(functional MRI,fMRI)、脑电、面部特征提取等手段相结合。
为了能够记录受试者在进行眼动实验时大脑的活动情况,必须实现眼睛和脑部2种数据的同步采集。当前,主要有2种采集方式:一种是眼动分析设备与fMRI相结合(如图7所示)[38],另一种是眼动分析设备与脑电设备相结合。Schneider等[39]将加拿大SR Research公司的EyeLink 1000 Plus设备与fMRI相结合,用于采集受试者的注视行为,该设备的优势在于,它是fMRI兼容的眼动跟踪器,内置于fMRI扫描仪孔末端和演示监视器下方,以250 Hz的采样频率记录受试者的瞳孔大小,确保了受试者可以在fMRI扫描仪内执行奖励任务,实现了真正意义上的眼动数据与fMRI数据的同步采集。研究发现奖励任务唤醒阶段的瞳孔测量值与抑郁症状负荷之间存在强烈的负相关,与任务相关的胰岛素和后扣带回皮质的激活也与抑郁症状呈负相关。该研究首次实现了从神经解剖学角度很好地描述抑郁症的病理、生理过程。通过直接跟踪患者的瞳孔反应,使瞳孔指标有希望成为鉴别抑郁症患者的生理性标志物[39]。
图7 眼动分析设备与fMRI相结合效果图[38]
尽管同步采集的研究热度越来越高,但很少有研究人员关注由不同设备记录的数据引起的时间对齐问题。Zhu等[40]利用脑电和眼动同步采集网络,确保记录的脑电和眼动数据流都以毫秒的精度同步。眼动数据由加拿大SR Research公司的EyeLink 1000桌面式眼动仪采集,采样频率为250 Hz。EyeLink 1000桌面式眼动仪的优势在于其强大的开放端口,可供用户在使用时接入其他设备。脑电和眼动同步采集网络的原理是:EyeLink Display PC通过E-Prime软件显示刺激,眼动和脑电信号分别由EyeLink Host PC和EEG设备记录,一旦在监视器上呈现刺激,2个系统就通过发送同步信号进行耦合,同步信号能够同时记录眼动和脑电数据,并生成与离线数据匹配的准确时间戳,而后使用特征融合策略处理脑电和眼动信号,鉴别准确率达到83.42%。桌面眼部追踪器与脑电设备相结合示意图如图8所示。
图8 桌面眼部追踪器与脑电设备相结合示意图[40]
由于表情和眼动等生理信号不宜伪装,因此被认为是实现抑郁症客观评估的重要信号。Stolicyn等[41]使用Gazepoint GP3眼动仪来采集受试者的眼动行为指标,采样频率为60 Hz,该设备精度为0.5°~1.0°,空间分辨力为0.1°。从面部动作编码系统中提取17个面部动作单位(action units,AUs)的强度时间序列,并提取3个面部指标:(1)最大AUs强度;(2)超过阈值的平均AUs强度;(3)超过阈值的AUs持续时间。与此同时,同步记录3个眼动追踪指标:(1)第一次注视的潜伏期(从刺激物出现开始,直到受试者注意到刺激物的时间);(2)注视的次数;(3)注视的总时间。采用支持向量机作为分类模型,结果显示:采用面部特征及眼动特征进行分类的准确率可达到79.17%(敏感度为76.00%、特异度为82.61%),而只用面部特征的分类准确率为66.67%(敏感度为68.00%、特异度为65.22%),只用眼动特征进行分类的准确率为64.58%(敏感度为68.00%、特异度为60.87%)。结果表明,面部和眼部运动测量相辅相成,可以达到更好的抑郁症分类效果。不难看出,当眼动分析技术与其他诊断技术相结合时,可以进一步提高抑郁症诊断的准确率,相关研究成果对抑郁症的临床诊疗提供了理论依据。
当前,眼动分析设备仍处于试验探索阶段,还未直接用于临床诊断。通常眼动分析设备会与脑电设备相结合,因为脑电信号和眼动信号分别表征了内部神经模式与外部潜意识行为信息,在情绪识别问题中展现了良好的互补特性[42]。有研究发现,脑电图具有对快乐情绪进行分类的优势,而眼动分析设备在识别恐惧情绪方面优于脑电图[43]。大量研究证实,多模态融合检测能获得更高的鉴别准确率[44-47]。对于单独的眼球分析设备是否能够可靠地用于情感识别,目前还没有实质性的结论[48]。
从当前的研究现状来看,眼动分析设备在抑郁症领域的研究主要存在以下几个方面的不足:(1)缺乏大量的临床数据,样本量不足。当前的研究较多停留在小样本的试验阶段,而样本量不足会因为存在个体化差异,导致不同的试验群体可能得出截然不同的试验结果。(2)缺乏统一的诊断标准。由于当前的眼动分析设备精度较高,各项指标纷繁复杂,不同的研究者会纳入不同的眼动指标进行研究,因而当前的研究成果无法形成较为统一的结论,存在自圆其说的情况。(3)缺乏对抑郁症分型的研究,当前的眼动分析设备只能在一定程度上鉴别受试者是否抑郁,但不能对抑郁症患者进行分类。
在未来的眼动分析设备研究中,可以着眼于以下几个方向:(1)从医学及生理学的角度,探究抑郁症与眼球运动之间的关联性,从而将眼动指标更加科学地提取出来,为制定诊断标准奠定理论基础;(2)不断改良或开发眼动试验范式,制定眼动分析设备诊断抑郁症的行业标准;(3)针对抑郁症的不同分型,深入挖掘不同患者的眼动数据,确定差异,避免因共病问题出现误诊,进一步为眼动分析设备进入临床诊断奠定基础;(4)不断优化机器学习模型,构建多模态人工智能眼动分析的抑郁症诊断模型,基于眼动分析设备与其他检测技术之间的关联性,对眼动数据模型进行优化升级,提高模型的鉴别准确率;(5)扩大试验样本量,收集更多的临床试验数据,进一步验证前期的试验成果。相信在不远的将来,眼动分析设备会在抑郁症的临床诊断、干预、治疗分析等诸多方面大放异彩。