基于心率变异性与机器学习相结合的警觉度水平监测

2023-01-05 05:28周维逸周仁来
载人航天 2022年6期
关键词:警觉性心电平均数

周维逸,周仁来

(南京大学心理系,南京 210023)

1 引言

长期在轨生活,生物节律紊乱现象会慢慢出现,这对航天员的生理、心理健康以及认知能力都存在不同程度的损害[1-3]。空间环境的特殊性会对航天员的睡眠和生物节律产生重要影响。据统计,几乎所有航天员的主观报告都显示在执行航天任务时存在睡眠严重不足的现象[4]。有研究表明,航天员的生物节律紊乱与相应的睡眠障碍会导致警觉性水平和认知功能的下降[5]。

警觉性又称持续注意能力,是指在一段较长的时间内对同一刺激保持觉察和反应的准备状态[6]。昼夜规律的改变会引起长期在轨生活的航天员生理节律失调,加之太空失重环境、在轨期间工作负荷强度高以及时间感缺失等问题的影响,都可能会导致航天员警觉性下降[7-8]。研究人员对某次在轨飞行任务前和返回后3 名航天员的警觉度进行测试发现,与飞行前第一次精神运动警觉任务(Psychomotor Vigilance Task,PVT)结果相比,有1 名航天员无明显改变,2 名航天员在飞行后有较大改变,其中1 名航天员PVT 均值在飞行后降低,而另一名升高[9]。

个体往往很难对自身的警觉性水平做出客观的评价[10-11]。目前,警觉性检测技术的局限性制约了研究人员对于航天员警觉性水平变化的系统研究。传统的警觉性检测手段分为主观检测和客观检测。主观检测主要使用量表评分,例如卡罗琳斯卡嗜睡量表(Krolinska Sleepiness Scale,KSS)[12]以及斯坦福嗜睡量表(Stanford Sleepiness Scale,SSS)[13],量表评分操作简单灵活,但是信效度不理想。警觉性水平的降低并非孤立存在,其往往与任务表现相关联,因此传统的客观检测方法主要通过行为范式进行,公认的最常用且最有效的行为范式为PVT[14]。PVT 是一项操作简单但是漫长单调的简单反应时任务,需要受试者长时间关注一个刺激物的出现并且在刺激物出现时尽可能快速地做出反应。

随着认知神经科学技术的发展,神经生理测试逐渐引入到了认知功能的检测当中,因为生理指标的客观性相对于主观问卷和行为范式而言更高。常用的生理检测手段包括心电(Electrocardiography,ECG)、脑电((Electroencephalography,EEG)等。心率变异性(Heart Rate Variability,HRV)是反映自主神经活性和定量评估心脏交感神经和副交感神经(迷走神经)张力及其平衡性的一类心电指标[15]。研究人员对警觉性变化或者脑力疲劳程度变化伴随的心电指标进行了一些探索。郭玮等[16]使用脑力疲劳试验发现随着脑力疲劳的程度增加,个体的心率会显著下降而HRV 会显著上升;李延军等[17]通过睡眠剥夺过程中的动态检测,发现HRV 指标可以有效地反映出疲劳度和困倦的增长;随后郭玮等[16]发现HRV 对睡眠剥夺条件下的警觉性注意的敏感程度更高。赵小静等[18]以睡眠剥夺的方式诱导脑力疲劳,将心电测量和行为结果结合起来,发现昼夜节律稳定的人进入脑力疲劳状态后,应激能力会显著下降,注意力和反应力会下降,副交感神经的活性会显著增强。脑电的频域指标中,警觉性的下降伴随着顶叶alpha 能量的增加以及额叶beta 和theta 能量的增加;时域指标中,枕叶P1 和N1 的波幅反映出了选择性的视觉空间注意能力,随着警觉性的下降,2 个成分的波幅会发生降低[19]。枕叶以及额叶的较晚期成分N2、P3 等波幅也会随着疲劳度的增加而降低[20]。

综上,脑力疲劳的变化以及应激能力的变化可以通过心电以及脑电指标反映出来。以往的研究更多地在较为极端的睡眠剥夺情况下进行[17-18],而在警觉性变化幅度并不明显的情形下,生理指标的检测效果还是不明确的。在实际操作中,开展脑电为主的检测方法需要较为复杂繁琐的操作流程以及算法,而心电的数据获取相对于脑电而言更加简单且可靠。

本文通过开展连续的、较长时间的警觉性任务,营造警觉性逐渐下降、疲劳度逐渐增长的情境,从而观察心电指标的变化情况,并尝试通过机器学习的手段对心电指标的预测效力进行检验。

2 实验方法

2.1 被试

共招募48 名被试,年龄在18~28 岁之间,其中男性21 名,女性27 名。被试均为右利手,且无生理以及心理疾病,实验开始前2 周内不存在明显的失眠以及生物节律紊乱的症状。本实验通过南京大学心理系伦理委员会批准;所有被试均为自愿参与实验,在实验前了解了实验的基本情况并签署了知情同意书。

2.2 警觉性任务

警觉性任务采用PVT 范式,每个试次的刺激呈现前空屏时长为2~10 s(不定),要求被试将注意力保持在屏幕中央,并且将双手放置在键盘的空格键上。随后刺激(红点)呈现,被试需要尽可能快地按下空格键作出反应,受试者作出反应后刺激(红点)消失,屏幕上显示受试者的反应时长,1 s 后进入下一试次。标准PVT 任务的测试时长为10 min,共80 个试次。实验结束后,计算警觉性相关指标前需要统计被试的有效反应试次数(总试次数减去刺激出现前就按下空格键的试次数)。警觉性指标包括反应时的平均数、反应时的中位数以及反应时倒数的平均值。

实验开始后,被试需要连续完成5 组标准的PVT 测试,共80×5 = 400 个试次。完成连续5 组PVT 测试的过程中同步采集心电数据。

2.3 心电信号采集与处理

采用BIOPAC 的MP160 多导生理记录仪对被试的心电数据进行采集,采样率为1000 Hz,使用0.5 Hz 的高通以及35 Hz 的低通进行滤波。使用MP160 多导生理记录仪自带的Acq 软件对频域指标极低频(VLF,0.01~0.04 Hz)、低频(LF,0.04~0.15 Hz)、高频(HF,0.15~0.40 Hz)进行提取计算。

2.4 警觉性分级以及支持向量机分析

为了检验心率变异性指标对于警觉性变化的预测效果,数据处理完成后首先计算出所有PVT测试结果的反应时平均数以及标准差,保留平均数前后3 个标准差的数据,超出平均数前后3 个标准差以外的数据为异常数据,予以排除。这部分的数据代表着受试者警觉性从高到低的变化趋势,用于警觉性分级,势必需要对警觉性从高到底的变化过程进行刻画。如果警觉性出现下降,行为指标则会向后偏移。随后,将反应时数据从高到低进行排列,若分为5 级,分级起点和终点分别为反应时平均数加减3 个标准差,每一个级别的跨度为1.2 个标准差。因此,第一级的范围为平均数减3 个标准差到平均数减1.8 个标准差,第二级的范围为平均数减1.8 个标准差到平均数减0.6 个标准差,第三级的范围为平均数减0.6 个标准差到平均数加0.6 个标准差,第四级的范围为平均数加0.6 个标准差到平均数加1.8 个标准差,第五级的范围为平均数加1.8 个标准差到平均数加3 个标准差。

使用多分类支持向量机(Multi-Class Support Vector Machine,MCSVM),选择生理指标对相应阶段的警觉性分级进行预测。输入的指标为VLF-HRV 和HF-HRV 2 个指标,预测相应时间段内由警觉性行为绩效指标得出的分级情况。支持向量机算法中所使用的带惩罚的径向基函数(Radial Basis Function,RBF)通过Libsvm 工具箱引用。通过绘制被试工作特征(Receiver Operating Characteristic,ROC)曲线来评估分类的性能。准确率、特异性、敏感性等指标应达到70%以上,说明预测效果比较稳定。数据分析过程中采取k折交叉验证的方式:将样本均匀地分为互斥的k份,保证每一份的样本个数相同;一共进行k次训练,每次训练选择其中k-1 份作为训练集,剩下的1 份作为测试集,最终的指标为k次训练之后得到的模型在测试集上指标的平均值。本研究取k= 5,采用五折交叉验证。

3 结果

3.1 PVT 测试结果

在连续完成5 组标准的PVT 测试,结果如表1 所示。被试反应时的平均数以及反应时的中位数会呈现出明显的上升趋势,单因素方差分析结果表明,个体在连续完成5 组PVT 任务过程中的反应时平均数以及反应时中位数具有显著差异,F(4,235)= 3.416,P< 0.001,F(4,235)=3.784,P< 0.001。反应时倒数的平均值呈现出明显的下降趋势,单因素方差分析结果表明,个体在5 组PVT 任务过程中的反应时倒数的平均值具有显著差异,F(4,235)= 3.180,P= 0.032。反应时数据见表1。

表1 连续5 组PVT 任务的反应时指标变化情况(±s)Table 1 Reaction Time variation during 5 blocks of PVT task(±s)

指标第一组第二组第三组第四组第五组平均数336.0±53.6363.3±58.4391.5±71.0414.2±78.0432.8±80.0中位数330.2±49.3350.6±56.4375.25±64.5392.9±62.8413.6±70.5倒数平均值3.13±0.32.99±0.42.9±0.42.77±0.32.57±0.4

3.2 心电测试结果

心率变异性的2 个频域指标VLF-HRV、 HFHRV 与PVT 测试的结果表现出良好的相关关系。2 种心率指标在组间的变化趋势如表2 所示。VLF-HRV 与反应时的平均数(r= 0.38,P=0.003)以及反应时的中位数呈现显著的正相关(r= 0.36,P= 0.002),与反应时倒数的平均值呈现出显著的负相关(r= -0.27,P< 0.001)。HF-HRV 也与反应时的平均数以及反应时的中位数呈现显著的正相关(相关系数分别为0.16 以及0.22,p值均小于0.001),与反应时倒数的平均值没有显著的差异。

表2 心率变异性变化情况Table 2 VLF-HRV and HF-HRV during 5 blocks of PVT task(±s)

表2 心率变异性变化情况Table 2 VLF-HRV and HF-HRV during 5 blocks of PVT task(±s)

指标第一组第二组第三组第四组第五组HF675.2±63.5602.3±67.8617.9±74.0658.1±71.3706.4±82.6 VLF344.6±59.3380.7±46.7465.4±63.1409.3±59.0511.2±71.4

3.3 警觉性分级结果

将所有行为反应时数据整合,根据正态分布(通过Kolmogorov-Smirnov 检验,P= 0.145)的性质,平均值前后3 个标准差的数据包含了整个分布中99.7%的数据,而前后3 个标准差之外的数据往往可以视为错误的数据,警觉性分级共纳入238 个数据,占总数据量的95.8%。数据的具体分布情况见图1。

图1 反应时数据的分布情况Fig.1 Distribution of reaction time

警觉性检测技术实验中积累的大量PVT 任务的行为数据,将PVT 的反应时进行统计。首先计算得出所有数据的平均值为360.25 ms,标准差为74.91 ms;将警觉性分为5 级别,而选取的数据包括前后3 个标准差(135.52~584.98 ms)以内的数据。因此,从平均数减去3 个标准差,每一个分级需要包含1.2 个标准差的数据,因此本文将整体的反应时分为下列6 个参考点(单位:ms):157.8,247.7,337.5,383.0,517.1,607.0,初步确立起警觉性的分级标准,见表3。

表3 警觉性分级Table 3 Five levels of vigilance

随后采用机器学习的MCSVM 手段,利用受试者某一时段的2 种心电指标对该时段的警觉度分级情况进行预测。由于第1 分级以及第5 分级之中所包含的数据量较小,本部分的研究围绕中间3 个分级的数据进行开展。输入值设定为2 种心电指标,输出值为该时段基于PVT 反应时得出的警觉性分级。

采取五折交叉验证,通过绘制ROC 曲线(图2)来分析指标对于警觉度水平的指示效果。结果表明单独使用2 种心电指标对警觉度水平进行预测的平均准确率为77.81%(95%置信区间为:0.7388~0.8172),平均灵敏度为0.763(95%置信区间为:0.674 ~ 0.862),平均特异度为0.792(95%置信区间为:0.713~0.877)。曲线下方积分面积(Area Under The Curve,AUC)为0.87 的结果表明,2 个心电指标可以较为准确地对警觉度分级情况进行预测。

图2 受试者工作特征曲线图Fig.2 Receiver operating characteristic curve

4 讨论

连续完成5 组标准的PVT 测试过程之中,随着被试的疲劳度增加,警觉性下降,PVT 任务的反应时平均数以及反应时中位数呈现出了上升的趋势;相应地,反应时倒数的平均值呈现出了下降的趋势。相对于睡眠剥夺实验的激发而言,这种激发形式产生的疲劳度比较低,PVT 任务的行为指标依旧呈现出了显著变化的趋势,进一步肯定了PVT 任务对警觉度变化的信效度。本研究中所使用的是时长为10 min 的标准化PVT 任务,以往的研究表明,10 min 的版本对于警觉性的变化比其他的版本更为敏感[21],本文研究也对该结论进行了再次的检验。

警觉性下降的过程中,VLF-HRV 和 HRV 值与反应时的指标呈现出了相似的增长趋势。以往研究发现,当副交感神经的活性增强时,心率会下降,高频的HRV 会升高[22]。昼夜节律调节的情况下,人在白天清醒的情况下高频HRV 相对于夜晚更低[23]。来自睡眠剥夺的研究结果发现,睡眠剥夺的过程中,被试的副交感神经活性增加,高频HRV 增长,在行为上体现为PVT 任务表现变差,在量表上表现为主观困意的增长[24-25]。在本文研究中,行为任务的时间增长,被试的疲劳程度增大,困意有一定的累计,与以往的研究结果一致。

极低频HRV 的神经机制并不如高频HRV 明确,研究发现,HRV 中0.01~0.08 Hz 这一频段与PVT 任务指标的关联系数较高,PVT 任务反应越差,则该频段的活动越强[22];此外这一频段的HRV 与主观问卷KSS 的得分呈现出较高的正相关,即困意越高,该频段的值也越高。另一项睡眠剥夺的研究发现,0.02~0.08 Hz 频段的HRV 与PVT 任务指标的相关系数达到0.68[23-24]。不论是0.01~0.08 Hz 还是0.02~0.08 Hz,这些频段与极低频HRV 的频段分布(0.01~0.04 Hz)存在着完全或者大部分的重叠,与低频HRV 的频段分布(0.04~0.15 Hz)的重叠较少。因此可以推断,低频HRV 并没有呈现出显著差异的原因可能在于其对于警觉性波动的敏感程度不如极低频成分以及高频成分。低频成分与警觉性的关联在长达24 h 乃至40 h 的睡眠剥夺研究中得到了显著地体现[24-25],或许可以认为警觉性水平在较大幅度波动的过程中,低频成分可以发挥更好的作用。

机器学习的结果进一步印证了心电测试在警觉性检测中的前景,得到的准确率等指标较好。在真实的工作场景中,长时间的工作任务中使用便携化的心电测量可以及时评估个体的警觉性水平。在长期在轨航天任务阶段,将PVT 测试与心电测试结合起来有助于在较短的时间内对航天员的警觉性水平进行快速评估,借以评估在轨飞行环境对于警觉性水平的影响。

本文研究的局限主要在于数据量不大,并且对于警觉性水平的操纵力度不够极端,较难反映出更大幅度的警觉性变化情况。在被试的选取上,本文研究尚未对受试者的性别因素、年龄因素等进行进一步的分类与考量,而实际的应用场景中更需要关注到性别、年龄等差异对于警觉性水平的影响,从而提升监测与评估的精确性。准确的常模建立以及严格的机器学习算法实施依赖于庞大的数据量,本文研究的数据有限,可能会降低机器学习方法的泛化推广能力,并且不便于开展更精准复杂的算法。本文研究中使用的生理参数HRV,其测量结果受到了硬件设备、电极佩戴位置的影响,所以大样本的对比研究有助于更好地选取更有效且精准的测量方法。更重要的是,地基研究的目的是为天基的实际应用进行积累和铺垫,未来的研究需要与实际的在轨飞行相结合,以期进一步加深对于在轨飞行期间警觉性水平变化的认识,推动科研人员对更深层次规律的探索。

5 结论

1)警觉性的下降伴随着行为反应时的延长以及心率变异性高频(HF-HRV)和极低频(VLFHRV)的升高;反应时指标与心率变异性的高频以及极低频指标均呈现出了显著的统计相关性。

2)通过相关分析和机器学习预测2 个角度的验证,心率变异性的高频(HF-HRV)和极低频(VLF-HRV)能够较好地监测警觉性变化。

猜你喜欢
警觉性心电平均数
心电向量图诊断高血压病左心室异常的临床应用
心电医联体建设需求分析及意义
睡眠剥夺对机体认知功能的影响及其简要机制
颜色对认知加工的影响:情绪以及警觉性的作用
基于非接触式电极的心电监测系统
卡片式智能心电采集仪
不一样的平均数
关注加权平均数中的“权”
平均数应用举隅
说说加权平均数