基于心率变异性的长航时模拟飞行疲劳评估

2024-03-05 11:34曹征涛熊瑾乐梁学宇李敬洁

空军军医大学学报 2024年2期

曹征涛，熊瑾乐，梁学宇，王聪，李敬洁，雍伟

(1空军特色医学中心，北京 100142；2东南大学仪器科学与工程学院，江苏南京 210096)

驾驶员的疲劳是航空领域中的一个研究热点，因为他们在工作期间会经历长时间的状态变化、昼夜节律紊乱和睡眠不足。复杂的操作系统和动态需求要求驾驶者具有高水平的认知能力，而疲劳会导致认知能力和主观感受下降，从而影响飞行安全[1]。因此，研究致力于探索疲劳的产生条件并优化其检测。通常认为，疲劳并非由单一机制诱发，大量的内在生理因素和外在环境因素导致驾驶员产生疲劳[2]。开始时间和休息安排等调度因素会影响睡眠调节过程，而任务持续时长和任务需求会导致不同的工作量[3]。本试验旨在分析长航时模拟飞行中执行夜间飞行任务的驾驶员的状态，通过获取到的心电图(electrocardiogram，ECG)信号完成心率变异性(heart rate variability，HRV)多参数指标的计算，将出现休息的过程和执行任务的过程进行对比，初步对受试者夜间执行任务的状态和可能预警点进行评估。

1 对象与方法

1.1 对象

健康男性志愿者8人，年龄18～22岁，平均(19.4±1.2)岁；身高169～173 cm，平均(171.0±1.3)cm；体质量58～72 kg，平均(64.8±4.2)kg；均为右利手。生活规律，自述无睡眠障碍，无神经及精神科用药史和病史。试验前1周及试验期间禁用烟、酒、茶、咖啡等饮料及中枢兴奋或抑制性药物，避免剧烈运动。在试验开始前，受试者均完成了训练，能够熟练操作模拟飞行系统，掌握正确的检测方法。

1.2 方法

1.2.1 试验流程试验前对受试者进行讲解，使其熟悉试验程序，受试者2人一组(1名机长，1名副机长)，在波音737模拟飞行平台上连续模拟飞行48 h(图1)。飞行4.5 h时由副机长开始进行45 min睡眠休息，每隔5.5 h两人交替休息1次，每人各休息8次。试验从早上9时开始模拟48 h连续飞行任务，期间持续采集ECG数据，并在模拟飞行前和飞行后以及中间每次休息前和休息后进行主观量表测评。

图1 机长(A)和副机长(B)试验流程图

根据试验时间安排(图1)，其中图1A表示机长的试验安排，图1B表示副机长的试验安排。飞行部分除第1段及第8段外，时长均为4 h，睡眠部分为45 min，恢复及交接飞行部分为45 min。在试验开始和结束以及中间每隔2段飞行的睡眠前后，均进行主观量表测评。在下文的结果部分，为了简要起见，采用C1～C4代表每个小组的机长，D1～D4代表对应的副机长。

表1 疲劳量表主观记录 (分)

表2 试验个体HRV指标

表3 个人模型准确率 (%)

1.2.2 试验设备本试验采用表贴式生理指标监测系统，可以实时采集ECG信号，并将数据实时上传存储。该设备ECG性能指标如下：①采样率：200 Hz；②A/D：10 bit；③心率测量范围：15～240次/min；④心率测量精度：±2次/min或者±2%取大者；⑤动态输入范围：10 mV；⑥共模抑制：≥70 dB；⑦计时准确性：24 h内的总误差不超过±10 s。

1.2.3 试验指标 ①主观指标：采用斯坦福嗜睡量表，按1～7分自主评定嗜睡感，1分为“精力旺盛、头脑清醒、警觉性好”，7分为“马上可以睡着，强睁着才能保持觉醒”，1～7分为嗜睡感逐渐增强；采用自认疲劳分级表(rating of perceived exertion，RPE)，按0～10分自主评定疲劳感，0分为无疲劳感，1～4分疲劳感比较轻，5分疲劳感有点重，6～9分疲劳感重，10分疲劳感非常重。②客观指标：ECG信号(采样频率200 Hz)；闪光融合频率(离散测量)；反应时和运动时(离散测量)；收缩压；舒张压；脉率；血氧；呼吸率；体温(每15 min测量1次)。

在本试验中，只有ECG信号是实时连续测量，所以在分析数据时以ECG信号作为主体对象进行分析。生理指标监测系统提供的ECG波形经过人工标注处理后，对RR间隔进行HRV解算，由于判断状态变化，将整体48 h的数据进行分段分析，每一段为3 min，约200点RR间隔，计算得到对应时间段的HRV指标(共10个)，包括三类：一是HRV时域指标，包括RR间隔均值(RR mean)、RR间隔标准差(standard deviation of RR intervals，SDNN)、相邻RR间隔差值的均方根值(square root of the mean squared differences of successive RR intervals，RMSSD)、相差超过50 ms的连续RR间隔百分比(percentage of successive RR intervals differing by more than 50 ms，pNN50)；二是HRV频域指标，包括低频分量(low frequency，LF)、高频分量(high frequency，HF)、低频与高频之比(LF/HF ratio，LF/HF)；三是非线性指标，包括传统阈值样本熵(sample entropy with traditional threshold，SampEnrt)、物理阈值样本熵(sample entropy with physical threshold，SampEnrp)和模糊测度熵(fuzzy measure entropy，FuzzyMEn)[4-5]。

以上三个维度，以HRV为目标，集中在交感和副交感活跃度的判别和分类，但是有不同侧重[6]。时域指标反映了其时间维度的变异性大小；频域指标反映了频率维度的能量分布；非线性指标反映了序列中的模式多少，即复杂程度。用三个维度进行分析有两方面的原因：一是互相补充，多角度分析；二是增加鲁棒性，减少对数据绝对准确性的依赖。鉴于时域和频域指标比较常见，因此下文仅简述非线性指标。

在过去对于HRV的研究中，人们常常关注线性方法，但信号的复杂起源使得传统的线性方法往往有所局限。为了解决这一问题，非线性方法与混沌理论得到了发展，其中尤为突出的是针对人体系统本身非线性动力学属性而发展起来的非线性动力学分析[7]。在现有的非线性动力学方法中，熵测度是一类重要的方法，因其特别适用于短时(约几分钟)信号分析，具有较高临床应用价值；并且，作为量化生理时间序列的规律性的一种宝贵工具，熵理论也加深了人们对心血管系统的基本机制的理解。

本研究采用了RICHMAN等[8]提出的样本熵(sample entropy，SampEn)，该方法是近似熵的改进，较好地解决了之前计算中存在的自匹配问题，被广泛地应用于ECG信号分析、脉诊信号分析以及脑电图(electroencephalogram，EEG)信号情感识别等研究[9-11]。为了避免传统阈值rt下SampEn计算中的不一致性和无效值问题，本研究采用了一种具有物理意义的新阈值rp[4]。之前关于心力衰竭与心房颤动检测的分析结果证明具有物理意义的固定阈值更加有效，其优点有：①避免了RR片段计算中产生的无效熵值；②阈值的选取由生理信号的采样分辨率决定，因而在实际医学应用中更为稳定；③灵活的阈值选取在处理信号波动时具有更好的稳健性。此外，为了克服SampEn中采用阶跃函数作为阈值函数而导致的不一致性等问题，本研究还使用了FuzzyMEn[12]，该方法分别从局部和整体度量信号中隐含的复杂度，从而更加准确地刻画生理信号的内在非线性本质。

在试验过程中，由于只在部分休息前后采集了闪光融合频率(离散测量)、反应时和运动时(离散测量)这两个指标，故只能作为前后对比，来判断休息前后状态是否变化，而无法从一段连续的飞行状态中判断个体的变化。同时，在试验飞行过程中，每15 min测量收缩压、舒张压、脉率、血氧、呼吸率、体温，由受试者主动报给检测人员。鉴于记录时间的分散性，尽管不能作为产生连续变化的明确指标依据，这些生理参数仍然可以作为后期辅助标签对现有的HRV参数进行分析。

1.2.4 统计学分析本试验的数据采用Matlab 2020a进行分析，计算HRV的相关指标，用K均值聚类算法和K近邻算法对现有时间刻度下的HRV参数进行计算，同时使用支持向量机(support vector machines，SVM)和朴素贝叶斯分类器(naive Bayes classifier，NBC)，对不同状态下的参数进行计算。

SVM是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的线性分类器，间隔最大使它有别于感知机；SVM还包括核技巧，这使它成为实质上的非线性分类器。SVM的学习策略就是间隔最大化，可形式化为一个求解凸二次规划的问题，也等价于正则化的合页损失函数的最小化问题；SVM的学习算法就是求解凸二次规划的最优化算法[13]。

NBC是一系列以假设特征之间强(朴素)独立下运用贝叶斯定理为基础的简单概率分类器。该分类器模型会给问题实例分配用特征值表示的类标签，类标签取自有限集合。它不是训练这种分类器的单一算法，而是一系列基于相同原理的算法：所有NBC都假定样本每个特征与其他特征都不相关。贝叶斯方法提供了推理的一种概率手段，它假定待考查的变量遵循某种概率分布，且可根据这些概率及己观察到的数据进行推理，从而作出最优的决策。

本试验的分类建模使用SVM作为多特征多分类的主要分类器，同时用NBC进行辅助概率确定分类，从而完成准确率、敏感性和特异性的计算。

2 结果

2.1 全时程疲劳分析结果

本章节通过主观指标给出试验各个阶段的疲劳程度评估，将算取的ECG信号根据不同时间段所对应的嗜睡和疲劳数值进行标签的赋值，并且刻画出试验过程中连续的HRV指标变化(表1)。

试验设计进行了对于疲劳状态的主观和客观记录，对于短时间序列的疲劳判断，目前学术界并没有标准指标的量化指标，根据文献调查，欧美进行疲劳判断的是小组中的心理人员，心理人员设计问卷并进行等时间间隔问卷调查，然后通过心理人员对试验员的问卷调查结果判断该时刻的疲劳程度。而根据此次试验的调查结果进行标注时，我们选用主观加客观的标注形式，其中主观因素为疲劳量表测量，疲劳量表为个人对自己疲劳程度的判断，由轻到重为0～10分，客观评价指标为闪光融合频率和反应时运动时。

图2分别展示了4组试验人员在48 h试验过称中的ECG RR间隔，主观疲劳指标以及闪光融合频率的变化，从图中可以看出，RPE的数值个体差异性较大，每个试验个体对自身疲劳的判定受主观影响较大，同时闪光融合频率在各次测量时所表现出的变化规律一致性较弱。

左侧y轴为RR间隔值，右侧y轴为闪光融合频率；RPE的数值通过直方图颜色渐变体现，蓝色为不疲劳(RPE=0分)，红色为疲劳(RPE=7分)；两段飞行间的睡眠和恢复阶段分别用浅灰色和深灰色表示。C1～C4代表每个小组的机长；D1～D4代表对应的副机长。ECG：心电图。

试验个体的全程，表中所列举的各个HRV指标将作为提取的特征输入各个试验个体所对应的模型，采用70%作为训练集，30%作为测试集，利用SVM和NBC相结合的优化分类方法，对试验过程中疲劳与非疲劳状态进行区分(表2)。

考虑到个体的特性不同、标准不同，为了消除个体差异性对于模型建立的影响，在给出标注时，我们将不同试验员的疲劳分成3级，分级由个人参与本次试验的状态而定。由疲劳量表的两个极值决定将主观指标均分为3级。由于疲劳量表和其余测试的间隔之间较长，两次测量中间的数据的标签以两端的标签给出。为了使模型更贴近于个人，该结果的计算模型为个人单输入和个人单输出，即每次试验针对每一名试验员，构建其个人模型进行演算；因而本次试验的结果共有8次输入输出。每次输入特征矩阵后，随机选出其中70%的数据作为训练集，30%作为测试集，共循环20次，对于所有的准确率结果去极值并取平均值(表3)。

直观来看，在分析试验全时程数据时，根据主观加客观的分析方式在准确率上并不能让人满意。其原因主要是主观疲劳量表在疲劳程度相对不明显或者对比不明显时，标签的赋值不够准确、过于分散，无法帮助我们区分不同飞行时间段受试者状态的变化。

2.2 夜间飞行状态评估结果

图3展示了以RR mean和SDNN为特征对试验整个过程中疲劳与非疲劳状态进行区分的准确率结果。从图中可以看出，虽然疲劳状态判定的准确率结果个体差异性较大，准确率大于90%的段落主要分布在夜间，即飞行段落3和4、7和8，分别对应试验第1日和第2日的上下半夜时间段。其中，飞行段落3和7，即两个夜晚的上半夜至午夜时间段，疲劳和非疲劳的差异较为明显，故以这两段为研究对象，展开进一步研究。为了区别起见，在下文中将用第1日来代指第3段飞行段落，以第2日来代指第7段飞行段落。

C1～C4代表每个小组的机长；D1～D4代表对应的副机长。图中右侧数字为以RR mean和SDNN为特征对试验特定飞行过程中疲劳与非疲劳状态进行区分的准确率。RR mean：RR相隔均值；SDNN：RR间隔标准差。

图4展示了以10个HRV指标为特征对试验2 d上半夜的疲劳与非疲劳状态进行区分的准确率结果。图中多数试验个体的疲劳判别准确率在90%上下，同时，相比于图5中仅用两个时域HRV指标，部分个体准确率上升，而有些个体的准确率有所下降，说明采用试验涉及的全体HRV指标并不是判别疲劳的最佳方案，故进一步对特征的组合进行研究。

C1～C4代表每个小组的机长；D1～D4代表对应的副机长。图中数字为分别以时域、频域和非线性HRV特征对试验特定飞行过程中疲劳与非疲劳状态进行区分的准确率。HRV：心率变异性。

图5展示了分别以HRV时域指标(RR mean，SDNN，RMSSD，pNN50)、频域指标(LF，HF，LF/HF)和非线性指标(SampEnrt，SampEnrp，FuzzyMEn)为特征对试验2 d上半夜的疲劳与非疲劳状态进行区分的准确率结果。从图5中可以看出，三类特征的总体效果相差不大，准确率均超过80%，且大部分飞行段落的分类结果超过90%。并且，对比第1日和第2日，可以看出在试验第2日的相同时间段疲劳与非疲劳段落之间的差异更明显。因此，出于对准确率和计算效率的考虑，单独使用时域、频域或非线性中的一类特征进行分类是较为合理的方案。

图6展示了利用SampEnrt、SampEnrp和FuzzyMEn分别刻画48 h试验过程中D4个体的飞行与休息段落。从图中可以看出，模拟飞行阶段和睡眠阶段的熵值有较为明显的区别，睡眠时期的熵值明显较低，且物理阈值样本熵相较于传统阈值样本熵和模糊测度熵可以更好地体现出这种区别。这为在未来的研究中进一步评估飞行模拟中的不同生理状态提供了可能性。

SampEn rt：传统阈值样本熵；SampEn rp：物理阈值样本熵；FuzzyMEn：模糊测度熵；HRV：心率变异性。

3 讨论

超过70%的航空事故可归因于人为因素，飞行员疲劳现在被认为是管理和改善飞行安全的关键决定因素之一[14]。在运输行业中，驾驶员最常见的疲劳原因是睡眠不足、休息质量差、压力和过度工作[15]。对于疲劳的有效检测与预警可以降低飞行中事故的发生概率。

疲劳的无创测定主要涉及主观和客观两种方法。主观方法包括自评量表和问卷，较容易受到个人主观判断的影响，并且在试验期间很难频繁地实施问卷[16]。客观方法如反应时和运动时等通过嵌入式行为指标进行的监测仍然无法实现持续测量；使用试验人员的身体运动(如眼睑运动和凝视运动)进行检测则缺乏有效的硬件支持。在这种情况下，包括EEG、眼电图和ECG在内的电生理信号被用于描述驾驶人员的精神负荷、精神疲劳和困倦等概念[17]。其中，EEG已被公认为评估驾驶员和飞行员疲劳的黄金标准[18]。然而，EEG的高成本和难以操作阻碍了其在实际监测中的应用，作为一种简单且快速的测量方法，ECG已成为疲劳测量的重要指标之一。研究已证实心率和HRV与心理生理学领域的困倦和工作量有关，李岩辉[19]以HRV中的LF/HF表征高原公路驾驶员自主神经系统受疲劳的影响；祝荣欣等[20]验证了HRV指标可以有效识别联合收获机驾驶人的疲劳状态；赵小静等[21]通过分析睡眠剥夺受试者，证明了HRV指标可以作为辅助手段，对脑力疲劳状态实现更有效的评测；向洪义等[22]通过结合HRV特征和呼吸频率，建立了驾驶疲劳识别模型，在模拟驾驶试验中准确率达到了80%以上。

本研究同时采用了主观和客观无创疲劳测量方法，其中客观测量方法包括反应时、运动时、闪光融合频率以及ECG信号等。其中，仅有ECG信号实现了连续测量，能较为客观地反映飞行员试验过程中的生理状态变化。

过去的研究倾向于将疲劳分为身体疲劳和精神疲劳，前者被认为等同于肌肉疲劳，而后者本质上被认为是心理疲劳[18]。足球等体育活动主要涉及身体疲劳，而驾驶等单调任务主要导致精神疲劳[23]。本研究实施了轮班飞行模拟，飞行员长时间坐在模拟平台前，易造成精神上的疲劳感；并且，本试验包含夜间飞行，因此困倦也是决定疲劳的一个主要因素[24]。尽管一些研究认为疲劳和困倦是等同的，但疲劳不仅仅等同于困倦或嗜睡[25]。事实上，困倦主要受睡眠缺乏、昼夜节律和清醒时间的调节，而任务时间和认知工作量会累积精神疲劳。即使受试者没有处于昼夜节律的困倦期，飞行模拟中的低唤醒工作状态也可能会导致精神疲劳。因此，对于飞行员疲劳的评估应当综合考量困倦和工作量，这对夜间飞行阶段尤为重要。

综上所述，HRV作为一种无创的连续生理指标，可以清晰地体现不同状态下的自主神经系统变化，通过结合相关分类模型和算法，可靠地完成了对模拟飞行试验中飞行员疲劳状况的评估。虽然长航时飞行中疲劳的形成仍有待进一步的研究，合理的工作时间安排显然是该领域的一个焦点问题。对于疲劳的有效检测与预警可以启示我们如何更好地安排轮班工作时间，从而降低飞行中事故的发生概率。