张博俊,陈天宁,李魏然,赵宇
(1.西安交通大学,西安 710000;2.中国航天员科研训练中心,北京 100094; 3.航天工程大学,北京 101416;4.北京协和医院,北京 100730)
随着经济腾飞、民航行业的整体发展,我国空中运输量一直在不断激增。据统计,2017年,我国共有航空公司58家,民航运营机场233个,在册民航运输飞机3 296架。预计2025年,民航运输飞机将达到7 000余架。[1]空中运输量的增加带来的是认知负荷的提升。为了有效监控飞行器的飞行路线、状态,空中管制作业人员必须长时间、高负荷地对区域内飞行器的运行轨迹进行监视,并基于监视结果对飞行器的飞行路线、状态进行分析判断。随着监控区域内飞行器数量增多,这一过程中空中管制作业人员的认知负荷就可能出现过载甚至崩溃的现象。
认知负荷是执行具体作业时,作用在作业人员认知系统上的负荷,是一个由反映作业与人员特征之间交互的原因维度和反映心理负荷、心理努力和绩效等可测性概念的评估维度所组成的多维结构[2]。认知负荷过载将严重影响作业人员的工作绩效、操作可靠性和身心健康,进而影响整个人机系统的效率和可靠性,因此认知负荷已成为人机系统评价的主要指标之一[3]。空中管制作业(ATC,Air Traffic Control)作为一个典型的人机任务,其认知负荷直接决定空中管制作业人员的判断、决策和操控的准确性,对于人为事故的预防和处理都有着重大意义[4]。
为了对空中管制作业的认知负荷进行有效研究,需要建立一套空中管制作业的模拟实验环境。由于空中管制作业本身往往具备保密性,且考虑作业的安全性和实验成本,研究人员很难就空中管制作业进行直接研究,就需要在实验环境下对空中管制作业进行复制。其次,空中管制作业的复杂性使其难以向认知负荷研究进行聚焦,因此需要对作业本身进行简化的同时保留作业的认知特性。基于以上考虑,本文描述一种满足上述要求的基于空中管制作业模拟的认知负荷实验范式及其实验流程的设计。
依据空中管制作业的作业任务特征、角色特征、环境特征,空中管制作业具备以下特征:(1)空中管制作业属于需要高度注意的作业,作业具备高水平的视觉和听觉占用,并具备高水平的脑力需求;(2)作业中出现失误的主要原因是在人员协同阶段产生的误解和作业阶段的疏忽大意,而这两种失误均在高作业量水平下多发;(3)作业受作业人员的自身个体因素影响明显。
空中管制作业的认知负荷被认为与管制区域内的交通密度、空域复杂性具有较大的关联[5],此外管制区域的几何形态、飞行计划、气候因素也都会对空中管制作业的认知负荷产生影响[6]。在真实空中管制的作业环境中,这些影响因素对实验结果的扰动很难被消除,但在仿真环境下,可以对其中某一项影响因素进行针对性的分析,并控制其他影响因素来保障实验结果的稳定性。那么考虑本研究,通过改变空域内的交通密度,可以实现对作业认知负荷的一个控制,达到以不同的交通密度设计来实现作业认知负荷的梯度化设计。
基于上述的任务分析,研究基于空中管制作业的认知特性设计了如下的实验任务。实验程序将在被测人员前方的屏幕上显示一片空白区域,并以固定的时间间隔在空白区域中的随机位置产生一个可被鼠标点击触发的目标点。当被测人员点击目标点时,如果这个目标点是第一次被触发,那么在屏幕右侧的固定信息栏会显示这个目标点的属性;如果这个目标点被再次触发,那么屏幕右侧的固定信息栏不会产生任何变化(见图1)。
图1 实验范式
在这个过程中,被测人员需要执行两个任务步骤:(1)寻找视野范围内所有目标点中新出现的那一个,并使用鼠标点击以触发这个目标点;(2)根据屏幕右侧固定信息栏上的属性,依次点击正确的选项。在实验过程中,被测人员需要交替进行这两个任务步骤,直到实验结束。
屏幕右侧的固定信息栏将显示目标点的 “数量”“类型”“高度”三项属性。在目标点被首次触发后,被测人员需要根据这三项属性的显示点击图6右下方对应的按钮。例如图6右侧屏幕显示的是“●”“A”“968”,被测人员需要依次点击“一架”“军用飞机”“低空飞行”三个按钮。各项属性具体的显示及其代表的含义见下表1。
表1 目标属性的显示及其含义
(2)指标设计
实验进行过程中共记录正确触发数、错误触发数、触发用时、正确判断数、错误判断数、判断用时和遗漏次数7项绩效数据。
在实验分析过程中,可以通过这7项绩效数据计算到的遗漏率、触发正确率、判断率正确、触发反应时、判断反应时,并进一步综合得到任务成功率和任务效率,见表2。
表2 实验范式产生的绩效指标
实验要求受试者视力或矫正视力正常,没有色盲,没有认知或精神障碍,无癫痫及其他光诱发性疾病史。实验前一天内没有熬夜,没有酒精、可乐、咖啡、精神药物(安眠药、兴奋剂等)的摄入。
实验平台应设置在暗室或其他可控的人工光照环境中,建议为10 m2左右的封闭空间(参考空中管制作业的一般作业环境),避免明显噪声干扰。实验平台上应布署两台PC设备:一台PC设备用于被试人员操作实验范式及进行屏幕录制,该PC设备应包含显示设备、键盘与鼠标输入设备。另一台PC设备用于实验人员监视、记录被试的生理数据,与生理记录设备相连,例如多导生理记录仪、眼动仪等。
为了验证范式设计的有效性,确保实验设计能够体现空中管制作业的认知特性,本研究设计了一组实验,验证实验范式所采集的任务绩效数据是否能与主流的主观评价量表NASA-TLX所得的结果保持一致。
本次实验在中国航天员中心的支持下招募了16名战士参与本次实验。所有受试者均为男性(为了与空中管制作业的实际性别分布情况相匹配),年龄范围介于18-35岁,具有大专或以上学历,能够正常使用PC设备。实验共采集16名受试者数据,每一名受试者采集2次实验的数据,共计32例实验数据被纳入分析。
实验使用了上文所述的范式作为实验的主要任务,以受试者的个人特质作为实验的因变量,使用任务绩效作为认知负荷的主要数据依据,辅以NASA-TLX量表进行主观评估。每名被测进行两次重复实验,每次实验的时长为10 min,实验中目标点出现间隔设定为5 s。两次实验中间间隔5 min。实验具体流程见下表3。
表3 实验流程
每次实验结束后,受试者填写一次NASA-TLX量表。NASA-TLX量表是一种评估作业人员执行任务的工作负荷多维量表[7],通过NASA-TLX量表可以让作业人员进行工作负荷的自我评估,它考察工作6个维度:心智需求、体力需求、时间需求、自我绩效、努力程度、受挫程度[8]。本实验所使用NASA-TLX量表见表4。
表4 实验中使用的NASA-TLX量表
实验统计了32例样本数据中的绩效数据,如下表5所示。
表5 作业任务绩效的描述统计
实验通过NASA-TLX量表采集了受试者对工作负荷的自我评估,结果如表6所示。
表6 NASA-TLX量表的描述统计
图2 NASA-TLX量表的箱型图
研究使用IBM SPSS Statistics软件对任务绩效与NASA-TLX量表的结果进行皮尔逊相关性分析。表7是皮尔逊相关性分析的结果。
表7 任务绩效与NASA-TLX量表结果的皮尔逊相关性分析
上表显示,任务正确率与心智需求在0.01级别呈现显著的负相关,并与受挫程度在0.05级别呈现显著的负相关;任务效率与心智需求在0.01级别呈现显著的负相关,并与努力程度在0.05级别呈现显著的正相关。这说明在所设计的范式中,任务绩效水平确实与作业人员的心理负荷中的心智需求具有明显的关联。
利用仿真技术对空中管制作业进行模拟辅助研究并不是一种新思路,S Loft等人利用空中管制模拟系统验证外部显示辅助设备对于减少预期记忆错误的效果[9];RS Pierce等人则在低保真的空中管制模拟系统中比较了几种情境意识探测技术的效果[10];JB Brookings等人通过空中管制模拟技术研究工作负荷对于人员生理和心理层面的影响[11]。这些年,空中管制作业的仿真在空管人员培训、空管系统的研发中也发挥着越来越重要的作用,因为它能够一定程度上再现空中交通状况,同时又不会对人员和设备产生实质的风险[12]。
随着技术的成熟,对空中管制的模拟越来越走向高保真、高复杂度和多模态交互,但对于空中管制中的某些机制的研究来说,反而导致了研究难以聚焦、变量难以控制、干扰因素过多等一些问题。本研究从空中管制作业的认知特征提取和建立空中管制作业的简化作业任务,以目标搜索和信息识别两个元任务建立了实验范式,用于认知负荷相关的研究,对未来相关领域的探索具备实用价值。
但本研究也存在一定的局限性。空中管制作业人员的工作除了对空域进行监控等认知型任务之外,也包含对使用和维护设备等操作型任务。在实际空中管制作业中,设备的差异对于空中管制作业的认知负荷也产生了较为明显的影响,这说明这类任务对于认知负荷的研究仍然是不可忽略。而这一点在目前的实验范式中无法得到体现。对空中管制设备的具体操作细节缺乏了解是造成这一局限性的主要原因,因此后续我们还将继续进行这项研究,基于不同的背景和目的设计开发更多适合空中管制作业任务的实验范式。