系统可信度和人格特质对人机协同决策的影响研究

2024-03-07 08:32张宜静李志忠
载人航天 2024年1期
关键词:神经质人机开放性

李 威,汪 亮,张宜静,3∗,李志忠

(1.北京建筑大学机电与车辆工程学院,北京 102616;2.人因工程全国重点实验室,北京 100094;3.清华大学工业工程系,北京 100084)

1 引言

随着科学技术的发展以及机器智能水平的提高,人机协同的工作模式愈发常见[1],其中一个重要应用方向为人机协同决策[2]。 在协同决策的过程中,智能体(包括智能机器人、智能系统等)一般作为决策的辅助者,为人类做出更优的决策提供数据支撑或建议[3]。 研究表明,在决策过程中引入智能体,可以减轻决策人员的认知负荷,带来更优的决策结果[4⁃5]。 人机协同决策可以克服人类决策者的认知局限,在多项研究中已被证实是更科学和有效的决策方式[6]。 协同决策的主要应用领域包括灾后救援、航空航天、核电等。 在人机协同救援时,智能系统可以为救援人员提供勘察搜索、路径规划等建议,提高搜救效率[7]。 但智能体决策通常基于高度复杂和不透明的算法,人们往往难以知晓其决策规则及其内在含义[2]。 这一类似黑箱的过程将导致人们对智能体决策建议的感知可信度较低,进一步影响对建议的判断[8]。 因此,探讨智能体可信度对协同决策的影响机理,可以为复杂系统的信息设计提供指导,在协同救援、航空航天等实际任务中具有重要的意义。

可信性是人类心中对客观对象各属性较为整体的反映[9]。 对智能系统而言,广义的可信度包含了可靠性、正确性、安全性、可用性以及鲁棒性等众多属性[10]。 信息的可信度则是指信息的可靠性及其被接收者所信任的程度[11]。 具有高可信度的信息应该是准确、完整、清晰,并且来源可靠。 信息的可信度是人们认为其具有参考价值的重要因素,因为它能够让人们确定信息的真实性,消除疑虑和不信任。 信息领域的研究表明,提供信息越清晰,产生的可信度越高[12]。 Zhang 等[13]在电商平台推荐研究中发现,可信度对建议采纳有显著的正向影响。 Mercado 等[14]研究发现,随着对系统建议的支持信息的增加,参试者对系统正确建议的接受率显著提高;提高系统可信度,决策者对系统建议的正确采纳次数也显著增加,但决策时间没有显著变化。 Stowers 等[15]研究了人与智能军事防御系统协同,研究发现决策时间、任务绩效随着系统可信度的增加而显著增加。 Big⁃ras 等[16]研究了产品分类任务中,产品规划师的任务绩效和满意度与辅助系统的可信度之间的关系,结果表明可信度的提高显著增加了用户的满意度与任务绩效。 现有研究表明,可以从所提供信息可信度的角度来调整系统可信度,而系统可信度对协同绩效的影响总体是提高的,但对其如何影响决策时间,尚未有统一结论。

为实现高效人机协同,研究人员从自动化的可信度、可靠性、自主性等属性方面进行了许多研究,但很少考虑人类自身特点对协同绩效的影响。人类作为现阶段人机协同的主体之一,人的个体差异将不可避免的对人机协同产生影响。 Stanov⁃ich 等[17]研究发现人在决策中进行信息加工时存在个体差异,但少有研究证明个体的差异对协同绩效产生影响。 近年来的研究表明[18],个体的人格差异影响人们处理信息的方式,影响人们的行为。 Hovland 等[19]研究发现,不同的个体在对待相同的信息时,会选择不同的方式进行可信度判断。 李思贤等[20]基于建议者-决策者系统(Judge-Advisor System,JAS)建立了个体对智能系统建议使用的因素模型,分别从决策者(人类)、建议者(智能系统)和人机互动过程(交互方式)分析了个体对系统建议使用的影响,其中,决策者的大五人格是决策者维度上重要影响因素之一。 陈莉等[21]研究神经质对情绪信息加工的影响研究时发现,两者存在着特质一致性效应,情绪信息加工过程中偏爱加工与其人格类型相同的信息,高神经质的参试者会对负性信息更为敏感。 Byrne等[22]针对大五人格与决策的研究中发现,神经质与被试在有时间压力的决策游戏中的绩效呈负相关关系。 在开放性上,Colquitt 等[23]发现,低开放性的个体在使用计算机辅助沟通和决策工具时,对决策绩效有轻微的不利影响,高开放性的个体则表现出显著的绩效提升。

综上所述,针对人机协同过程中系统可信度与绩效的关系进行了探讨,但缺乏考虑作为交互主体的人的个性特征对协同决策的影响以及与可信度之间的交互作用。 因此,本文研究拟在人机协同应急救援的背景下,聚焦协同决策任务,考察系统可信度和人的神经质与开放性水平对协同决策的影响。 从人因工程的角度,通过实验进行实证研究,以期丰富人机协同相关理论,为复杂系统的信息设计和操作人员的选拔提供现实指导。

2 研究方法

2.1 实验设计

为研究机和人的不同特性对协同决策的影响,实验选择灾后救援为背景,参试者需要与智能救援车(智能系统)协作,完成对特定区域被困人员的勘察。 实验为组间设计,自变量为智能系统可信度,从调整系统信息提供的角度设置低、中、高3 个水平,见图1。 低水平组,系统仅给出基本客观信息,如当前救援车状态、目标区域的被困人数;中水平组,在低水平的基础上,还给出以往使用者对系统的使用评价;高水平组,在中水平信息的基础上,还给出系统建议的技术依据,表达系统决策建议的来源。

图1 不同系统可信度水平的信息显示Fig.1 Information display for different levels of sys⁃tem credibility

实验选取人格特质中的神经质和开放性作为为解释变量,使用大五人格问卷(NEO⁃FFI⁃R)进行测量。 问卷采用五点式李克特量表,从非常不同意至非常同意依次为1 ~5 分。 问卷包含5 个人格维度:外向性(Extraversion)、宜人性(Agreea⁃bleness)、 尽 责 性(Conscientiousness)、 神 经 质(Neuroticism) 以及开放性(Openness to experi⁃ence),每个维度设置12 个题项,其中消极评价项目采用反向计分,各题项之和为参试者该维度的得分。

实验因变量为参试者的任务完成时间、决策时间和任务得分。 任务完成时间是指参试者开始实验任务到收到任务结束提示的时间;决策时间是指从智能系统给出拍照建议到参试者做出是否采纳建议的时间;任务得分是指参试者在救援区域拍摄到的被困人员的数量(0 ~5 分,分别对应照片拍摄到0~5 名被困人员)。 任务完成时间和决策时间由实验平台自动记录。

2.2 志愿者

实验招募了北京某高校理工科学生志愿者54 人(18 ~30 岁),其中女生23 人,男生31 人。实验开始前,参试者被告知实验相关规定,自愿签署知情同意书。

2.3 实验平台

一台配备23 寸显示屏的计算机(分辨率为1920×1080),运行基于Unity3D 软件搭建的实验平台,平台模拟某城镇地震灾后的场景。 场景中共设置A、B、C 等3 个任务目标点,在任务目标建筑物周围放置有人形组件用来模拟被困人员,A处为医院,周围放置2 个人型组件;B 处为学校,周围放置2 个人型组件;C 处为损毁的居民楼,建筑物周围放置1 个人型组件。 每个目标点处的被困人员数量告知了志愿者。

2.4 实验任务

实验过程中,志愿者担任的角色为人机联合救援队的人类队员,与救援车(智能系统)协同工作,对任务点处的被困人员进行拍照勘察,明确具体被困位置。 救援车按照设定路线自动行进到任务点附近时,志愿者需要在目标建筑物附近寻找被困人员,并对所在位置拍照。 要求每个目标建筑物附近只能拍摄一张照片,拍摄信息尽可能全且清晰可见,无遮挡物。 智能车的决策辅助系统会提供关于最佳拍照点的建议,并在不同可信度水平下以不同信息形式提供建议(图1)。

2.5 实验过程

实验分为3 个阶段。 首先是实验前培训。 志愿者接受20 min 的任务培训,培训方式为观看培训视频,该视频为预先设计并录制,内容包括灾后救援的实验背景、实验任务以及实验平台操作方法等。 然后是休息调整及问卷。 培训之后,志愿者会有10 min 的理解时间,接着志愿者填写大五人格问卷。 最后是正式实验。 每名参试者在不同可信度水平上,完成拍照勘察的实验任务,所需时间约15 min。

3 结果

3.1 描述性统计

首先对参试者的神经质、开放性得分以及绩效指标进行描述性统计,表1 中列出了各指标的均值、标准差、最大值、最小值。

表1 描述性统计结果(n=54)Table 1 Results of descriptive statistics(n=54)

3.2 层次回归分析

将系统可信度这一分类变量进行哑变量处理,以低水平为对照组,设置系统可信度中低差异和系统可信度高低差异2 个哑变量,与解释变量以及因变量进行相关性分析,采用Hayes[24]提出的层次回归分析的方法建立分析模型,检验自变量与人格特质对任务绩效的交互作用。 模型1 中包括志愿者的年龄、性别和自变量系统可信度,模型2 在模型1 的基础上加入与绩效指标具有相关性的人格特质,模型3 在模型2 的基础上加入系统可信度与人格特质的交互项。 表2 中列出了各自变量与解释变量对绩效指标的Pearson 相关系数。 表3 至表5 列出了层次回归分析模型的标准化回归系数β、调整拟合优度△R2、方差检验量的变化量△F值。

表2 Pearson 相关系数Table 2 Pearson’s correlation coefficient

表3 对任务完成时间的层次回归分析Table 3 Hierarchical regression analysis of task comple⁃tion time

1)任务完成时间。 由相关性分析可知,任务完成时间与神经质(r=- 0.191,P<0.1)边缘显著负相关;根据相关分析的结果,将神经质加入相应的线性模型,分析其与系统可信度的交互作用,结果见表3。 由表3 可知,系统可信度和神经质的主效应不显著,神经质与系统可信度高低差异的交互项系数显著且为正(β= 0.505,P<0.05),表明系统可信度与任务完成时间的关系受神经质的调节,调节方向为增强系统可信度对任务完成时间的影响。 为进一步检验调节效应,对不同系统可信度绘制了交互效应图,如图2 所示,低神经质水平的参试者是指其神经质人格得分处于所有参试者分数中位数以下,图中直线斜率反映了系统可信度对任务时间影响的大小。

图2 神经质对可信度-任务完成时间的调节作用Fig.2 The moderating effect of neuroticism on credi⁃bility⁃task completion time

简单斜率检验表明,对于低神经质得分的参试者,系统可信度的提高并不能显著预测任务完成时间(直线斜率B=-0.13,t=-1.484,P>0.05);对于高神经质得分的参试者,系统可信度与任务完成时间显著正相关(直线斜率B=0.189,t=2.199,P<0.05)。

2)决策时间。 由相关性分析可知,决策时间与系统可信度高低差异(r=0.287,P<0.05)显著正相关,与开放性(r=-0.178,P<0.1)边缘显著负相关;根据相关分析的结果,将开放性加入相应的线性模型,分析其与系统可信度高低差异的交互作用,结果见表4。 由表4 可知,与低系统可信度相比,在高可信度水平下,参试者的决策时间显著增加(β=0.418,P<0.05);与低开放性相比,高开放性的参试者决策时间显著减少(β=-0.279,P<0.05),开放性与高系统可信度高低差异的交互项系数显著且为负(β=-0.299,P<0.05),与系统可信度高低差异主效应符号相反,这表明系统可信度与决策时间的关系受开放性的调节,调节方向为减弱系统可信度对决策时间的影响。 为进一步检验调节效应,对不同可信度水平绘制了交互效应图,如图3,图中直线斜率反映了系统可信度对决策时间影响的大小低开放性水平的参试者是指其开放性人格得分处于所有参试者分数中位数以下。

表4 对决策时间的层次回归分析Table 4 Hierarchical regression analysis of decision⁃making time

图3 开放性对可信度-决策时间的调节作用Fig.3 The moderating effect of openness on credibil⁃ity⁃decision time

简单斜率检验表明,对于低开放性得分的参试者,系统可信度与决策时间显著正相关(直线斜率B=0.394,t=3.392,P<0.05);对于高开放性得分的参试者,系统可信度的提高并不能显著预测决策时间变化(直线斜率B=0.091,t=0.721,P>0.05)。

3)任务得分。 由相关性分析可知,任务得分只与系统可信度高低差异(r=0.447,P<0.01)显著正相关,因此只需按模型1 进行分析,分析结果见表5。 由表5 可知,与低系统可信度相比,高系统可信度时,参试者的任务得分显著增加(β=0.418,P<0.05)。

表5 对任务得分的层次回归分析Table 5 Hierarchical regression analysis of task score

4 讨论

在地震灾后救援情境下,数据分析结果表明,提高系统可信度水平使参试者的决策时间和任务得分显著增加。 从实验设置角度看,研究通过改变系统提供的信息调整系统可信度,更高的可信度带来了更大的信息量,使得认知过程更加复杂,需要志愿者花费更多的时间进行理解与分析,导致决策时间的显著增加。 研究表明[21],提供更多的相关信息,使操作员能够更好地评估系统的可靠性、可预测性,也提高了操作员感知、理解和预测系统表现的能力,从而决定是否使用自动化[25-26]。 正是由于参试者对系统决策的评估与理解,任务得分与低系统可信度相比显著增加,表明系统可信度的增加是在效率有所牺牲的代价下提高协同决策的质量。

研究发现,对于高神经质水平的志愿者,系统可信度的增加会显著增加任务完成时间。 个体的神经质水平是其情绪状态的稳定性和内心体验的倾向性的反映,表现个体负面情绪的倾向性。 低水平的人镇定、自信,而高水平的人则容易沉浸于负面情绪,如焦虑、紧张等。 张利燕等[27]从认知方式方面对神经质人格进行了研究,在紧张条件下,高神经质个体的唤醒水平更高,容易焦虑,从而抑制或干扰认知操作;但低神经质个体由于适度的激活,会激发出更大的认知努力,使认知操作得以改善。 研究表明[28],在应急救援团队中,当团队整体的神经质水平较高时,团队内的抗压能力较差,团队容易被消极紧张情绪笼罩,从而降低了对周围环境的敏感性,团队情境意识降低,不利于团队绩效。 高神经质的志愿者在面对高可信度的自动化时,获得了更多关于系统的信息,可能感知到的任务复杂度更高,导致对任务处理的压力与焦虑更加严重,对决策缺乏信心而对信息反复处理,导致任务完成时间增加。

研究发现,对于低开放性水平的参试者,系统可信度水平的增加会显著增加决策时间。 大五人格中开放性维度是研究最少的一个维度,国外研究发现[29],开放性似乎是个积极的人格特质,高开放性个体压力弹性更好,而低开放性个体面对压力的不良影响会更脆弱。 如前所述,由于系统可信度水平的增加带来了信息量的增加,志愿者可能感知到的任务复杂度更高,给低开放性水平的参试者带来更大的压力,因此对接纳建议的思考时间更长,显著增加接受建议的决策时间。

本文研究存在一定不足之处。 首先,本文仅从信息提供的角度调整了系统可信度,未来可采用其他方式进行可信度的调控,以及结合更多系统特征开展探讨。 此外,本文从研究需要出发,依据理论分析、专家讨论等方式确定了系统可信度水平的内容设置,不一定很好地反映现实情形。最后,考虑了人格特质的影响,但鉴于样本量限制,只是进行了初步的探讨,尚有待更多样本的验证。

5 结论

1)系统可信度增加可显著提高协同救援任务的得分。 结果说明,系统信息界面设计需确保可信度,这有益于提高协同救援效率。

2)提高系统可信度显著提高了任务得分,对协同救援任务是有益的,在进行系统界面设计时要确保系统可信度。 本文研究通过系统提供的信息来调整系统可信度,可信度提高同时带来信息量的增加,也因此增加了认知负荷,尤其对于低开放性个体影响较大。 系统可信度可以探讨其他的增强方式。

3)人格特质的神经质与开放性与系统可信度存在交互作用,影响了团队绩效。 这表明人的因素在未来人机团队的构建中也是不可忽视的重要方面。 在诸如航天、核电、军事等复杂领域已有相关人因研究。 未来可作为人机协同人员选拔的参考,以达到良好的人机协同效果。

猜你喜欢
神经质人机开放性
人机“翻译员”
神经质有九个表现
从内到外,看懂无人机
例析三类开放性问题的解法
初中英语开放性探究式阅读教学策略
大学生主观幸福感与人格特征之间的关系
“人机大战”人类智慧遭遇强敌
未来深空探测中的人机联合探测
寻根压力
神经质人格的神经生理基础*