马 华
(苏州工艺美术职业技术学院 江苏 苏州 215000)
智能增强IA是人工智能领域正在被关注的方向。IA强调使用智能计算来辅助和加强人类的智力工作,而不是强调模拟人类智力并替代人类工作。IA以人为中心,关注人类用户的需求及其任务,旨在与人类用户协同完成工作。交互设计则成为人与智能算法之间实现有效协同的重要因素。这为交互领域的研究提供了新的需求与动力。目前,面向智能增强IA系统的交互设计研究仍处于起始阶段,需要进一步对智能增强的特征进行探究,并分析其特有的交互特性、交互设计原则、策略与方法,从而为智能增强IA系统的设计研究提供有效支撑。
人工智能(artificial intelligence,AI)是正在不断发展的机器智能重要研究领域。人工智能旨在复制人类的认知过程,去处理多种来源的数据与信息,并模拟人类智能形成决策模型。智能增强(intelligence augmentation,IA),作为人工智能发展的另一个方向,也正在被关注和探索。
自从科学家Engelbart等[1]提出需要使用现代技术来“增强人类的智力”,研究者们分析了扩展和增强人类智力能力的概念框架,设定IA的目标为提升人类的工作效率,认为IA是介于完全人力和完全自动化之间的解决方案。然而针对智能增强IA的系统化研究工作还很不足。
人工智能AI基于数据和分析模型,关注计算机的算法和计算能力。而智能增强IA更多地关注如何使AI技术与人类能够更好地相互补充、在人类的工作任务中更好地互助,以及如何更有效地使用信息技术去强化人类的能力。因此,对于智能增强而言,人是其核心的关注点,而不是AI技术本身。例如帮助人们正确进行英语书写的软件“Grammarly”是IA应用的一个典型案例。“Grammarly”通过智能算法对用户的原始英语文本提出语法、措辞等方面的纠正建议,供用户参考。用户则基于建议,根据其自身的判断,选择接受或忽略建议,并对文本进行修改编辑。随后,算法基于用户的选择和编辑又提出新的建议。整个过程中,用户与智能算法,通过持续的交互,共同完成英语书写的纠正和优化任务。
因此,人机交互领域专家王党校等[2]提出:“智能增强是以增强人机交互为目的;智能增强为交互研究提供了新的需求和动力,因此实现人机和谐成为一个新的研究课题;在基础研究和应用层面,面向智能增强的研究均具有其重要的研究价值”。另外,许为等[3]也提出智能增强IA是以人为中心的AI研究的新领域之一。
智能增强是通过强化人类工作能力,简化工作流程,优化工作和生活环境等方法来实现的。其现有的应用领域包含了自动驾驶、工业互联网、机器人、遥感控制、医疗健康等很多相关方面。通过分析这些应用,可以发现智能增强具有人机互补性、人类自主性、任务情境化等方面特征。
(1)人机互补性:在基于智能增强的人类任务的完成过程中,机器智能与人类智能形成了有效的互补与互助。AI机器智能承担了计算的角色,即通过计算进行预测或进行公式化的决策;人类则基于机器智能的计算力和计算结果,结合人的知识、经验和智慧进行行为的判断。在这个过程中,机器智能的计算速度、计算准确度和处理大规模数据的能力是人类无法获得和施展的。同时人类所具有的领域知识、生活经验,以及进行复杂判断的能力,则是机器智能所不足的。因此,智能增强具有明显的人—机的互补性。
(2)人类自主性:人工智能旨在没有人类帮助的情况下工作,并且以在人类的任务中替代人类为目标。而智能增强IA具有人类的自主性,IA中的智能算法不必参与决策过程。相反,IA将分析数据等结果报告给用户,由人类自主接管,自主决策。基于机器智能的运算,人类是系统运行过程中的最终决策者。例如Apple的Siri、语言纠正工具Grammarly等虚拟助手,它们不会替用户做决定,只是在用户需要时提供合适的数据或信息,从而来辅助人们的判断、选择和决定。
(3)任务情境化:根据帮助人们完成的目标不同,智能增强IA所面向的关联性任务不同。这些任务的内容包括:动态地生成、反馈与情境相关的智能信息,提供解决方案与决策建议,以及支持人与机器智能的交互协作。其中IA面向的任务所属的情境不同,机器智能在IA中承担的角色就不同。例如Zhou等[4]提出IA的任务可以分为工具、助手、协作、训练和协调五个情境,因此机器智能在这些不同的IA情境中的角色及其与人类用户的交互模式也有着相应不同。
近年来,机器学习领域提出需要更多地采用融合“以人为中心”的方法。研究者们开始通过人与AI的交互来解决问题,例如以人为中心AI和人在环路混合智能[5]等。同时交互领域的学者们也开始研究如何通过交互来为人们使用智能工具提供支持,例如在人们与机器智能的协作过程中,设计人们与多种备选操作方案的交互、通过交互保证和实现人们在过程中的主导性和控制权等。因此,面向智能增强IA的交互设计研究将进一步推进IA的发展。在面向IA的交互设计研究中,最核心最需要关注的问题是:如何将智能推理的AI算法功能与以人为中心的交互系统进行有效整合[6],本文主要围绕这个问题进行阐述。
在智能增强IA中,AI与人类用户组成了相互合作的“人—AI小组”,即机器的自动化功能与人类用户的自治的相互配合与协作。Sawyer等[7]提出,在AI智能与人类用户的小组合作中,存在着一种交互“轮唱”。基于交互“轮唱”,结合其中人类用户的感知—行动过程,提出了“互补性”循环交互框架,见图1。首先当系统运行了相应的智能算法(系统行动),便开始等待人类操作者的下一步操作(用户等待)。与此同时,人类用户开始了从“感知”到“行动”的过程,即“感知”智能系统在运行后分析并呈现给人类用户的相关信息(用户感知),然后在此基础上人类用户决定将如何“行动”(用户行动)。之后在系统等待用户的行动后(系统等待),开始新一轮的(系统行动)。于是形成了机器智能与人类用户的交互循环。
图1 “互补性”循环交互框架(基于Sawyer交互“轮唱”)
在这样的交互循环中,机器智能与人类用户的双方角色在三个方面展现能力互补[8],如图1。首先在“不确定性”方面,机器智能根据预测分析提供实时的提醒信息,人类用户面临不确定时,能够依靠自身直觉快速决策。其次面对“复杂性”时,机器智能能够收集、处理和分析数据,而人类用户能够决定到哪里搜寻和收集数据,并基于数据支持做出决定。最后对于“多义性”冲突,当机器智能在分析后展示出多种不同的解读时,人类用户能够协调这样的“多义”以形成统一,并通过与系统的交互,重新获得智能支持。
因此,在面向IA的交互设计中,设计者可以基于互补性的循环交互框架,设计AI系统运行过程中人类用户参与“感知”的时刻、做出“决策”的时刻以及直接在系统中“操作”的时刻;设计机器智能开始计算分析的时刻和提供给人类操作者各种信息线索的时刻等。另外,在交互设计中,双方的互补能力为整合人类和机器智能,并寻找到双方各自合适的功能角色提供引导。
为了引导智能系统的交互设计实践,来自美国微软及华盛顿大学的Amershi等[9]于2019年提出了人与AI交互的18条交互设计原则,见表1。此原则从交互行为的起始、行为中、行为后,以及交互出错时这四个时段归纳了与之相对应的设计指导。
表1 人与AI的交互设计原则(Amershi等[9])
(1)在人与AI交互的起始阶段,帮助用户理解AI的功能和表现是交互设计需要关注的(G1和G2)。
(2)在交互行为过程中,随着交互的进程,实时、按需提供与用户情境相关的信息服务(G3和G4);信息的传递和表达需要与用户的习惯理解和当下的社会文化标准相一致,以及防止产生各种偏见的可能(G5和G6)。
(3)当交互过程中出现错误时,支持用户依照自己的需要和理解,选择、忽略或者纠正AI的信息服务和执行结果(G7、G8和G9);主动向用户提供可供选择的不同的可能结果(G10)并告知用户AI行为的原因(G11)。
(4)在交互行为过后,记录最近的用户交互行为,并学习总结用户的个性化特点,赋予个性化的全局控制(G12、G13和G17);支持用户对交互体验的直接反馈以及系统对用户行为结果的实时反馈(G15和G16),同时将AI的系统变化与更新实时告知用户(G14和G18)。
当面向智能增强IA,以上交互设计原则依然能够很好地引导交互设计实践。然而,对于智能增强IA,交互设计需要更为着重地有效支撑智能增强“人—AI小组”的实现和运行,即有效支持和实现人与机器智能的协同与协作。因此,基于1.2节描述的智能增强的人机互补性、人类自主性、任务情境化特征,以及2.1节描述的“互补性”循环交互框架,
本文基于以上交互设计原则,进行了有针对性的分类重整,使其能够更好地指导面向智能增强IA的交互设计,见图2。
图2 面向智能增强IA的交互设计原则(G1-G18基于Amershi等[9])
基于人与机器智能的交互循环框架来分类交互设计原则,而不是以单个交互行为的前、中、后等的不同时段去分类。由于系统目标的差异,交互设计原则在智能增强IA的交互设计中对应着四个不同的阶段,具有不同的内涵。
如图2,在系统运行智能算法阶段(系统行动),交互设计首先需要关注如何帮助用户理解智能算法的功能和表现(G1和G2);并在此基础上向用户提供不同的可供选择的结果、信息和方案(G10),告知用户产生这些方案的原因(G11);而当智能算法发生变化或产生更新的结果时,须实时告知用户(G14和G18)。
当进入用户等待和用户感知阶段,结合“人—AI小组”需要共同完成的任务及任务流,按需实时提供与完成具体任务相关的信息服务(G3和G4);同时信息的传递和表达需要满足完成任务的需要,并需要与用户的习惯理解和当下的社会文化标准相一致,以及防止产生各种偏见的可能(G5和G6)。
在用户开始操作的阶段(用户行动),交互设计支持用户依照任务流程和自己完成任务时的需要和认知,自行选择或者忽略智能算法提供的信息服务;并提供用户在其自主分析的基础上,对AI执行结果进行纠正的通道(G7、G8和G9);支持用户在操作过程中直接反馈自身的交互体验,并提供用户个性化的全局、全过程的自主控制(G15和G17)。
在用户操作过后,下一次智能算法开始执行前(系统等待),系统需要反馈用户操作产生的结果和影响(G16);记录并分析用户已有的交互行为,并学习总结个性化的用户特征,从而支持智能算法对个性化情境和不同用户的算法包容(G12和G13)。
以上面向智能增强IA的交互设计原则,对IA系统的交互设计具有参考意义。特别是,在将智能推理的AI算法功能与以人为中心的交互系统进行整合过程中,原则上能够指导设计合适的交互流程与信息架构,从而适时、有效地确定智能算法提供信息服务的时间点和表现形式,以及人类用户参与操作和决策的时间点和交互方法等。
由于智能增强IA具有人机互补性、人类自主性和任务情境化等方面的特征,需要进一步探索有效的交互设计方法与策略,以满足人类用户与智能算法之间合作互动的交互系统的创建。
(1)任务的共享呈现:Heer[6]1845在分析现有智能增强系统的基础上,提出了基于对人的行为预测的“任务共享呈现”。作为面向IA的设计方法和策略,“任务共享呈现”使得人与智能算法能够相互学习,并合作面对共同的系统目标与任务。
具体来说,“任务的共享表现”是基于对人类用户所需完成任务的计算推理,对用户可能的行为进行设计表现,并提供交互界面使得用户能够查阅、选择、修正或者否定驳回推理算法提供的建议结果。在这个过程中,用户行为的呈现、提供人与算法有效合作的交互界面,以及对应的交互模型是此设计策略的三个重要元素。另外,在IA系统中,由于人类用户的交互操作对智能算法本身具有不断优化和精进的作用,因此伴随IA交互循环的交互界面的更新将有助于提升IA系统的可用性和有效性。
(2)可调节与自适应:IA需要在交互策略中提供人类用户“调节系统自动化水平”的可能,使得IA具有可调节性。所谓“调节系统自动化水平”,就是在用户和智能算法的协作中,用户在交互过程中有自由、有可能调节人机协作中自动算法参与程度的多少,以及用户主动控制程度的多少。
同时IA通过观察用户的交互反馈情况,来理解用户的不同情况下的需求和状态,从而能够主动、动态地分配系统的自动化算法功能的部分和用户自主控制的部分,使得IA实现其自适应性,能够适应不规律和无法事先预测的用户行为。
(3)强化认知同步:IA的设计除了需要规划合理的交互时间点,还需要对人类用户的认知过程予以支持,从而强化IA与人的认知过程的同步。人类并不具有如机器那般的快速反应能力,也不具备如机器算法的强大的算力。因此,IA需要基于用户的认知模型,特别是与认知的时间相关的因素与模型,来增强IA中智能信息服务的用户有效性,既不分散用户的注意力、打扰用户,也不因为过长的延迟时间而失去智能服务的价值。
IA一方面通过观察用户与系统交互的时间,或者通过用户的自定义,来确定与用户认知过程相关的时间模型;另一方面,通过快速综合多种信息,考虑计算算法所传达信息的复杂度和长度等,并为用户过滤不重要的信息,或者突出重要的信息,从而降低用户在做决策时会面临的时间压力。这些具体的策略和方法能够使IA匹配用户与智能算法之间沟通的时间节奏,使沟通更为高效。
综上所述,智能增强IA作为人工智能领域被关注的发展方向,需要更多地引入“以人为中心”的方法。虽然人们提出了“人为中心AI”和“人在环路混合智能”,但是IA因为凸显了人机互补性、人类自主性和任务情境化等与人和情境密切相关的特征,亟待交互设计领域更有针对性和更为深入的研究,从而推进其系统性的发展。面向智能增强的交互设计,如何将智能推理的AI算法功能与以人为中心的交互系统进行有效整合。未来,更多的相关研究问题需要被关注,人与智能算法的协同需要更紧密、更有效、更和谐。