技术特性对政务智能聊天机器人初始信任的影响*

2022-07-18 06:28冉龙亚孙宁华
情报杂志 2022年7期
关键词:易用性聊天政务

冉龙亚 陈 涛 孙宁华

(华中科技大学公共管理学院 武汉 430074)

0 引 言

经过70余年的探索,人工智能技术已经取得了突破式的发展,并日益在社会生活的各方面得到了广泛应用。在此背景下,将人工智能应用于政务服务,既是社会发展的必然趋势,又是办事公众的现实需要,同时更是政府部门与时俱进提升自身政务服务供给水平与能力的必然选择[1]。智能聊天机器人是一种使用自然语言处理技术与用户进行交互的计算机程序,它根据用户的输入从文本中提取有意义的信息[2],并根据用户提出问题的意图作出适当的答复[3]。由于可用于向公众提供办事咨询和政策答疑等多项服务,并具有提升政务服务效率、减少服务成本、改善服务体验以及增强公众满意度等多重优势,政府部门正开始加速采用该技术。

尽管如此,社会公众对智能聊天机器人等智能技术的信任并没有和其流行程度成正比、整体信任水平仍然较低[4]。对于智能技术的信任,是十分重要的。因为正如和其它信息技术一样,信任是技术接受和采纳的重要前提[5],而考虑到人工智能技术的特殊性,信任的作用更为显著[6]。鉴于此,探索影响公众对政务智能聊天机器人信任的因素及其作用机制,对于它的成功采纳与应用具有极其重要的意义。

在影响公众对智能技术的信任和采纳等方面的因素中,技术本身的特性是最重要的[7]。有研究对智能技术的技术特性和信任之间的关系进行了探讨,如在医疗保健领域,Liu等在对智能医疗的采纳研究中发现,智能医疗的拟人性和个性化特征,会显著影响公众对它的信任[8];在电子商务领域研究中,也得出了相同的结论,即智能聊天机器人的智能性、拟人性等特性,是影响公众对它的信任的重要因素[9],它们都对于公众的信任和采纳,具有积极的影响[10]。

现有相关研究为本文探讨政务智能聊天机器人的初始信任问题,提供了重要的见解和支撑。但,存在的不足仍然值得引起重视。首先最重要的一点,当前关于技术特性对于公众信任的影响的研究,主要仍然集中于电子商务、智能医疗等领域,而在电子政务背景下的实证研究,还较为匮乏[11]。很少有研究从具体的理论模型出发,探究这些因素对初始信任的影响路径与作用机制[12],不同学者的研究也并未能得到统一的结论[13]。鉴于此,本文在前人的基础上,进一步从电子政务的研究背景出发,同时结合TAM模型的应用,来探究智能聊天机器人的技术特性对公众初始信任的影响及其相应的作用机理。

1 研究基础及假设

1.1 技术接受模型

Davis提出了经典的技术接受模型(Technology Acceptance Model,TAM),用以预测和解释对信息技术的接受等相关问题[14]。时至今日,经过学者们多年的反复验证,它已经成为了信息系统研究领域中应用最广泛的理论之一。本研究选取了TAM作为理论基础,因为它是解释各种信息系统采纳方面的最简洁、最有力的理论之一[8]。

根据Davis的定义,感知有用性指的是“用户对使用政务智能聊天机器人对于提升获取政务服务的效率和有用性方面的感知”,感知易用性是指“用户对使用政务智能聊天机器人的容易程度的感知”[14]。众多研究已经表明,正如TAM中所指出的一样,感知易用性对于感知有用性具有显著正向影响。尽管政务智能聊天机器人是一种新应用,但是二者间的上述关系仍然成立。据此,综合TAM的相关理论和电子政务领域的实证研究结论,本文提出如下假设:

H1:对政务智能聊天机器人的感知易用性显著正向影响感知有用性。

1.2 初始信任

在信息系统领域,信任代表了对系统的可靠性、有效性和安全性等的一种信念[15]。根据形成阶段,信任常常被划分为初始信任和持续信任两种不同类型[16]。所谓“初始信任”,是指双方在第一次见面或互动的时候,在彼此没有直接经验的情况下形成或建立的信任[17]。随着互动的增加,当用户获得更多的经验时,初始信任发展为持续信任。作为一种新技术,政务智能聊天机器人带给用户的会是一种全新的服务体验。因此,这一阶段所建立起来的信任,是在没有先验经验的初始互动期内发展起来的,属于上文提到的可能决定“双方第一次互动”的“信任”。因此,为了更好地契合本研究的现实背景,本文将研究主题界定为“初始信任”,而不是“持续信任”或一般意义上的“信任”。

在本文中,初始信任指的是“用户认为政务智能聊天机器人在提供政务服务方面的可靠、值得信赖的程度”。在关于人工智能的研究中,已经有少量研究将信任与TAM联系起来,用以预测用户对人工智能的态度与行为。如Zhang等人研究发现,信任是促进对自动驾驶汽车使用意愿的最重要因素之一,而感知有用性和感知易用性又是促进消费者对自动驾驶汽车的信任的重要决定因素[18]。在智能医疗服务领域,Liu 等也有相同的发现,即消费者对智能医疗服务的有用性和易用性的感知,同样对于初始信任具有显著正向影响[8]。据此,在政务智能聊天机器人的背景下,本文提出如下2个假设:

H2:政务智能聊天机器人的感知有用性显著正向影响初始信任;

H3:政务智能聊天机器人的感知易用性显著正向影响初始信任。

1.3 人工智能的技术特性

尽管包括技术接受模型(TAM)等在内的经典技术接受理论在技术采纳方面具有很强的解释力,但这些理论在解释人工智能技术的采纳机制方面还存在一定的局限性,因为它们很少关注智能技术的独特特征[19]。因此,对于人工智能技术,应该有其它更多的技术特征因素被给予关注,从而更好的理解智能技术的采纳机制问题[20]。据此,本文进一步将政务智能聊天机器人的技术特性与TAM进行结合,从而希望能更好的理解政务智能聊天机器人的初始信任问题。

根据前人的研究,智能性、拟人性、个性化以及便利性等,是人工智能技术的基本特性[21]。智能性代表了“政务智能聊天机器人通过处理自然语言来理解用户的命令并产生应答、从而提供有效结果的能力”[22]。Pillai在关于旅游聊天机器人的研究中发现,聊天机器人的智能性,对于用户的感知易用性和感知有用性具有显著正向的影响[9]。这与Moussawi等关于个人智能代理的研究结果一致[22]。对于政务智能聊天机器人,由于它具备处理、生成以及有效输出自然语言的能力,并能够在一定程度上采取活动和交流等自适应行为,因此可高效快速的为用户提供所需的信息或服务,这能够有效提升用户的感知有用性。与此同时,在交互的过程中,用户只需简单通过语音或文字的方式输入自己的命令便可得到想要的答复,因此对它的感知易用性也会很高。据此,本文提出如下假设:

H4: 智能性正向影响政务智能聊天机器人的感知有用性;

H5:智能性正向影响政务智能聊天机器人的感知易用性。

个性化是指“政务智能聊天机器人根据用户输入的信息,为其提供针对性或特异性回答或服务的程度”[23]。研究表明,个性化是建立对人工智能技术或产品态度的重要前提[24]。Guo 等在对智能移动医疗设备的研究中发现,设备的个性化程度越高,用户对它的信任和相应的使用意愿也会越高[23]。总的来说,人工智能技术的个性化特征对用户十分有价值,它能够根据他们的需求和个体数据提供定制的信息和服务,这能够帮助用户节省时间、增强他们的使用体验[25]。因此,如果用户感知到政务智能聊天机器人为他们提供的信息或服务是个性化的,那他们就很可能对它的有用性形成积极的态度。据此,本文假设如下:

H6:个性化显著正向影响政务智能聊天机器人的感知有用性。

拟人性是指“对政务智能聊天机器人的类人特征的感知水平,例如类似于人的说话方式、声音、自我意识和情感等”[19]。之前的研究发现了拟人性对用户态度的积极影响,如Roy等指出,增加智能聊天机器人的拟人性特征,可以提升对话的有效性[26]。考虑到政务智能聊天机器人能够模仿人的方式和语气与用户进行交流,因此本文预期这一特性能够唤起用户对它的有用性的感知。这在一定程度上与Pelau 等的研究结果一致,即人工智能设备在与人类互动中所表现出的同理心等类似于人类的情感,能够促使用户形成正向的态度[10]。据此,本文提出如下假设:

H7:拟人性正向影响政务智能聊天机器人的感知有用性。

便利性指的是“政务智能聊天机器人的24*7全天候服务、提供实时信息与支持,以及在整个服务周期的每个关键点提供主动协助的特性”[27]。从上述定义可以看到,便利性的特点在于随时随地的可用性,节省时间和精力,并允许移动性,这对于促进用户形成对技术的正面评价很重要[28]。对于政务智能聊天机器人而言,和以往的其他途径相比,它支持用户在任何时间和地点与之进行交互,并为用户提供所需的信息与服务。因此,可以预期它将对于公众的感知有用性和感知易用性,产生显著的正向影响。据此,本文提出如下假设:

H8:便利性正向影响政务智能聊天机器人的感知有用性。

H9:便利性正向影响政务智能聊天机器人的感知易用性。

根据上述研究假设,本文的总体研究模型如图1所示。

图1 研究模型

2 研究方法与设计

2.1 量表及问卷设计

本文中各个变量的测量项,均借鉴已有研究的成熟量表。其中,智能性和个性化来源于Moussawi等研究[29];拟人性来源于Liu等[8]以及Komiak等研究[30];便利性来源于Ameen等研究[27];感知易用性和感知有用性来源于Venkatesh等研究[31];初始信任来源于Carter等研究[32]。为确保量表质量,本文采用翻译-回译方法对量表进行修改,并选取Credamo网络平台的50名用户进行预测试。对各变量的测量都使用的是7点李克特量表。

问卷共包括三部分的内容,分别调查样本的人口统计学要素、对智能政务聊天机器人技术特性的感知以及初始信任等因素。其中,对政务智能聊天机器人进行概要介绍,并以上海市的政务智能聊天机器人“小申”为例,对实际应用场景进行展示,以加深被试者对研究主题和背景的认知。

2.2 数据收集

为验证文中提出的研究假设模型,通过Credamo网络平台,向上海地区的被试者发送了问卷。由于本文关注的是政务智能聊天机器人的初始信任问题,因此,被试者应只有有限的或完全没有使用过政务智能聊天机器人的相关经历。为此,在问卷设计上,问卷特意设置了题项“您是否使用过政务智能聊天机器人”来筛选出符合条件的样本。与此同时,为提升有效作答问卷的数量,问卷使用了平台的IP地址限制等技术,以拒绝无效问卷。最后,增设两道质量检测题,以此作为手动筛选问卷的依据。

在系统自动拒绝无效问卷之后,调查回收到完整问卷1040份。通过前述相关标准进行逐一手动筛选,最终获取有效问卷共833份。在样本的人口统计学方面:性别上,男女占比分别为42.7%和57.3%;年龄上,21~30和31~30之间的占比最大,分别达到56.5%和37.6%;年收入方面,约38.7%的受访者收入在2万及以下,2万~4万为17.9%,4万~6万为8.4%,6万~8万为14.5%,8万~10万为27.9%,10万及以上为36.7%;受教育程度方面,2.2%的受访者为高中学历,10.1%为专科学历,有本科及以上学历的占到绝大多数,达到87.8%。

3 数据分析与研究结果

3.1 测量模型检验

为了检验测量模型的信度和效度,本文中对各潜变量和观测变量的克朗巴赫系数(Cronbach's α),标准化因子载荷,组合信度(CR),平均提取方差值(AVE)以及AVE平方根等进行了测量(相关结果见表1)。在模型的信度方面,数据分析表明本研究各变量的克朗巴赫系数,都显著大于一般要求的0.7的标准,同时各变量的CR值也大于一般标准0.7,由此说明测量项的组成信度较高。

表1 问卷量表

在效度方面,各观测变量的因子载荷介于0.730和0.962之间,均大于0.7的标准。与此同时,各变量的平均变异萃取量AVE均在0.5的标准之上(结果见表1)。因此,综合上述两方面的指标,可以认为测量模型符合收敛效度的标准。同时,每一个潜变量的AVE值的平方根都要大于潜变量之间的相关系数的绝对值。据此,可以判定模型的区分效度也符合要求。分析结果如表2所示。

表2 区分效度检验结果

3.2 结构模型检验

结构模型检验结果表明,模型的各项拟合优度指标分别为:SRMR=0.055、CMIN/DF=2.695、GFI=0.949、NFI=0.971,RFI=0.965、IFI=0.982、TLI=0.978、CFI=0.982、RMSEA=0.045。所有指标均达到了一般要求的标准,充分说明模型的整体拟合度较好。对各潜变量间的相互关系及程度的检验结果显示,感知易用性对感知有用性和初始信任的标准化路径系数β分别为0.185和0.394(p<0.001),表明感知易用性对于二者具有显著正向影响,假设H1和H3成立;感知有用性对初始信任的影响同样是正向的(β=0.622,p<0.001),假设H2成立。实证分析结果同样指出,政务智能聊天机器人的智能性等技术特性,对感知有用性、感知易用性均具有显著正向影响。其中:智能性对感知有用性和感知易用性的标准化路径系数β分别为0.232和0.272(p<0.001),假设H4和H5成立;个性化对感知有用性的标准化路径系数β=0.111(p<0.001),假设H6成立;拟人性对感知有用性的标准化路径系数β=0.032(p<0.05),假设H7成立;便利性对感知有用性和感知易用性的路径系数分别为0.329和0.417(p<0.001),假设H8和H9也成立。上述结果表明,政务智能聊天机器人的智能性、个性化和便利性等技术特性,对感知有用性和感知易用性具有显著的正向影响。图2为结构方程模型路径图。

注:***表示p<0.001,*表示p<0.05

3.3 中介效应分析

由于本文研究的是政务智能聊天机器人的技术特性对初始信任的影响及其相应的作用机制,因此有必要进一步通过中介分析检验智能性等技术特性对初始信任的具体作用路径。结果表明,智能性对初始信任具有显著正向影响(β=0.585,t=19.655,p<0.001),且这种影响部分受到感知易用性和感知有用性的中介。从效应量上来看,这种中介效应占到了总效应的50.2%;个性化对初始信任具有显著正向影响(β=0.296,t=14.887,p<0.001),且在中介变量感知易用性和感知有用性的作用下,这种正向影响依然显著(β=0.153,t=10.845,p<0.001)。直接效应(0.153)和中介效应(0.143)分别占总效应(0.296)的51.7%和48.3%;拟人性对初始信任同样存在显著积极影响(β=0.153,t=8.646,p<0.001),同样,这种影响部分受到了感知有用性的中介,相应的中介效应的效应值为0.055,占到了总效应量的31.6%;便利性和初始信任之间具有显著的正向关系(β=0.453,t=8.094,p<0.001),但是便利性对初始信任的直接效应并不显著。与之相对,总中介效应量为0.452,表明这种影响完全由感知易用性和感知有用性中介。

综合上述数据,可以发现政务智能聊天机器人的智能性、拟人性、个性化等技术特性,一方面对初始信任的形成具有直接的正向作用,另一方面也会通过中介变量感知易用性、感知有用性,对初始信任的形成产生间接影响,而且直接效应和间接效应的作用程度大体相当。此外,政务智能聊天机器人的便利性特性,则是完全通过上述两个中介变量,对初始信任的形成产生影响。上述研究结果表明,本文提出的基于TAM的初始信任分析框架具有较强的解释能力。

4 结论与讨论

4.1 结论

本文旨在以TAM为基础理论框架,探究政务智能聊天机器人的技术特性对于公众初始信任的影响及其作用机制。结果显示,本文提出的研究假设都得到了实证检验的验证。同时,中介效应分析的结果还进一步指出,对于研究模型中未直接列出的相互关系,如智能性与初始信任、个性化与初始信任等,相关变量之间存在着直接和间接两种大致相当的作用路径。本文得到的主要结论如下。

第一,不同技术特性对于初始信任的影响方式存在差异。首先,智能性既能对初始信任形成直接影响,又能通过感知有用性和感知易用性促进初始信任的产生。其次,个性化对于初始信任具有直接和间接两种大体相当的影响,这种间接影响主要是通过感知有用性实现的。最后,便利性对于初始信任的影响,完全受到感知有用性和感知易用性的中介。这些结果表明,政务智能聊天机器人的智能性、个性化、便利性等程度越高,用户对它的感知有用性或感知易用性程度也会越高,而且这些特性能够通过不同的方式,对初始信任的形成产生直接或间接的正向影响。

第二,拟人性对用户的感知有用性和初始信任,均具有显著正向影响。这与当前多数研究的结论保持了一致。这一结果可能意味着,Mori等[33]在“恐怖谷”理论中所提出的“对人工智能技术的厌恶”并不是公众的主流态度,公众还是倾向于对智能技术所呈现的拟人性特性表现出积极的情感。对于政务智能聊天机器人而言,随着拟人性程度的提升,能够唤起用户对它的有用性的感知,从而会进一步促使用户初始信任的形成。

第三,本研究将初始信任纳入TAM中,将感知有用性和感知易用性作为直接影响初始信任的关键前因。结果显示,感知有用性和感知易用性对初始信任的路径系数分别为0.622和0.394,说明以上两个因素对于初始信任的影响较大,这也从另一个侧面表明本研究将初始信任纳入TAM模型中,用以分析公众对人工智能技术的初始信任的形成机制的合理性和必要性。

4.2 理论贡献与实践意义

通过本文研究,可进一步丰富关于人工智能技术的信任和采纳等方面的实证研究,并为今后相关主题下的研究提供一种可借鉴的理论分析视角。

本研究对于人工智能技术的拟人性特征的探讨,能够进一步对现有研究中存在的分歧提供更多的实证证据。尽管多数研究均指出,人工智能技术的拟人性特征对于初始信任、使用意愿等因素具有积极的正向影响[10],但也有部分研究得到了相反的结论,即拟人性会引起使用者对智能技术的厌恶和恐慌等消极情绪,从而可能降低对人工智能技术的初始信任和使用意愿[13]。本研究的结果与当前的多数研究结论保持了一致,有助于进一步为相关研究提供实证支撑,从而加深对人工智能技术的拟人性特性和用户态度之间关系的认识。

在政府部门已经开始部署政务智能聊天机器人的现实背景下,本研究的相关研究结论,能够为政府部门、IT企业等相关实践者提供一定的有益借鉴。政府部门和开发者应该从感知易用性和感知有用性两个方面入手,提升公众对于政务智能聊天机器人的初始信任和使用意愿。如在有用性方面,可以在产品开发过程中考虑结合智能推荐算法等技术的应用,提升服务的精准性及个性化;而在易用性方面,应尽可能提升结果的可解释性和系统的可操作性。

尽管研究结果发现拟人性对于感知有用性和初始信任的影响是正向的,但是Mori等[33]提出的担忧也仍然不容忽视。因此,IT开发者应该采取措施,尽可能消解这种可能存在的负面情感。一方面,要通过不断优化相关算法的准确性和有效性,提升政务智能聊天机器人的性能,从而达到公众对其的心理预期,消减因拟人性和性能不匹配而产生的厌恶等消极情绪。另一方面,要明确人工智能产品与人类的界限,保证人类身份的独特性。如对于政务智能聊天机器人,应在醒目的位置进行必要的标示,不断强化使用者对其非人类身份的认知,减轻可能带来的因人类独特身份丧失而产生的不安感。

4.3 研究局限与展望

首先,本文的样本以20~40岁之间为主,且多数具有大学及以上学历,同时在互联网的使用方面经历较为丰富,因此在代表性和均衡性方面存在明显缺陷。鉴于此,未来研究需要尽可能从更多样化的样本群体中获取数据,以增强本文结论的普遍性。

其次,研究中的多数受访者均没有实际使用政务智能聊天机器人的相关经历,因此对其认知在一定程度上只停留在问卷中的陈述和自身的主观想象,这不可避免会导致研究的客观真实性不足。因此,未来研究还应进一步采取情景实验等方式,使受访者形成对研究对象更立体全面的认知,从而增强研究的客观真实性。

最后,出于简化模型和数据分析的现实需要,本文的研究模型中并未包括智能性、拟人性等技术特性对于初始信任的直接影响路径,但事实上这些路径是实际存在的。因此,未来的研究需要进一步探讨技术特性因素对于初始信任以及相应的使用意愿等因素的直接影响。

猜你喜欢
易用性聊天政务
政务软件易用性评测探究
政务云上看政情
关于陈某政务公开申请案的启示
我就是不想跟你聊天了
老年人家电产品易用性设计研究
二维码让政务公开更直接
中国国际人才交流大会网站易用性评价调查问卷
敞开门聊天
政务微信,你加了吗?
读者消费俱乐部